BACCALAUREAT NET

 

Mathématique

Pour connaître une langue naturelle, il n’est pas nécessaire d’en apprendre l’histoire ni, pour comprendre sa littérature, de faire l’étude historique de la grammaire et du vocabulaire. À cet égard, le langage mathématique, en raison de son caractère plutôt artificiel, se présente bien différemment. Alors que l’accord qui est à la base d’une langue naturelle n’a jamais été exprimé explicitement, les conventions du langage mathématique l’ont toujours été. Cet état conventionnel du langage mathématique permet des manipulations qui ont parfois conduit à des changements fondamentaux et même brusques. Si, sous le terme de formalisation, la manipulation consciente du langage mathématique est devenue de nos jours une activité mathématique importante, elle est, à vrai dire, aussi ancienne que la mathématique elle-même. L’histoire des notations mathématiques montre une foule de tentatives, dont la plupart n’ont influencé le développement de cette science que par la démonstration de leur insuffisance. Si l’on rappelle dans cet article l’histoire des notations, c’est pour expliquer l’état présent des choses et justifier les différents choix qui y ont conduit. On ne mentionnera guère les tentatives qui ont été désavouées par l’histoire. D’autre part, on donnera au concept de notation mathématique une interprétation plus vaste que celle contenue dans les exposés traditionnels. Ce ne sont pas seulement les nombres, les variables, les fonctions, les êtres géométriques qui demandent une expression linguistique, mais aussi les propositions, les questions, les raisonnements, qui sont exprimés dans un langage naturel, manipulé ou totalement formalisé. Ces habitudes de notation qui caractérisent le style mathématique, quoique plus intéressantes que le système des symboles isolés, n’ont pas, à ce jour, été suffisamment étudiées.

L’arithmétique élémentaire

Les nombres naturels

En dehors des plus primitives, toutes les langues connaissent un système de mots numéraux pour désigner les premiers nombres (en général jusqu’à 9) et des unités supérieures (en général quelques puissances de 10), avec lesquels on forme des noms pour d’autres nombres par des procédures qui doivent refléter l’addition et la multiplication. Notons cependant qu’on rencontre parfois dans la formation des numéraux des principes soustractifs; ainsi en latin: duodeviginti , deux de vingt, pour 18.

Ces systèmes de formation de noms numéraux sont limités par le nombre restreint de noms d’unités supérieures. Au contraire, la représentation des nombres naturels sur l’abaque est plus algorithmique et est illimitée; les nombres y sont rendus au moyen de jetons d’après un principe positionnel: la valeur du jeton est déterminée par la colonne où il se trouve. Un petit nombre est rendu par le nombre correspondant de jetons dans la première colonne; dans la colonne suivante (vers la gauche), la valeur d’un jeton égale l’unité suivante du système (par exemple 10), etc. Souvent on trouve des unités intermédiaires (5 entre 1 et 10, 50 entre 10 et 100, etc.).

La plupart des systèmes de notation numérale furent un compromis entre le système linguistique et celui de l’abaque. La figureci-dessous montre le nombre 1971 écrit d’après divers systèmes.

Le système égyptien est strictement additif; dans l’exemple choisi, on voit, à droite, le symbole de 1 000, suivi par neuf symboles de 100, sept de 10 et une unité.

La notation grecque archaïque connaît les unités intermédiaires de l’abaque; les symboles mêmes sont des lettres initiales de noms numéraux (le H de chilioi pour 1 000, le D de déka pour 10, avec le signe multiplicatif G pour penta = 5). Le système grec classique est celui des nombres alphabétiques: on indique les nombres 1, 2, .. , 9, 10, 20, ..., 90, 100, ..., 900 par les lettres de l’alphabet; un accent souscrit indique mille fois la valeur originelle; de cette manière, a vaut 1 tandis que le |a vaut 1 000. Ce système a été imité par les Hébreux et les Arabes.

Le système des chiffres romains est bien connu; on remarque dans la figure un exemple du principe soustractif qui joue aussi un rôle dans la formation des numéraux latins. Les symboles numéraux romains ressemblent aux lettres de l’alphabet latin; en particulier le C et le M semblent provenir des mots centum et mille. En réalité, l’origine de ces symboles n’est pas alphabétique; c’étaient des symboles purs, inventés probablement par les Étrusques. Par exemple, la forme originelle du symbole de 1 000 est un trait vertical dans un cercle: ž; ce symbole fut ensuite déformé en M. La moitié du symbole originel a donné le D de 500. Il faut noter que le principe soustractif, dans la formation des numéraux romains, n’est systématiquement appliqué qu’aprčs le Moyen Âge.

Le premier et le dernier système représentés dans la figure ci-dessus ont la propriété commune d’être vraiment positionnels. Ils se distinguent par la base du système, qui était sexagésimal chez les Babyloniens, tandis que le nôtre est décimal. Dans le système babylonien, de droite à gauche sur la figure ci-dessus, le premier clou représente une unité du premier ordre, les cinq crochets valent chacun 10, les deux clous suivants indiquent deux fois l’unité d’ordre supérieur (60), et les trois derniers crochets valent 10 Z 60. Le système sexagésimal apparaît presque dès les premiers textes cunéiformes; son origine est obscure. Les langues des peuples qui l’ont inventé et développé avaient un système décimal de noms numéraux. Otto Neugebauer a formulé l’hypothèse que la base soixante a été adoptée comme le rapport arrondi de deux mesures ou de deux valeurs monétaires. Avec l’héritage astronomique babylonien la science grecque adopta le système sexagésimal en astronomie; il subsiste dans la division sexagésimale des mesures de l’angle et du temps. Notons que la division du pied en douze pouces et du sou en douze deniers est d’origine romaine; elle provient du rapport naturel entre le pied et le pouce.

Dans la plupart des textes babyloniens, il n’existe pas de symbole de zéro ; par conséquent, leur notation n’est pas univoque. Dans les textes babyloniens plus tardifs, on trouve un symbole de zéro intermédiaire (non terminal); mais il n’est pas écrit systématiquement. Dans les textes astronomiques grecs, le signe sexagésimal de zéro est o, première lettre du mot grec ouden signifiant "rien". Dans la numérotation alphabétique grecque, cette lettre signifiait 70; dans la notation sexagésimale de subdivisions du temps et de l’arc, on employait seulement les symboles alphabétiques jusqu’à 50, ou tout au plus jusqu’à 60; le symbole o pour 70 était en fait disponible pour signifier zéro.

C’est en Inde que l’on trouve les premières traces des chiffres 1, 2, 3, 4, 5, 6, 7, 8, 9 actuellement usités; ils datent des premiers siècles de l’ère chrétienne, mais ne sont pas encore utilisés dans un système positionnel. Les nombres métaphoriques de la poésie sanscrite montrent, d’autre part, l’existence d’un certain système positionnel dans lequel, comme dans la langue indienne, on commençait par les unités. Au cours des VIe et VIIe siècles de notre ère, on trouve sur le sol indien des preuves de l’existence du système décimal positionnel. Des éléments nouveaux de ce système, qui peuvent trahir l’influence de l’astronomie grecque, sont l’inversion de la succession des positions (qui alors correspond à celle de la langue grecque plutôt qu’à celle des langues indiennes) et le symbole de zéro (qui est un cercle, comme dans les textes astronomiques grecs).

Le monde chrétien devait la connaissance du système indien aux Arabes. Cependant, il faut noter que les chiffres employés par les Arabes occidentaux, ainsi que les nôtres, ressemblent plus aux chiffres originels indiens que ceux qu’utilisent les Arabes orientaux. Depuis le Xe siècle, le système indo-arabe s’est répandu en Europe. La forme des chiffres est restée constante depuis l’invention de l’imprimerie.

La ligne latérale est le système numéral chinois et japonais, parfois purement positionnel, parfois multiplicatif; l’écriture japonaise de 1971 donnée dans la figure se lit:

Durant l’Antiquité, les nombres écrits jouaient un rôle négligeable; les calculs se faisaient sur l’abaque. Ce que les Arabes apprenaient des Indes et enseignaient aux Européens n’était pas seulement l’écriture des nombres, mais aussi la méthode de calcul écrit, appelé algorithme par les Européens du Moyen Âge d’après le nom de Muhammad b. Musa al-Khwarizmi, auteur d’un livre où cette méthode fut exposée. Tant que les calculs arithmétiques se faisaient sur l’abaque, l’existence d’une écriture rationnelle des nombres était un facteur négligeable; au contraire, l’algorithme positionnel des nombres indo-arabes était tout à fait adapté au calcul écrit. Cependant on ne doit pas s’imaginer que ce calcul se faisait sur le papier. On écrivait dans de la poudre étalée sur une planche et, en calculant, on effaçait tous les résultats intermédiaires; cette méthode persista même assez longtemps après l’entrée en usage du papier comme support du calcul écrit, ou plutôt elle se transforma en une méthode de biffage; la méthode actuelle du calcul écrit fut établie par Luca Pacioli, dit Luca di Borgo (Summa de arithmetica, geometria, proportioni et proportionalita , publiée à Venise en 1494).

Les fractions

Les fractions sont un instrument très ancien du calcul. Les Égyptiens préféraient des fractions d’unité, c’est-à-dire à numérateur un; ils indiquaient une telle fraction par son dénominateur, muni d’une marque spéciale; il y avait des signes spéciaux pour 1/2, 1/3, 2/3. Des fractions générales sont représentées par des combinaisons additives de fractions d’unité: par exemple, on représentait 2/7 (= 1/4 + 1/28) par:

Il existait des tables pour réduire des fractions à des sommes de fractions d’unité.

Cette méthode de fractions d’unité fut adoptée par les Grecs; on indique une telle fraction par le symbole alphabétique de son dénominateur, muni d’un ou de deux accents. Mais on écrivait aussi des fractions communes, le numérateur marqué par un accent précédant le dénominateur marqué par deux accents. Dans les textes mathématiques, on trouve souvent le dénominateur dans une position d’exposant du numérateur.

Les Indiens écrivaient le dénominateur au-dessous du numérateur; la ligne de fraction horizontale est usitée chez quelques Arabes; elle devient usuelle au Moyen Âge chrétien. Pour des raisons typographiques, G. W. Leibniz proposait, sans succès, la notation a : b au lieu de ab ; au XIXe siècle, A. De Morgan suggérait a /b , notation qui se répand de plus en plus.

Les précurseurs de nos fractions décimales sont les fractions sexagésimales des Babyloniens. Sans aucun scrupule, ces derniers continuaient les divisions après ce que l’on appellerait aujourd’hui la virgule, alors qu’ils ne possédaient pas de signe de séparation entre les unités et les parties fractionnaires, pas plus que de zéro terminal. Les fractions sexagésimales furent adoptées par les Grecs et les calculateurs du Moyen Âge.

En 1585, Simon Stevin, dit Simon de Bruges, publiait quelques pages auxquelles il donnait le titre bien caractéristique de: La Disme enseignant facilement expedier par nombres entiers sans rompuz tous comptes se rencontrant aux affaires des Hommes. Il proposait d’abolir les fractions communes en faveur du calcul décimal et de décimaliser la monnaie et les mesures. Dès le début du XVIIe siècle se répand la notation moderne avec le point décimal ou la virgule.

Les opérations arithmétiques

Outre les représentations verbales des opérations, on connaissait dès l’Antiquité des abréviations ou des signes spéciaux, tels que le q retourné () de Diophante d’Alexandrie pour la soustraction; souvent l’addition s’exprimait par juxtaposition. Les signes "moins" et "plus" apparaissent dans des manuscrits allemands de 1481 et 1486; le premier qui les imprima (mais sans prétendre à une nouveauté) fut J. Widmann (1489). Ces signes sont employés pour indiquer non seulement des opérations, mais aussi l’état positif ou négatif; on a proposé pour l’enseignement scolaire de séparer ces deux fonctions, par exemple de remplacer _ 3 par _ 3 ou _3 ou 3 _. L’origine des signes "plus" et "moins" est incertaine, probablement + est une ligature de "et", tandis que, depuis longtemps, dans les comptes, la barre horizontale avait servi à séparer le poids brut de la tare.

La croix de multiplication est plus récente. Michael Stifel (1545) indiquait la multiplication par un M; François Viète (1591) employait le mot latin in. Le premier exemple authentique de la croix se trouve chez William Oughtred (1637). Le point de multiplication provient de Leibniz (dès 1698). On doit noter qu’en algèbre la multiplication par juxtaposition était une vieille habitude. Le signe ÷ de division fut introduit par J. H. Rahn (1659) et adopté par les Anglais: on le trouve encore assez communément dans les textes de langue anglaise. Le "colon" (c’est-à-dire le signe "deux-points") de Leibniz pour la division ainsi que le point de multiplication se répandirent grâce à l’influence des manuels de Christian Wolff.

Le signe d’égalité provient de Robert Recorde (1557); pendant le XVIIe siècle, son usage fit des progrès en Angleterre tandis que, sur le Continent, le symbole cartésien (le symbole des astronomes pour le signe Taurus) prédominait. Grâce à Leibniz, le signe = l’emporta sur le symbole cartésien au cours du XVIIIe siècle.

Au signe d’égalité Thomas Harriot (1631) ajoutait ceux de majorité et de minorité: O et S.

La notation exponentielle des puissances est due à Descartes. L’idée des exposants négatifs et fractionnaires provient de J. Wallis (1656), mais c’est seulement I. Newton qui les écrira explicitement. Leibniz (1708) proposait de remplacer systématiquement les signes de racine par des exposants.

Pour la racine carrée, la notation R ou , abréviation du latin radix , apparut dans l’œuvre de Leonardo Fibonacci, dit Léonard de Pise (1220). L’opinion que le signe était un r déformé est réfutée par des manuscrits allemands de la fin du XVe siècle qui prennent pour symbole de racine carrée un point avec une queue.

2. Le formalisme algébrique

La syntaxe des formules algébriques

Les langues naturelles doivent leur structure syntactique à un amas chaotique de moyens de flexion, de subordination, de conjonction, de ponctuation, de mélodie et de rythme. Mais, très souvent, la structure syntactique s’explique par le sens et non par des critères formels. "Mathématique et langue française" et "langue et littérature françaises" ont la même structure formelle, mais le sens indique des structures syntactiques différentes.

Dans le langage des expressions algébriques, on s’efforce d’exprimer complètement la structure par des moyens formels, dont les plus importants sont les parenthèses, crochets et accolades: (a + b ).c est aussi plein de sens que a + b.c , et on a besoin de pouvoir les distinguer.

Le système des règles pour la succession des opérations est plus compliqué qu’on ne pense et que ne le veulent certains vers mnémotechniques. Passe comme si toutes les parenthèses ouvrantes étaient placées à gauche. Pour l’addition, qui est associative, toute règle est superflue.

Ce principe de l’ordre linéaire est si naturel que, avant l’usage de parenthèses, on structurait des expressions algébriques au moyen de déviations par rapport à l’ordre linéaire. Par exemple, Descartes écrit (Œuvres , édition Adam et Tannery, vol. VI, p. 415):

C’est une méthode qu’on trouve déjà chez Viète; parfois il emploie des crochets placés d’un côté ou même des deux côtés d’une expression algébrique. Le principe de structure par rupture de l’ordre linéaire est plus ancien; il est à l’origine de cette notation des fractions que l’on doit aux Indiens.

Un autre moyen formel de structure a été la barre horizontale, servant à agréger les termes; Descartes fut le premier à l’employer à profusion. L’usage de cette barre s’est conservé jusqu’à la fin du XIXe siècle dans des expressions telles que n + 1. Parfois, des accolades horizontales ont la même fonction. Le dernier vestige de cette écriture est la barre du signe de racine a + b ; la barre qui indique la conjugaison complexe est fonctionnelle plutôt que syntactique. La paire de parenthèses ne remplaça pas d’emblée la barre. D’abord employée par Stifel (dans ses manuscrits, 1544), elle prévalut grâce à Leibniz.

Le plus ancien des principes structurels formels est celui selon lequel certaines opérations en précèdent d’autres. Le principe selon lequel la multiplication crée une liaison plus étroite que l’addition et la soustraction est attesté dès les textes cunéiformes. Il est, en effet, bien naturel de traiter la multiplication comme une dénomination (2 Z 6, c’est deux sixaines), même si l’on rejette des abus didactiques (2a +3a = 5a , parce que 2 vaches + 3 vaches = 5 vaches). Cette interprétation de la multiplication fut historiquement suggérée par le langage des équations où, dès le début, un problème tel que x 2 + 21 = 10 x était formulé sous la forme "une chose-carré plus 21 égale 10 choses". À partir des premières formules algébriques, il ne fut jamais douteux que la multiplication précédait l’addition et la soustraction, en particulier si on indiquait la multiplication par juxtaposition; il en fut de même quand la multiplication fut exprimée par un signe explicite, par exemple chez Viète qui employait en général le mot in en tant que symbole de multiplication. Dès la notation exponentielle de Descartes pour les puissances, il devient aussi évident que l’opération exponentielle précède l’addition, la soustraction et la multiplication.

Tous ces moyens structurels étaient de caractère agrégeant; cela est rare dans les langues naturelles, qui préfèrent la structuration par séparateurs. Des formules telles que:

qu’on trouve parfois dans les cahiers de calcul arithmétique, trahissent l’intention d’une structure par ordre linéaire. Dans les formules mathématiques, au contraire, on suppose, sans l’indiquer par des parenthèses et sans le dire explicitement, que le signe d’égalité sépare plus fortement que les autres signes (ce qui est également vrai pour les signes d’inégalité et d’ordre). Dans le passé, il y a eu des essais notationnels de structure par séparation. Stevin (1585) employait) (comme séparateur. On trouve des points et des colons séparateurs chez M. Rudolff (1525), C. Stifel (1544), L. Van Ceulen (1610) et leurs contemporains; W. Oughtred (1631), J. Wallis (1670), Jakob Bernoulli (1689) se servaient du colon comme séparateur; Leibniz (1702) utilisait parfois la virgule; même chez L. Euler et J. L. Lagrange, il existe de telles notations.

Des ponctuations séparantes seraient plus économiques et plus faciles à embrasser d’un coup d’œil. B. Russell et A. N. Whitehead ont employé d’une manière presque exclusive les ponctuations séparantes dans leurs Principia Mathematica. Au lieu des parenthèses de force agrégeante graduée, on écrirait des séparateurs de force graduée. Les ponctuations des Principia Mathematica sont des groupes de points: tel groupe sépare d’autant plus fortement qu’il compte plus de points. Cette méthode a été raffinée par H. Freudenthal dans Lincos.

Bien que le système de ponctuations séparantes soit plus pratique, il est peu vraisemblable qu’on parvienne un jour à adapter la structure du langage mathématique à ce principe.

Le sens des formules algébriques

L’interprétation naïve des formules algébriques est celle d’un rapport sur une suite d’opérations et leur résultat: 2 + 7 est lu comme un commandement "À 2 ajoutez 7", et la formule:

comme un récit "À 2 ajoutez 7 et le résultat est 9". Cette interprétation naïve explique aussi bien la structure par ordre linéaire des expressions.

Selon l’interprétation acceptée en mathématiques, 2 + 7 ne constitue pas un problème mais un nombre et, d’une façon générale, a + b est un nombre dès lors que a et b sont des nombres. Dans cette interprétation, le signe d’égalité se lit "est la même chose que". Un même objet peut avoir des noms divers, ainsi "Paris" et "la capitale de la France" désignent le même objet; le nombre 9 peut être désigné par une infinité d’expressions, telles que 2 + 7, 10 _ 1, 32, 9.1, etc. Dans cette interprétation, le signe d’égalité n’est pas un signe mathématique, mais un signe sémantique, exprimant que deux termes signifient la même chose.

Cette interprétation s’est développée lentement et, même à l’heure actuelle, certains auteurs de manuels scolaires ne respectent pas cette convention qui est l’essence du langage mathématique. En effet, même si l’on peut interpréter 2 + 7 comme un problème, il n’en est pas de même du cas de a + b , si a et b ne sont pas donnés explicitement.

L’interprétation statique des expressions algébriques est une intervention qui date probablement de 1460 et qui peut être attribuée à Johann Müller dit Regiomontanus et à l’auteur anonyme d’un manuscrit de Munich (1455-1461). Cette nouveauté apparut avec des équations qui, pour la plupart, comportaient des fractions telles que:

Pour des expressions avec des nombres connus , l’interprétation naïve est bien suffisante et, d’autre part, le concept de fraction commune repose sur l’idée que 27 n’est pas, comme 2 + 7, un problème mais un nombre, idée inhérente à l’arithmétique indienne, distincte de celle des Égyptiens qui se croyaient obligés de transformer 27 en 14 + 128. Finalement, l’ordre vertical dans l’écriture de la fraction produit la première structuration naturelle, avant même l’emploi des parenthèses.

Selon l’interprétation moderne, les deux membres d’une équation décrivent le même objet, et l’équation est l’expression d’une proposition qui affirme cette identité. Cependant, jusqu’aux textes les plus récents, on trouve des traces du "style naïf", par exemple:

Ce qui suit "les coefficients de Fourier ", "nombre" et "pour tout" devrait, en effet, être un objet mathématique (par exemple, un nombre) tandis que, dans les expressions précédentes, c’est une proposition. Évidemment, on veut que le signe d’égalité ou d’ordre ne soit pas lu comme un prédicat "est égal à" ou "est plus grand que", mais plutôt comme un attribut "égal à", "plus grand que". Il serait plus correct d’écrire respectivement:

De telles licences ne sauraient persister longtemps encore.

Les lettres

Chaque langue connaît des noms propres et des noms communs. Vercingétorix , la France , Sirius , trois , la révolution de février , le Soldat inconnu désignent chacun un seul objet, tandis que des mots tels que rat , pierre , je , hier , là-bas sont des termes ambigus. En mathématique, les termes ambigus sont appelés des variables. La notation des variables est très différente dans les langues naturelles et dans la mathématique. Les variables des langues naturelles ont un domaine restreint de variabilité; les variables que l’on vient de citer ne s’appliquent respectivement qu’à des rats, des pierres, des hommes, des moments, des lieux. Au contraire, les lettres dont on se sert en tant que variables en mathématique peuvent désigner tout ce qu’on veut, bien qu’il s’agisse de préférence d’objets mathématiques. Tandis que les mathématiciens tiennent à indiquer, dans un contexte donné, la même chose par le même nom et à répéter ce nom autant de fois qu’on revient sur cette chose, une manie des langues naturelles veut, au contraire, qu’on évite les répétitions et qu’on remplace des noms par des synonymes généraux ou accidentels. Ainsi dans la phrase "Jean s’est brûlé la cervelle dans sa voiture", on désigne la même personne par quatre termes différents: Jean, se, la, sa.

Puisque pierre est un nom commun à toutes les pierres, on a besoin d’autres moyens linguistiques pour distinguer éventuellement des pierres diverses. On satisfait à ce besoin en parlant de cette pierre-ci et de cette pierre-là, ou bien en disant: "encore une pierre", ou "la pierre qui est dans ma main", etc. Lorsqu’on envisagea en géométrie des figures complexes et, en tout cas, dès que les raisonnements géométriques furent rédigés par écrit, il devint impossible de se contenter de citations telles que "ce point-ci" et "ce point-là". Il était bien naturel qu’on numérotât les points d’une figure, ce qu’on faisait en se servant des lettres de l’alphabet grec qui jouaient en même temps le rôle de chiffres. On distinguait un point des autres en parlant du "point à A", ce qui devenait "le point A" et enfin simplement "A". Cet A peut être interprété comme un nom propre, à savoir le nom du point de la figure en question auprès duquel se trouve la lettre A. Mais, étant donné la généralité des énoncés géométriques où A peut être un point quelconque, les lettres devenaient des noms ambigus de points, donc des symboles de variables. Grâce à l’alphabet, on peut donc disposer d’un grand nombre de telles variables, ce qui est un avantage appréciable.

Comparée à l’usage mathématique des lettres depuis Viète, la pratique des lettres dans la géométrie grecque paraît bien primitive. On se sert de lettres en tant que noms d’objets, mais, à partir de ces symboles, on ne construit que très imparfaitement des mots et des phrases. Si une figure est construite pas à pas, on donne à chaque nouveau point un nom nouveau. L’imposition de noms ne reflète ni la marche de la construction ni les relations existantes. Il existe certes des traces de terminologie algorithmique: si A et B sont deux points, AB est la droite, ou le segment, qui les joint; mais on attribue à l’intersection de deux droites à noms donnés un nom arbitraire non algorithmique. Ce système s’est conservé en géométrie jusqu’à nos jours, et cela malgré les tentatives algorithmiques de Leibniz en géométrie, dont le programme a été rempli en un certain sens par le calcul vectoriel.

Il est bon d’expliquer pour quelle raison Viète (1591) doit être considéré comme fondateur de notre langage algébrique. On ne cesse de "découvrir" un usage des lettres en algèbre antérieur à celui de Viète et de lui en retirer la primeur. En fait, le mérite de Viète ne réside pas dans l’introduction des lettres en algèbre. Avant lui, on employait bien des lettres en algèbre, mais on imitait en général la méthode de la géométrie: par exemple, Maurolycus, connu aussi sous le nom de Maurolico, dit Francesco da Messina (1575) fait usage de lettres, mais sans calculer avec elles et, s’il fait des additions ou des multiplications, il introduit une nouvelle lettre pour chaque somme et chaque produit.

Un algorithme vraiment algébrique s’est développé assez tôt dans la théorie des équations. On invente des symboles pour l’inconnue et ses puissances, puis on forme des sommes algébriques avec ces symboles et des numéraux. Cela commence déjà avec Diophante. Les Indiens employaient des noms de couleurs pour des inconnues diverses. Les termes utilisés en arabe pour l’inconnue, qui signifient chose et racine, et le nom du carré de l’inconnue, qui provient du grec dunamiv et qui signifie la possession, ont donné naissance aux termes en usage chez les abacistes et les cossistes du Moyen Âge chrétien: res , radix , causa (cosa italien) pour l’inconnue, census pour le carré de l’inconnue. Chez Regiomontanus (1470) et l’anonyme des manuscrits de Munich (1455-1461), des abréviations de res et de census apparaissent dans les formules; chez Rudolff (1525), un système de notations pour l’inconnue et ses puissances se trouve développé. Stevin indiquait la n -ième puissance de l’inconnue par un n dans un cercle. La plus importante innovation avant Viète est celle de J. Butéon (1559): l’usage des lettres A, B, C pour les inconnues dans des équations à plusieurs inconnues.

Le grand mérite de Viète est d’avoir amalgamé la méthode traditionnelle en géométrie et la méthode nouvelle en algèbre. En algèbre, il indiquait par des lettres non seulement les inconnues, ce qui était une habitude algébrique, mais aussi les indéterminées, ce qu’on avait fait en géométrie depuis l’Antiquité; d’autre part, avec ces lettres, il formait des mots, c’est-à-dire des expressions algébriques avec lesquelles il opérait comme on l’avait fait depuis un siècle dans les équations.

Ce fut une innovation qui marqua une époque. Il faut toutefois noter que, sous certains aspects, le formalisme de Viète était plus lourd que celui de ses prédécesseurs. Il indiquait la multiplication et la formation des puissances par des mots latins, même déclinés: quadratum , cubus , quadrato-quadratum pour la deuxième, la troisième, la quatrième puissance, potestas pour une puissance générale; et, s’il y en avait deux dans le même contexte, il désignait l’une par potestas et l’autre par gradus

Le terme de fonction a été introduit par Leibniz (1692) dans un contexte géométrique: il s’agit pour lui de portions de lignes droites qui dépendent d’un point variable sur une courbe, comme la tangente ou la normale. Jean Bernoulli, en 1698, a repris ce terme pour désigner une quantité X "composée d’une manière quelconque de x et de quantités données", où x désigne en l’occurrence l’ordonnée du point variable sur la courbe; plus tard (1718), il proposera de noter x une fonction d’une quantité variable x (pas forcément rattachée à un contexte géométrique). Le concept de fonction ainsi dégagé a servi de base à Euler pour son exposé de l’analyse mathématique (1748) d’un point de vue formel et non plus géométrique. Euler définit une variable comme une quantité qui admet toutes les valeurs possibles, par opposition à une constante, dont la valeur est fixée, et il représente géométriquement une variable par un axe; ensuite, il définit une fonction d’une variable comme "une expression analytique composée d’une manière quelconque de cette quantité variable et de nombres ou de quantités constants". Bien entendu, il ne précise pas ce qu’il entend par "expression analytique", ni la façon dont elle doit être "composée": la suite du livre montre que c’est au moyen des opérations algébriques élémentaires éventuellement itérées indéfiniment (séries, produits infinis) et des opérations transcendantes comme log, exp, sin, cos; suivant la manière dont elles sont composées, Euler classe les fonctions en algébriques et transcendantes, les fonctions algébriques étant elles-mêmes subdivisées en rationnelles et irrationnelles.

Les fonctions sont représentées graphiquement par des courbes dans le plan, où l’ordonnée est la valeur de la fonction lorsque l’abscisse est la valeur de la variable; inversement, Euler se demande si une courbe donnée correspond à une fonction, et il est amené à distinguer les courbes "continues", graphes de fonctions définies par des expressions analytiques, et les courbes "discontinues" (ou "mixtes" ou "irrégulières"), réunion de morceaux qui correspondent à diverses fonctions. Par la suite, Euler sera amené à étendre le concept de fonction, en remarquant que les "fonctions arbitraires" intervenant dans la solution de l’équation des cordes vibrantes donnée par d’Alembert (1747) n’étaient pas nécessairement définies par des expressions analytiques, mais plutôt par un graphe obtenu par le "tracé libre de la main"; c’est l’origine physique du problème qui conduisit Euler à cette définition très générale des fonctions. Daniel Bernoulli (1753) a donné une autre solution de l’équation des cordes vibrantes au moyen de séries trigonométriques, et il pensait que sa solution était aussi générale que celle de d’Alembert-Euler, ce qu’Euler a vivement contesté. On se trouvait donc en présence de deux notions de fonction: la conception formelle d’expression analytique, et la conception "ensembliste" plus générale de correspondance arbitraire; le problème du rapport entre les deux notions se trouvait posé et sa solution devait attendre la fin du XIXe siècle.

Tandis que Lagrange (Théorie des fonctions analytiques , 1797), restait attaché à la définition des fonctions par des expressions analytiques (sa théorie est fondée sur l’utilisation des développements en séries entières), Fourier observa dès 1807 que la formule intégrale qui donne des coefficients du développement d’une fonction en série trigonométrique conservait un sens pour une fonction arbitraire du type de celles introduites par Euler (l’intégrale étant interprétée comme une aire dont l’existence est admise comme une évidence intuitive); il en déduisit, sans se poser de problème de convergence, qu’une fonction arbitraire pouvait toujours être représentée par une série trigonométrique, mais la notion de fonction arbitraire était encore extrêmement vague pour lui. Les travaux de Bolzano (1817) et de Cauchy (1821) devaient apporter un peu de clarté sur cette notion, en introduisant la définition des fonctions continues (au sens moderne du terme, qui ne se réfère pas du tout aux "courbes continues" d’Euler); Cauchy développa une théorie de l’intégration des fonctions continues dégagée de l’intuition géométrique, et Dirichlet (1829) parvint à démontrer qu’une fonction continue monotone par par morceaux était effectivement représentée par sa série de Fourier. Les réflexions de Dirichlet pour l’extension à des fonctions plus générales le conduisirent à une conception des fonctions arbitraires beaucoup plus vaste que celle de ses prédécesseurs (pour qui il s’agissait essentiellement de fonctions continues par morceaux): comme exemple de fonction discontinue, il donne la fonction f telle que f (x ) vaille 1 pour x rationnel et 0 pour x irrationnel (1837); il pose alors le problème de l’intégration des fonctions arbitraires suffisamment générales (par exemple avec un ensemble rare de discontinuités): ce devait être l’objet de travaux de Riemann (pour les fonctions dont l’ensemble de discontinuités est de mesure nulle) et de Lebesgue (pour une classe beaucoup plus large, stable par des passages à la limite simple).

P. Du Bois-Reymond montra en 1873 que, contrairement à la conviction des mathématiciens, la série de Fourier d’une fonction continue ne converge pas nécessairement vers cette fonction. Mais Weierstrass parvint cependant à raccorder les deux notions de fonction (expression analytique et fonction arbitraire) en montrant qu’une fonction continue est toujours la somme d’une série de polynômes convergeant uniformément sur tout intervalle fermé et borné (1885). Le problème de la représentation analytique des fonctions discontinues allait être abordé en 1898 par Baire, qui caractérise les fonctions discontinues limites simples des fonctions continues (fonctions de classe 1), puis donne une classification des fonctions selon laquelle les fonctions de classe a sont des limites simples de fonctions des classes aH avec aH S a (a et aH peuvent être des ordinaux transfinis); Lebesgue (1905) montra l’existence de fonctions de chacune des classes de Baire et aussi de fonctions échappant à la classification de Baire: de telles fonctions n’admettent pas de représentation analytique.

À côté des fonctions d’une variable réelle, que nous avons considérées jusqu’à présent, les mathématiciens ont aussi étudié les fonctions de plusieurs variables, dont le domaine de définition est une partie d’un espace Rn . Par ailleurs, le calcul des variations conduisit à la notion de fonction dont la variable est une courbe (théorie des fonctions de lignes développée par V. Volterra); M. Fréchet (1904) et E. H. Moore (1905) étendirent ces conceptions en prenant la variable dans un ensemble arbitraire, et Fréchet (1909) eut même l’idée de considérer des fonctions non plus numériques, mais prenant leurs valeurs dans un ensemble quelconque: c’est la notion générale de fonction ou application utilisée de nos jours.

 

Précédant