Mathématique
Pour connaître une
langue naturelle, il n’est pas nécessaire d’en apprendre l’histoire ni, pour
comprendre sa littérature, de faire l’étude historique de la grammaire et du
vocabulaire. À cet égard, le langage mathématique, en raison de son caractère
plutôt artificiel, se présente bien différemment. Alors que l’accord qui est à
la base d’une langue naturelle n’a jamais été exprimé explicitement, les
conventions du langage mathématique l’ont toujours été. Cet état conventionnel
du langage mathématique permet des manipulations qui ont parfois conduit à des
changements fondamentaux et même brusques. Si, sous le terme de formalisation,
la manipulation consciente du langage mathématique est devenue de nos jours une
activité mathématique importante, elle est, à vrai dire, aussi ancienne que la
mathématique elle-même. L’histoire des notations mathématiques montre une foule
de tentatives, dont la plupart n’ont influencé le développement de cette
science que par la démonstration de leur insuffisance. Si l’on rappelle dans
cet article l’histoire des notations, c’est pour expliquer l’état présent des
choses et justifier les différents choix qui y ont conduit. On ne mentionnera
guère les tentatives qui ont été désavouées par l’histoire. D’autre part, on
donnera au concept de notation mathématique une interprétation plus vaste que
celle contenue dans les exposés traditionnels. Ce ne sont pas seulement les
nombres, les variables, les fonctions, les êtres géométriques qui demandent une
expression linguistique, mais aussi les propositions, les questions, les
raisonnements, qui sont exprimés dans un langage naturel, manipulé ou
totalement formalisé. Ces habitudes de notation qui caractérisent le style
mathématique, quoique plus intéressantes que le système des symboles isolés,
n’ont pas, à ce jour, été suffisamment étudiées.
L’arithmétique
élémentaire
Les
nombres naturels
En dehors des plus
primitives, toutes les langues connaissent un système de mots numéraux pour
désigner les premiers nombres (en général jusqu’à 9) et des unités supérieures
(en général quelques puissances de 10), avec lesquels on forme des noms pour
d’autres nombres par des procédures qui doivent refléter l’addition et la
multiplication. Notons cependant qu’on rencontre parfois dans la formation des
numéraux des principes soustractifs; ainsi en latin: duodeviginti , deux de
vingt, pour 18.
Ces systèmes de
formation de noms numéraux sont limités par le nombre restreint de noms
d’unités supérieures. Au contraire, la représentation des nombres naturels sur
l’abaque est plus algorithmique et est illimitée; les nombres y sont rendus au
moyen de jetons d’après un principe positionnel: la valeur du jeton est
déterminée par la colonne où il se trouve. Un petit nombre est rendu par le
nombre correspondant de jetons dans la première colonne; dans la colonne
suivante (vers la gauche), la valeur d’un jeton égale l’unité suivante du
système (par exemple 10), etc. Souvent on trouve des unités intermédiaires (5
entre 1 et 10, 50 entre 10 et 100, etc.).
La plupart des
systèmes de notation numérale furent un compromis entre le système linguistique
et celui de l’abaque. La figureci-dessous montre le nombre 1971 écrit d’après
divers systèmes.
Le système égyptien
est strictement additif; dans l’exemple choisi, on voit, à droite, le symbole
de 1 000, suivi par neuf symboles de 100, sept de 10 et une unité.
La notation grecque
archaïque connaît les unités intermédiaires de l’abaque; les symboles mêmes
sont des lettres initiales de noms numéraux (le H de chilioi pour 1 000, le D
de déka pour 10, avec le signe multiplicatif G pour penta = 5). Le système grec
classique est celui des nombres alphabétiques: on indique les nombres 1, 2, ..
, 9, 10, 20, ..., 90, 100, ..., 900 par les lettres de l’alphabet; un accent
souscrit indique mille fois la valeur originelle; de cette manière, a vaut 1
tandis que le |a vaut 1 000. Ce système a été imité par les Hébreux et les
Arabes.
Le système des
chiffres romains est bien connu; on remarque dans la figure un exemple du
principe soustractif qui joue aussi un rôle dans la formation des numéraux
latins. Les symboles numéraux romains ressemblent aux lettres de l’alphabet
latin; en particulier le C et le M semblent provenir des mots centum et mille.
En réalité, l’origine de ces symboles n’est pas alphabétique; c’étaient des
symboles purs, inventés probablement par les Étrusques. Par exemple, la forme
originelle du symbole de 1 000 est un trait vertical dans un cercle: ž; ce
symbole fut ensuite déformé en M. La moitié du symbole originel a donné le D de
500. Il faut noter que le principe soustractif, dans la formation des numéraux
romains, n’est systématiquement appliqué qu’aprčs le Moyen Âge.
Le premier et le
dernier système représentés dans la figure ci-dessus ont la propriété commune
d’être vraiment positionnels. Ils se distinguent par la base du système, qui
était sexagésimal chez les Babyloniens, tandis que le nôtre est décimal. Dans
le système babylonien, de droite à gauche sur la figure ci-dessus, le premier
clou représente une unité du premier ordre, les cinq crochets valent chacun 10,
les deux clous suivants indiquent deux fois l’unité d’ordre supérieur (60), et
les trois derniers crochets valent 10 Z 60. Le système sexagésimal apparaît
presque dès les premiers textes cunéiformes; son origine est obscure. Les
langues des peuples qui l’ont inventé et développé avaient un système décimal
de noms numéraux. Otto Neugebauer a formulé l’hypothèse que la base soixante a
été adoptée comme le rapport arrondi de deux mesures ou de deux valeurs
monétaires. Avec l’héritage astronomique babylonien la science grecque adopta
le système sexagésimal en astronomie; il subsiste dans la division sexagésimale
des mesures de l’angle et du temps. Notons que la division du pied en douze
pouces et du sou en douze deniers est d’origine romaine; elle provient du
rapport naturel entre le pied et le pouce.
Dans la plupart des
textes babyloniens, il n’existe pas de symbole de zéro ; par conséquent, leur
notation n’est pas univoque. Dans les textes babyloniens plus tardifs, on
trouve un symbole de zéro intermédiaire (non terminal); mais il n’est pas écrit
systématiquement. Dans les textes astronomiques grecs, le signe sexagésimal de
zéro est o, première lettre du mot grec ouden signifiant "rien". Dans
la numérotation alphabétique grecque, cette lettre signifiait 70; dans la
notation sexagésimale de subdivisions du temps et de l’arc, on employait
seulement les symboles alphabétiques jusqu’à 50, ou tout au plus jusqu’à 60; le
symbole o pour 70 était en fait disponible pour signifier zéro.
C’est en Inde que
l’on trouve les premières traces des chiffres 1, 2, 3, 4, 5, 6, 7, 8, 9
actuellement usités; ils datent des premiers siècles de l’ère chrétienne, mais
ne sont pas encore utilisés dans un système positionnel. Les nombres
métaphoriques de la poésie sanscrite montrent, d’autre part, l’existence d’un
certain système positionnel dans lequel, comme dans la langue indienne, on commençait
par les unités. Au cours des VIe et VIIe siècles de notre ère, on trouve sur le
sol indien des preuves de l’existence du système décimal positionnel. Des
éléments nouveaux de ce système, qui peuvent trahir l’influence de l’astronomie
grecque, sont l’inversion de la succession des positions (qui alors correspond
à celle de la langue grecque plutôt qu’à celle des langues indiennes) et le
symbole de zéro (qui est un cercle, comme dans les textes astronomiques grecs).
Le monde chrétien
devait la connaissance du système indien aux Arabes. Cependant, il faut noter
que les chiffres employés par les Arabes occidentaux, ainsi que les nôtres,
ressemblent plus aux chiffres originels indiens que ceux qu’utilisent les
Arabes orientaux. Depuis le Xe siècle, le système indo-arabe s’est répandu en
Europe. La forme des chiffres est restée constante depuis l’invention de
l’imprimerie.
La ligne latérale
est le système numéral chinois et japonais, parfois purement positionnel,
parfois multiplicatif; l’écriture japonaise de 1971 donnée dans la figure se
lit:
Durant l’Antiquité,
les nombres écrits jouaient un rôle négligeable; les calculs se faisaient sur
l’abaque. Ce que les Arabes apprenaient des Indes et enseignaient aux Européens
n’était pas seulement l’écriture des nombres, mais aussi la méthode de calcul
écrit, appelé algorithme par les Européens du Moyen Âge d’après le nom de
Muhammad b. Musa al-Khwarizmi, auteur d’un livre où cette méthode fut exposée.
Tant que les calculs arithmétiques se faisaient sur l’abaque, l’existence d’une
écriture rationnelle des nombres était un facteur négligeable; au contraire,
l’algorithme positionnel des nombres indo-arabes était tout à fait adapté au
calcul écrit. Cependant on ne doit pas s’imaginer que ce calcul se faisait sur
le papier. On écrivait dans de la poudre étalée sur une planche et, en
calculant, on effaçait tous les résultats intermédiaires; cette méthode
persista même assez longtemps après l’entrée en usage du papier comme support
du calcul écrit, ou plutôt elle se transforma en une méthode de biffage; la
méthode actuelle du calcul écrit fut établie par Luca Pacioli, dit Luca di
Borgo (Summa de arithmetica, geometria, proportioni et proportionalita ,
publiée à Venise en 1494).
Les
fractions
Les fractions sont
un instrument très ancien du calcul. Les Égyptiens préféraient des fractions
d’unité, c’est-à-dire à numérateur un; ils indiquaient une telle fraction par
son dénominateur, muni d’une marque spéciale; il y avait des signes spéciaux
pour 1/2, 1/3, 2/3. Des fractions générales sont représentées par des
combinaisons additives de fractions d’unité: par exemple, on représentait 2/7
(= 1/4 + 1/28) par:
Il existait des
tables pour réduire des fractions à des sommes de fractions d’unité.
Cette méthode de
fractions d’unité fut adoptée par les Grecs; on indique une telle fraction par
le symbole alphabétique de son dénominateur, muni d’un ou de deux accents. Mais
on écrivait aussi des fractions communes, le numérateur marqué par un accent
précédant le dénominateur marqué par deux accents. Dans les textes
mathématiques, on trouve souvent le dénominateur dans une position d’exposant
du numérateur.
Les Indiens
écrivaient le dénominateur au-dessous du numérateur; la ligne de fraction
horizontale est usitée chez quelques Arabes; elle devient usuelle au Moyen Âge
chrétien. Pour des raisons typographiques, G. W. Leibniz proposait, sans
succès, la notation a : b au lieu de ab ; au XIXe siècle, A. De Morgan
suggérait a /b , notation qui se répand de plus en plus.
Les précurseurs de
nos fractions décimales sont les fractions sexagésimales des Babyloniens. Sans
aucun scrupule, ces derniers continuaient les divisions après ce que l’on
appellerait aujourd’hui la virgule, alors qu’ils ne possédaient pas de signe de
séparation entre les unités et les parties fractionnaires, pas plus que de zéro
terminal. Les fractions sexagésimales furent adoptées par les Grecs et les
calculateurs du Moyen Âge.
En 1585, Simon
Stevin, dit Simon de Bruges, publiait quelques pages auxquelles il donnait le
titre bien caractéristique de: La Disme enseignant facilement expedier par
nombres entiers sans rompuz tous comptes se rencontrant aux affaires des
Hommes. Il proposait d’abolir les fractions communes en faveur du calcul
décimal et de décimaliser la monnaie et les mesures. Dès le début du XVIIe
siècle se répand la notation moderne avec le point décimal ou la virgule.
Les opérations
arithmétiques
Outre les
représentations verbales des opérations, on connaissait dès l’Antiquité des
abréviations ou des signes spéciaux, tels que le q retourné () de Diophante
d’Alexandrie pour la soustraction; souvent l’addition s’exprimait par
juxtaposition. Les signes "moins" et "plus" apparaissent
dans des manuscrits allemands de 1481 et 1486; le premier qui les imprima (mais
sans prétendre à une nouveauté) fut J. Widmann (1489). Ces signes sont employés
pour indiquer non seulement des opérations, mais aussi l’état positif ou
négatif; on a proposé pour l’enseignement scolaire de séparer ces deux
fonctions, par exemple de remplacer _ 3 par _ 3 ou _3 ou 3 _. L’origine des
signes "plus" et "moins" est incertaine, probablement + est
une ligature de "et", tandis que, depuis longtemps, dans les comptes,
la barre horizontale avait servi à séparer le poids brut de la tare.
La croix de
multiplication est plus récente. Michael Stifel (1545) indiquait la
multiplication par un M; François Viète (1591) employait le mot latin in. Le
premier exemple authentique de la croix se trouve chez William Oughtred (1637).
Le point de multiplication provient de Leibniz (dès 1698). On doit noter qu’en
algèbre la multiplication par juxtaposition était une vieille habitude. Le
signe ÷ de division fut introduit par J. H. Rahn (1659) et adopté par les
Anglais: on le trouve encore assez communément dans les textes de langue anglaise.
Le "colon" (c’est-à-dire le signe "deux-points") de Leibniz
pour la division ainsi que le point de multiplication se répandirent grâce à
l’influence des manuels de Christian Wolff.
Le signe d’égalité
provient de Robert Recorde (1557); pendant le XVIIe siècle, son usage fit des
progrès en Angleterre tandis que, sur le Continent, le symbole cartésien (le
symbole des astronomes pour le signe Taurus) prédominait. Grâce à Leibniz, le
signe = l’emporta sur le symbole cartésien au cours du XVIIIe siècle.
Au signe d’égalité
Thomas Harriot (1631) ajoutait ceux de majorité et de minorité: O et S.
La notation
exponentielle des puissances est due à Descartes. L’idée des exposants négatifs
et fractionnaires provient de J. Wallis (1656), mais c’est seulement I. Newton
qui les écrira explicitement. Leibniz (1708) proposait de remplacer
systématiquement les signes de racine par des exposants.
Pour la racine
carrée, la notation R ou , abréviation du latin radix , apparut dans l’œuvre de
Leonardo Fibonacci, dit Léonard de Pise (1220). L’opinion que le signe était un
r déformé est réfutée par des manuscrits allemands de la fin du XVe siècle qui
prennent pour symbole de racine carrée un point avec une queue.
2. Le formalisme
algébrique
La syntaxe
des formules algébriques
Les langues
naturelles doivent leur structure syntactique à un amas chaotique de moyens de
flexion, de subordination, de conjonction, de ponctuation, de mélodie et de
rythme. Mais, très souvent, la structure syntactique s’explique par le sens et
non par des critères formels. "Mathématique et langue française" et
"langue et littérature françaises" ont la même structure formelle,
mais le sens indique des structures syntactiques différentes.
Dans le langage des
expressions algébriques, on s’efforce d’exprimer complètement la structure par
des moyens formels, dont les plus importants sont les parenthèses, crochets et
accolades: (a + b ).c est aussi plein de sens que a + b.c , et on a besoin de
pouvoir les distinguer.
Le système des
règles pour la succession des opérations est plus compliqué qu’on ne pense et
que ne le veulent certains vers mnémotechniques. Passe comme si toutes les
parenthèses ouvrantes étaient placées à gauche. Pour l’addition, qui est
associative, toute règle est superflue.
Ce principe de l’ordre
linéaire est si naturel que, avant l’usage de parenthèses, on structurait des
expressions algébriques au moyen de déviations par rapport à l’ordre linéaire.
Par exemple, Descartes écrit (Œuvres , édition Adam et Tannery, vol. VI, p.
415):
C’est une méthode
qu’on trouve déjà chez Viète; parfois il emploie des crochets placés d’un côté
ou même des deux côtés d’une expression algébrique. Le principe de structure
par rupture de l’ordre linéaire est plus ancien; il est à l’origine de cette
notation des fractions que l’on doit aux Indiens.
Un autre moyen
formel de structure a été la barre horizontale, servant à agréger les termes;
Descartes fut le premier à l’employer à profusion. L’usage de cette barre s’est
conservé jusqu’à la fin du XIXe siècle dans des expressions telles que n + 1.
Parfois, des accolades horizontales ont la même fonction. Le dernier vestige de
cette écriture est la barre du signe de racine a + b ; la barre qui indique la
conjugaison complexe est fonctionnelle plutôt que syntactique. La paire de
parenthèses ne remplaça pas d’emblée la barre. D’abord employée par Stifel
(dans ses manuscrits, 1544), elle prévalut grâce à Leibniz.
Le plus ancien des
principes structurels formels est celui selon lequel certaines opérations en
précèdent d’autres. Le principe selon lequel la multiplication crée une liaison
plus étroite que l’addition et la soustraction est attesté dès les textes
cunéiformes. Il est, en effet, bien naturel de traiter la multiplication comme
une dénomination (2 Z 6, c’est deux sixaines), même si l’on rejette des abus
didactiques (2a +3a = 5a , parce que 2 vaches + 3 vaches = 5 vaches). Cette
interprétation de la multiplication fut historiquement suggérée par le langage
des équations où, dès le début, un problème tel que x 2 + 21 = 10 x était
formulé sous la forme "une chose-carré plus 21 égale 10 choses". À
partir des premières formules algébriques, il ne fut jamais douteux que la
multiplication précédait l’addition et la soustraction, en particulier si on
indiquait la multiplication par juxtaposition; il en fut de même quand la
multiplication fut exprimée par un signe explicite, par exemple chez Viète qui
employait en général le mot in en tant que symbole de multiplication. Dès la
notation exponentielle de Descartes pour les puissances, il devient aussi
évident que l’opération exponentielle précède l’addition, la soustraction et la
multiplication.
Tous ces moyens
structurels étaient de caractère agrégeant; cela est rare dans les langues
naturelles, qui préfèrent la structuration par séparateurs. Des formules telles
que:
qu’on trouve
parfois dans les cahiers de calcul arithmétique, trahissent l’intention d’une
structure par ordre linéaire. Dans les formules mathématiques, au contraire, on
suppose, sans l’indiquer par des parenthèses et sans le dire explicitement, que
le signe d’égalité sépare plus fortement que les autres signes (ce qui est
également vrai pour les signes d’inégalité et d’ordre). Dans le passé, il y a
eu des essais notationnels de structure par séparation. Stevin (1585)
employait) (comme séparateur. On trouve des points et des colons séparateurs
chez M. Rudolff (1525), C. Stifel (1544), L. Van Ceulen (1610) et leurs
contemporains; W. Oughtred (1631), J. Wallis (1670), Jakob Bernoulli (1689) se
servaient du colon comme séparateur; Leibniz (1702) utilisait parfois la
virgule; même chez L. Euler et J. L. Lagrange, il existe de telles notations.
Des ponctuations
séparantes seraient plus économiques et plus faciles à embrasser d’un coup
d’œil. B. Russell et A. N. Whitehead ont employé d’une manière presque
exclusive les ponctuations séparantes dans leurs Principia Mathematica. Au lieu
des parenthèses de force agrégeante graduée, on écrirait des séparateurs de
force graduée. Les ponctuations des Principia Mathematica sont des groupes de
points: tel groupe sépare d’autant plus fortement qu’il compte plus de points.
Cette méthode a été raffinée par H. Freudenthal dans Lincos.
Bien que le système
de ponctuations séparantes soit plus pratique, il est peu vraisemblable qu’on
parvienne un jour à adapter la structure du langage mathématique à ce principe.
Le sens des
formules algébriques
L’interprétation
naïve des formules algébriques est celle d’un rapport sur une suite
d’opérations et leur résultat: 2 + 7 est lu comme un commandement "À 2
ajoutez 7", et la formule:
comme un récit
"À 2 ajoutez 7 et le résultat est 9". Cette interprétation naïve
explique aussi bien la structure par ordre linéaire des expressions.
Selon
l’interprétation acceptée en mathématiques, 2 + 7 ne constitue pas un problème
mais un nombre et, d’une façon générale, a + b est un nombre dès lors que a et
b sont des nombres. Dans cette interprétation, le signe d’égalité se lit
"est la même chose que". Un même objet peut avoir des noms divers,
ainsi "Paris" et "la capitale de la France" désignent le
même objet; le nombre 9 peut être désigné par une infinité d’expressions,
telles que 2 + 7, 10 _ 1, 32, 9.1, etc. Dans cette interprétation, le signe
d’égalité n’est pas un signe mathématique, mais un signe sémantique, exprimant
que deux termes signifient la même chose.
Cette
interprétation s’est développée lentement et, même à l’heure actuelle, certains
auteurs de manuels scolaires ne respectent pas cette convention qui est
l’essence du langage mathématique. En effet, même si l’on peut interpréter 2 +
7 comme un problème, il n’en est pas de même du cas de a + b , si a et b ne
sont pas donnés explicitement.
L’interprétation
statique des expressions algébriques est une intervention qui date probablement
de 1460 et qui peut être attribuée à Johann Müller dit Regiomontanus et à
l’auteur anonyme d’un manuscrit de Munich (1455-1461). Cette nouveauté apparut
avec des équations qui, pour la plupart, comportaient des fractions telles que:
Pour des
expressions avec des nombres connus , l’interprétation naïve est bien
suffisante et, d’autre part, le concept de fraction commune repose sur l’idée
que 27 n’est pas, comme 2 + 7, un problème mais un nombre, idée inhérente à
l’arithmétique indienne, distincte de celle des Égyptiens qui se croyaient
obligés de transformer 27 en 14 + 128. Finalement, l’ordre vertical dans
l’écriture de la fraction produit la première structuration naturelle, avant
même l’emploi des parenthèses.
Selon
l’interprétation moderne, les deux membres d’une équation décrivent le même
objet, et l’équation est l’expression d’une proposition qui affirme cette
identité. Cependant, jusqu’aux textes les plus récents, on trouve des traces du
"style naïf", par exemple:
Ce qui suit
"les coefficients de Fourier ", "nombre" et "pour
tout" devrait, en effet, être un objet mathématique (par exemple, un
nombre) tandis que, dans les expressions précédentes, c’est une proposition.
Évidemment, on veut que le signe d’égalité ou d’ordre ne soit pas lu comme un
prédicat "est égal à" ou "est plus grand que", mais plutôt
comme un attribut "égal à", "plus grand que". Il serait
plus correct d’écrire respectivement:
De telles licences
ne sauraient persister longtemps encore.
Les lettres
Chaque langue
connaît des noms propres et des noms communs. Vercingétorix , la France ,
Sirius , trois , la révolution de février , le Soldat inconnu désignent chacun
un seul objet, tandis que des mots tels que rat , pierre , je , hier , là-bas
sont des termes ambigus. En mathématique, les termes ambigus sont appelés des
variables. La notation des variables est très différente dans les langues
naturelles et dans la mathématique. Les variables des langues naturelles ont un
domaine restreint de variabilité; les variables que l’on vient de citer ne
s’appliquent respectivement qu’à des rats, des pierres, des hommes, des
moments, des lieux. Au contraire, les lettres dont on se sert en tant que
variables en mathématique peuvent désigner tout ce qu’on veut, bien qu’il
s’agisse de préférence d’objets mathématiques. Tandis que les mathématiciens
tiennent à indiquer, dans un contexte donné, la même chose par le même nom et à
répéter ce nom autant de fois qu’on revient sur cette chose, une manie des
langues naturelles veut, au contraire, qu’on évite les répétitions et qu’on remplace
des noms par des synonymes généraux ou accidentels. Ainsi dans la phrase
"Jean s’est brûlé la cervelle dans sa voiture", on désigne la même
personne par quatre termes différents: Jean, se, la, sa.
Puisque pierre est
un nom commun à toutes les pierres, on a besoin d’autres moyens linguistiques
pour distinguer éventuellement des pierres diverses. On satisfait à ce besoin
en parlant de cette pierre-ci et de cette pierre-là, ou bien en disant:
"encore une pierre", ou "la pierre qui est dans ma main", etc.
Lorsqu’on envisagea en géométrie des figures complexes et, en tout cas, dès que
les raisonnements géométriques furent rédigés par écrit, il devint impossible
de se contenter de citations telles que "ce point-ci" et "ce
point-là". Il était bien naturel qu’on numérotât les points d’une figure,
ce qu’on faisait en se servant des lettres de l’alphabet grec qui jouaient en
même temps le rôle de chiffres. On distinguait un point des autres en parlant
du "point à A", ce qui devenait "le point A" et enfin simplement
"A". Cet A peut être interprété comme un nom propre, à savoir le nom
du point de la figure en question auprès duquel se trouve la lettre A. Mais,
étant donné la généralité des énoncés géométriques où A peut être un point
quelconque, les lettres devenaient des noms ambigus de points, donc des
symboles de variables. Grâce à l’alphabet, on peut donc disposer d’un grand
nombre de telles variables, ce qui est un avantage appréciable.
Comparée à l’usage
mathématique des lettres depuis Viète, la pratique des lettres dans la
géométrie grecque paraît bien primitive. On se sert de lettres en tant que noms
d’objets, mais, à partir de ces symboles, on ne construit que très
imparfaitement des mots et des phrases. Si une figure est construite pas à pas,
on donne à chaque nouveau point un nom nouveau. L’imposition de noms ne reflète
ni la marche de la construction ni les relations existantes. Il existe certes
des traces de terminologie algorithmique: si A et B sont deux points, AB est la
droite, ou le segment, qui les joint; mais on attribue à l’intersection de deux
droites à noms donnés un nom arbitraire non algorithmique. Ce système s’est
conservé en géométrie jusqu’à nos jours, et cela malgré les tentatives
algorithmiques de Leibniz en géométrie, dont le programme a été rempli en un
certain sens par le calcul vectoriel.
Il est bon
d’expliquer pour quelle raison Viète (1591) doit être considéré comme fondateur
de notre langage algébrique. On ne cesse de "découvrir" un usage des
lettres en algèbre antérieur à celui de Viète et de lui en retirer la primeur.
En fait, le mérite de Viète ne réside pas dans l’introduction des lettres en
algèbre. Avant lui, on employait bien des lettres en algèbre, mais on imitait
en général la méthode de la géométrie: par exemple, Maurolycus, connu aussi
sous le nom de Maurolico, dit Francesco da Messina (1575) fait usage de
lettres, mais sans calculer avec elles et, s’il fait des additions ou des
multiplications, il introduit une nouvelle lettre pour chaque somme et chaque
produit.
Un algorithme
vraiment algébrique s’est développé assez tôt dans la théorie des équations. On
invente des symboles pour l’inconnue et ses puissances, puis on forme des
sommes algébriques avec ces symboles et des numéraux. Cela commence déjà avec
Diophante. Les Indiens employaient des noms de couleurs pour des inconnues
diverses. Les termes utilisés en arabe pour l’inconnue, qui signifient chose et
racine, et le nom du carré de l’inconnue, qui provient du grec dunamiv et qui
signifie la possession, ont donné naissance aux termes en usage chez les
abacistes et les cossistes du Moyen Âge chrétien: res , radix , causa (cosa
italien) pour l’inconnue, census pour le carré de l’inconnue. Chez
Regiomontanus (1470) et l’anonyme des manuscrits de Munich (1455-1461), des abréviations
de res et de census apparaissent dans les formules; chez Rudolff (1525), un
système de notations pour l’inconnue et ses puissances se trouve développé.
Stevin indiquait la n -ième puissance de l’inconnue par un n dans un cercle. La
plus importante innovation avant Viète est celle de J. Butéon (1559): l’usage
des lettres A, B, C pour les inconnues dans des équations à plusieurs
inconnues.
Le grand mérite de
Viète est d’avoir amalgamé la méthode traditionnelle en géométrie et la méthode
nouvelle en algèbre. En algèbre, il indiquait par des lettres non seulement les
inconnues, ce qui était une habitude algébrique, mais aussi les indéterminées,
ce qu’on avait fait en géométrie depuis l’Antiquité; d’autre part, avec ces
lettres, il formait des mots, c’est-à-dire des expressions algébriques avec
lesquelles il opérait comme on l’avait fait depuis un siècle dans les
équations.
Ce fut une
innovation qui marqua une époque. Il faut toutefois noter que, sous certains
aspects, le formalisme de Viète était plus lourd que celui de ses
prédécesseurs. Il indiquait la multiplication et la formation des puissances
par des mots latins, même déclinés: quadratum , cubus , quadrato-quadratum pour
la deuxième, la troisième, la quatrième puissance, potestas pour une puissance générale;
et, s’il y en avait deux dans le même contexte, il désignait l’une par potestas
et l’autre par gradus
Le terme de
fonction a été introduit par Leibniz (1692) dans un contexte géométrique: il
s’agit pour lui de portions de lignes droites qui dépendent d’un point variable
sur une courbe, comme la tangente ou la normale. Jean Bernoulli, en 1698, a
repris ce terme pour désigner une quantité X "composée d’une manière
quelconque de x et de quantités données", où x désigne en l’occurrence l’ordonnée
du point variable sur la courbe; plus tard (1718), il proposera de noter x une
fonction d’une quantité variable x (pas forcément rattachée à un contexte
géométrique). Le concept de fonction ainsi dégagé a servi de base à Euler pour
son exposé de l’analyse mathématique (1748) d’un point de vue formel et non
plus géométrique. Euler définit une variable comme une quantité qui admet
toutes les valeurs possibles, par opposition à une constante, dont la valeur
est fixée, et il représente géométriquement une variable par un axe; ensuite,
il définit une fonction d’une variable comme "une expression analytique
composée d’une manière quelconque de cette quantité variable et de nombres ou
de quantités constants". Bien entendu, il ne précise pas ce qu’il entend par
"expression analytique", ni la façon dont elle doit être
"composée": la suite du livre montre que c’est au moyen des
opérations algébriques élémentaires éventuellement itérées indéfiniment
(séries, produits infinis) et des opérations transcendantes comme log, exp,
sin, cos; suivant la manière dont elles sont composées, Euler classe les
fonctions en algébriques et transcendantes, les fonctions algébriques étant
elles-mêmes subdivisées en rationnelles et irrationnelles.
Les fonctions sont
représentées graphiquement par des courbes dans le plan, où l’ordonnée est la
valeur de la fonction lorsque l’abscisse est la valeur de la variable;
inversement, Euler se demande si une courbe donnée correspond à une fonction,
et il est amené à distinguer les courbes "continues", graphes de
fonctions définies par des expressions analytiques, et les courbes
"discontinues" (ou "mixtes" ou "irrégulières"),
réunion de morceaux qui correspondent à diverses fonctions. Par la suite, Euler
sera amené à étendre le concept de fonction, en remarquant que les
"fonctions arbitraires" intervenant dans la solution de l’équation
des cordes vibrantes donnée par d’Alembert (1747) n’étaient pas nécessairement
définies par des expressions analytiques, mais plutôt par un graphe obtenu par
le "tracé libre de la main"; c’est l’origine physique du problème qui
conduisit Euler à cette définition très générale des fonctions. Daniel
Bernoulli (1753) a donné une autre solution de l’équation des cordes vibrantes
au moyen de séries trigonométriques, et il pensait que sa solution était aussi
générale que celle de d’Alembert-Euler, ce qu’Euler a vivement contesté. On se
trouvait donc en présence de deux notions de fonction: la conception formelle
d’expression analytique, et la conception "ensembliste" plus générale
de correspondance arbitraire; le problème du rapport entre les deux notions se
trouvait posé et sa solution devait attendre la fin du XIXe siècle.
Tandis que Lagrange
(Théorie des fonctions analytiques , 1797), restait attaché à la définition des
fonctions par des expressions analytiques (sa théorie est fondée sur
l’utilisation des développements en séries entières), Fourier observa dès 1807
que la formule intégrale qui donne des coefficients du développement d’une
fonction en série trigonométrique conservait un sens pour une fonction
arbitraire du type de celles introduites par Euler (l’intégrale étant
interprétée comme une aire dont l’existence est admise comme une évidence
intuitive); il en déduisit, sans se poser de problème de convergence, qu’une
fonction arbitraire pouvait toujours être représentée par une série
trigonométrique, mais la notion de fonction arbitraire était encore extrêmement
vague pour lui. Les travaux de Bolzano (1817) et de Cauchy (1821) devaient
apporter un peu de clarté sur cette notion, en introduisant la définition des
fonctions continues (au sens moderne du terme, qui ne se réfère pas du tout aux
"courbes continues" d’Euler); Cauchy développa une théorie de
l’intégration des fonctions continues dégagée de l’intuition géométrique, et Dirichlet
(1829) parvint à démontrer qu’une fonction continue monotone par par morceaux
était effectivement représentée par sa série de Fourier. Les réflexions de
Dirichlet pour l’extension à des fonctions plus générales le conduisirent à une
conception des fonctions arbitraires beaucoup plus vaste que celle de ses
prédécesseurs (pour qui il s’agissait essentiellement de fonctions continues
par morceaux): comme exemple de fonction discontinue, il donne la fonction f
telle que f (x ) vaille 1 pour x rationnel et 0 pour x irrationnel (1837); il
pose alors le problème de l’intégration des fonctions arbitraires suffisamment
générales (par exemple avec un ensemble rare de discontinuités): ce devait être
l’objet de travaux de Riemann (pour les fonctions dont l’ensemble de
discontinuités est de mesure nulle) et de Lebesgue (pour une classe beaucoup
plus large, stable par des passages à la limite simple).
P. Du Bois-Reymond
montra en 1873 que, contrairement à la conviction des mathématiciens, la série
de Fourier d’une fonction continue ne converge pas nécessairement vers cette
fonction. Mais Weierstrass parvint cependant à raccorder les deux notions de
fonction (expression analytique et fonction arbitraire) en montrant qu’une
fonction continue est toujours la somme d’une série de polynômes convergeant
uniformément sur tout intervalle fermé et borné (1885). Le problème de la
représentation analytique des fonctions discontinues allait être abordé en 1898
par Baire, qui caractérise les fonctions discontinues limites simples des
fonctions continues (fonctions de classe 1), puis donne une classification des
fonctions selon laquelle les fonctions de classe a sont des limites simples de
fonctions des classes aH avec aH S a (a et aH peuvent être des ordinaux
transfinis); Lebesgue (1905) montra l’existence de fonctions de chacune des
classes de Baire et aussi de fonctions échappant à la classification de Baire:
de telles fonctions n’admettent pas de représentation analytique.
À côté des
fonctions d’une variable réelle, que nous avons considérées jusqu’à présent,
les mathématiciens ont aussi étudié les fonctions de plusieurs variables, dont
le domaine de définition est une partie d’un espace Rn . Par ailleurs, le
calcul des variations conduisit à la notion de fonction dont la variable est
une courbe (théorie des fonctions de lignes développée par V. Volterra); M.
Fréchet (1904) et E. H. Moore (1905) étendirent ces conceptions en prenant la
variable dans un ensemble arbitraire, et Fréchet (1909) eut même l’idée de
considérer des fonctions non plus numériques, mais prenant leurs valeurs dans
un ensemble quelconque: c’est la notion générale de fonction ou application
utilisée de nos jours.