11 novembre 2023 — Logique, Théorie des corps, Transfert
On distingue parfois en mathématiques deux concepts que sont les mathématiques continues et les mathématiques discrètes.
Le corps des nombres réels et son extension sont des exemples typiques d’objets continus.
D’un autre côté, le discret s’intéresse aux ensembles finis ou dénombrables. Cela concerne par exemple l’arithmétique ou le formalisme utilisé pour étudier théoriquement l’informatique — les ordinateurs manipulent des objets représentés par des entiers.
L’utilisation des courbes elliptiques en cryptographie est un exemple intéressant à cet égard : la notion de courbe est issue de considérations liées au continu et les outils pour les étudier sont historiquement ceux du calcul infinitésimal. Pourtant, ce même type de formalisme est mis en œuvre en cryptographie dans un cadre par nature fini — on pourra lire cette entrée qui présente un usage des courbes elliptiques en cryptographie.
Dans cet article, nous allons faire appel à des considérations du domaine de la logique, pour montrer comment certains résultats exprimés dans la théorie des corps peuvent se transférer d’un cadre continu à un cadre discret (et vice versa).
La théorie des corps vise à extraire un langage et des propriétés qu’ont en commun des structures comme les nombres rationnels, les nombres réels ou les nombres complexes.
On peut alors énoncer des propositions et tenter de les prouver à l’aide des axiomes de la théorie et des règles d’inférence de la logique — ce qui revient en pratique à effectuer des manipulations sur des phrases mathématiques, sans qu’il soit nécessaire de leur donner un sens particulier.
Les théorèmes démontrés dans ce cadre s’appliqueront alors à toute structure vérifiant les axiomes de la théorie.
💡 Dans tout cet article, le mot théorie est employé au sens de la logique du premier ordre. J’avais déjà abordé ce sujet dans un article au sujet des théories arithmétiques, j’essaierai néanmoins de ne pas supposer trop de prérequis.
La théorie des corps introduit des symboles de constantes et , des symboles de fonction et les axiomes suivants :
Un corps est un modèle de cette théorie, c’est-à-dire une structure telle que :
Il est bien connu que , ou sont des corps — ils sont d’ailleurs à l’origine de la formalisation de ce concept. Ils vérifient et une telle séquence d’extensions de corps est parfois appelée une tour.
Si est un nombre premier, on peut construire un corps fini de taille en considérant le calcul dans les entiers modulo — ceci est essentiellement une conséquence de l’identité de Bézout. Le corps ainsi obtenu est noté et vérifie en particulier l’égalité : est de caractéristique .
De façon générale, pour tout entier et en notant , il existe un unique corps fini de taille . est une extension de que l’on peut construire comme corps de décomposition du polynôme , ce qui revient (très sommairement) à introduire successivement des racines de ses facteurs irréductibles.
Il s’agit du même type de procédé (on parle d’extension algébrique) qui permet de construire à partir de en ajoutant une racine au polynôme . Dans le cas de , le corps obtenu est algébriquement clos et il est impossible de réitérer le processus.
Le corps lui est fini, et il est toujours possible de trouver un nouveau polynôme irréductible de degré et ainsi de construire une nouvelle extension (ce qui donne dans ce cas ).
On peut par exemple obtenir une tour d’extensions que l’on peut faire croître indéfiniment (j’ai choisi d’utiliser la factorielle car , ce qui résulte essentiellement des propriétés des polynômes mentionnés plus haut).
On peut associer à cette construction un ensemble limite noté qui est infini dénombrable.
Par ailleurs, si est un polynôme à coefficients dans , il existe tel que les coefficients de soient tous dans . Si est un facteur irréductible de degré de dans , admet une racine dans . On en déduit que est un corps algébriquement clos.
💡 En toute rigueur, la construction de utilise la notion de limite inductive. Notez qu’il est tout à fait possible de représenter informatiquement et de façon exacte les éléments de : on pourra lire par exemple Standard Generators of Finite Fields and their Cyclic Subgroups.
Comme je le mentionnais plus haut, c’est un résultat bien connu que dans , tout polynôme non constant admet au moins une racine. Il en existe une multitude de preuves qui, d’une façon ou d’une autre, font toutes appel à des propriétés topologiques correspondant à l’idée que (et par extension ) n’a “pas de trou”.
Le résultat en lui-même n’est pas propre à — on peut toujours construire la clôture algébrique d’un corps, comme — et s’exprime bien dans le langage de la théorie des corps.
La théorie des corps algébriquement clos étend la théorie des corps en y ajoutant pour chaque , l’axiome .
La formule suivante (dans laquelle désignent des variables libres) peut se déduire des axiomes de la théorie des corps :
Cette formule correspond à un résultat classique d’algèbre linéaire, caractérisant l’existence de zéros non triviaux d’un système linéaire en fonction du déterminant de celui-ci.
Il s’agit d’une équivalence entre les formules (portant sur quatre variables libres) et suivantes :
La formule est une formule quantifiée : elle comporte deux variables liées par des quantificateurs existentiels . La formule ne comporte quant à elle aucun quantificateur : on dit qu’on a éliminé les quantificateurs de .
Il est impossible, dans le cadre de la théorie des corps, d’éliminer les quantificateurs de la formule — comme nous le justifierons plus loin, cela impliquerait la décidabilité de cette formule en caractéristique zéro, qui aurait alors même valeur de vérité dans et .
En revanche, dans la théorie des corps algébriquement clos, cette formule est un théorème et en particulier on peut en éliminer le quantificateur : (symbole logique signifiant vrai, par opposition à ).
Dans l’exemple ci-dessous, nous utilisons le discriminant du polynôme pour éliminer les quantificateurs d’une formule signifiant que admet (au moins) deux racines distinctes :
En fait, et c’est là un résultat remarquable, la théorie des corps algébriquement clos admet l’élimination des quantificateurs : pour toute formule quantifiée qu’elle est capable d’exprimer, il existe une formule équivalente sans quantificateurs.
Mieux encore, on peut décrire un algorithme qui va effectuer cette transformation : cet algorithme prend en entrée une formule quantifiée et, en utilisant les axiomes de la théorie des corps algébriquement clos, transforme cette formule en une formule équivalente sans quantificateurs.
L’article A Formal Quantifier Elimination for Algebraically Closed Fields décrit une façon de procéder.
Les points clefs de ce procédé, résumés de façon très sommaire (il faudra lire l’article si vous voulez en savoir plus), sont :
L’élimination des quantificateurs telle que décrite ici s’applique à toute formule, avec ou sans variable libre. Dans le cas d’une proposition (formule sans variable libre), la formule résultant de l’élimination des quantificateurs n’a plus aucune variable (libre ou liée).
Après simplification, et comme dans l’exemple étudié précédemment (cas du discriminant), les atomes de la proposition résultante sont alors de la forme (on utilise abusivement un nombre premier pour désigner l’expression ).
Une proposition est dite décidable dans une théorie si ou sa négation est démontrable dans cette théorie.
Une théorie dont toutes les propositions sont décidables est dite complète.
Par exemple, n’est pas une proposition décidable de la théorie des corps, mais c’est une proposition décidable de la théorie des corps algébriquement clos.
La proposition n’est en revanche pas décidable dans la théorie des corps algébriquement clos — elle est fausse dans mais vraie dans .
Ceci nous montre qu’aucune de ces deux théories n’est complète.
Pour tout nombre premier , notons la proposition .
La théorie des corps algébriquement clos de caractéristique 0 est la théorie obtenue en ajoutant les axiomes , pour tout nombre premier , à la théorie des corps algébriquement clos.
Pour un nombre premier fixé, la théorie des corps algébriquement clos de caractéristique est la théorie obtenue en ajoutant l’axiome à la théorie des corps algébriquement clos.
Ces théories sont complètes : par élimination des quantificateurs (dans la théorie des corps algébriquement clos), toute proposition se ramène à une proposition équivalente constituée d’atomes reliés par des connecteurs logiques. Une fois la caractéristique fixée, la valeur de vérité de chacun de ces atomes est entièrement déterminée et peut alors être évaluée, par exemple par un algorithme.
Étant donnée une proposition de la théorie des corps, on a vu que pour toute caractéristique (ici ou un nombre premier), est décidable dans la théorie des corps algébriquement clos de caractéristique : c’est la complétude.
Notons si est un théorème, si est un théorème (de la théorie des corps algébriquement clos de caractéristique ).
Par élimination des quantificateurs, on obtient une proposition équivalente (dans la théorie des corps algébriquement clos) comportant un nombre fini d’atomes .
Notons le plus petit nombre premier majorant strictement les nombres premiers intervenant dans ces atomes de .
Pour , la valeur de vérité des atomes ne change plus : et de même .
Par complétude, en considérant des cas particuliers de corps algébriquement clos pour chaque caractéristique, on en déduit le théorème de transfert ci-dessous.
Étant donné une proposition de la théorie des corps, on a équivalence entre :
On désigne parfois sous le nom de principe de Lefschetz l’équivalence entre les points (1) et (2) ci-dessus. Ce principe permet de justifier que certains résultats algébriques obtenus sur , par exemple avec les outils de l’analyse complexe ou de la topologie, se généralisent à tout corps algébriquement clos de caractéristique 0.
L’équivalence avec le point (3) nous permet également d’obtenir le résultat pour des caractéristiques “suffisamment grandes” — pour une formule donnée, on peut être plus précis en éliminant les quantificateurs pour expliciter des conditions sur la caractéristique .
Les courbes elliptiques sont des courbes associées à certaines équations algébriques et sur lesquelles on peut définir une loi de groupe commutatif.
Les outils de l’analyse complexe et en particulier l’étude des fonctions elliptiques comme la fonction ℘ de Weierstrass permettent de faire apparaître naturellement le concept de courbe elliptique et la loi de groupe associée dans le cas complexe.
Dans ce cas, la loi de groupe correspond, à un isomorphisme près, à l’addition des points sur un tore (voir l’article Wikipedia).
Il est possible (mais fastidieux) de formuler certaines des propriétés de cette loi de groupe dans la théorie des corps et d’étendre, par transfert, leur validité à d’autres corps algébriquement clos.
L’image ci-dessus met en évidence (dans le cas ) le fait que le sous-groupe des points d’ordre d’une courbe elliptique complexe est de cardinal . Ce résultat se transfère à certaines caractéristiques et est fondamental dans la compréhension de certains vecteurs d’attaque de la cryptographie sur courbes elliptiques. Cet exemple est mentionné en page 10 de la présentation The group structure of rational points of elliptic curves over a finite field de Damien Robert.
Ce théorème affirme que pour tout entier naturel , si est une fonction polynomiale de dans (chacune de ses fonctions coordonnées est un polynôme en variables) injective, alors est surjective.
Nous allons le montrer dans le cas et pour des polynômes de degré au plus . La proposition correspondante, qui comme nous allons le voir est déjà assez complexe, illustre le procédé qui restera valable pour tout et tout majorant du degré.
Si je n’ai pas fait d’erreur, la proposition suivante de la théorie des corps exprime le résultat recherché pour les fonctions de cette forme :
Par ailleurs :
Par le théorème de transfert (ici (3) ⇒ (2)), on en déduit que est vraie dans .
Cet exemple est tiré d’un article d’Élisabeth Bouscaren sur la théorie des modèles publié dans la gazette de la SMF. Cet article utilise la notion d’ultraproduit pour établir le théorème de transfert mentionné plus haut, ce qui permet d’obtenir des résultats de portée plus générale. L’approche ad hoc développée ici a le mérite de ne pas nécessiter trop de formalisme et de décrire un algorithme permettant l’élimination des quantificateurs dans le cas des corps algébriquement clos.
Maths et applications, avec les mains et avec du code 💻
Suivre sur Twitter