OpenAI résout le problème d'Erdős : un modèle IA vient de démontrer un théorème de géométrie qui résistait depuis 80 ans
🔎 L'IA ne fait plus que réciter — elle découvre
En mai 2026, OpenAI annonce qu'un de ses modèles de raisonnement interne a réfuté une conjecture posée par Paul Erdős en 1946. Il ne s'agit pas d'un benchmark synthétique gonflé au score. C'est une preuve mathématique originale, validée par des chercheurs, qui utilise des outils de théorie algébrique des nombres pour dépasser les limites connues du problème de la distance unitaire planaire.
Ce résultat change le statut de l'IA en mathématiques. Jusqu'ici, les systèmes comme AlphaGeometry ou AlphaTensor excellaient sur des problèmes fermés, avec des règles claires et un espace de recherche borné. Là, le modèle d'OpenAI a navigué dans un problème ouvert — c'est-à-dire un problème dont personne ne connaissait la réponse à l'avance.
Le timing n'est pas anodin. Il coïncide avec la montée en puissance des modèles de raisonnement (GPT-5.5, Claude Opus 4.7, Gemini 3 Pro Deep Think) qui commencent à montrer des capacités de planification et de déduction bien au-delà de la paraphrase.
L'essentiel
- Un modèle de raisonnement interne d'OpenAI a réfuté la conjecture d'Erdős sur les distances unitaires, un problème ouvert depuis 1946 en géométrie discrète.
- La preuve repose sur la théorie algébrique des nombres, pas sur une brute-force computationnelle — le modèle a découvert une famille d'arrangements de points inconnus jusque-là.
- Il s'agit d'un modèle généraliste, pas d'un système spécialisé en mathématiques, ce qui rend le résultat plus significatif pour l'avenir de la recherche.
- OpenAI avait déjà fait une annonce prématurée sur un problème d'Erdős auparavant — cette fois, la preuve tient la route selon les premiers experts consultés.
- Ce résultat dépasse les précédentes avancées IA en mathématiques (AlphaGeometry, AlphaTensor) car il s'attaque à un problème véritablement ouvert.
Outils recommandés
| Outil | Usage principal | Prix (juin 2025, vérifiez sur openai.com) | Idéal pour |
|---|---|---|---|
| GPT-5.5 | Raisonnement avancé, recherche | Abonnement ChatGPT Pro/Team | Raisonnement mathématique, analyse de preuves |
| Claude Opus 4.7 (Adaptive) | Raisonnement long, rédaction technique | Abonnement Claude Pro/Team | Vérification de preuves, rédaction formelle |
| Gemini 3 Pro Deep Think | Raisonnement profond, multimodal | Abonnement Google AI Ultra | Problèmes ouverts nécessitant des sauts conceptuels |
Le problème d'Erdős : simple à énoncer, impossible à résoudre
La question est d'une élégance trompeuse. Combien de paires de points peut-on placer dans un plan de sorte que chaque paire soit exactement à une distance de 1 ?
Paul Erdős a formulé ce problème en 1946. Il a conjecturé que le nombre maximum de paires growait en O(n^(1+ε)) — autrement dit, à peu près linéairement avec le nombre de points.
Pendant près de 80 ans, les mathématiciens ont grignoté des bornes. La meilleure construction connue reposait sur des grilles carrées, qui donnent environ n^(1 + c/log log n) paires. Personne n'avait réussi à faire mieux de manière significative.
Ce qui rend le problème vicieux, c'est qu'il est ouvert. Il n'y a pas de réponse dans un manuel à consulter. Chaque amélioration exige une idée structurellement nouvelle sur la façon d'arranger des points dans le plan.
C'est exactement le genre de problème où les LLM classiques échouent : pas de pattern reconnaissable dans les données d'entraînement, pas de solution connue à reproduire.
Ce que le modèle d'OpenAI a réellement trouvé
Le modèle n'a pas simplement optimisé une grille existante. Selon les détails publiés par OpenAI et rapportés par The Guardian, il a découvert une famille d'arrangements de points fondée sur la théorie algébrique des nombres.
Concrètement, au lieu de placer les points sur une grille carrée régulière, le modèle a exploité les propriétés de certains corps de nombres algébriques pour générer des configurations où les distances unitaires apparaissent plus densément que dans toute construction connue.
La démonstration passe par plusieurs étapes :
Construction algébrique. Le modèle identifie des ensembles de points dans le plan dont les coordonnées sont des éléments de corps de nombres spécifiques. Ces ensembles ont la propriété que beaucoup de paires sont automatiquement à distance 1.
Comptage. Il prouve ensuite que le nombre de paires à distance 1 dans ces arrangements dépasse la borne associée à la conjecture d'Erdős, la réfutant ainsi.
Généralisation. Il montre que cette famille de constructions n'est pas un cas isolé mais peut être étendue, ce qui rend la réfutation robuste.
TechCrunch insiste sur un point crucial : ce n'est pas un système entraîné uniquement sur les mathématiques. C'est un modèle de raisonnement généraliste qui a appliqué des outils venant de branches différentes des mathématiques pour trouver une solution.
Pourquoi c'est différent d'AlphaGeometry et AlphaTensor
Comparaison nécessaire. Les précédents succès de l'IA en mathématiques ont des caractéristiques très différentes.
AlphaGeometry (DeepMind, 2024) résolvait des problèmes de géométrie olympique. Mais ces problèmes sont fermés : on sait qu'ils ont une solution, les axiomes sont fixés, et l'espace de recherche, bien que grand, est borné. Le système combinait un LLM pour proposer des constructions et un moteur symbolique pour déduire.
AlphaTensor (DeepMind, 2022) a trouvé de nouveaux algorithmes de multiplication matricielle. Là encore, c'est un espace de recherche bien défini : on cherche la séquence de multiplications la plus courte pour un format donné.
Le problème d'Erdős est d'une autre nature. Personne ne savait si la conjecture était vraie ou fausse. L'espace des preuves possibles n'est pas borné par un jeu d'axiomes clos. Et surtout, la solution nécessite de connecter des domaines mathématiques distincts — géométrie discrète et théorie algébrique des nombres — ce qui demande une forme de créativité conceptuelle.
| Système | Type de problème | Espace de recherche | Résultat |
|---|---|---|---|
| AlphaGeometry | Géométrie olympique (fermé) | Borne par axiomes | State of the art sur les Olympiades |
| AlphaTensor | Multiplication matricielle (fermé) | Borne par la taille des matrices | Nouveaux algorithmes |
| Modèle OpenAI | Problème d'Erdős (ouvert) | Non borné | Réfutation d'une conjecture |
Le saut qualitatif est réel. Passer de l'optimisation dans un espace connu à la découverte dans un espace inconnu change la nature même de ce qu'on attend de l'IA en sciences.
Les réactions des mathématiciens : prudence et émerveillement
Les réactions sont nuancées, et c'est sain. Scientific American rapporte que plusieurs mathématiciens sont impressionnés par la qualité des idées, notamment le pont inattendu entre géométrie discrète et théorie des nombres.
La réaction de la communauté se structure autour de trois axes.
L'émerveillement devant les idées. La construction algébrique est jugée "ingénieuse" par plusieurs chercheurs cités par le New York Post. Ce n'est pas une astuce triviale — c'est une idée que personne n'avait vue en 80 ans.
La prudence sur la validation. La preuve n'a pas encore passé le processus de revue par les pairs complet. Certains mathématiciens soulignent que les preuves en théorie des nombres peuvent contenir des erreurs subtiles qui ne se révèlent qu'après des mois de vérification.
Le spectre de l'épisode précédent. Comme le rappelle LODJ.ma, OpenAI avait déjà fait une annonce fracassante sur un problème d'Erdős — les solutions prétendument nouvelles existaient déjà dans la littérature. Cet épisode embarrassant rend la communauté naturellement méfiante.
Cette fois cependant, les premiers retours sont nettement plus positifs. BFM TV qualifie le résultat d'"étape majeure dans les mathématiques", et Les Numériques soulignent le caractère autonome de la découverte.
Un modèle généraliste, pas un outil spécialisé
C'est peut-être le point le plus important pour l'avenir. D'après ExplainX, le modèle utilisé n'est pas un système conçu exclusivement pour les mathématiques.
C'est un modèle de raisonnement interne qui partage son architecture avec les modèles généraux d'OpenAI. La différence réside dans les incitations au raisonnement en chaîne, la capacité à planifier sur de longues séquences de déduction, et probablement des mécanismes de vérification interne.
Pourquoi c'est significatif ? Parce qu'un modèle spécialisé en géométrie discrète n'aurait probablement pas pensé à utiliser la théorie algébrique des nombres. C'est précisément le fait que le modèle a été entraîné sur un large spectre de mathématiques qui lui a permis de faire ce pont conceptuel.
Dans le classement agentic actuel en 2026, GPT-5.5 d'OpenAI domine avec un score de 98.2, suivi de Gemini 3 Pro Deep Think (95.4) et Claude Opus 4.7 Adaptive (94.3). Ces scores reflètent une capacité de raisonnement qui dépasse maintenant la simple reproduction de patterns.
Pour choisir le bon modèle selon votre besoin de raisonnement, voir Google Gemini vs ChatGPT vs Claude : lequel pour quel usage ?.
Ce que ça implique pour la recherche scientifique
L'impact dépasse la géométrie discrète. Si un modèle généraliste peut réfuter une conjecture ouverte en mathématiques, la question devient : quels autres domaines scientifiques sont vulnérables ?
En physique théorique, de nombreux problèmes ouverts impliquent de connecter des formalismes différents — exactement le type de saut que le modèle a fait entre géométrie et théorie des nombres.
En informatique théorique, les conjectures sur la complexité (P vs NP, bornes inférieures) pourraient bénéficier d'approches similaires, même si le problème d'Erdős est structurellement plus accessible.
En chimie computationnelle, la découverte de nouvelles configurations moléculaires ressemble formellement au problème d'Erdős : trouver des arrangements d'éléments qui satisfont des contraintes de distance.
Phys.org note que ce résultat montre que l'IA peut désormais "attaquer des problèmes ouverts majeurs en mathématiques de manière autonome" — formulation forte qui aurait semblé exagérée il y a seulement un an.
Les limites qu'il faut garder en tête
Excès d'enthousiasme mise en garde. Ce résultat est majeur, mais il ne signe pas la fin des mathématiciens.
Le modèle n'a pas "compris" le problème. Il a généré une séquence de déductions valides qui mène à une réfutation. La distinction est importante : il n'y a pas d'intentionnalité, pas de intuition géométrique au sens humain. Le modèle ne "voit" pas les points dans le plan.
La vérification humaine reste indispensable. La preuve doit être lue, comprise et validée par des mathématiciens. Le modèle peut produire des preuves, mais il ne peut pas encore garantir leur correction avec certitude absolue. Un faux positif élégant reste possible.
Un problème ne fait pas un programme de recherche. Erdős a posé des centaines de problèmes. En résoudre un, même emblématique, ne signifie pas que l'IA peut systématiquement attaquer les problèmes ouverts. La reproductibilité reste à démontrer.
L'impact sur le classement des modèles est indirect. Ce résultat vient d'un modèle de raisonnement interne qui n'est pas disponible publiquement. Les modèles accessibles comme GPT-5.4 Pro (91.8 en agentic) ou Claude Sonnet 4.6 (81.4) n'ont pas encore démontré ce niveau de découverte autonome.
Le lien avec le parameter golf et l'efficacité des modèles
Il y a une ironie intéressante. OpenAI n'a pas communiqué sur la taille du modèle utilisé pour cette découverte. Mais dans un contexte où le parameter golf montre que les petits modèles bien entraînés surpassent souvent les gros modèles mal optimisés, la question se pose.
La capacité de découverte mathématique dépend-elle de la taille du modèle, ou de la qualité du raisonnement interne ? Si un modèle relativement compact peut réfuter Erdős, cela renforce la thèse que l'efficacité prime sur l'échelle brute.
Les modèles self-host comme Kimi K2.6 (88.1 en agentic) et GLM-5 Reasoning (82) montrent que l'écosystème s'ouvre au-delà d'OpenAI. La découverte sur Erdős est impressionnante, mais elle pourrait accélérer la conviction de la communauté qu'on n'a pas besoin de modèles géants pour faire de la recherche.
❌ Erreurs courantes
Erreur 1 : Confondre réfutation et résolution
Dire qu'OpenAI a "résolu" le problème d'Erdős est inexact. Le modèle a réfuté la conjecture — il a montré qu'elle est fausse. Mais le problème original (trouver la borne exacte) reste ouvert. La nuance est importante dans tout article ou discussion technique.
Erreur 2 : Comparer avec les erreurs passées d'OpenAI sans nuance
Oui, OpenAI s'était planté sur un problème d'Erdős auparavant. Mais assimiler les deux épisodes est une erreur. Cette fois, la preuve a été examinée par des mathématiciens externes et les premières réactions sont positives. Ignorer cette différence, c'est tomber dans le cynisme inverse.
Erreur 3 : Présenter le modèle comme un mathématicien autonome
Le modèle n'a pas choisi de travailler sur Erdős. Il n'a pas décidé que la théorie algébrique des nombres était la bonne approche après une nuit de réflexion. Un humain a formulé le problème, configuré le système, et interprété le résultat. L'IA est un outil de découverte, pas un chercheur indépendant.
Erreur 4 : En déduire que tous les problèmes ouverts vont tomber
Le problème d'Erdős a des propriétés qui le rendent relativement "amenable" à l'IA : énoncé simple, connexions avec d'autres domaines, espace de preuves partiellement structuré. Transposer directement ce résultat à des conjectures comme l'hypothèse de Riemann ou P vs NP est une erreur de généralisation.
❓ Questions fréquentes
Quel est le problème d'Erdős exactement ?
C'est le problème de la distance unitaire planaire : combien de paires de points peut-on placer dans un plan pour que chaque paire soit exactement à distance 1 ? Erdős a conjecturé en 1946 que le maximum est proche de linéaire.
Le modèle a-t-il travaillé seul ?
Non. Des chercheurs d'OpenAI ont formulé le problème, orienté le modèle et vérifié la sortie. Le terme "autonome" utilisé par certains médias signifie que le modèle a produit la preuve sans intervention humaine pendant le processus de raisonnement, pas que le projet entier était non supervisé.
La preuve est-elle validée ?
Elle a été examinée par plusieurs mathématiciens avec des retours positifs, mais n'a pas encore passé le processus complet de revue par les pairs dans une journal académique. La prudence reste de mise.
Quel modèle exact a été utilisé ?
OpenAI parle d'un "modèle de raisonnement interne" sans le nommer publiquement. Ce n'est pas GPT-5.5 directement accessible via l'API. Il s'agit probablement d'une variante optimisée pour le raisonnement en chaîne longue.
Est-ce que ça remet en cause le travail des mathématiciens ?
Non. Le modèle a produit une preuve, mais c'est la communauté mathématique qui la valide, l'interprète et l'intègre dans le corpus de connaissances. L'IA devient un collaborateur puissant, pas un remplaçant.
✅ Conclusion
Un modèle généraliste vient de réfuter une conjecture que des générations de mathématiciens n'avaient pas pu attaquer en 80 ans — non par brute-force, mais par une idée algébrique originale. Ce n'est plus de l'optimisation dans un espace connu, c'est de la découverte dans l'inconnu. Le reste est une question de calendrier : à quand le prochain problème ouvert tombé par l'IA ?