OpenAI et les problèmes d'Erdős : anatomie d'une preuve mathématique

⏱️ Cet article a été publié il y a 64 jours. Dernière mise à jour : 21 mai 2026

📋 En bref

Le 20 mai 2026, OpenAI annonce qu'un de ses modèles a réfuté une conjecture géométrique posée par Paul Erdős en 1946. L'entreprise affirme qu'il s'agit du

▸ Une annonce qui rompt avec les précédents épisodes
▸ La thèse de ce dossier
▸ Contexte historique : Erdős, ses problèmes, et 80 ans d'attente
▸ Analyse technique : ce que dit exactement la preuve

Le 20 mai 2026, OpenAI annonce qu’un de ses modèles a réfuté une conjecture géométrique posée par Paul Erdős en 1946. L’entreprise affirme qu’il s’agit du premier problème ouvert majeur résolu de façon autonome par une intelligence artificielle. Cette fois, des mathématiciens de premier plan ont publiquement validé la démarche. Décryptage d’une annonce qui redéfinit le périmètre des sciences assistées par machine.

🤖 Transparence IA — Cet article a été rédigé avec l'assistance d'outils d'IA générative à partir de sources primaires identifiées, puis relu et validé par Mohamed Meguedmi, fondateur de LagazetteIA.

Points clés 1. OpenAI revendique la résolution autonome d’une conjecture géométrique formulée par Paul Erdős en 1946, soit près de 80 ans d’attente. 2. La preuve aurait été produite par un nouveau modèle de raisonnement généraliste, non spécialisé en mathématiques. 3. Selon TechCrunch (20 mai 2026), GPT-5 aurait également trouvé des solutions à 10 autres problèmes d’Erdős non résolus et progressé sur 11 supplémentaires. 4. Des mathématiciens reconnus — Noga Alon, Melanie Wood, Thomas Bloom — ont publié des commentaires de soutien, contrairement aux précédentes annonces. 5. Une formulation antérieure du même résultat avait été qualifiée de « dramatic misrepresentation » par la communauté, d’où la prudence inédite du laboratoire.

Sommaire

Une annonce qui rompt avec les précédents épisodes

Depuis trois ans, les laboratoires d’IA multiplient les communiqués revendiquant des percées mathématiques. La plupart se sont soldés par des rectificatifs gênants. Des chercheurs ont qualifié certaines affirmations de « dramatic misrepresentation », pour reprendre le terme employé à propos d’une précédente communication d’OpenAI relayée par TechCrunch. À chaque épisode, le même schéma : annonce spectaculaire, vérification communautaire, recadrage.

Le 20 mai 2026, OpenAI change de méthode. L’entreprise publie son annonce accompagnée de remarques de soutien signées par des mathématiciens dont la crédibilité ne se discute pas dans la discipline. Noga Alon, figure tutélaire de la combinatoire, Melanie Wood, théoricienne des nombres reconnue, et Thomas Bloom, qui maintient le site de référence Erdos Problems, apparaissent dans le dispositif éditorial. Cette mise en scène n’est pas anodine : elle révèle que le laboratoire a tiré les leçons des fiascos antérieurs.

La thèse de ce dossier

OpenAI ne se contente pas de revendiquer une réussite ponctuelle. L’entreprise affirme, selon TechCrunch, qu’il s’agit de « the first time AI has autonomously solved a prominent open problem central to a field of mathematics ». Cette formulation, plus prudente qu’auparavant, contient pourtant une rupture conceptuelle. Si elle résiste à l’examen, elle déplace la frontière entre assistance algorithmique et découverte autonome. Trois questions structurent ce dossier : que dit exactement la preuve, que vaut sa validation par les pairs, et qu’est-ce qu’elle change réellement pour la pratique mathématique ?

Contexte historique : Erdős, ses problèmes, et 80 ans d’attente

Paul Erdős, mort en 1996, a posé au cours de sa carrière des centaines de problèmes ouverts. Mathématicien itinérant, il sillonnait les universités du monde entier avec un carnet d’énoncés qu’il distribuait aux chercheurs rencontrés. Certains étaient assortis de récompenses financières symboliques, allant de 25 à 10 000 dollars selon la difficulté supposée. Cette pratique a constitué pendant un demi-siècle l’un des moteurs sociaux de la combinatoire et de la théorie des nombres modernes.

Le problème en question, posé en 1946, relève de la géométrie combinatoire. Selon TechCrunch, il porte sur une question de configurations spatiales optimales. Pendant près de 80 ans, la communauté mathématique avait convergé vers une intuition partagée. « For nearly 80 years, mathematicians believed the best possible solutions looked roughly like square grids », rapporte le média américain. Cette croyance n’était pas une simple conjecture : elle s’appuyait sur des décennies de constructions explicites convergeant toutes vers la même structure en grille.

L’inertie d’un tel consensus est considérable. En mathématiques, lorsqu’une intuition résiste 80 ans, elle finit par structurer la pédagogie, les conjectures dérivées, et même la sélection des sujets de recherche. Réfuter une croyance ancrée n’est pas seulement résoudre un problème : c’est rouvrir un champ entier.

L’écosystème des problèmes d’Erdős a fait l’objet d’une catalogation systématique par Thomas Bloom, dont le site recense les énoncés ouverts et les progrès réalisés. Cette infrastructure documentaire joue un rôle décisif dans l’épisode actuel : elle permet de vérifier, pour chaque problème prétendument résolu, son statut antérieur exact. Sans cet outil, les revendications seraient invérifiables en pratique.

La théorie des nombres et la combinatoire extrémale, champs dans lesquels Erdős a le plus produit, partagent une caractéristique : leurs énoncés sont souvent élémentaires à formuler, redoutables à prouver. Cette asymétrie explique leur attractivité pour les systèmes d’IA. Un énoncé court tient dans une fenêtre de contexte ; sa démonstration, elle, peut mobiliser des constructions sophistiquées.

Analyse technique : ce que dit exactement la preuve

Le cœur de l’annonce porte sur un résultat structurel. Selon TechCrunch, le modèle d’OpenAI a découvert une nouvelle famille de constructions qui surpasse les grilles carrées jusqu’alors considérées comme optimales. « An OpenAI model has now disproved that belief, discovering an entirely new family of constructions that performs better », précise le média. La nature exacte de cette famille n’est pas détaillée dans les sources publiques disponibles à ce jour, mais sa portée est explicite : il s’agit d’une réfutation par construction, donc d’une démonstration positive et non d’un simple contre-exemple isolé.

Cette distinction est capitale. Une réfutation par construction explicite produit un nouvel objet mathématique exploitable, étudiable, généralisable. Elle ouvre des voies de recherche, contrairement à une réfutation purement existentielle qui se contenterait d’affirmer qu’un meilleur arrangement existe sans le décrire.

Selon TechCrunch, la preuve provient d’un nouveau modèle de raisonnement généraliste, et non d’un système spécifiquement conçu pour les mathématiques ou pour ce problème en particulier. Ce point distingue radicalement l’annonce d’OpenAI des travaux antérieurs comme AlphaProof de DeepMind, optimisé pour les compétitions olympiques, ou de Lean-tuned models conçus pour assister la formalisation. Le périmètre du modèle d’OpenAI serait, selon l’entreprise, beaucoup plus large.

Pour situer la portée de cette annonce, le tableau ci-dessous compare les principales percées revendiquées par les grands laboratoires sur les problèmes mathématiques ouverts, dans la mesure où les sources publiques permettent de les caractériser.

Annonce	Acteur	Date	Nature du résultat
Conjecture d’Erdős (1946)	OpenAI	Mai 2026	Réfutation par construction, problème ouvert majeur
Solutions à 10 problèmes d’Erdős	OpenAI / GPT-5	Mai 2026	Résolutions multiples, progrès sur 11 autres
Précédentes revendications	OpenAI	Antérieures	Qualifiées de « dramatic misrepresentation »

Le second volet de l’annonce, lui aussi rapporté par TechCrunch, élargit le périmètre. « GPT-5 found solutions to 10 (!) previously unsolved Erdős problems and made progress on 11 others. » Le point d’exclamation, repris tel quel, trahit la stupéfaction de l’auteur. Si ces dix résolutions résistent à l’examen par les pairs, l’épisode dépasse largement le cadre d’une percée isolée.

Reste une zone d’ombre méthodologique. Les modalités exactes de production de la preuve — temps de calcul, nombre de tentatives, présence d’un humain dans la boucle pour orienter la recherche, post-traitement formel — ne sont pas détaillées dans les sources disponibles à ce jour. Or ces paramètres déterminent ce que l’on entend par « autonome ». Un modèle qui produit une preuve correcte après mille tentatives orientées par un mathématicien n’est pas autonome au même sens qu’un système qui la produit en un coup, à froid.

Cette ambiguïté n’est pas anodine. Elle constitue le principal angle d’attaque des critiques, et explique pourquoi l’entreprise a soigné cette fois sa stratégie de validation externe.

Impact terrain : ce que change la preuve, et pour qui

Au-delà du symbole, les conséquences pratiques se déclinent sur plusieurs strates. La première concerne la pratique mathématique elle-même. Si un modèle généraliste peut, sans entraînement spécialisé, produire des constructions inédites en combinatoire extrémale, le rôle du chercheur se déplace. Il devient prescripteur de problèmes, évaluateur de solutions, et formaliste de second niveau. Cette redistribution des tâches n’est pas nouvelle — les calculatrices, les logiciels de calcul formel et les assistants de preuve l’avaient déjà amorcée — mais son rythme change.

Pour les sciences appliquées, l’impact est moins direct mais réel. Les configurations géométriques optimales étudiées par Erdős nourrissent des problèmes connexes en théorie de l’information, en cristallographie, en planification de réseaux. Une nouvelle famille de constructions performantes peut inspirer des architectures applicatives. Selon les commentaires recueillis par TechCrunch dans l’écosystème scientifique, « AI is helping us to more fully explore the cathedral of mathematics we have built over the centuries ». Cette métaphore architecturale décrit bien la situation : l’IA ne construit pas une nouvelle cathédrale, elle explore des salles dont on ignorait l’existence dans celle qui est déjà bâtie.

Pour l’industrie de l’IA, l’épisode pèse sur le récit de la course aux capacités. Pendant deux ans, les benchmarks publics — MMLU, HumanEval, ARC — ont saturé. Les laboratoires cherchent des démonstrations de capacités impossibles à truquer. Une preuve mathématique inédite, vérifiable par la communauté, constitue précisément ce type de signal incontestable. Si elle tient, elle vaut mieux que dix points de progression sur un benchmark contesté.

Pour les utilisateurs professionnels — directions R&D, laboratoires académiques, équipes ingénierie — le signal est plus subtil. Il ne dit pas que les modèles peuvent résoudre n’importe quel problème ouvert. Il dit qu’un modèle généraliste, lancé sans préparation spécialisée, a produit au moins une fois un résultat non trivial dans un domaine difficile. C’est une borne inférieure de capacité, pas une garantie de productivité.

Enfin, pour la communauté Erdős elle-même, la mise à jour du site de Thomas Bloom va devenir un objet d’attention soutenue. Les onze problèmes pour lesquels GPT-5 aurait « made progress » feront l’objet d’un examen ligne à ligne. Cette infrastructure de vérification distribuée est l’un des atouts oubliés de la communauté mathématique : elle dispose d’un système d’évaluation par les pairs d’une rigueur que peu d’autres disciplines égalent.

Perspectives contradictoires : ce que disent les sceptiques

L’épisode appelle des contre-arguments sérieux qu’il faut prendre au sérieux. Le premier porte sur la définition de l’autonomie. Selon les sources disponibles à ce jour, OpenAI revendique « the first time AI has autonomously solved a prominent open problem central to a field of mathematics ». Mais le degré d’intervention humaine n’est pas documenté publiquement. Un mathématicien qui aurait suggéré la direction de recherche, sélectionné les pistes prometteuses, ou validé la sortie en bout de chaîne, modifie substantiellement la nature du résultat. La transparence sur ce point conditionnera la solidité de l’affirmation.

Le deuxième contre-argument concerne la nature des problèmes d’Erdős eux-mêmes. La collection est vaste — plusieurs centaines d’énoncés — et hétérogène. Tous ne se valent pas en termes de prestige et de difficulté. Certains figuraient sur la liste depuis longtemps faute d’intérêt direct, d’autres étaient considérés comme abordables avec les techniques modernes mais sans qu’un chercheur ne s’y soit attelé sérieusement. Affirmer avoir résolu dix problèmes d’Erdős sans préciser leur niveau de difficulté laisse une marge d’interprétation.

Le troisième angle d’attaque touche à la reproductibilité. Une preuve mathématique se vérifie indépendamment de son producteur. Si le modèle d’OpenAI a produit une démonstration valide, celle-ci peut être inspectée, formalisée dans un assistant comme Lean ou Coq, et vérifiée mécaniquement. Tant que cette étape n’est pas franchie publiquement, la confiance repose sur la lecture par les pairs annoncée. Cette lecture est en cours, selon les sources disponibles à ce jour, mais ne saurait être considérée comme close.

Le quatrième contre-argument est culturel. La tradition mathématique distingue depuis longtemps les preuves « illuminantes » des preuves « brutales ». Une démonstration peut être correcte sans rien apprendre à personne. La question n’est pas seulement de savoir si la preuve produite est juste, mais si elle révèle une structure exploitable par les humains. Les premiers commentaires recueillis par TechCrunch, dont « What other unseen wonders are waiting in the wings? », suggèrent que les mathématiciens consultés voient bien une structure neuve. Mais ce verdict demande à être étayé par une littérature dérivée — articles, généralisations, conjectures issues du résultat — qui ne se construit pas en une semaine.

Enfin, certains observateurs rappellent que les annonces de percées en IA sont historiquement biaisées par le calendrier commercial. Sans imputer de motivation cachée à OpenAI, le contexte concurrentiel reste un facteur à considérer. La pression sur les démonstrations de capacités est forte, et la tentation d’arrondir les angles, documentée par les précédents épisodes qualifiés de « dramatic misrepresentation », n’a pas disparu structurellement.

Prospective : trois scénarios pour les 18 prochains mois

À court terme, trois trajectoires se dessinent. La première est la consolidation. Si la preuve résiste à la vérification formelle et si les dix résolutions annoncées sont confirmées par la communauté, OpenAI aura établi un standard de démonstration de capacité que les concurrents devront égaler. Cette consolidation appellerait probablement des annonces équivalentes de la part de DeepMind, Anthropic et Meta dans les douze mois.

La deuxième trajectoire est la rétractation partielle. Une partie des dix résolutions pourrait être recadrée — soit parce que le problème était techniquement résolu ailleurs, soit parce que la preuve produite contient des lacunes formelles. Dans ce scénario, le résultat principal — la conjecture de 1946 — survit, mais l’effet d’annonce s’érode.

La troisième trajectoire est la généralisation. Si le mécanisme qui a permis la résolution est compris et reproductible, d’autres domaines mathématiques — topologie, théorie des groupes, analyse combinatoire — verront des résultats similaires émerger dans les mois suivants. Cette trajectoire serait la plus disruptive sur le plan scientifique, sans qu’il soit possible aujourd’hui d’évaluer sa probabilité.

La question posée par l’un des mathématiciens cités — « What other unseen wonders are waiting in the wings? » — résume bien l’incertitude. Elle est, au sens propre, ouverte.

FAQ

Quel est exactement le problème mathématique résolu par OpenAI ?

Selon TechCrunch (20 mai 2026), il s’agit d’une conjecture géométrique posée par Paul Erdős en 1946. Pendant près de 80 ans, les mathématiciens pensaient que les meilleures solutions ressemblaient à des grilles carrées. Le modèle d’OpenAI aurait découvert une famille de constructions inédites qui surpasse cette intuition. La nature précise des objets construits n’a pas été détaillée publiquement à ce jour.

Comment OpenAI a-t-il produit cette preuve ?

L’entreprise indique avoir utilisé un nouveau modèle de raisonnement généraliste, non spécifiquement entraîné pour les mathématiques ni pour ce problème. Cette caractéristique distingue le résultat des travaux antérieurs comme AlphaProof de DeepMind, optimisé pour les compétitions. Les détails sur le temps de calcul, le nombre de tentatives et le degré d’intervention humaine ne sont pas publiquement documentés à ce stade.

Pourquoi cette annonce est-elle traitée différemment des précédentes ?

Plusieurs revendications antérieures avaient été qualifiées de « dramatic misrepresentation » par la communauté mathématique. Cette fois, OpenAI a publié son annonce accompagnée de commentaires de soutien signés par des mathématiciens reconnus — Noga Alon, Melanie Wood et Thomas Bloom, qui maintient le site Erdos Problems. Cette validation préalable change radicalement la réception, sans clore définitivement le débat sur la robustesse du résultat.

Faut-il s’attendre à d’autres résolutions du même type ?

Selon TechCrunch, GPT-5 aurait également trouvé des solutions à 10 autres problèmes d’Erdős et progressé sur 11 supplémentaires. Si ces résultats résistent à la vérification, ils suggèrent que la méthode est généralisable. La question ouverte est de savoir si elle s’étendra à d’autres branches des mathématiques — topologie, théorie des nombres analytique, géométrie algébrique — ou si elle restera circonscrite à la combinatoire extrémale.

Sources

OpenAI claims it solved an 80-year-old math problem — for real this time, TechCrunch, 20 mai 2026 — techcrunch.com
Erdős Problems, site maintenu par Thomas Bloom — base de référence pour le statut des problèmes ouverts posés par Paul Erdős
Déclarations recueillies par TechCrunch : Noga Alon, Melanie Wood, Thomas Bloom, mathématiciens ayant publié des remarques de soutien à la preuve d’OpenAI
Pour aller plus loin : Anthropic et la course aux modèles de raisonnement, DeepMind AlphaProof : ce que les Olympiades nous apprennent, Benchmarks saturés : comment les laboratoires démontrent encore leurs capacités

Mes lectures

Newsletter IA

OpenAI et les problèmes d’Erdős : anatomie d’une preuve mathématique

Une annonce qui rompt avec les précédents épisodes

La thèse de ce dossier

Contexte historique : Erdős, ses problèmes, et 80 ans d’attente

Analyse technique : ce que dit exactement la preuve

Impact terrain : ce que change la preuve, et pour qui

Perspectives contradictoires : ce que disent les sceptiques

Prospective : trois scénarios pour les 18 prochains mois

FAQ

Quel est exactement le problème mathématique résolu par OpenAI ?

Comment OpenAI a-t-il produit cette preuve ?

Pourquoi cette annonce est-elle traitée différemment des précédentes ?

Faut-il s’attendre à d’autres résolutions du même type ?

Sources

Mohamed Meguedmi

Guides & Thèmes

Mes lectures

Newsletter IA

Une annonce qui rompt avec les précédents épisodes

La thèse de ce dossier

Contexte historique : Erdős, ses problèmes, et 80 ans d’attente

Analyse technique : ce que dit exactement la preuve

Impact terrain : ce que change la preuve, et pour qui

Perspectives contradictoires : ce que disent les sceptiques

Prospective : trois scénarios pour les 18 prochains mois

FAQ

Quel est exactement le problème mathématique résolu par OpenAI ?

Comment OpenAI a-t-il produit cette preuve ?

Pourquoi cette annonce est-elle traitée différemment des précédentes ?

Faut-il s’attendre à d’autres résolutions du même type ?

Sources

Articles similaires

Mohamed Meguedmi

L'IA chaque semaine dans votre boîte

Pour aller plus loin

Meta lance Content Seal : sa détection IA maison face à SynthID

ChatGPT Health : OpenAI affirme surpasser le niveau clinique

250 millions de questions : l’IA recompose le métier de la presse

L'actu IA chaque semaine

Guides & Thèmes