📌 Points clés

  • DeepSeek publie R2, un modèle de raisonnement open source qui obtient 97,8 % sur MATH-500.
  • Le modèle surpasse GPT-5.4 (94,8 %) et o3-pro (96,1 %) sur les benchmarks mathématiques.
  • R2 a été entraîné avec un budget estimé à 10 millions de dollars, soit 100 fois moins qu’OpenAI.
  • La publication relance le débat sur l’efficacité de l’approche chinoise face aux investissements massifs occidentaux.

DeepSeek, le laboratoire IA adossé au fonds spéculatif chinois High-Flyer, publie R2, un modèle de raisonnement avancé qui établit un nouveau record mondial sur le benchmark MATH-500 avec un score de 97,8 %. Ce résultat surpasse GPT-5.4 d’OpenAI (94,8 %) et le modèle o3-pro (96,1 %), confirmant la capacité des acteurs chinois à produire des modèles de pointe avec des budgets largement inférieurs à leurs concurrents américains.

Comment DeepSeek R2 atteint-il ces performances avec si peu de moyens ?

DeepSeek R2 repose sur une architecture Mixture-of-Experts (MoE) de nouvelle génération, activant seulement 37 milliards de paramètres sur un total de 671 milliards à chaque requête. Cette approche réduit drastiquement les coûts d’inférence tout en maintenant des performances de pointe. L’entraînement a utilisé des techniques de reinforcement learning sur des jeux de données mathématiques synthétiques, une méthode que DeepSeek a perfectionnée depuis son modèle R1.

Le budget total estimé à 10 millions de dollars contraste avec les centaines de millions investis par OpenAI pour GPT-5.4. Cette efficacité s’explique par l’utilisation de puces Huawei Ascend 910B en complément de GPU NVIDIA H800, contournant partiellement les restrictions d’exportation américaines sur les puces IA haut de gamme.

Quel impact pour la course mondiale à l’IA ?

La publication de DeepSeek R2 envoie un signal fort : les restrictions américaines sur les exportations de puces vers la Chine n’ont pas empêché l’émergence de modèles compétitifs. Au contraire, ces contraintes semblent avoir accéléré l’innovation en forçant les laboratoires chinois à développer des architectures plus efficientes. Le modèle est disponible en open source sous licence MIT, permettant à quiconque de le télécharger et de le modifier librement.

FAQ

DeepSeek R2 est-il accessible depuis la France ?

Oui, le modèle est disponible en téléchargement sur Hugging Face et via l’API DeepSeek. L’interface web chat.deepseek.com est accessible dans la plupart des pays européens sans restriction.

Le modèle est-il censuré sur les sujets politiques ?

La version API et l’interface web appliquent des filtres sur certains sujets sensibles liés à la politique chinoise. Cependant, les poids du modèle open source peuvent être utilisés sans ces restrictions, ce que de nombreux développeurs font déjà via des déploiements locaux.

À suivre

DeepSeek prévoit de publier R2-Vision, un modèle multimodal capable de résoudre des problèmes de géométrie à partir de photos, d’ici mai 2026. Le Congrès américain a convoqué une audition sur l’efficacité des restrictions d’exportation de puces face aux progrès de l’IA chinoise.