OpinionLes benchmarks IA sont-ils fiables ? Pourquoi il faut s’en méfier
Les benchmarks IA comme MMLU et HumanEval sont-ils fiables ? Contamination, optimisation ciblée, métriques déconnectées : pourquoi s'en méfier et quelles alternatives.
L'essentiel de l'actu IA, chaque semaine en 5 min. Gratuit, sans spam.
Rejoignez les lecteurs de LaGazetteIA

OpinionLes benchmarks IA comme MMLU et HumanEval sont-ils fiables ? Contamination, optimisation ciblée, métriques déconnectées : pourquoi s'en méfier et quelles alternatives.
Outils IAOpenAI ferme temporairement Sora, Runway passe en 4K avec Gen-4, Kling conquiert l'Asie. Le marché de la vidéo IA vit sa première grande recomposition.
IA Générale38 États américains ont voté leurs propres lois sur l'IA face à l'inaction du Congrès fédéral. Un patchwork juridique qui divise le secteur technologique et contraste avec l'AI Act européen.
TechDes documents internes fuités révèlent Claude Mythos, le prochain modèle d'Anthropic. Raisonnement long, usage autonome d'outils, fiabilité améliorée : décryptage des capacités annoncées.
TechApple prépare un tournant majeur avec iOS 27 : Siri pourrait céder sa place d'assistant par défaut au profit de ChatGPT, Gemini ou Claude, une ouverture imposée par le DMA européen.
IA GénéraleOpenAI boucle une levée historique de 40 milliards de dollars, portant sa valorisation à 300 milliards. Avec un cumul de 122 milliards de financements et un CA annualisé de 12,7 milliards, la start-up prépare son introduction en Bourse fin 2026.
GuidesGuide pratique pour utiliser le computer use de GPT-5.4 : activation, permissions, workflows concrets et pièges à éviter. Automatise tes tâches sans coder.
IA GénéraleGPT-5.4 d'OpenAI arrive avec le computer use natif, 1 million de tokens de contexte et trois variantes. Le modèle surpasse les humains dans 83 % des tâches professionnelles.
Opinion900 millions de personnes utilisent l'IA générative chaque mois. Analyse d'une adoption historique, de ses fractures et de ce qu'elle dit de notre rapport à la technologie.