Points clés

  • Microsoft lance trois modèles IA propriétaires : MAI-Transcribe-1, MAI-Voice-1 et MAI-Image-2
  • MAI-Transcribe-1 transcrit 2,5 fois plus vite que les solutions existantes dans 25 langues
  • MAI-Image-2 se classe 3e mondial sur le leaderboard Arena.ai
  • Les prix cassent le marché : 0,36 $ par heure de transcription

Microsoft a dévoilé le 2 avril 2026 trois modèles d’intelligence artificielle développés en interne, disponibles en préversion publique sur sa plateforme Azure AI Foundry. MAI-Transcribe-1, MAI-Voice-1 et MAI-Image-2 couvrent la transcription vocale, la synthèse de parole et la génération d’images. Cette annonce marque un tournant stratégique : pour la première fois, Microsoft concurrence directement OpenAI, son partenaire historique, avec ses propres modèles fondamentaux.

Ce que Microsoft met sur la table

MAI-Transcribe-1 est un modèle de reconnaissance vocale capable de transcrire du contenu audio dans 25 langues avec une précision qualifiée d’« enterprise-grade » par Microsoft. Selon les benchmarks internes, il transcrit 2,5 fois plus vite que les modèles Azure précédents, pour un coût GPU réduit de 50 %. Le tarif public démarre à 0,36 $ par heure de transcription, un positionnement agressif face à Whisper d’OpenAI.

MAI-Voice-1, dédié à la synthèse vocale, génère 60 secondes d’audio expressif en moins d’une seconde sur un seul GPU. Microsoft le propose à 22 $ par million de caractères. Le modèle vise les usages professionnels : assistants vocaux, narration de contenus, accessibilité.

MAI-Image-2, le modèle de génération d’images, s’est directement classé 3e mondial sur le leaderboard Arena.ai pour les familles de modèles image. Son tarif : 5 $ par million de tokens en entrée, 33 $ en sortie.

Un signal stratégique fort

Jusqu’ici, Microsoft s’appuyait quasi exclusivement sur les modèles d’OpenAI pour ses offres IA. Cette triple annonce change la donne. Comme le souligne VentureBeat, c’est « la preuve la plus concrète que Microsoft entend concurrencer OpenAI et Google sur le développement de modèles, pas seulement sur la distribution ».

Pour les entreprises, l’intérêt est immédiat : diversifier leurs fournisseurs de modèles IA sans quitter l’écosystème Azure. Pour OpenAI, c’est un avertissement. Son principal investisseur et distributeur développe désormais des alternatives maison.

FAQ

Les modèles MAI de Microsoft sont-ils gratuits ?

Non, ils sont payants mais accessibles en préversion publique sur Azure AI Foundry. MAI-Transcribe-1 démarre à 0,36 $ par heure, MAI-Voice-1 à 22 $ par million de caractères, et MAI-Image-2 à 5 $ par million de tokens en entrée.

Microsoft va-t-il remplacer les modèles OpenAI sur Azure ?

Non, les modèles GPT restent disponibles. Les modèles MAI s’ajoutent au catalogue pour offrir plus de choix aux développeurs, notamment sur les cas d’usage voix et image où le coût est un facteur déterminant.

À suivre : la disponibilité générale des trois modèles, attendue au cours du T3 2026, et la réaction d’OpenAI face à cette concurrence interne.