Huawei Ascend 950PR : ByteDance et Alibaba commandent la puce IA chinoise qui défie NVIDIA

ByteDance et Alibaba s’apprêtent à passer commande de l’Ascend 950PR, le nouveau processeur IA de Huawei conçu pour rivaliser avec les GPU NVIDIA sur le marché chinois. Avec un objectif de 750 000 unités livrées en 2026 et une compatibilité CUDA améliorée, cette puce redessine les lignes de fracture technologiques entre Washington et Pékin — et pose une question stratégique que le marché refuse encore de formuler clairement : la Chine peut-elle construire une infrastructure IA souveraine sans NVIDIA ?

Table of Contents

Points clés

ByteDance et Alibaba prévoient de commander l’Ascend 950PR après des tests montrant une meilleure compatibilité CUDA.
750 000 unités visées par Huawei en 2026, production de masse prévue au second semestre.
Prix : 50 000 yuans (~6 900 $) par carte en version DDR, 70 000 yuans (~9 700 $) en version HBM.
Positionnement : optimisé pour l’inférence (exécution de modèles IA) plutôt que l’entraînement.
Contexte géopolitique : les restrictions américaines sur les exportations de puces NVIDIA vers la Chine accélèrent la demande domestique.

Le virage stratégique de ByteDance et Alibaba

Selon des sources citées par Reuters le 27 mars 2026, ByteDance — maison mère de TikTok et opérateur de l’assistant IA Doubao — et Alibaba Cloud prévoient de passer commande de l’Ascend 950PR après une phase de tests jugée concluante. Le facteur déterminant : une compatibilité CUDA nettement améliorée par rapport aux générations précédentes de puces Huawei.

Jusqu’à présent, le principal obstacle à l’adoption des puces Ascend résidait dans l’écosystème logiciel. NVIDIA a construit un avantage quasi monopolistique grâce à CUDA, sa couche logicielle propriétaire utilisée par la quasi-totalité des frameworks d’apprentissage profond (PyTorch, TensorFlow, JAX). Les développeurs chinois, formés sur CUDA, devaient réécrire une partie significative de leur code pour migrer vers le framework CANN de Huawei — un coût de migration que peu d’entreprises étaient prêtes à assumer.

Avec le 950PR, Huawei change d’approche. Plutôt que d’imposer CANN comme alternative exclusive, la puce intègre une couche de compatibilité permettant aux modèles développés sous CUDA de fonctionner avec des modifications minimales. Paul Triolo, analyste chez Albright Stonebridge Group et spécialiste des technologies sino-américaines, résume l’enjeu : « Huawei a compris que la bataille des puces se gagne d’abord sur le terrain du logiciel. Le 950PR n’a pas besoin de battre le H100 en benchmark — il doit juste être suffisamment facile à adopter pour que le coût de ne pas l’acheter devienne supérieur au coût de la migration ».

Inférence plutôt qu’entraînement : un choix calculé

Point technique crucial : le 950PR n’offre qu’une amélioration marginale de la puissance de calcul brute par rapport au 910C, son prédécesseur. En revanche, il est optimisé pour l’inférence — le processus d’exécution de modèles IA déjà entraînés pour répondre aux requêtes des utilisateurs ou exécuter des tâches automatisées.

Ce choix n’est pas anodin. L’inférence représente désormais la majorité des coûts d’infrastructure IA pour les grandes plateformes. Selon une analyse de Bernstein publiée en février 2026, les dépenses d’inférence des hyperscalers (AWS, Azure, Google Cloud, Alibaba Cloud) dépasseront celles d’entraînement pour la première fois en 2026, avec un ratio estimé à 60/40. Pour ByteDance, qui gère des centaines de millions de requêtes quotidiennes via Doubao, et pour Alibaba Cloud, qui propose des modèles Qwen en inférence à ses clients, la performance par watt en inférence compte davantage que les TFLOPS bruts.

Le prix reflète ce positionnement : 50 000 yuans (~6 900 dollars) par carte en version DDR standard, 70 000 yuans (~9 700 dollars) en version HBM (High Bandwidth Memory). À titre de comparaison, un NVIDIA H100 se négocie entre 25 000 et 40 000 dollars sur le marché officiel — quand il est disponible en Chine, ce qui n’est plus le cas depuis le durcissement des restrictions d’exportation américaines en octobre 2023.

Le contexte géopolitique : une fenêtre d’opportunité créée par Washington

L’ironie de la situation mérite d’être soulignée. Les restrictions américaines sur les exportations de puces IA vers la Chine, initiées sous l’administration Biden et maintenues par l’administration Trump, avaient pour objectif de freiner le développement de l’IA chinoise. Leur effet secondaire — prévisible mais largement sous-estimé — a été d’accélérer la substitution domestique.

Avant les restrictions, les géants technologiques chinois achetaient massivement des GPU NVIDIA. Après, ils n’ont eu d’autre choix que de se tourner vers les alternatives locales. Huawei, malgré les sanctions qui le visent directement depuis 2019, a investi des milliards dans sa division semi-conducteurs HiSilicon et dans l’écosystème Ascend. Le résultat : une puce qui n’est pas encore au niveau du H100 de NVIDIA, mais qui s’en rapproche suffisamment pour être « good enough » dans un marché où l’alternative est… rien.

Chris Miller, auteur de « Chip War » et professeur à Tufts University, observe que « les sanctions créent un paradoxe temporel : elles ralentissent l’IA chinoise à court terme mais accélèrent la souveraineté technologique à moyen terme. Le 950PR est la preuve que la fenêtre de ralentissement se referme plus vite que prévu ».

750 000 unités : ambition réaliste ou signal politique ?

Huawei cible 750 000 unités livrées en 2026, avec une production de masse prévue au second semestre. Ce chiffre, bien qu’impressionnant, reste très inférieur aux volumes de NVIDIA : Jensen Huang a déclaré lors du GTC 2026 que NVIDIA prévoyait de livrer plusieurs millions de GPU Blackwell cette année. La comparaison directe est toutefois trompeuse — Huawei ne vise pas le marché mondial mais le marché chinois, où il bénéficie d’un avantage réglementaire et patriotique significatif.

La question de la capacité de fabrication reste le talon d’Achille. Huawei dépend de SMIC (Semiconductor Manufacturing International Corporation) pour la gravure, et SMIC opère sur des nœuds technologiques inférieurs à ceux de TSMC (7 nm contre 4/5 nm pour les derniers GPU NVIDIA). Cette contrainte limite la densité de transistors et, par extension, l’efficacité énergétique du 950PR. Mais comme le note Dan Wang, analyste chez Gavekal Dragonomics, « la Chine ne cherche pas la perfection technologique — elle cherche l’autonomie stratégique. Le 950PR remplit cette mission ».

Ce que cela change pour le marché mondial de l’IA

L’adoption du 950PR par ByteDance et Alibaba envoie un signal clair : le découplage technologique entre les États-Unis et la Chine dans le domaine de l’IA n’est plus une hypothèse mais une réalité en cours de matérialisation. Deux écosystèmes parallèles émergent — l’un autour de NVIDIA/CUDA/TSMC, l’autre autour de Huawei/Ascend/SMIC — avec des implications profondes pour les entreprises qui opèrent dans les deux sphères.

Pour NVIDIA, la perte du marché chinois n’est pas existentielle mais significative. La Chine représentait environ 25 % du chiffre d’affaires de NVIDIA avant les restrictions. Pour Huawei, chaque commande du 950PR valide le pari d’une infrastructure IA souveraine et renforce l’argument politique en faveur de l’autosuffisance technologique.

La vraie question n’est plus de savoir si la Chine peut construire des puces IA compétitives — le 950PR prouve que c’est possible. La question est de savoir à quelle vitesse l’écart avec NVIDIA se réduit, et si le marché mondial de l’IA finira par se fragmenter en deux standards technologiques incompatibles.

Sources : Reuters (27 mars 2026), CNBC, Bloomberg, Techmeme, Cybernews, Bernstein Research (février 2026).

Points clés

Le virage stratégique de ByteDance et Alibaba

Inférence plutôt qu’entraînement : un choix calculé

Le contexte géopolitique : une fenêtre d’opportunité créée par Washington

750 000 unités : ambition réaliste ou signal politique ?

Ce que cela change pour le marché mondial de l’IA

Adrian Ferreira

Articles connexes

AI Act : le Parlement européen vote le report des échéances IA à haut risque

Souveraineté numérique : Mistral peut-il sauver l’Europe de la dépendance américaine en IA ?

IA et éducation : l’apprentissage personnalisé transforme les salles de classe en 2026

Recevez l'actu IA chaque matin