📑 Table des matières

Alibaba Zhenwu M890 : la puce IA qui veut détrôner Nvidia en Chine

Deep Tech 🟢 Débutant ⏱️ 15 min de lecture 📅 2026-05-22

Alibaba Zhenwu M890 : la puce IA qui veut détrôner Nvidia en Chine

🔎 3× en une génération : le signal d'une rupture technologique

Le 20 mai 2026, au Alibaba Cloud Summit, T-Head — la filiale semi-conducteurs d'Alibaba — a dévoilé le Zhenwu M890. Une puce d'accélération IA classée GPU qui revendique trois fois les performances de la génération précédente, elle-même déjà comparable au H20 de Nvidia.

Le timing n'est pas anodin. Les sanctions américaines de 2022, renforcées en 2023 et 2024, ont coupé la Chine des puces H100 et B200 de Nvidia. Pékin a répondu par un plan d'investissement massif dans les semi-conducteurs domestiques. Le M890 est le résultat le plus tangible de cette politique.

Mais au-delà du symbole patriotique, les chiffres sont concrets : 144 Go de mémoire HBM3, une bande passante interconnect de 800 Go/s, et un serveur supernode intégrant 128 puces. C'est une architecture pensée pour l'échelle, pas pour la démonstration de laboratoire.

Alibaba a profité de l'annonce pour lancer simultanément le modèle Qwen 3.7-Max, signalant que la puce et le logiciel avancent de concert. L'écosystème chinois IA n'attend plus Nvidia pour exister.


L'essentiel

  • Le Zhenwu M890 est une puce d'accélération IA conçue par T-Head (Alibaba), dévoilée le 20 mai 2026 au Alibaba Cloud Summit.
  • Elle revendique des performances 3× supérieures au H20 de Nvidia, avec 144 Go HBM3 et 800 Go/s de bande passante interconnect.
  • Le système serveur Panjiu AL128 intègre 128 accélérateurs par rack, conçu pour le déploiement d'agents autonomes à grande échelle.
  • Alibaba prévoit d'introduire en bourse son activité de conception de puces pour capitaliser sur la demande d'alternatives à Nvidia.
  • Cette annonce s'inscrit dans le contexte des sanctions US qui empêchent l'accès chinois aux H100 et B200 de Nvidia.

Outils recommandés

Outil Usage principal Prix (mai 2026, vérifiez sur site.com) Idéal pour
Alibaba Cloud Inférence et entraînement sur Zhenwu M890 Sur devis (enterprise) Entreprises chinoises cherchant l'indépendance matérielle
Hostinger Hébergement web pour déployer des interfaces IA ~2,99 €/mois Développeurs et startups
Qwen 3.7-Max LLM phare d'Alibaba optimisé pour le M890 Via API Alibaba Cloud Inférence haute performance sur infrastructure chinoise

Les spécifications techniques du Zhenwu M890 — Du concret, pas du marketing

Mémoire et bande passante : le saut quantifié

Le Zhenwu M890 embarque 144 Go de mémoire HBM3, soit 50 % de plus que les 96 Go du Zhenwu 810E. La bande passante interconnect passe de 700 Go/s à 800 Go/s, un gain de 14 % sur ce point précis selon les spécifications détaillées rapportées par Wccftech.

Ces chiffres ont un sens direct pour l'entraînement de grands modèles de langage. La mémoire détermine la taille du modèle qu'on peut charger sur une seule puce. Avec 144 Go, le M890 peut héberger un modèle de 70 milliards de paramètres en full precision sans recourir au sharding.

La bande passante interconnect, elle, conditionne la vitesse à laquelle les puces communiquent dans un cluster. À 800 Go/s, le M890 se rapproche des standards Nvidia tout en restant en dessous du NVLink du H100 (900 Go/s). Mais la comparaison n'est pas tout à fait juste : le M890 concurrence le H20, pas le H100.

Le Panjiu AL128 : 128 puces dans un seul rack

Alibaba a présenté le serveur supernode Panjiu AL128, qui intègre 128 accélérateurs Zhenwu M890 par rack. C'est une architecture de cluster densifiée, pensée pour le déploiement d'agents numériques autonomes à grande échelle selon Interesting Engineering.

L'approche rappelle celle de Nvidia avec ses systèmes DGX, mais avec une différence de taille : chaque puce du rack est interconnectée via un protocole propriétaire optimisé pour les charges de travail chinoises. Alibaba n'a pas publié les détails exacts de cette interconnexion, mais la promesse est claire : éliminer les goulots d'étranglement réseau qui pénalisent les clusters hétérogènes.

Comparatif avec la génération précédente et le H20

Spécification Zhenwu 810E Zhenwu M890 H20 (Nvidia)
Mémoire 96 Go HBM 144 Go HBM3 96 Go HBM3
Bande passante interconnect 700 Go/s 800 Go/s 900 Go/s (NVLink)
Performance relative Référence (1×) 3× (revendiqué) Référence
Disponibilité Chine Oui Oui Limité par licences US
Année de sortie 2025 Mai 2026 2024 (avec restrictions)

Le tableau révèle une réalité nuancée. Le M890 ne surpasse pas le H20 sur tous les critères matériels — la bande passante reste inférieure. Mais la "performance 3×" revendiquée par Alibaba intègre probablement des optimisations logicielles et architecturales globales, pas seulement les specs brutes. C'est un point à vérifier une fois les benchmarks indépendants disponibles.


La guerre des puces IA en Chine — Pourquoi le M890 existe

Les sanctions US : l'accélérateur involontaire de l'innovation chinoise

Tout commence en octobre 2022, lorsque le département du Commerce américain restreint les exportations de puces avancées vers la Chine. Le H100 de Nvidia est interdit d'exportation. Nvidia répond avec une version dégradée, le H20, spécifiquement conçue pour respecter les plafonds américains tout en restant vendable en Chine.

Mais les sanctions se durcissent. En 2024, même les puces dégradées font l'objet de nouvelles restrictions. Le résultat est paradoxal : les entreprises chinoises qui achetaient du matériel Nvidia sans réfléchir se retrouvent contraintes de développer des alternatives domestiques.

Le Zhenwu M890 est l'enfant direct de cette pression. Sans les sanctions, il n'existerait probablement pas, ou pas à cette échelle. T-Head aurait continué à produire des puces spécialisées pour le cloud Alibaba sans chercher à concurrencer Nvidia frontalement.

L'écosystème chinois au complet : puces, modèles, capitaux

Le M890 n'est pas un projet isolé. Il s'inscrit dans un écosystème chinois IA qui s'est structuré à vitesse grand V. Moonshot AI vient de lever 2 milliards de dollars pour son modèle Kimi K2.6, qui atteint un score de 88.1 en agentic et 84 en général sur les benchmarks de référence.

DeepSeek, avec son V4 Pro, affiche 88 en général. Z.AI propose le GLM-5 à 82 en agentic. L'écosystème de modèles open-weight chinois est désormais le plus dynamique au monde, en partie grâce à des puces comme le M890 qui rendent l'entraînement et l'inférence possibles sans dépendance américaine.

Alibaba a également annoncé son intention d'introduire en bourse son activité de conception de puces, selon Bloomberg. L'objectif est de lever des capitaux pour accélérer la roadmap de la série Zhenwu, avec de nouvelles puces prévues pour le troisième et quatrième trimestre 2027-2028 selon TrendForce.

La réponse réglementaire américaine

Washington ne reste pas inactive face à cette dynamique. La Maison Blanche veut vérifier les modèles IA avant leur sortie, un revirement stratégique qui montre la nervosité américaine face à la progression chinoise. Le contrôle ne porte plus seulement sur le matériel, mais aussi sur les modèles eux-mêmes.

Cette évolution réglementaire renforce la détermination chinoise à construire une stack complète et autonome : de la puce au modèle, de l'infrastructure cloud à l'application finale. Le M890 est un maillon essentiel de cette chaîne.


Qwen 3.7-Max et le M890 — Le couple puce-modèle qui change la donne

Une optimisation verticale intégrée

L'annonce simultanée du Zhenwu M890 et du modèle Qwen 3.7-Max n'est pas un hasard de calendrier. Alibaba applique la stratégie d'intégration verticale que Nvidia a imposée avec CUDA : le matériel et le logiciel sont co-conçus pour maximiser les performances.

Qwen 3.7-Max vient compléter la famille Qwen d'Alibaba, qui s'est imposée comme l'une des alternatives les plus crédibles aux modèles américains. L'optimisation spécifique pour le M890 signifie que l'inférence peut être significativement plus rapide que sur du matériel générique.

Où se positionne Qwen face à la concurrence ?

Dans le paysage des LLM actuels (juin 2025), les modèles américains dominent encore les classements. GPT-5.5 d'OpenAI mène en agentic avec 98.2, suivi de Gemini 3 Pro Deep Think de Google à 95.4 et Claude Opus 4.7 d'Anthropic à 94.3.

Mais les modèles chinois grimpent rapidement. Kimi K2.6 atteint 88.1 en agentic, DeepSeek V4 Pro (Max) affiche 88 en général. La question n'est plus de savoir si les modèles chinois peuvent rivaliser, mais quand ils dépasseront les modèles américains sur des métriques spécifiques.

Le M890 pourrait accélérer ce basculement en offrant une infrastructure d'entraînement et d'inférence qui n'est plus pénalisée par les limitations matérielles.


Le M890 face au H20 de Nvidia — Que valent vraiment ces 3× ?

Déconstruire la revendication de performance

Alibaba revendique des performances 3× supérieures au H20 de Nvidia avec le M890. Cette affirmation, rapportée par Wccftech et TNW, mérite d'être examinée avec soin.

Premier point : la base de comparaison. Le H20 est une puce bridée par les contraintes américaines d'exportation. Elle n'est pas représentative du plein potentiel de l'architecture Hopper de Nvidia. Comparer le M890 au H100 ou au B200 serait plus pertinent pour évaluer le niveau technologique réel, mais ces puces ne sont pas disponibles en Chine.

Deuxième point : la métrique. "3× les performances" est vague. S'agit-il de la vitesse d'inférence en batch ? De la vitesse d'entraînement ? Du throughput en tokens par seconde ? Alibaba n'a pas précisé, ce qui rend la comparaison difficile à vérifier de manière indépendante.

Troisième point : les conditions de test. Les benchmarks internes sont rarement reproductibles. Jusqu'à ce que des laboratoires indépendants comme MLPerf publient des résultats, le chiffre 3× reste une revendication marketing, pas un fait scientifique établi.

Ce qui est crédible dans l'annonce

Malgré ces réserves, plusieurs éléments rendent l'annonce crédible. Le saut de 96 Go à 144 Go de mémoire est réel et mesurable. L'augmentation de la bande passante de 700 à 800 Go/s est documentée. L'architecture à 128 puces par rack est une réponse concrète au problème de scalabilité.

Le Zhenwu 810E était déjà considéré comme comparable au H20 par les observateurs de l'industrie selon TrendForce. Un gain de 3× en une seule génération est ambitieux mais pas irréaliste si T-Head a résolu les principaux goulots d'étranglement architecturaux.

Le facteur logiciel : l'avantage caché d'Alibaba

Nvidia domine grâce à CUDA, son écosystème logiciel qui rend ses puces faciles à programmer. T-Head ne dispose pas d'un équivalent aussi mature. Mais Alibaba contourne ce problème en optimisant directement ses modèles Qwen pour le M890, réduisant la dépendance à un framework d'abstraction universel.

Cette approche "verticale" — puce + modèle co-optimisés — est plus limitée en portée mais plus efficace en performance pure. C'est la même logique qui a fait le succès des puces Apple Silicon : l'intégration matérielle-logicielle bat l'approche générique quand l'écosystème est suffisamment grand.


La roadmap Zhenwu — Ce qui arrive après le M890

Des puces prévues pour 2027-2028

T-Head n'a pas dévoilé uniquement le M890. Lors du Alibaba Cloud Summit, l'entreprise a présenté une roadmap complète de la série Zhenwu, avec de nouvelles puces prévues pour le troisième et quatrième trimestre 2027-2028 selon TrendForce.

Cette transparence inhabituelle pour un fondeur chinois envoie un signal : Alibaba ne considère plus le M890 comme un prototype, mais comme la première étape d'une ligne de produits pérenne. La stratégie ressemble à celle de Huawei avec la série Ascend, qui est passée en quelques années de puces expérimentales à des produits déployés à l'échelle nationale.

L'IPO de la division puces : pourquoi maintenant ?

Alibaba prévoit d'introduire en bourse son activité de conception de puces, rapporte Bloomberg. Le timing est calculé : l'appétit des investisseurs pour les alternatives chinoises à Nvidia est à son maximum, et le M890 offre un narratif concret à valoriser.

Une IPO réussie donnerait à T-Head les capitaux nécessaires pour accélérer sa roadmap et recruter des talents internationaux. C'est aussi un moyen de rendre la division plus autonome vis-à-vis de la maison-mère, un signal positif pour les investisseurs qui craignent l'ingérence politique dans les entreprises technologiques chinoises.


Les implications géopolitiques — Au-delà de la technologie

La déconnexion technologique US-Chine s'accélère

Le Zhenwu M890 est un symptôme de la déconnexion technologique entre les États-Unis et la Chine. Chaque round de sanctions pousse la Chine à développer des alternatives, ce qui à son tour justifie de nouvelles sanctions américaines. Le cycle est auto-renforçant.

À terme, le marché mondial des semi-conducteurs IA pourrait se scinder en deux écosystèmes parallèles : un écosystème Nvidia/CUDA pour les pays alliés des États-Unis, et un écosystème Zhenwu/Qwen pour la Chine et ses partenaires. Les entreprises européennes, indiennes et du Moyen-Orient devront alors choisir leur camp, ou maintenir une double compatibilité coûteuse.

L'impact sur la compétitivité des modèles chinois

L'accès à des puces performantes est un facteur déterminant pour l'entraînement de modèles de plus en plus grands. Avec le M890, les entreprises chinoises ne sont plus condamnées à utiliser du matériel sous-dimensionné. Cela pourrait se traduire par une accélération de la cadence de sortie de nouveaux modèles.

Le classement actuel des LLM montre que les modèles chinois sont déjà compétitifs en général (DeepSeek V4 Pro Max à 88, Kimi K2.6 à 84) et en agentic (Kimi K2.6 à 88.1, GLM-5 à 82). Avec le M890 comme accélérateur, la prochaine génération de modèles chinois pourrait combler l'écart avec GPT-5.5 (98.2 en agentic) et Gemini 3.1 Pro (92 en général).

La réponse des autres acteurs chinois

Alibaba n'est pas le seul à développer des puces IA domestiques. Huawei avec l'Ascend 910C, Biren Technology, et Cambricon ont tous des produits en développement ou en déploiement. Mais le M890 se distingue par son intégration directe avec l'écosystème cloud d'Alibaba, le plus grand d'Asie.

La concurrence entre fondeurs chinois est saine : elle évite la dépendance à un seul acteur et accélère l'innovation. Mais elle fragmente aussi l'écosystème logiciel, ce qui pourrait ralentir l'adoption par rapport à l'unified stack de Nvidia.


Les agents autonomes : la vraie cible du M890

Pourquoi Alibaba mise sur les agents

Interesting Engineering souligne que le M890 est conçu spécifiquement pour alimenter des agents numériques autonomes à grande échelle. Ce n'est pas anodin : le marché des agents IA est considéré comme le prochain front de croissance, et les charges de travail agentiques ont des caractéristiques différentes de l'inférence classique.

Un agent IA doit effectuer de multiples appels de modèle en séquence, avec une latence faible et une mémoire importante pour maintenir le contexte sur de longues interactions. Le M890, avec ses 144 Go HBM3 et son architecture de cluster à 128 puces, est optimisé pour ce profil d'utilisation.

L'architecture Panjiu AL128 pensée pour le multi-agent

Le serveur Panjiu AL128 n'est pas un simple rack de puces. C'est un système conçu pour le déploiement simultané de centaines d'agents, chacun avec son propre contexte et sa propre chaîne de raisonnement. L'interconnect à 800 Go/s garantit que les agents peuvent communiquer entre eux sans latence excessive.

Cette orientation agentique positionne Alibaba différemment de Nvidia, dont les puces sont d'abord optimisées pour l'entraînement, l'inférence étant un cas d'usage secondaire. Le M890 inverse cette priorité : l'inférence agentique est le design target, l'entraînement vient en second.


❌ Erreurs courantes

Erreur 1 : Confondre le M890 avec un H100 killer

Le M890 est comparé au H20, pas au H100. Le H20 est une puce dégradée conçue pour respecter les plafonds d'exportation américains. Dire que le M890 "bat Nvidia" est trompeur : il bat une version bridée d'une ancienne architecture. La comparaison honnête est M890 vs H20, pas M890 vs H100 ou B200.

Erreur 2 : Prendre le "3×" au pied de la lettre

Alibaba revendique 3× les performances du H20, mais sans préciser la métrique, la charge de travail, ni les conditions de test. Ce chiffre est un point de départ pour la discussion, pas un fait établi. Attendre les benchmarks indépendants avant de conclure.

Erreur 3 : Ignorer le facteur logiciel

Une puce sans écosystème logiciel est inutile. Le M890 bénéficie de l'optimisation directe avec Qwen, mais CUDA reste le standard de l'industrie. La performance brute ne compense pas toujours le déficit logiciel, surtout pour les équipes qui n'utilisent pas les modèles Alibaba.

Erreur 4 : Sous-estimer la roadmap

Voir le M890 comme un one-shot serait une erreur. La roadmap annoncée par T-Head couvre 2027-2028 avec de nouvelles puces. C'est un programme de long terme, pas une démonstration ponctuelle.


❓ Questions fréquentes

Le Zhenwu M890 est-il disponible à l'achat pour les développeurs individuels ?

Non. Le M890 est déployé via l'infrastructure cloud d'Alibaba (Alibaba Cloud). Les développeurs accèdent à ses capacités à travers les API des modèles Qwen, pas en achetant la puce directement.

Le M890 peut-il entraîner des modèles de la taille de GPT-5.5 ?

En théorie, oui, grâce à l'architecture Panjiu AL128 à 128 puces. Mais la puissance de calcul totale d'un cluster M890 reste probablement inférieure à celle des clusters H100/B200 utilisés par OpenAI. Le M890 optimise l'inférence, pas l'entraînement à l'échelle frontière.

Quelle est la différence entre le Zhenwu 810E et le M890 ?

Le 810E avait 96 Go HBM et 700 Go/s d'interconnect. Le M890 passe à 144 Go HBM3 (+50 %) et 800 Go/s (+14 %), avec une revendication de 3× en performance globale. Le saut est surtout notable sur la mémoire, cruciale pour les grands modèles.

Les benchmarks indépendants confirment-ils les 3× ?

Pas encore. Les seuls chiffres disponibles proviennent d'Alibaba. Les résultats de MLPerf ou d'autres benchmarks tiers prendront probablement plusieurs mois à apparaître, comme pour chaque nouvelle puce.

Comment le M890 se compare-t-il aux puces Huawei Ascend ?

Les deux visent le même marché chinois, mais avec des approches différentes. L'Ascend 910C est plus intégré dans l'écosystème gouvernemental chinois, tandis que le M890 bénéficie de l'écosystème cloud commercial d'Alibaba. La comparaison détaillée reste difficile sans benchmarks communs.


✅ Conclusion

Le Zhenwu M890 ne va pas "tuer" Nvidia — mais il prouve que la Chine peut désormais construire des puces IA compétitives sans accès au matériel américain. Avec 144 Go HBM3, un cluster à 128 puces et une intégration directe avec Qwen, Alibaba a posé un jalon sérieux dans la course à l'indépendance semi-conducteurs. Reste à vérifier ces 3× en conditions réelles.