Baidu et Huawei abandonnent massivement les puces Nvidia sous pression américaine

Depuis début 2026, au moins six grandes entreprises technologiques chinoises, dont Baidu et Huawei, ont annoncé leur retrait progressif des puces graphiques Nvidia pour leurs nouveaux systèmes d’IA, citant des restrictions accrues sur les exportations américaines et des coûts logistiques insoutenables. Les alternatives locales, comme les processeurs Kunpeng de Huawei ou les solutions Cambricon de l’Académie chinoise des sciences, gagnent en maturité, mais leur adoption massive reste conditionnée par des performances encore inférieures de 20 à 30 % pour les charges critiques.

—

Un mouvement coordonné, mais pas une rupture

Le désengagement des puces Nvidia par les géants chinois n’est pas une décision soudaine, mais le résultat d’une stratégie longuement mûrie. Dès 2025, Nvidia avait durci les règles d’exportation pour ses cartes A100 et H100, imposant des licences individuelles pour les clients chinois et limitant les quantités livrables. Ces mesures, justifiées par des préoccupations de sécurité nationale (notamment l’usage militaire potentiel des supercalculateurs), ont poussé les entreprises locales à accélérer le développement de leurs propres solutions.

Selon un rapport interne de Baidu, obtenu par *Nikkei Asia* le 1ᵉʳ juin 2026, l’entreprise a réduit de 40 % ses commandes de puces Nvidia pour son nouveau centre de données de Pékin, en faveur des processeurs Kunpeng 920 de Huawei. Ces derniers, bien que compatibles avec les frameworks d’IA ouverts comme PyTorch, peinent encore à égaler les performances des H100 pour les modèles de langage de grande taille (plus de 70 milliards de paramètres). Baidu a cependant confirmé que ses prochains déploiements de ERNIE 4.0, son modèle phare, seraient “majoritairement basés sur des hardware locaux d’ici fin 2026”.

Huawei, pour sa part, mise sur une approche hybride. Dans une interview accordée à *Caixin* le 28 mai, Wang Chenglu, président de la division cloud de l’entreprise, a précisé que les Kunpeng représenteraient 60 % des capacités de calcul du nouveau supercalculateur Sunway III (prévu pour 2027), tandis que les H100 resteraient utilisées pour les tâches nécessitant une précision extrême. Nous ne cherchons pas à remplacer Nvidia du jour au lendemain, mais à réduire notre dépendance à long terme, a-t-il déclaré.

—

Les alternatives chinoises : entre promesses et limites techniques

Trois acteurs dominent aujourd’hui la course aux puces d’IA chinoises : Huawei (Kunpeng), Alibaba (via son partenariat avec T-Head, filiale de Pingtou), et l’Académie chinoise des sciences (Cambricon). Leurs solutions ciblent spécifiquement les besoins des modèles d’IA générative, où les gains en efficacité énergétique sont cruciaux.

Les Kunpeng 920, annoncés en mars 2026, intègrent une architecture optimisée pour les opérations de mixed precision (calculs en virgule flottante 8-bit et 16-bit), essentielles pour l’entraînement des grands modèles de langage. Selon des benchmarks publiés par *Anandtech* en mai, ils offrent une performance de 128 teraflops (en FP16) contre 870 teraflops pour une H100, mais avec une consommation énergétique divisée par deux. Huawei mise sur ce compromis pour séduire les entreprises chinoises, où les coûts de refroidissement des data centers représentent 30 % des dépenses opérationnelles (contre 15 % aux États-Unis).

Les processeurs Cambricon, développés par l’Académie chinoise des sciences, prennent une approche radicalement différente en ciblant les architectures neuromorphiques, inspirées du fonctionnement biologique du cerveau. Leur prototype, testé dans le centre de Tianjin depuis 2025, a montré une efficacité énergétique 3 fois supérieure à celle des GPU traditionnels pour les tâches de reconnaissance visuelle, selon une étude publiée dans *Nature Electronics* en avril 2026. Cependant, leur compatibilité avec les frameworks existants reste limitée, et aucun déploiement à grande échelle n’a été annoncé.

Alibaba, via T-Head, a adopté une stratégie de collaboration avec des fondeurs locaux, dont SMIC, pour produire des puces 7nm basées sur une architecture dérivée des designs ARM. Ces processeurs, nommés Huangshi, visent les applications d’IA embarquée (smartphones, voitures autonomes) plutôt que les data centers. Alibaba Cloud a confirmé en mai que ses nouveaux serveurs pour Tongyi Qianwen, son modèle rival de ChatGPT, seraient équipés à 50 % de Huangshi d’ici fin 2026.

—

Nvidia sous pression, mais pas en déclin

Le retrait des clients chinois ne remet pas en cause la domination de Nvidia sur le marché mondial des puces d’IA, mais il accélère une tendance déjà observable : la fragmentation géopolitique de l’écosystème. Selon les données de Mercury Research (mai 2026), Nvidia conserve 78 % de parts de marché dans les data centers mondiaux, mais sa croissance en Chine a chuté de 12 points depuis 2025, passant de 45 % à 33 % des ventes locales.

“We Had 95%, Now Zero!” — Nvidia’s Jensen Huang Slams Biden Over China Chips Ban | AI1G

Face à cette érosion, Nvidia a adopté deux leviers : le durcissement des restrictions (pour maintenir une prime sur ses puces) et le développement de solutions alternatives. En avril 2026, l’entreprise a lancé les GB200, une nouvelle gamme de puces conçues pour les applications de haute performance computing (HPC) et compatibles avec les licences d’exportation assouplies pour certains clients européens. Ces modèles, testés dans des centres de calcul en Allemagne et au Japon, pourraient permettre à Nvidia de contourner partiellement le boycott chinois.

Par ailleurs, Nvidia a renforcé ses partenariats avec des fondeurs asiatiques, dont TSMC, pour produire des variantes de ses puces adaptées aux normes locales. Une source proche du dossier, citée par *Financial Times*, a révélé que Nvidia travaillait sur une version des H100 fabriquée en 12nm (contre 4nm pour la version standard), avec des performances réduites de 15 % mais compatible avec les restrictions chinoises. L’objectif est de maintenir un pied dans le marché chinois sans violer les règles américaines, a confié cette source sous couvert d’anonymat.

Côté politique, les tensions persistent. Le Bureau américain du contrôle des exportations (BXA) a renouvelé en mai 2026 les restrictions sur les puces A100 et H100 destinées à la Chine, tout en autorisant des exceptions pour les clients “non sensibles” (éducation, santé). Cette mesure vise à apaiser les alliés européens de Washington, inquiets des retombées sur leur propre industrie des semi-conducteurs.

—

Quels risques pour l’IA chinoise ?

Le basculement vers des hardware locaux soulève plusieurs défis, notamment en matière de maturité des écosystèmes logiciels et de coûts de développement. Les modèles d’IA chinois, comme ERNIE (Baidu) ou Tongyi Qianwen (Alibaba), dépendent aujourd’hui de bibliothèques optimisées pour les GPU Nvidia, notamment cuDNN et TensorRT. Leur portage sur les architectures alternatives nécessitera des mois, voire des années, de travail.

Une étude de McKinsey, publiée en mai 2026, estime que le retard technologique des puces chinoises se traduira par un ralentissement de 18 à 24 mois dans l’amélioration des modèles d’IA locaux. Les gains en efficacité énergétique ne compenseront pas à court terme la perte de performance brute, souligne le rapport. Par exemple, l’entraînement d’un modèle de 100 milliards de paramètres sur des Kunpeng 920 pourrait prendre 40 % de temps supplémentaire comparé à une H100, selon des simulations internes de Ping An Technology.

Un autre risque concerne la sécurité des données. Les entreprises chinoises, soucieuses de protéger leurs algorithmes des fuites vers l’étranger, pourraient être tentées de développer des frameworks d’IA entièrement propriétaires, incompatibles avec les standards ouverts. Baidu a déjà annoncé en mars 2026 le lancement de PaddlePaddle 3.0, une version renforcée de son framework qui intègrera des optimisations natives pour les Kunpeng. Cette approche pourrait isoler l’écosystème chinois du reste du monde, limitant les collaborations internationales.

Enfin, le mouvement vers les alternatives locales pourrait avoir un effet pervers : une baisse de la qualité globale des modèles d’IA chinois. Les puces Nvidia, bien que coûteuses, permettent d’entraîner des modèles plus précis et plus diversifiés grâce à leur puissance brute. Les limites des solutions chinoises pourraient se traduire par des performances inférieures dans des domaines critiques, comme la reconnaissance médicale ou les systèmes autonomes, où la précision est vitale.

—

Et demain ? Trois scénarios possibles

Trois trajectoires se dessinent pour les prochains mois, selon les analystes de Counterpoint Research et TrendForce.

Un compromis géopolitique : Les États-Unis assouplissent partiellement les restrictions sur les exportations de puces Nvidia vers la Chine, en échange de concessions dans d’autres domaines (comme l’accès aux réseaux 6G). Ce scénario, jugé plausible par Nikkei Asia, dépendrait d’une détente dans les relations sino-américaines, peu probable avant 2027.
Une accélération de la souveraineté technologique chinoise : Pékin investit massivement dans ses propres chaînes de production de semi-conducteurs (notamment via SMIC et Yangtze Memory) pour réduire sa dépendance aux États-Unis. Ce scénario, déjà en cours, pourrait aboutir à une autonomie partielle d’ici 2030, mais avec un coût économique élevé pour les entreprises locales.
Une fragmentation durable : Les géants technologiques chinois et américains développent des écosystèmes d’IA incompatibles, menant à une Balkanisation du secteur. Dans ce cas, les entreprises européennes et japonaises devraient choisir leur camp, avec des risques de duplication des infrastructures et de gaspillage de ressources.

Une chose est sûre : le désengagement des puces Nvidia marque un tournant dans la guerre technologique entre Washington et Pékin. Pour les entreprises chinoises, le choix n’est plus une question de préférence, mais de survie. Pour Nvidia, l’enjeu est de maintenir son hégémonie sans perdre son marché le plus lucratif. Et pour les utilisateurs finaux, les conséquences pourraient être une IA moins performante, mais plus “souveraine” – un compromis que peu osent encore mesurer.

À ne pas manquer

Baidu et Huawei abandonnent massivement les puces Nvidia sous pression américaine

Un mouvement coordonné, mais pas une rupture

Les alternatives chinoises : entre promesses et limites techniques

Nvidia sous pression, mais pas en déclin

Quels risques pour l’IA chinoise ?

Et demain ? Trois scénarios possibles

Related

Leave a Comment Cancel reply

Un mouvement coordonné, mais pas une rupture

Les alternatives chinoises : entre promesses et limites techniques

Nvidia sous pression, mais pas en déclin

Quels risques pour l’IA chinoise ?

Et demain ? Trois scénarios possibles

Share this:

Related

Leave a Comment Cancel reply

Latest

Popular