NVIDIA pulvérise les records d’inférence IA avec sa plateforme Blackwell, propulsant une nouvelle ère de performances
SANTA CLARA, Californie – NVIDIA a annoncé aujourd’hui des performances d’inférence de modèles de langage de grande taille (LLM) révolutionnaires, obtenues grâce à sa nouvelle plateforme Blackwell et à des techniques d’optimisation innovantes. Les résultats, validés par les benchmarks MLPerf V5.1, marquent une avancée significative dans le domaine de l’intelligence artificielle, promettant des applications plus rapides, plus efficaces et plus abordables.
La clé de cette performance réside dans une approche appelée “service désagrégé”, qui sépare les étapes de traitement du contexte et de génération des LLM.Cette division permet d’optimiser chaque phase indépendamment,augmentant considérablement le débit global. NVIDIA affirme que cette technique a permis d’obtenir une augmentation de près de 50% des performances par GPU avec les systèmes GB200 NVL72 par rapport aux GPU Blackwell sur un serveur NVIDIA DGX B200.NVIDIA a également mis en œuvre son framework d’inférence Dynamo pour ces soumissions, démontrant son engagement envers l’innovation logicielle.
Ces avancées ne sont pas l’œuvre exclusive de NVIDIA. Un large éventail de partenaires,incluant des géants du cloud comme Azure,Oracle et des fabricants de serveurs tels que Dell Technologies,HPE et Lenovo,ont également soumis des résultats impressionnants basés sur les plateformes NVIDIA Blackwell et Hopper.
Qu’est-ce que cela signifie pour l’avenir de l’IA ?
Ces améliorations en matière d’inférence ont des implications majeures pour un large éventail d’applications d’IA. Une inférence plus rapide et plus efficace se traduit par :
Des chatbots et assistants virtuels plus réactifs : Une expérience utilisateur améliorée grâce à des réponses instantanées.
Une analyze de données plus rapide : Permettant aux entreprises de prendre des décisions plus éclairées en temps réel.
Des applications d’IA plus accessibles : Réduction des coûts et des barrières à l’entrée pour les organisations de toutes tailles.
Des avancées dans la recherche scientifique : Accélération de la découverte dans des domaines tels que la médecine, la biologie et la physique.
La plateforme NVIDIA AI, désormais disponible auprès des principaux fournisseurs de cloud et fabricants de serveurs, offre un coût total de possession (TCO) inférieur et un retour sur investissement amélioré pour les entreprises qui déploient des applications d’IA sophistiquées.
Pour plus d’informations sur ces technologies et les benchmarks MLPerf V5.1, consultez le blog technique de Nvidia et le Nvidia DGX Cloud Performance Explorer.
