Deepseek V3 : le coût réel de l’IA chinoise révélé, un défi pour l’Occident ?
Pékin, Chine – Le modèle d’intelligence artificielle Deepseek V3, présenté comme une avancée majeure et potentiellement plus économique que ses concurrents occidentaux, a vu son coût de développement dévoilé. Loin des estimations initiales, le projet aurait englouti près de 5,87 millions de dollars, incluant 2,79 millions d’heures de calcul sur 2 048 GPU H800, soit environ deux mois de formation.
Ces chiffres, initialement sous-estimés selon certaines sources, soulèvent des questions sur la véritable efficacité de Deepseek.L’achat du matériel nécessaire, 256 serveurs GPU, dépasserait les 51 millions de dollars, sans compter les coûts de recherche et développement, d’acquisition et de nettoyage des données.
L’analyze comparative avec le modèle Llama 4 de Meta révèle une complexité inattendue. Si Deepseek V3 est plus grand que Llama 4 Maverick, il a été entraîné sur un volume de données significativement inférieur (14,8 billions de jetons contre 22 à 40 billions pour Llama 4). Meta a donc formé un modèle légèrement plus petit en un temps de calcul comparable, mais avec une quantité de données d’entraînement bien plus importante.
Cette révélation met à mal l’idée que Deepseek aurait réussi à développer un modèle performant à moindre coût. Elle souligne la complexité et l’investissement massif nécessaires pour rivaliser dans le domaine de l’intelligence artificielle de pointe.
Contexte et perspectives :
L’ascension rapide de l’IA chinoise, incarnée par des entreprises comme Deepseek, représente un défi croissant pour les acteurs occidentaux. La course à la performance et à l’efficacité est féroce, et les stratégies adoptées par chaque camp divergent.Alors que Meta privilégie l’entraînement sur des volumes massifs de données, Deepseek semble miser sur une architecture plus sophistiquée, mais nécessitant des ressources considérables.
L’avenir de l’IA dépendra de la capacité à optimiser à la fois l’architecture des modèles et l’utilisation des données, tout en maîtrisant les coûts de développement. La transparence sur ces coûts, comme le cas de Deepseek le démontre, est essentielle pour une évaluation réaliste des progrès et des défis de cette technologie en pleine expansion. L’investissement continu dans la recherche et le développement, ainsi que l’accès à des infrastructures de calcul performantes, resteront des facteurs déterminants pour le succès dans ce domaine.
