Pénurie de données pour l’IA : Goldman Sachs tire la sonnette d’alarme
new York, États-Unis – Une pénurie alarmante de données d’entraînement menace le développement de l’intelligence artificielle, selon Neema Raphael, directeur des données de goldman Sachs et chef de l’ingénierie des données. Cette situation, révélée lors d’un podcast de la banque américaine, pourrait déjà influencer la manière dont les nouvelles technologies d’IA sont conçues et déployées.
Selon raphael, le “manque de données fraîches” est une réalité qui se fait sentir. Cette contrainte pousse les développeurs à explorer des alternatives, comme l’utilisation de données synthétiques – des informations générées par des machines. Si cette approche offre une source potentiellement illimitée de données, elle soulève des questions cruciales concernant la qualité et la fiabilité des résultats.
L’exemple de Deepseek, une entreprise chinoise, illustre cette tendance. Elle a privilégié l’optimisation des modèles existants plutôt que la collecte de nouvelles données, une stratégie qui pourrait devenir de plus en plus courante.
Cependant, Raphael tempère l’inquiétude, estimant que les entreprises disposent encore de ressources importantes à exploiter. Les ensembles de données propriétaires, détenus par les sociétés, pourraient devenir un atout stratégique majeur, conférant une valeur considérable aux outils d’IA.
Le véritable défi réside dans la capacité à comprendre et à normaliser ces données,en tenant compte du contexte commercial dans lequel elles ont été collectées. La gestion et l’interprétation des données, plus que leur simple volume, seront donc déterminantes pour l’avenir de l’IA.
Cette pénurie de données met en lumière une dépendance croissante à l’égard des informations disponibles sur le web, qui a déjà été largement exploitée. L’avenir du développement de l’IA pourrait donc dépendre de la capacité à trouver des sources de données alternatives et à optimiser l’utilisation de celles qui existent déjà.
