2023-10-25 18:00:56
Mis à jour
Des chercheurs de l’Université de New York et de Pompeu Fabra ont développé une technique pour améliorer la capacité des outils d’intelligence artificielle à généraliser à partir de ce qu’ils leur enseignent.
La capacité des gens àsaisir un concept et l’appliquer à d’autres usages C’est l’une des principales manifestations du caractère unique de l’intelligence humaine. Intégrer un enseignement spécifique pour ensuite pouvoir le généraliser pour l’utiliser dans différentes conditions. Dans les années 1980, un groupe de philosophes et de spécialistes des sciences cognitives a souligné que cette capacité humaine constituait une barrière insurmontable à l’intelligence artificielle (IA) ; Les réseaux de neurones artificiels – les moteurs qui pilotent l’IA et l’apprentissage automatique – pourraient ne pas être en mesure d’établir ces connexions.
Au cours des dernières décennies, les scientifiques ont développé des lignes de recherche pour tester ces limites et intégrer la capacité de faire des « généralisations compositionnelles » aux nouvelles technologies. Cette semaine, des chercheurs de l’Université de New York (NYU) et de l’Université Pompeu Fabra de Barcelone décrivent dans le magazine Nature une de ces lignes. Appelée Meta-learning for Compositionality (MLC), cette approche surpasse celles existantes, selon ses auteurs, avec des résultats similaires – et, dans certains cas, supérieurs – aux performances humaines.
La méthode se concentre sur entraîner des réseaux de neurones artificiels, les systèmes derrière de nombreuses technologies actuelles, par exemple celles liées à la reconnaissance vocale et au traitement du langage naturel. Les réseaux de neurones sont formés pour améliorer la généralisation compositionnelle par la pratique et la mise à jour continue.
Certains concepteurs des systèmes d’IA actuels avaient émis l’hypothèse que la capacité de généralisation pouvait surgir spontanément avec des méthodes de formation standard, tandis que d’autres ont tenté de développer des architectures spécifiques pour acquérir ces capacités.
Les auteurs de l’étude en Nature Ils soulignent que le MLC démontre que la pratique explicite de ces compétences permet à ces systèmes de débloquer de nouvelles facultés. “Depuis 35 ans, les chercheurs en sciences cognitives, en intelligence artificielle, en linguistique et en philosophie débattent pour savoir si les réseaux de neurones peuvent parvenir à une généralisation systématique de type humain”, explique Brenden Lake, l’un des auteurs des travaux, professeur au Data Science Center et au Département de psychologie à NYU. “Nous avons démontré, pour la première fois, que “Un réseau neuronal générique peut imiter ou surpasser la généralisation systématique humaine en comparaison directe.”
recherche innovante
Pour tester l’efficacité de la méthode, Lake et Marco Baroni, chercheur à l’Institut Catalana de Recerca i Estudis Avanats et professeur au Département de Traduction et Sciences du Langage de l’Université Pompeu Fabra, a mené une série d’expériences dans lesquelles des participants humains et le MLC ont effectué des tâches identiques. Cependant, au lieu d’avoir à apprendre la signification de vrais mots – des termes que les humains connaissent peut-être déjà – les participants et l’IA ont dû apprendre la signification de termes créés par les chercheurs et les appliquer tels qu’ils les avaient conçus.
Les performances de l’IA lors des tests étaient généralement aussi bonnes que celles des participants humains et, dans certains tests, meilleures. ET les deux groupes ont surperformé ChatGPT et GPT-4. “Il s’agit d’un article ingénieux lorsqu’on compare la capacité de prédiction des réseaux neuronaux génératifs avec celle des humains”, analyse Teodoro Calonge, professeur du Département d’informatique de l’Université de Valladolid, dans des déclarations au Science Media Center Spain (SMC). . “Pour ce faire, ils ont conçu une batterie de tests basés sur la psychologie de l’intelligence.”
Cependant, Calonge souligne qu’il s’agit d’un premier travail et Il est encore trop tôt pour prédire le chemin que pourrait prendre cette nouvelle méthode de mise en relation des concepts. “Je ne peux pas dire si c’est une ligne de recherche qui va offrir de grandes avancées à court ou moyen terme”, précise-t-il. “Bien sûr, je ne crois pas que cela répondra aux questions qui se posent actuellement dans le domaine de “l’explicabilité de l’intelligence artificielle” et, en particulier, dans le domaine de l’intelligence artificielle et de la médecine, où se trouve le principal point de suspicion” .
#Nouvelle #avancée #pour #lintelligence #artificielle #pense #comme #humain #elle #commence #généraliser #partir #quelle #appris
1698250717