Home Sciences et technologiesIA : Simplification et réduction des coûts grâce à la mémoire procédurale

IA : Simplification et réduction des coûts grâce à la mémoire procédurale

by Louis Girard - Tech

IA : Meta révolutionne l’apprentissage automatique avec un “juge” IA auto-formé

SAN FRANCISCO, Californie – Meta a franchi une étape cruciale dans le développement de l’intelligence artificielle, en introduisant un système capable de s’auto-évaluer et de générer ses propres données d’entraînement. Cette innovation promet de rendre les agents d’IA plus autonomes, adaptables et robustes, ouvrant la voie à une automatisation plus sophistiquée dans les entreprises.Jusqu’à présent, l’évaluation des performances des modèles d’IA reposait souvent sur une combinaison de modèles puissants et de règles définies manuellement. Cependant, ces règles se sont avérées fragiles et difficiles à adapter à des tâches complexes et subjectives. la nouvelle approche de Meta consiste à utiliser un grand modèle de langage (LLM) comme “juge”. Ce LLM est capable de fournir une rétroaction nuancée, permettant à l’agent d’IA de s’auto-corriger et d’améliorer ses performances de manière continue. “Combiner des modèles puissants avec des règles manuelles pour calculer les scores d’achèvement fonctionne, mais ces règles sont cassantes et difficiles à généraliser”, explique un expert de Meta. Cette avancée est particulièrement importante pour les tâches qui nécessitent un jugement subjectif, où les critères d’évaluation sont moins clairement définis. En permettant à l’IA de s’auto-évaluer, Meta vise à créer des “travailleurs d’IA” capables de s’adapter à des situations nouvelles et imprévues, sans nécessiter une intervention humaine constante. Implications à long terme : Cette technologie représente un changement de paradigme dans le domaine de l’apprentissage automatique. L’auto-évaluation et la génération de données d’entraînement par l’IA pourraient accélérer considérablement le développement de systèmes d’IA plus performants et plus fiables. Au-delà de l’automatisation des tâches répétitives, cette innovation pourrait avoir des applications dans des domaines tels que la recherche scientifique, la création artistique et la résolution de problèmes complexes. L’IA auto-formée pourrait également jouer un rôle clé dans le développement d’agents virtuels capables d’interagir de manière plus naturelle et intuitive avec les humains. L’évolution vers des IA plus autonomes et adaptables est un processus continu, mais l’approche de Meta représente une avancée significative vers la réalisation de cet objectif.

Une nouvelle technique de Université de Zhejiang et Groupe d’alibaba Donne aux agents du modèle de langage grand (LLM) une mémoire dynamique, ce qui les rend plus efficaces et efficaces dans des tâches complexes. La technique, appelée MISfournit aux agents une «mémoire procédurale» qui est continuellement mise à jour à mesure qu’ils acquièrent de l’expérience,un peu comme la façon dont les humains apprennent de la pratique.

MEMP crée un cadre d’apprentissage à vie où les agents n’ont pas à repartir de zéro pour chaque nouvelle tâche. Au lieu de cela, ils deviennent progressivement meilleurs et plus efficaces car ils rencontrent de nouvelles situations dans des environnements réels, une exigence clé pour une automatisation fiable d’entreprise.

Le cas de la mémoire procédurale dans les agents d’IA

Les agents LLM sont prometteurs pour l’automatisation des processus commerciaux complexes et en plusieurs étapes. Dans la pratique, cependant, ces tâches longs-horizon peuvent être fragiles. Les chercheurs soulignent que des événements imprévisibles comme les pépins de réseau, les modifications de l’interface utilisateur ou le décalage des schémas de données peuvent dérailler l’ensemble du processus. Pour les agents actuels, cela signifie souvent commencer à chaque fois, ce qui peut prendre du temps et coûteux.

Pendant ce temps, de nombreuses tâches complexes, malgré les différences de surface, partagent des points communs structurels profonds. Au lieu de réapprendre ces modèles à chaque fois, un agent devrait être en mesure d’extraire et de réutiliser son expérience des succès et des échecs passés, soulignent les chercheurs. Cela nécessite une «mémoire procédurale» spécifique, qui chez l’homme est la mémoire à long terme responsable des compétences telles que la saisie ou la conduite d’un vélo, qui devient automatique avec la pratique.


IA : Meta révolutionne l’apprentissage automatique avec un “juge” IA auto-formé

SAN FRANCISCO, Californie – Meta a franchi une étape cruciale dans le développement de l’intelligence artificielle, en introduisant un système capable de s’auto-évaluer et de générer ses propres données d’entraînement. Cette innovation promet de rendre les agents d’IA plus autonomes, adaptables et robustes, ouvrant la voie à une automatisation plus sophistiquée dans les entreprises. Jusqu’à présent, le calcul des performances des modèles d’IA reposait souvent sur une combinaison de modèles puissants et de règles définies manuellement. Cependant, ces règles se sont avérées fragiles et difficiles à adapter à des situations complexes. Meta propose une alternative : un Large Language Model (LLM) agissant comme un “juge”, capable de fournir une rétroaction nuancée et supervisée. Cette approche permet à l’IA de s’auto-corriger sur des tâches complexes et subjectives, rendant le processus d’apprentissage plus évolutif et fiable. L’impact potentiel est considérable. Au lieu de dépendre d’interventions humaines constantes pour affiner les modèles,l’IA peut désormais apprendre et s’améliorer de manière autonome. Un changement de paradigme pour l’IA d’entreprise Cette avancée représente un changement de paradigme dans le domaine de l’IA d’entreprise. Les entreprises sont de plus en plus à la recherche de solutions d’automatisation capables de gérer des tâches complexes et imprévisibles. Les agents d’IA traditionnels, limités par des règles rigides, peinent souvent à répondre à ces exigences. Le système de Meta,en revanche,offre une flexibilité et une adaptabilité accrues. il permet aux entreprises de déployer des agents d’IA capables de s’adapter à des environnements changeants et de prendre des décisions éclairées dans des situations ambiguës. Les implications à long terme L’auto-évaluation et la génération de données d’entraînement par l’IA ne sont pas seulement une amélioration technique, mais une étape fondamentale vers la création d’une IA véritablement autonome. Cela pourrait conduire à des applications révolutionnaires dans divers secteurs,notamment : Service client : Agents virtuels capables de résoudre des problèmes complexes sans intervention humaine. Analyze de données : Identification de tendances et d’informations cachées dans des ensembles de données massifs. Développement de produits : conception et optimisation de produits en fonction des besoins des clients. Automatisation industrielle : Robots capables de s’adapter à des environnements de production dynamiques. L’innovation de Meta marque un tournant dans l’évolution de l’IA,ouvrant la voie à une nouvelle génération d’agents intelligents capables de transformer la façon dont nous travaillons et vivons. L’avenir de l’automatisation est en marche,et il est alimenté par une IA qui apprend,s’adapte et se perfectionne sans cesse.

IA : Meta révolutionne l’apprentissage automatique avec un “juge” IA auto-formé

SAN FRANCISCO, Californie – Meta a franchi une étape cruciale dans le développement de l’intelligence artificielle, en introduisant un système capable de s’auto-évaluer et de générer ses propres données d’entraînement. Cette innovation promet de rendre les agents d’IA plus autonomes, adaptables et robustes, ouvrant la voie à une automatisation plus sophistiquée dans les entreprises.Jusqu’à présent, l’évaluation des performances des modèles d’IA reposait souvent sur une combinaison de modèles puissants et de règles définies manuellement. Cependant, ces règles se sont avérées fragiles et difficiles à adapter à des tâches complexes et subjectives. La nouvelle approche de Meta consiste à utiliser un grand modèle de langage (LLM) comme “juge”. Ce LLM est capable de fournir une rétroaction nuancée, permettant à l’agent d’IA de s’auto-corriger et d’améliorer ses performances de manière continue. “Cela rend l’ensemble de la boucle d’apprentissage plus évolutive et robuste”,explique un expert de meta. “Nous nous rapprochons de la construction de travailleurs d’IA véritablement autonomes, capables de s’adapter à des environnements changeants et de résoudre des problèmes complexes sans intervention humaine constante.” Implications à long terme : Cette avancée représente un changement de paradigme dans le domaine de l’apprentissage automatique. En éliminant la dépendance aux règles codées en dur, Meta ouvre la voie à des systèmes d’IA plus flexibles et plus performants. Les applications potentielles sont vastes : Automatisation des processus d’entreprise : Des tâches complexes nécessitant un jugement subjectif,comme l’évaluation de la qualité du contenu ou la gestion de la relation client,pourraient être automatisées avec une plus grande précision. Développement de produits et services : L’IA auto-évaluée pourrait accélérer le processus de développement en identifiant rapidement les erreurs et en suggérant des améliorations. * Recherche scientifique : La capacité de l’IA à s’auto-corriger pourrait accélérer la découverte scientifique en permettant aux modèles d’explorer des hypothèses complexes de manière plus efficace. L’introduction de ce “juge” IA auto-formé par Meta marque une étape significative vers la réalisation du potentiel complet de l’intelligence artificielle, et pourrait bien redéfinir la manière dont les entreprises et les organisations abordent l’automatisation et l’innovation.

IA : Meta révolutionne l’apprentissage automatique avec un “juge” IA auto-formé

SAN FRANCISCO, Californie – Meta a franchi une étape cruciale dans le développement de l’intelligence artificielle, en introduisant un système capable de s’auto-évaluer et de générer ses propres données d’entraînement. Cette innovation promet de rendre les agents d’IA plus autonomes,adaptables et robustes,ouvrant la voie à une automatisation plus sophistiquée dans les entreprises. Jusqu’à présent, l’évaluation des performances des modèles d’IA reposait souvent sur une combinaison de modèles puissants et de règles définies manuellement. Cependant, ces règles se sont avérées fragiles et difficiles à adapter à des situations complexes. Meta propose une alternative : un Large Language Model (LLM) agissant comme un “juge”, capable de fournir une rétroaction nuancée et précise. Cette approche permet à l’IA de s’auto-corriger sur des tâches complexes et subjectives, rendant le processus d’apprentissage plus évolutif et fiable.L’impact potentiel est considérable. Au lieu de dépendre d’interventions humaines constantes pour affiner les modèles, l’IA peut désormais s’améliorer de manière autonome, accélérant ainsi le développement et le déploiement de solutions d’IA avancées. Un changement de paradigme dans l’IA Cette avancée s’inscrit dans une tendance plus large vers l’autonomie de l’IA. Les premières générations de systèmes d’IA nécessitaient une programmation explicite pour chaque tâche.Les modèles d’apprentissage automatique actuels, bien que plus sophistiqués, dépendent encore fortement de vastes ensembles de données étiquetées par des humains. Le système de Meta représente un pas vers une IA capable d’apprendre et de s’améliorer sans intervention humaine directe. Cela pourrait avoir des implications majeures dans de nombreux secteurs, notamment : Automatisation des processus métier : Des tâches complexes et nécessitant du jugement, comme le service client ou l’analyse de données, pourraient être automatisées plus efficacement. Développement de logiciels : L’IA pourrait aider à identifier et à corriger les erreurs dans le code, accélérant ainsi le processus de développement. * Recherche scientifique : L’IA pourrait analyser des données complexes et formuler des hypothèses, aidant les chercheurs à faire des découvertes plus rapidement. L’introduction de ce “juge” IA auto-formé par Meta marque une étape importante dans la quête d’une intelligence artificielle véritablement autonome et adaptable, capable de relever les défis complexes du monde réel. L’avenir de l’IA semble de plus en plus orienté vers des systèmes capables d’apprendre, de s’améliorer et de s’adapter sans intervention humaine constante.
  • transformer l’énergie en un avantage stratégique
  • Architecting Inférence efficace pour les gains de débit réels
  • Déverrouiller un retour sur investissement compétitif avec des systèmes d’IA durables
  • IA : Meta révolutionne l’apprentissage automatique avec un “juge” IA auto-formé

    SAN FRANCISCO, californie – Meta a franchi une étape cruciale dans le développement de l’intelligence artificielle, en introduisant un système capable de s’auto-évaluer et de générer ses propres données d’entraînement. cette innovation promet de rendre les agents d’IA plus autonomes, adaptables et robustes, ouvrant la voie à une automatisation plus sophistiquée dans les entreprises. Jusqu’à présent, le calcul des performances des modèles d’IA reposait souvent sur une combinaison de modèles puissants et de règles définies manuellement. Cependant, ces règles se sont avérées fragiles et difficiles à adapter à des situations complexes. Meta propose une alternative : un Large Language model (LLM) agissant comme un “juge”, capable de fournir une rétroaction nuancée et supervisée. Cette approche permet à l’IA de s’auto-corriger sur des tâches complexes et subjectives, rendant le processus d’apprentissage plus évolutif et fiable. L’impact potentiel est considérable. Au lieu de dépendre d’interventions humaines constantes pour affiner les modèles, l’IA peut désormais apprendre et s’améliorer de manière autonome. Un changement de paradigme pour l’IA d’entreprise Cette avancée représente un changement de paradigme dans le domaine de l’IA d’entreprise. Les entreprises sont de plus en plus à la recherche de solutions d’automatisation capables de gérer des tâches complexes et imprévisibles. Les agents d’IA traditionnels, limités par des règles rigides, peinent souvent à répondre à ces exigences. Le système de Meta, en revanche, offre une flexibilité et une adaptabilité accrues. Il permet aux entreprises de déployer des agents d’IA capables de s’adapter à des environnements changeants et de prendre des décisions éclairées dans des situations ambiguës. Les implications à long terme L’auto-évaluation et la génération de données d’entraînement par l’IA ne sont pas seulement une amélioration technique,mais une étape fondamentale vers la création d’une IA véritablement autonome. Cela pourrait conduire à des applications révolutionnaires dans divers secteurs, notamment : Service client : Agents virtuels capables de comprendre et de répondre aux besoins des clients de manière plus personnalisée et efficace. Analyse de données : Systèmes d’IA capables d’identifier des tendances et des informations précieuses dans des ensembles de données complexes. Automatisation des processus : Robots logiciels capables d’automatiser des tâches répétitives et chronophages, libérant ainsi les employés pour des activités plus stratégiques. Recherche et développement : Accélération de la découverte scientifique grâce à des agents d’IA capables de formuler des hypothèses, de mener des expériences et d’analyser les résultats de manière autonome. L’innovation de Meta marque donc un tournant dans l’évolution de l’IA, ouvrant la voie à une nouvelle génération d’agents intelligents capables de transformer la façon dont nous travaillons et vivons.
    À partir de zéro (en haut) vs en utilisant la mémoire procédurale (en bas) (source: arXiv)

    Les systèmes d’agent actuels manquent souvent de cette capacité. Leurs connaissances procédurales sont généralement fabriquées à la main par les développeurs, stockées dans des modèles invites rigides ou intégrées dans les paramètres du modèle, qui sont coûteux et lents à mettre à jour. Même les cadres existants à mémoire de mémoire ne fournissent que des abstractions grossières et ne traitent pas de manière adéquate comment les compétences doivent être construites, indexées, corrigées et finalement élaguées sur le cycle de vie d’un agent.

    Par conséquent,les chercheurs notent Leur papier“Il n’y a pas de moyen de principe de quantifier à quel point un agent évolue efficacement son répertoire procédural ou pour garantir que les nouvelles expériences s’améliorent plutôt que d’éroder les performances.”

    Comment fonctionne MEMP

    Le MEMP est un cadre agnostique de tâche qui traite la mémoire procédurale comme un composant central à optimiser.Il se compose de trois étapes clés qui fonctionnent dans une boucle continue: construire,récupérer et mettre à jour la mémoire.

    Les souvenirs sont construits à partir des expériences passées d’un agent ou des «trajectoires». Les chercheurs ont exploré le stockage de ces souvenirs dans deux formats: actions motrices, étape par étape; ou distillant ces actions en abstractions de niveau supérieur et de type script. Pour la récupération, l’agent recherche sa mémoire pour l’expérience passée la plus pertinente lorsqu’elle a donné une nouvelle tâche. L’équipe a expérimenté différentes méthodes, une telle recherche de vecteur, pour correspondre à la description de la nouvelle tâche aux requêtes passées ou à l’extraction de mots clés pour trouver le meilleur ajustement.

    Le composant le plus critique est le mécanisme de mise à jour. MEMP présente plusieurs stratégies pour garantir que la mémoire de l’agent évolue.Alors qu’un agent accomplit plus de tâches, sa mémoire peut être mise à jour en ajoutant simplement la nouvelle expérience, en filtrant uniquement les résultats réussis ou, plus efficacement, en réfléchissant aux échecs pour corriger et réviser la mémoire d’origine.

    MEMP framework (Source: ArXIV)

    Cette concentration sur la mémoire dynamique et évolutive place le MEMP dans un domaine de recherche croissant visant à rendre les agents de l’IA plus fiables pour les tâches à long terme. Le travail est parallèle à d’autres efforts, tels que MEM0qui consolide les informations clés des longues conversations en faits structurés et graphiques de connaissances pour assurer la cohérence. De la même manière, A-mem Permet aux agents de créer et de lier de manière autonome des «notes de mémoire» à partir de leurs interactions, formant une structure de connaissances complexe au fil du temps.

    Cependant,le co-auteur Runnan Fang met en évidence une distinction critique entre MEMP et d’autres cadres.

    «MEM0 et A-MEM sont d’excellentes œuvres… mais ils se concentrent sur la rappel de contenu saillant dans Une seule trajectoire ou conversation », a commenté Fang pour VentureBeat. Essentiellement, ils aident un agent à se souvenir de« ce qui »s’est produit.« MEMP, en revanche, cible la mémoire procédurale transversale. » il se concentre sur les connaissances «comment» qui peuvent être généralisées sur des tâches similaires,empêchant l’agent de se réexplorer à partir de zéro à chaque fois.

    “En distillant les flux de travail réussis passés en priors procéduraux réutilisables, MEMP augmente les taux de réussite et raccourcit les étapes”, a ajouté Fang. «Surtout, nous introduisons également un mécanisme de mise à jour afin que cette mémoire procédurale continue de s’améliorer – après tout, la pratique rend également parfait pour les agents.»

    Surmonter le problème du «démarrage à froid»

    Bien que le concept d’apprentissage des trajectoires passés soit puissant, il soulève une question pratique: comment un agent construit-il sa mémoire initiale lorsqu’il n’y a pas d’exemples parfaits à apprendre? Les chercheurs abordent ce problème de «démarrage à froid» avec une approche pragmatique.

    Fang a expliqué que les développeurs peuvent d’abord définir une métrique d’évaluation robuste au lieu de nécessiter une trajectoire «or» parfaite à l’avance. Cette métrique,qui peut être basée sur des règles ou même un autre LLM,marque la qualité des performances d’un agent. “Une fois cette métrique en place, nous laissons les modèles de pointe explorer dans le flux de travail de l’agent et conserver les trajectoires qui atteignent les scores les plus élevés”, a déclaré Fang. Ce processus amortit rapidement un ensemble initial de souvenirs utiles, permettant à un nouvel agent de se mettre à la vitesse sans programmation manuelle approfondie.

    MEMP en action

    Pour tester le cadre, l’équipe a mis en œuvre un MEMP au-dessus des LLM puissants comme GPT-4O, Claude 3.5 Sonnet et Qwen2.5les évaluer sur des tâches complexes comme les tâches ménagères dans la référence Alfworld et la recherche d’informations dans Travelplanner. Les résultats ont montré que la construction et la récupération de la mémoire procédurale permettaient à un agent de distiller et de réutiliser efficacement son expérience antérieure.

    Pendant les tests,les agents équipés d’un MEMP ont non seulement atteint des taux de réussite plus élevés,mais sont devenus beaucoup plus efficaces. Ils ont éliminé l’exploration et les essais et erreurs infructueux, conduisant à une réduction substantielle du nombre d’étapes et de la consommation de jeton requise pour accomplir une tâche.

    L’utilisation de la mémoire procédurale (à droite) aide les agents à accomplir des tâches dans moins d’étapes et à utiliser moins de jetons (source: arXIV)

    L’une des conclusions les plus importantes pour les applications d’entreprise est que la mémoire procédurale est transférable. Dans une expérience, la mémoire procédurale générée par le puissant GPT-4O a été donnée à un modèle beaucoup plus petit, Qwen2.5-14b. Le modèle plus petit a connu une augmentation significative des performances, améliorant son taux de réussite et réduisant les étapes nécessaires pour effectuer les tâches.

    Selon Fang, cela fonctionne parce que les modèles plus petits gèrent souvent bien les actions simples et en une seule étape, mais faiblissent en ce qui concerne la planification et le raisonnement long-horizon. La mémoire procédurale du modèle plus grand comble efficacement cet écart de capacité. Cela suggère que les connaissances peuvent être acquises à l’aide d’un modèle de pointe, puis déployée sur des modèles plus petits et plus rentables sans perdre les avantages de cette expérience.

    Vers des agents vraiment autonomes

    En équipant des agents de mécanismes de mise à jour de mémoire, le cadre du MEMP leur permet de construire et d’affiner en permanence leurs connaissances procédurales tout en opérant dans un environnement en direct. Les chercheurs ont constaté que cela avait doté l’agent d’une «maîtrise continue, presque linéaire de la tâche».

    Cependant, le chemin de l’autonomie complète nécessite de surmonter un autre obstacle: de nombreuses tâches réelles, telles que la production d’un rapport de recherche, n’ont pas de signal de réussite simple.Pour s’améliorer en continu, un agent doit savoir s’il a fait du bon travail. Fang dit que l’avenir réside dans l’utilisation des LLM eux-mêmes comme juges.

    «Aujourd’hui, nous combinons souvent des modèles puissants avec des règles fabriquées à la main pour calculer les scores d’achèvement», note-t-il. «Cela fonctionne, mais les règles rédigées sont cassantes et difficiles à généraliser.»

    Un Llm-as-juge pourrait fournir la rétroaction de supervision nuancée nécessaire pour qu’un agent se corrige sur des tâches complexes et subjectives.Cela rendrait l’ensemble de la boucle d’apprentissage plus évolutive et robuste, marquant une étape critique vers la construction des travailleurs d’IA résilients, adaptables et vraiment autonomes nécessaires à l’automatisation des entreprises sophistiquées.

    You may also like

    Leave a Comment

    This site uses Akismet to reduce spam. Learn how your comment data is processed.