Les scientifiques développent une IA qui peut transformer l’activité cérébrale en texte | Science

0
30

La lecture des esprits vient de se rapprocher de la réalité: les scientifiques ont développé une intelligence artificielle qui peut transformer l’activité cérébrale en texte.

Bien que le système fonctionne actuellement sur les schémas neuronaux détectés pendant que quelqu’un parle à haute voix, les experts disent qu’il pourrait éventuellement aider à la communication pour les patients qui ne peuvent pas parler ou taper, tels que ceux atteints du syndrome de l’enfermement.

“Nous n’en sommes pas encore là, mais nous pensons que cela pourrait être la base d’une prothèse vocale”, a déclaré le Dr Joseph Makin, co-auteur de la recherche de l’Université de Californie à San Francisco.

Dans la revue Nature Neuroscience, Makin et ses collègues révèlent comment ils ont développé leur système en recrutant quatre participants qui avaient des réseaux d’électrodes implantés dans leur cerveau pour surveiller les crises d’épilepsie.

Il a été demandé à ces participants de lire à haute voix à partir de 50 phrases fixes plusieurs fois, dont «Tina Turner est une chanteuse pop» et «Ces voleurs ont volé 30 bijoux». L’équipe a suivi leur activité neuronale pendant qu’ils parlaient.

Ces données ont ensuite été introduites dans un algorithme d’apprentissage automatique, un type de système d’intelligence artificielle qui a converti les données d’activité cérébrale pour chaque phrase parlée en une chaîne de nombres.

Pour s’assurer que les chiffres ne concernent que les aspects de la parole, le système a comparé les sons prédits à partir de petits morceaux des données d’activité cérébrale avec l’audio enregistré. La chaîne de nombres a ensuite été introduite dans une seconde partie du système qui l’a convertie en une séquence de mots.

Au début, le système crachait des phrases absurdes. Mais à mesure que le système comparait chaque séquence de mots avec les phrases qui étaient réellement lues à haute voix, il s’améliorait, apprenant comment la chaîne de nombres était liée aux mots et quels mots avaient tendance à se suivre.

L’équipe a ensuite testé le système, générant un texte écrit uniquement à partir de l’activité cérébrale pendant la parole.

Le système n’était pas parfait. Parmi ses erreurs, “Ces musiciens s’harmonisent merveilleusement” a été décodé comme “Les épinards étaient un chanteur célèbre”, et “Un rouleau de fil de fer était près du mur” est devenu “Will Robin portera un lis jaune”.

Cependant, l’équipe a constaté que la précision du nouveau système était beaucoup plus élevée que les approches précédentes. Bien que la précision varie d’une personne à l’autre, pour un participant, seulement 3% de chaque phrase en moyenne devaient être corrigés – plus élevé que le taux d’erreur de 5% pour les transcripteurs humains professionnels. Mais, souligne l’équipe, contrairement à ce dernier, l’algorithme ne gère qu’un petit nombre de phrases.

«Si vous essayez de sortir du [50 sentences used] le décodage devient bien pire », a déclaré Makin, ajoutant que le système repose probablement sur une combinaison d’apprentissage de phrases particulières, d’identification des mots de l’activité cérébrale et de reconnaissance des modèles généraux en anglais.

L’équipe a également constaté que la formation de l’algorithme sur les données d’un participant signifiait moins de données de formation de la part de l’utilisateur final – ce qui pourrait rendre la formation moins onéreuse pour les patients.

Le Dr Christian Herff, un expert dans le domaine de l’Université de Maastricht qui n’était pas impliqué dans l’étude, a déclaré que la recherche était excitante car le système utilisait moins de 40 minutes de données de formation pour chaque participant, et une collection limitée de phrases, plutôt que des millions d’heures généralement nécessaires.

“Ce faisant, ils atteignent des niveaux de précision qui n’ont pas été atteints jusqu’à présent”, a-t-il déclaré.

Cependant, il a noté que le système n’était pas encore utilisable pour de nombreux patients gravement handicapés car il reposait sur l’activité cérébrale enregistrée par des personnes prononçant une phrase à voix haute.

“Bien sûr, c’est une recherche fantastique, mais ces gens pourraient également utiliser” OK Google “”, a-t-il déclaré. “Ce n’est pas la traduction de la pensée [but of brain activity involved in speech]. “

Herff a déclaré que les gens ne devraient pas s’inquiéter que les autres lisent leurs pensées pour l’instant: les électrodes cérébrales doivent être implantées, tandis que la parole imaginée est très différente de la voix intérieure.

Mais le Dr Mahnaz Arvaneh, expert en interfaces cerveau-machine à l’Université de Sheffield, a déclaré qu’il était important de considérer les questions éthiques maintenant. “Nous [are still] très, très loin du point où les machines peuvent lire dans nos esprits », a-t-elle déclaré. “Mais cela ne signifie pas que nous ne devons pas y penser et nous ne devons pas planifier à ce sujet.”

.

LEAVE A REPLY

Please enter your comment!
Please enter your name here

This site uses Akismet to reduce spam. Learn how your comment data is processed.