Nouvelles Du Monde

Scarlett Johansson reconnaît sa voix dans Chat-GPT.

Scarlett Johansson reconnaît sa voix dans Chat-GPT.

2024-05-22 17:50:00

Un épisode sur une nouvelle voix de Chat-GPT montre comment les entreprises technologiques de la Silicon Valley aiment fonctionner : au lieu de demander la permission, elles préfèrent demander pardon par la suite. Il serait en effet facile de modifier artificiellement une voix pour qu’elle ne puisse plus être identifiée.

Voix recherchée : Scarlett Johansson au Festival de Cannes, le 23 mai 2023.

Gareth Cattermole / Getty

Un homme tombe amoureux d’une IA – telle est l’étrange intrigue du film « Her » : un homme timide retarde son divorce. Par peur de la solitude. C’est pourquoi il achète un nouveau système d’exploitation pour son ordinateur. Dès son installation, le logiciel lui parle.

Au début, les conversations sont gênantes. Mais Samantha, comme le système s’appelle lui-même, devient de plus en plus intelligente. Les conversations deviennent plus profondes, d’abord amicales, mais bientôt aussi intimes. C’était un film de science-fiction de 2013. Mais aujourd’hui, la fiction est devenue réalité. Lorsque Open AI a lancé son nouveau modèle de langage Chat-GPT 4.o la semaine dernière, on ne pouvait s’empêcher de penser à « Elle ».

Parce que le nouveau modèle communique de la même manière avec les gens, rit, provoque et comprend même le sarcasme. Lors du lancement, Sam Altman, PDG d’Open AI, a publié le titre du film. sur X: « Ici » sans commentaire. Avant cela, il avait assisté à une conférence dita déclaré qu’il avait aimé le film et l’a décrit comme « prophétique » sur la façon dont les humains interagiraient avec l’IA à l’avenir.

Lundi, on a appris qu’il existait un autre parallèle entre « Her » et Chat-GPT 4.o : la voix. Scarlett Johannsson, l’actrice qui a doublé Samantha, s’est reconnue dans les démos de Chat-GPT. “J’étais choqué, en colère et je ne pouvais pas croire que M. Altman utiliserait une voix si semblable à la mienne que des amis proches et des personnalités médiatiques ne pouvaient pas faire la différence”, a écrit Johansson dans un article. Post Instagramqu’elle a publié sur le profil d’un journaliste américain.

Lire aussi  vendu plus de 40 millions de consoles...

Scarlett Johansson a-t-elle été intentionnellement laissée de côté ?

Johannson a été contactée par Altman l’automne dernier pour lui demander si elle acceptait l’utilisation de sa voix. Il lui a dit que sa voix « comblerait le fossé entre les entreprises technologiques et la scène créative », « rassurerait » les utilisateurs et les aiderait à mieux faire face au « changement sismique » dans la relation entre les humains et l’intelligence artificielle.

Cependant, Johansson a refusé de partager sa voix avec AI après « un examen attentif et pour des raisons personnelles ». Elle fut d’autant plus surprise que la voix appelée « Sky » dans Chat-GPT lui ressemblait. D’autant plus que Sam Altman les a recontactés deux jours avant le lancement du nouveau modèle linguistique pour leur demander de reconsidérer son offre. « Avant que nous puissions échanger des idées, le système existait déjà », écrit Johansson.

La voix fait partie de notre identité

Apparemment, Johansson et sa famille ont immédiatement reconnu sa voix. Ce ne serait pas surprenant. Votre propre voix fait partie de notre identité. Non seulement nous reconnaissons les personnes que nous connaissons à leur voix. Nous lisons dans la voix comment une personne est « à l’écoute ». Est-ce que quelqu’un est nerveux, excité, effrayé ? Mieux nous connaissons la voix d’une personne, plus nous sommes susceptibles de reconnaître son état émotionnel.

« Cependant, le son d’une voix peut être modifié. C’est ce que l’on entend lorsque des imitateurs imitent une personnalité importante», explique Jörg Bohlender. Le médecin est spécialisé dans les troubles de la parole et de la voix et travaille au service de phoniatrie et d’orthophonie clinique de l’hôpital universitaire de Zurich. Le seul moment où vous entendez la voix dans sa forme originale, c’est lorsque vous riez et pleurez, dit-il. Nous pourrions seulement changer un peu le son à volonté.

Le son provient des cordes vocales

Fondamentalement, le son de la voix humaine provient des cordes vocales situées entre la trachée et la gorge. Lorsque nous expulsons l’air des poumons à travers les deux bandes de tissu conjonctif, les cordes vocales commencent à vibrer et des ondes sonores sont créées.

Lire aussi  Découverte d'une cellule "hybride" dans le cerveau: une avancée révolutionnaire

Plus l’air circule rapidement dans les cordes vocales, plus le son est fort. Et plus on tend les cordes vocales, plus le ton est aigu. La profondeur avec laquelle nous pouvons parler est déterminée par l’anatomie. Les hommes ont des cordes vocales plus longues que les femmes.

La voix est caractérisée par les harmoniques, mais pas seulement

La voix s’individualise à mesure que le son traverse la gorge, les fosses nasales et la bouche. Car d’une part on peut y former des voyelles. En revanche, les sons y trouvent leur timbre caractéristique. À nos oreilles, une voix peut paraître chaude, grêle, nasale ou pressée.

Le soi-disant timbre peut être mesuré et défini mathématiquement en analysant les fréquences sonores les plus élevées, appelées harmoniques. L’analyse de Fourier nécessaire à cet effet est un processus antérieur au développement de l’intelligence artificielle.

L’IA peut imiter n’importe quelle voix

Cependant, l’identité d’une voix ne peut pas toujours être dérivée d’une analyse de Fourier. Parce que les locuteurs formés peuvent modifier le spectre harmonique de leur voix. Bien qu’une personne ne puisse pas modifier la taille de ses cavités nasales, elle peut modifier la forme de la chambre de résonance à l’aide de pièces mobiles telles que le palais mou.

Le spectre sonore d’une voix peut également être modifié numériquement à l’aide de procédés techniques bien connus. Il est d’autant plus étonnant qu’Open AI n’ait pas pris la peine de procéder à un tel changement. Il est également possible que la voix de Johansson se distingue particulièrement par d’autres caractéristiques.

“Apparemment, la voix de Scarlett Johanson doit jouir d’un haut niveau de reconnaissance”, déclare le docteur Bohlender. Divers facteurs supplémentaires pourraient jouer un rôle. Par exemple, en plus du timbre d’une voix, l’articulation des consonnes peut être tout à fait unique. Ils sont formés à l’aide de la langue, des dents et du palais. Et enfin, la façon dont quelqu’un accentue des syllabes individuelles dans une phrase ou insère des pauses est très individuelle.

Lire aussi  Le Bloc-notes affiche le nombre de caractères dans le document. Ouvrez le fichier via le menu contextuel - Živě.cz

Silicon Valley typique : vous le faites simplement ?

Pendant ce temps, Open AI a retiré le vote Sky et en un Entrée de blog explique comment c’est arrivé : “Sky n’est pas une imitation de Scarlett Johansson, mais appartient à une autre actrice”, dit-il. “Pour protéger votre vie privée, nous ne pouvons pas partager les noms de nos talents vocaux”, poursuit Open AI.

Pour Martin Steiger, avocat et spécialiste du droit dans l’espace numérique, l’approche d’Open AI est typique des grandes entreprises de la Silicon Valley : « Vous le faites et espérez que vous vous en sortirez », explique Steiger. « Ce n’est que lorsque quelqu’un s’en défendra efficacement que les entreprises reviendront. »

Cependant, on ne sait toujours pas s’il aurait réellement été nécessaire de mettre la voix de Sky hors ligne. S’il s’avère qu’Open AI a trouvé une actrice qui ressemble réellement à Scarlett Johansson, il est en principe autorisé que sa voix soit utilisée sur une plateforme comme Chat-GPT – à condition qu’elle ait donné son consentement.

Cependant, plusieurs faits vont à l’encontre de cette affirmation : premièrement, Altman n’aurait plus eu à contacter Johansson deux jours avant le lancement, il aurait après tout la loi de son côté ; Deuxièmement, il est possible mais peu probable que le sosie de Scarlett Johansson n’ait jamais fait une apparition publique. “Elle serait certainement une invitée bienvenue dans les talk-shows”, déclare Steiger. Puisqu’elle est actrice selon Open AI, elle devrait être connue du public.

Open AI pourrait réfuter de telles hypothèses en rendant publique la ou les voix avec lesquelles la voix Sky a été formée. Cependant, maintenant que Sky n’est plus accessible, les analyses acoustiques ne peuvent plus fournir d’informations sur la similitude des sons entre Sky et Scarlett Johansson.



#Scarlett #Johansson #reconnaît #voix #dans #ChatGPT
1716696064

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

ADVERTISEMENT