Nouvelles Du Monde

Alexey Khitrov, PDG d’ID R&D, parle de la lutte contre les clones vocaux grâce à la biométrie

R&D en identification s’est depuis longtemps imposé comme un innovateur technologique et un leader dans le domaine de la biométrie, et a démontré ces dernières années une attention particulièrement forte sur la détection de la vivacité. Sa technologie de vivacité du visage, par exemple, a battu plus de 80 autres algorithmes pour atteindre les meilleurs classements lors des tests menés par le National Institute of Standards and Technology (NIST) l’année dernière. Mais c’est la technologie de biométrie vocale de l’entreprise qui a fait l’actualité ces dernières semaines, grâce au lancement par ID R&D de sa solution IDLive Voice liveness, au moment même où la FTC lançait un appel à l’aide pour lutter contre les clones vocaux. Naturellement, le travail de l’entreprise dans ce domaine de plus en plus important est un sujet central dans la dernière interview de FindBiometrics avec Alexey Khitrov, fondateur et président d’ID R&Dqui aborde également l’IA générative, l’authentification des utilisateurs et le paysage de l’industrie de la biométrie de manière plus large, comme détaillé dans le Prisme d’identité numérique biométrique.

Poursuivez votre lecture pour entendre l’un des fournisseurs pionniers en matière de biométrie et de lutte contre les clones deepfake :

FindBiometrics : ID R&D vient d’annoncer une nouvelle solution capable de détecter les clones vocaux. Qu’est-ce qu’un clone vocal et en quoi constitue-t-il un type de menace biométrique différent de celui que nous voyons généralement dans l’industrie de la biométrie ?

Alexey Khitrov, fondateur et président, ID R&D : Le clonage vocal est une contrefaçon audio qui exploite les technologies d’IA générative et de synthèse vocale pour reproduire numériquement la voix d’une personne. Le clonage vocal collecte et analyse les données audio d’une personne qui parle, entraîne des algorithmes d’IA, puis crée une synthèse de l’audio vocal basée sur le texte.

Il s’agit d’une technologie puissante dotée d’un large éventail d’applications intéressantes, mais le clonage vocal a également été cité comme le résultat le plus préoccupant des progrès de l’IA. Pour comprendre pourquoi, il est utile de faire la distinction entre les menaces de notre monde réel et celles de notre monde numérique. L’IA peut être utilisée pour créer des images et des contenus numériques truqués, ce qui constitue certainement une menace sous la forme d’usurpation d’identité et de désinformation. Les clones vocaux portent la menace à un niveau différent, dans le sens où ils peuvent être utilisés pour usurper l’identité de personnes. dans le monde réel, en temps réel. Il s’agit d’un nouveau type de menace sans précédent.

Considérez également le rôle que jouent les communications audio dans notre vie quotidienne. Rien que sur WhatsApp, il y a 100 millions d’appels vocaux chaque jour. Sans image faciale pour confirmer l’identité de la personne à qui nous parlons, nous devons nous fier à deux choses : ce qu’elle dit et à qui elle ressemble. Les clones vocaux permettent des imitations incroyablement convaincantes, même celles de personnes dont nous entendons la voix tous les jours. Lorsqu’elles sont combinées à la technologie d’IA conversationnelle, elles peuvent être entièrement automatisées pour permettre des attaques de vishing évolutives visant la fraude et l’extorsion à grande échelle.

FindBiometrics : les clones vocaux, les deepfakes et d’autres types de médias génératifs créés par l’IA sont passés d’une nouveauté à une préoccupation majeure en quelques mois. Comment les technologies d’identité peuvent-elles stopper ces menaces de fraude par usurpation d’identité IA, et quelle est la clé pour rester dans la course aux armements en matière d’apprentissage automatique ?

Lire aussi  Les enfants irlandais en fauteuil roulant pourraient à nouveau marcher dans une nouvelle combinaison robotique

Alexey Khitrov, fondateur et président, ID R&D : La sécurité a toujours été une course aux armements effrénée qui nécessite une approche multiforme ; la sécurité, de par sa nature, est déterminée par sa plus grande vulnérabilité. La détection de la vivacité n’est pas différente dans la mesure où elle doit être capable de détecter toutes les méthodes parmi tant d’autres par lesquelles un fraudeur pourrait tenter de se faire passer pour une personne réelle. Ainsi, la clé n°1 pour rester dans la course aux armements est d’avoir la capacité de surveiller les nouveaux vecteurs d’attaque et de s’adapter et de faire face rapidement à la menace.

Il est également important de noter qu’il existe deux catégories de signaux que la détection de l’activité doit couvrir : le contenu de l’attaque (ce qui est dans l’image ou l’audio) et la méthode de l’attaque (la façon dont l’attaque est menée). Dans le cas des images faciales, le contenu d’une attaque pourrait être un deepfake sur un écran, une copie d’une image faciale imprimée sur papier ou l’un des nombreux autres vecteurs d’attaque. Ces attaques peuvent également être menées en utilisant différents points d’entrée ; soit une attaque de présentation contre la caméra, soit une attaque par injection au moyen de piratages logiciels ou matériels directement dans un système ou une plate-forme.

L’IA joue un rôle essentiel dans la détection des signaux de vivacité dans les deux catégories. Mais à mesure que le contenu deepfake devient plus difficile à différencier du contenu réel, il devient de plus en plus important de pouvoir détecter le contenu. méthode de l’attaque. La clé n°2 pour suivre la course aux armements est donc de supposer que la technologie progressera jusqu’à un point où nous ne pourrons plus nous fier à des artefacts évidents dans le contenu pour détecter les attaques ; le méthode l’attaque doit également être détectable.

FindBiometrics : Nous constatons une attention accrue portée à la biométrie vocale, à la fois en tant qu’authentificateur autonome et en tant qu’option multifactorielle. Il ne s’agit pas d’une nouvelle modalité, mais la génération actuelle connaît un niveau d’acceptation plus élevé que les itérations précédentes. Qu’est-ce qui se cache derrière cette nouvelle montée en puissance de la biométrie vocale ?

Alexey Khitrov, fondateur et président, ID R&D : Revenir sur l’évolution de la biométrie faciale est instructif. Au début – avant l’IA – les performances de la reconnaissance faciale étaient terribles – pires que les empreintes digitales, sensibles aux facteurs environnementaux comme l’éclairage – et n’étaient tout simplement pas suffisamment fiables ou pratiques pour protéger l’accès des consommateurs aux comptes bancaires et autres informations sensibles. L’IA a mûri et la reconnaissance faciale en a été l’une des premières preuves. L’omniprésence des données d’images faciales a conduit à de plus en plus d’apprentissage automatique, à un point tel que les algorithmes sont désormais incroyablement précis par rapport à il y a dix ans.

La biométrie vocale suit une trajectoire similaire, mais c’est une histoire quelque peu différente. Considérez que la biométrie est comme des super-héros, dans la mesure où chaque modalité présente des forces et des faiblesses différentes pour différentes applications. La biométrie faciale est difficile à battre pour se connecter à un téléphone mobile ; ils sont essentiellement sans friction. Mais ce qui se passe actuellement, c’est que grâce à l’IA générative, les progrès de la synthèse vocale et de l’IA conversationnelle convergent pour provoquer une explosion de cas d’utilisation qui exploitent le caractère naturel d’une interface vocale.

Lire aussi  Profitez de l'offre exceptionnelle sur le Xiaomi Redmi Note 13 Pro !

Notre voix est notre interface de communication la plus naturelle, car il est naturel pour les humains de parler, plutôt que de cligner des yeux devant un appareil photo ou d’appuyer un doigt sur un scanner. Cela signifie que même si la biométrie faciale est optimale pour les fonctions d’identité sans friction – lorsqu’elle est assistée par la voix – la sécurisation des communications numériques est une tâche naturelle pour la biométrie vocale et la vivacité de la voix.

Nous entrons dans un nouveau paradigme d’interface homme-machine, dans lequel nos machines ont désormais des choses beaucoup plus intéressantes et précieuses à dire, et elles ont de nouvelles voix pour les dire. Dans certains cas, ces voix seront des clones. Nous passerons de demander à Alexa l’heure et la météo à demander aux agents IA d’assister à nos appels Zoom dans un avenir proche. La valeur des services d’agents intelligents – estimée en milliers de milliards de dollars par certains comptes – crée un besoin important de sécuriser l’accès à ces services et également de garantir que les gens sachent quand ils communiquent avec une personne réelle et quand ils ne le sont pas, de la même manière que l’assistance par chat est différenciée entre les agents en direct et une IA. bot.

FindBiometrics : Quelle est la différence entre la détection d’activité active et passive ? Et comment les technologies d’IA font-elles évoluer l’industrie vers l’option passive ?

Alexey Khitrov, fondateur et président, ID R&D : La différence entre la vivacité active et passive réside essentiellement dans le niveau et la nature des frictions imposées aux utilisateurs légitimes pour passer les contrôles. Les techniques actives reposent sur l’interaction avec les utilisateurs, les obligeant à cligner des yeux ou à rapprocher et éloigner leur téléphone. Il y en a plein preuve montrer que ce type de friction entraîne des taux d’abandon importants.

Certaines techniques prétendent être passives car elles n’obligent pas l’utilisateur à faire quoi que ce soit mais imposent néanmoins un impact sur l’expérience utilisateur, comme les lumières clignotantes et les images qui, au mieux, sont distrayantes et au pire peuvent causer des dommages.

Une approche véritablement passive est mise en œuvre d’une manière qui n’a aucun impact sur l’expérience utilisateur et présente l’avantage supplémentaire de ne pas informer les fraudeurs que les contrôles sont en cours ou de ne pas fournir d’indices sur la façon dont ils pourraient être déjoués. Une solution encore plus élégante utilise uniquement les images ou l’audio utilisés pour la correspondance biométrique, minimisant ainsi toute latence qui pourrait être provoquée par le renvoi de flux audio ou vidéo supplémentaires à un serveur pour analyse.

FindBiometrics : À l’horizon 2024, quelles tendances émergentes pensez-vous qu’elles influenceront notre industrie ?

Alexey Khitrov, fondateur et président, ID R&D : L’IA générative a été une nouvelle injection de carburéacteur dans notre transformation numérique, accélérant les progrès technologiques à un rythme jamais vu auparavant. L’un des résultats est que nous partagerons bientôt le monde avec des humains virtuels sous de multiples formes : agents intelligents, assistants numériques, chatbots et autres. Ils seront très compétents et nous communiquerons avec eux en utilisant nos voix. Les frontières entre humains et machines continueront de s’estomper dans le monde numérique, et de plus en plus dans le monde réel. Considérez le film Son, sorti il ​​y a dix ans en octobre dernier, sur un homme qui tombe amoureux de son ordinateur et de sa voix. La science-fiction devient de la science beaucoup plus rapidement que la plupart d’entre nous ne l’imaginaient en 2013.

Lire aussi  Microsoft GitHub Enterprise : avertissement de sécurité informatique concernant une nouvelle vulnérabilité

Il est difficile de surestimer l’impact, mais il est également difficile de visualiser pleinement quel sera cet impact. Les humains virtuels auront-ils des visages ? Des identités ? Comment nos interactions avec eux seront-elles régies et sécurisées ? Quelles que soient les réponses à ces questions, il est clair que ces agents intelligents auront un impact considérable sur l’identité et sur ce qu’elle signifie. Jusqu’à présent, l’identité numérique consistait à donner aux humains leurs (nombreuses) identités dans le domaine numérique. Les êtres numériques auront-ils désormais besoin d’identités dans le domaine humain ? Il n’est pas exagéré de s’attendre à ce que les gens veuillent savoir quand la machine qu’ils pensaient connaître a été reprogrammée et qu’ils aient des identités différentes.

FindBiometrics : ID R&D est un catalyseur du prisme de l’identité numérique biométrique – une désignation formidable. Le Prism propose que les industries de la biométrie et de l’identité soient confrontées à un point d’inflexion. Selon vous, qu’est-ce qui sera essentiel pour saisir ce moment et construire un avenir sûr de l’identité ?

Alexey Khitrov, fondateur et président, ID R&D : Imaginer l’avenir est ce qui rend les bons fournisseurs de technologies formidables, quel que soit le domaine, et l’identité ne fait pas exception. L’arrivée de machines dotées de connaissances et de capacités de communication comparables à celles des humains constitue un changement de paradigme sans précédent dans le domaine de l’identité. Alors que la vivacité a été un facteur secondaire de l’authentification biométrique à distance, la frontière floue entre réel et virtuel a placé la vivacité au centre de la scène. Nous devrons d’abord vous demander : « Êtes-vous une personne », puis utiliser la biométrie pour vérifier que vous êtes bien la personne que vous prétendez être. L’utilisation secrète de clones et de deepfakes est un signal fort et utile de tentative de fraude et de crime. Les fournisseurs de technologies qui ont anticipé ce changement seront bien préparés à participer à la course folle qui ne fait que commencer.

ID R&D a compris très tôt non seulement à quel point la détection de l’activité est importante et difficile, mais aussi qu’elle doit être déterminée sans friction. Cela est encore plus vrai avec la voix, où tout l’intérêt de la technologie est de permettre une interface humaine naturelle. ID R&D est depuis longtemps un fournisseur de technologies vocales de premier ordre. Il s’agit de la forme de communication humaine la plus naturelle et, pour cette raison, elle jouera un rôle essentiel dans le développement de nos relations avec les humains virtuels.

Pour plus d’informations sur la détection de clonage vocal, visitez : www.idrnd.ai/voice-clone-landing

2024-01-23 21:32:03
1706036722


#Alexey #Khitrov #PDG #parle #lutte #contre #les #clones #vocaux #grâce #biométrie

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

ADVERTISEMENT