Nouvelles Du Monde

L’IA a eu un problème avec ses mains. Maintenant qu’il l’a réparé, nous avons des ennuis

L’IA a eu un problème avec ses mains.  Maintenant qu’il l’a réparé, nous avons des ennuis

Donald Trump est à terre, à genoux, attaqué par les flics. La photo est fausse – comme cela a été largement documenté – Pourtant le photoréalisme de ce plan, généré parintelligence artificielleen a trompé beaucoup.

Le faux cliché de Trump en état d’arrestation ne sera pas le premier – et même pas le dernier – pour nous mettre en crise. Mais jusqu’à présent, heureusement, l’IA qui produit ce genre d’images – ça peut être À mi-parcours mais aussi Diffusion stable o Dall-E 2 – J’avais un point faible bien précis : les mains.

Une série d’images, devenues virales en janvier dernier, bien mis en évidence le problème. Miles Zimmerman, un programmeur de San Francisco, a utilisé Midjourney pour créer des plans d’une fête qui n’a jamais eu lieu, avec des gens totalement maquillés. Pourtant personne (ou presque) n’aurait douté de la véracité des photos à première vue, si ce n’était pas pour les mains des filles représentées. L’un d’eux avait au moins dix doigts. Un autre, au contraire, en avait cinq mais d’une longueur surnaturelle.

Lire aussi  ChatGPT, bras de fer sur la vie privée et la technologie. Les risques pour l'Italie

Ces tirs ont déclenché commentaires ironiques parmi les utilisateurs de Twitter. Et ils ont rassuré, dans un certain sens, ceux qui prédisaient déjà un monde submergé par les deepfakesdes images créées par l’IA dans lesquelles, par exemple, le visage d’une personne est remplacé de manière transparente par celui d’une autre personne.

Dans l’ensemble, Les images générées par l’IA semblent cohérentes et plausibles. Mais souvent, à mesure que l’on approfondit le regard et que l’on déplace l’attention vers des éléments en arrière-plan ou autour du sujet principal, on se rend compte que ceux-ci apparaissent déformés et déformés.

C’est évident sur la fausse photo où Trump “est arrêté”. L’auteur des images, le journaliste – et fondateur de Bellingcat – Eliot Higginsil l’a souligné d’un tweet très grossier, reprochant une certaine “bêtise” à ceux qui ont interprété le coup comme vrai: il suffit de regarder les symboles chaotiques sur les uniformes des policiers, mais aussi (et surtout) les deux mains qui apparaissent entre les agents, qu’ils ont très peu d’humains.

Lire aussi  L'application iOS ChatGPT ajoute l'intégration de Microsoft Bing

Midjourney (et similaire) AI a été formé sur des milliards d’images et leur description textuelle. L’algorithme a ainsi appris que le mot “astronaute” correspond à l’image d’un homme ou d’une femme portant une combinaison et un casque spatial. Ainsi, lorsqu’un utilisateur, utilisant une interface similaire à un chat, demande à l’IA de générer une nouvelle image qui prédit la présence d’un astronaute, le logiciel va pêcher les images liées à cette description. ET à partir d’une forme aléatoirese rapproche le plus possible de la requête de l’utilisateur grâce à un raffinement qui implique de nombreuses itérations, c’est-à-dire passes de finition qui augmentent la précision et la qualité de l’image finale.

Nous avons vu que ce processus est miraculeuxau point de remporter des concours d’art et de secouer photographes, designers et illustrateurs, dont le travail est soudainement en danger.

Une œuvre créée par l’intelligence artificielle a remporté un concours d’art. Mais pour beaucoup c’est une arnaque


Pourtant l’IA, si douée pour générer les visages des êtres humains, si unique et pleine d’expressions et de particularités, il a de sérieux problèmes avec ses mains. Pouquoi?

Un journaliste de BuzzFeed a demandé à Stability AIl’entreprise qui a été lancée en août 2022 Diffusion stableune des IA texte à image le plus fort là-bas. Un porte-parole de la société a répondu que « dans le volume de données dont dispose l’IA, il est universellement connu que les mains sont plus visibles que les visages. Et qui, de surcroît, sont beaucoup plus petits dans l’image d’origine”. L’algorithme a donc plus de mal à les étudier et à les répliquer.

Technologie italienne adressée la même question à ChatGptla intelligence artificielle populaire développé par OpenAI, et la réponse est étonnamment similaire : “Il est vrai que les visages humains ont également de nombreuses caractéristiques uniques, telles que les proportions faciales, les expressions faciales, les rides, les cheveux, etc. Cependant, l’IA semble avoir moins de mal à générer des visages humains que des mains car les visages humains ont des caractéristiques communes qui les rendent plus faciles à générer. Par exemple, la symétrie du visage humain permet à l’algorithme de génération d’image de créer plus facilement une image réaliste du visage, puisque les deux côtés du visage sont généralement très similaires. De plus, il y a aussi beaucoup plus d’images de visages humains disponibles que de mains, ce qui signifie que l’algorithme de génération d’images a plus d’exemples à apprendre.

Ce que ChatGpt “affirme” a sa propre logique et surtout a un fondement de vérité. Plus un algorithme dispose de données, plus il est intelligent. Et en ce qui concerne les visages, il est vrai que ceux-ci sont plus facilement attribuables à certains “patterns”, c’est-à-dire un régularités pertinentes qui constituent un modèle: la disposition des yeux, par exemple, ou celle du nez ou de la bouche.

Après tout, il était basé sur ces modèles l’un des premiers systèmes de reconnaissance faciale basé sur l’intelligence artificielledéveloppé au milieu des années 1990 par le département américain de la Défense à l’aide de milliers de photos de ses employés.

En bref, jusqu’à présent, il a été relativement facile à démasquer une image créée par l’IA, même si c’était crédible : il suffisait d’observer les mains, de compter les doigts et de vérifier leur forme. Une autre fausse photo de Trump circule, bloquée par deux agents, sur laquelle un troisième policier pose sa main sur le poing gauche de l’ancien président américain : eh bien, la main du policier a quelque chose d’étrange, il semble n’avoir aucun index.

Toutefois même ces défauts sont destinés à disparaître. En effet, dans de nombreux cas, ils semblent avoir déjà disparu.

La dernière mise à jour de À mi-parcours, survenu le 16 mars dernier, semble avoir résolu le problème des mains et des doigts. Un utilisateur de Twitter, Zein Khan, souligné de deux images comment la nouvelle version de l’IA est capable de générer mains crédibles: Les filles représentées ont été inventées par AI et ont exactement cinq doigts. Cinq, le même nombre qui identifie la mise à jour Midjourney.

Les progrès de l’IA ont également été soulignés par un jeune utilisateur de Midjourney interviewé par le Washington PostAidan Ragan, 19 ans, qui a comparé les mains générées par Midjourney v4 (à gauche, dans le tweet ci-dessous) avec celles créées après la dernière mise à jour (à droite, dans le même tweet).

La différence est frappante. Ragan a dit qu’il lui manquait déjà les anciennes “imperfections”, qui, selon lui, sont le résultat d’une fascinante interprétation artistique de l’IA. “Maintenant, cependant, le modèle semble très rigide – a déclaré le programmeur – tout est plus robotique, il est réduit à un outil”.

“Avant de trier ces détails – le Hany Farid, professeur d’informatique judiciaire, de l’Université de Californie – les utilisateurs moyens ont compté leurs doigts et sont arrivés à la conclusion que, peut-être, une certaine image était fausse. Mais maintenant que les détails des aiguilles sont également corrigés, ces preuves visuelles vont commencer à se faire plus rares ».

La même inquiétude agite Del Walker, spécialiste de la création de personnages 3D, qui le 16 mars dernier – le jour de la mise à jour de Midjourney – a publié des images dans un tweet viral, vu par plus d’un million d’utilisateurs, dans lequel il déclarait : « Midjourney peut désormais créer des mains de la bonne manière. Soyez critique vis-à-vis de toutes les images politiquement motivées que vous voyez en ligne.”

“L’erreur à ne pas commettre est de dire ‘regarde tes mains’ ou ‘regarde tes dents’ [che nelle foto generate dall’IA sono solitamente più numerosi rispetto alla realtà, ndr] – a écrit Walker – Cette intelligence artificielle ne produit des photos que depuis quatre mois. Dans deux ans, ce sera indiscernable. La bonne chose à demander est : “Cette photo cite-t-elle de vraies sources ?” ou ‘Pouvons-nous prouver l’origine de cette image ?’ ».

Tout artiste ou illustrateur sait que la main est peut-être la partie du corps la plus complexe à dessiner: pour les nombreuses pièces mobiles par rapport au reste du corps, par exemple, et pour le chevauchement qui se produit lorsque les doigts prennent des positions différentes.

Sans surprise jusqu’au Moyen Âge la représentation des mains ne brillait pas pour son réalisme. Puis vint la Renaissance. Et Léonard de Vinci, cavec ses dessins qui mettent en valeur les os et les ligaments de la main. E Michel-Ange, Botticelli e Dürer. Même la main est devenue art.

En seulement quatre mois, les machines ont assimilé 623 ans d’histoire. Et ils s’apprêtent à laisser leur empreinte sur l’art que l’homme produira dans le futur.

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

ADVERTISEMENT