MidJourney, DALL-E 2 et StabilityAI. Trois des meilleurs projets d’intelligence artificielle (IA) actuellement disponibles qui peuvent générer des images et des illustrations basées sur la saisie de texte. Comment gérez-vous la même mission ?
L’intelligence artificielle est déjà capable de générer des textes, des images photoréalistes ou encore vidéos crédibles. Les cercles professionnels et les groupes d’amateurs ont partagé avec enthousiasme des images générées par l’IA ces derniers mois. La dernière comparaison prouve que lorsque deux (en fait trois) font la même chose, ce n’est pas la même chose.
Dans le cas de l’intelligence artificielle, les données d’entrée, l’algorithme utilisé et l’entrée elle-même jouent un rôle important. Chaque IA a été formée sur des données différentes et a une approche légèrement différente de la génération d’images.
Quelle IA donne de meilleurs résultats ?
La comparaison des résultats des projets MidJourney, DALL-E 2 et StabilityAI a été divisée en deux domaines. Convergent (quand après l’IA on veut quelque chose avec beaucoup de détails et de spécifications) a Divergent (lorsque nous lui donnons très peu d’instructions et laissons le résultat à sa créativité).
Les sorties sont ensuite divisées en deux parties supplémentaires :
- Convergent (réel). Alors que ce que nous demandons à l’IA de faire est quelque chose qui pourrait appartenir au monde réel.
- Convergent (Imaginaire). Quand ce qu’on demande à l’IA n’existe pas en tant que tel, il s’agit de nouvelles créations.
- Divergente (Spécifique). Lorsque nous accordons à l’IA un certain espace, mais exigeons un résultat spécifique.
- Divergente (résumé). Quand on demande à l’IA de nous donner des perceptions et des idées en sortie, rien de concret.
Comme le montrent les résultats, en termes de créativité, l’IA de MidJourney est en tête (première colonne). Cependant, ses résultats ne sont pas très réalistes. Dans cette direction, DALL-E 2 et éventuellement StabilityAI est un meilleur choix. MidJourney échoue car il est incapable de créer des créations cohérentes avec une grande quantité de détails. À première vue, ils ressemblent à ça, mais en y regardant de plus près, la différence est perceptible.
Pour les humains, si nous recherchons un résultat de type photo, DALL-E 2 et StabilityAI sont à nouveau des options. Si nous voulons que cela soit fait dans un style artistique spécifique et que nous ne nous attendons pas à ce que les détails soient parfaits, MidJourney est à nouveau le choix.
La source: David Alayon