2024-03-07 10:00:00
Il y a treize ans, dans le cadre d’un cours de journalisme, j’ai écrit une nouvelle campagnarde sur un homme qui mange de la nourriture de luxe pour chats. Maintenant, je suis assis ici à regarder une IA générative appelée Machine à savoir a donné vie à mes paroles.
Publicité
“Nous identifions les scènes, les lieux et les personnages, ainsi que l’ambiance. Ce processus peut prendre jusqu’à deux minutes”, indique le site Web de Lore Machine. L’IA de l’entreprise analyse le texte, extrait les descriptions des personnages et des décors mentionnés, puis transmet ces informations à un modèle de génération d’images qui génère une sorte de storyboard illustré à la fin.
Après plus d’un an de développement, Lore Machine est désormais accessible au public pour la première fois. Pour 10 $ par mois, les utilisateurs peuvent télécharger jusqu’à 100 000 mots de texte (jusqu’à 30 000 mots à la fois) et les utiliser pour générer 80 images pour des histoires courtes, des scripts ou des transcriptions de podcast. Les utilisateurs expérimentés bénéficient de 2,24 millions de mots et de 1 792 images dans le forfait Entreprise pour 160 $ par mois. Les illustrations peuvent être générées dans différents styles, du manga à l’aquarelle en passant par les séries télévisées des années 80.
Zac Ryder, fondateur de l’agence de création Modern Arts, utilise une version préliminaire de l’outil depuis que le fondateur de Lore Machine, Thobey Campion, le lui a présenté. Ryder lui a envoyé un scénario pour un court métrage et Campion l’a transformé du jour au lendemain en un roman graphique de 16 pages en utilisant Lore Machine.
Lore Machine fonctionne en quelques clics
“Je me souviens quand Thobey a partagé son écran. Nous étions tous complètement dépassés”, raconte Ryder. “Ce n’était pas tant l’aspect de la création de l’image. C’était le niveau du récit. Du flux du récit aux émotions des personnages, ça a été tout de suite.” Son agence utilise désormais Lore Machine pour développer un univers fictionnel pour une série manga basé sur un texte du créateur de la série Netflix “Love, Death & Robots”.
Lore Machine utilise des techniques d’intelligence artificielle générative bien connues. Un modèle linguistique analyse le texte et identifie les descriptions de personnes et de lieux ainsi que l’ambiance générale du texte. Une version de Stable Diffusion crée ensuite les images, le tout en quelques clics. Cela en fait l’un des nombreux outils conviviaux qui cachent l’incroyable puissance des modèles génératifs derrière une interface Web simple.
“C’est beaucoup de travail pour les utilisateurs que de se tenir au courant des nouveaux outils d’IA, et l’interface et le flux de travail sont toujours différents”, explique Ben Palmer, PDG de la société de production New Computer Corporation. « Utiliser un outil doté d’une interface unifiée est très convaincant. J’ai le sentiment que c’est là que l’industrie va aboutir. »
Thobey Campion a fondé la société derrière Lore Machine il y a deux ans pour travailler sur une version blockchain de Wikipédia. Cependant, lorsqu’il a constaté à quel point les modèles génératifs étaient bien accueillis par le public, il a changé de direction. Campion a utilisé le modèle texte-image disponible gratuitement Midjourney pour créer une version bande dessinée de « The Rime of the Ancient Mariner » de Samuel Taylor Coleridge. Le projet est devenu viral, mais ce n’était pas amusant.
« Ma femme détestait ce projet », dit-il. “Je restais debout jusqu’à quatre heures du matin tous les soirs pour essayer d’obtenir les bonnes images. Le problème était que les modèles texte-image comme Midjourney généraient les images une par une. Il était donc difficile de maintenir la même cohérence entre les différentes images. caractères. Même déterminer un style spécifique pour plusieurs images peut être difficile.
#Cette #générative #transforme #nimporte #quelle #histoire #bande #dessinée
1709826971