OpenAI, soutenu par Microsoft, développe un logiciel capable de générer des vidéos d’une minute basées sur des invites textuelles, a annoncé jeudi la société.
Le logiciel, nommé « Sora » d’après le mot japonais signifiant « ciel », est actuellement disponible pour l’équipe rouge, qui permet d’identifier les failles du système d’IA. De plus, il est destiné à être utilisé par les artistes visuels, les designers et les cinéastes pour fournir des commentaires sur le modèle, a indiqué la société.
“Sora est capable de générer des scènes complexes avec plusieurs personnages, des types de mouvements spécifiques et des détails précis du sujet et de l’arrière-plan”, indique le communiqué, ajoutant qu’il peut créer plusieurs plans dans une seule vidéo.
En plus de générer des vidéos à partir d’invites textuelles, Sora peut également animer une image fixe, comme mentionné dans un article de blog de la société.
Le logiciel de génération vidéo fait suite au chatbot ChatGPT d’OpenAI, sorti fin 2022 et qui a créé le buzz autour de l’IA générative avec sa capacité à composer des e-mails et à écrire des codes et des poèmes.
Le géant des médias sociaux Meta Platforms a renforcé son modèle de génération d’images Emu l’année dernière pour ajouter deux fonctionnalités basées sur l’IA qui peuvent éditer et générer des vidéos à partir d’invites de texte. La société mère de Facebook cherche également à concurrencer Microsoft, Google d’Alphabet et Amazon dans l’univers de l’IA générative en évolution rapide.
Sora est toujours en cours de développement, la société reconnaissant que le modèle peut parfois avoir des difficultés avec les détails spatiaux et rencontrer des difficultés à suivre une trajectoire de caméra spécifique.
OpenAI a également mentionné qu’ils développaient des outils pour déterminer si une vidéo a été générée par Sora.
OpenAI a mentionné dans un article de blog qu’il consultait des artistes, des décideurs politiques et d’autres parties prenantes avant de rendre le nouvel outil public.
“Nous travaillons avec des équipes rouges – des experts dans des domaines tels que la désinformation, les contenus haineux et les préjugés – qui testeront le modèle de manière contradictoire”, a déclaré la société. “Nous développons également des outils pour aider à détecter les contenus trompeurs, tels qu’un classificateur de détection qui peut déterminer quand une vidéo a été générée par Sora.”