Nouvelles Du Monde

OpenAI lance Sora, un outil vidéo révolutionnaire doté d’intelligence artificielle | Technologie

OpenAI lance Sora, un outil vidéo révolutionnaire doté d’intelligence artificielle |  Technologie

2024-02-16 02:18:15

Alors que la fascination pour ChatGPT et les modèles linguistiques d’intelligence artificielle générative n’est pas encore passée, OpenAI vient d’introduire un outil de création vidéo éblouissant et révolutionnaire appelé Sora. Avec lui, donnez simplement une description de ce que vous souhaitez voir à l’écran et voilà le clip, créé par l’intelligence artificielle. Certains sont plus aboutis que d’autres, ils ont parfois ce style vidéoludique qui les différencie de la réalité, mais ils sont tous surprenants.

Sam Altman, PDG d’OpenAI, a annoncé le lancement sur le réseau social, qui a été inondé en un rien de temps de nouvelles créations. Vidéos réalistes, futuristes, folles, dessins animés… Les vidéos incluent toutes sortes de créations automatiques créées avec l’intelligence artificielle générative. Sora est capable de produire des vidéos entières en une seule fois ou de zoomer sur les vidéos générées pour les allonger.

Dans les épreuves montré par Altman et votre entreprise, vous voyez des scènes complexes avec plusieurs personnages, des types de mouvements spécifiques et des détails précis du sujet et de l’arrière-plan. Le modèle comprend non seulement ce que l’utilisateur a demandé dans la requête, mais également comment ces choses existent dans le monde physique, selon OpenAI. Le modèle possède une compréhension approfondie du langage, ce qui lui permet d’interpréter avec précision les signaux et de générer des personnages convaincants qui expriment des émotions vibrantes, explique la société.

“Voici Sora, notre modèle de génération vidéo”, Altman a écrit. “Nous offrons l’accès à un nombre limité de créateurs”, a-t-il ajouté, avant de demander à ses abonnés de lui faire des suggestions pour créer de nouvelles vidéos, en plus des échantillons qu’il avait déjà proposés sur son site Internet.

Les instructions peuvent être plus ou moins détaillées. L’un des exemples proposés par OpenAI répond à la description suivante : « Une femme élégante se promène dans une rue de Tokyo pleine de néons chaleureux et lumineux et de signalisation urbaine animée. Elle porte une veste en cuir noire, une longue robe rouge, des bottes noires et un sac noir. Elle porte des lunettes de soleil et du rouge à lèvres. Marchez avec confiance et insouciance. La rue est humide et réfléchissante, ce qui crée un effet miroir des lumières colorées. De nombreux piétons s’y promènent. Et le résultat est surprenant (au-dessus de).

Lire aussi  La famille Bitcoin dit avoir perdu 1 million de dollars cette année

Un autre note : “Bande-annonce d’un film sur les aventures d’un astronaute de 30 ans portant un casque de moto tricoté en laine rouge, ciel bleu, désert de sel, style cinématographique, tourné sur pellicule 35 mm, couleurs vives” (ci-dessous).

En plus de pouvoir générer une vidéo uniquement à partir d’instructions textuelles, le modèle est capable de prendre une image fixe existante et de générer une vidéo à partir de celle-ci, animant le contenu de l’image avec précision et attention aux détails. Le modèle peut également prendre une vidéo existante et zoomer ou remplir les images manquantes.

Vous pouvez demander du contenu, du style et donner toutes sortes d’instructions. Altman publie de nouvelles vidéos demandées par les tweeters, prouvant que les résultats sont immédiats. Sora peut également créer plusieurs plans dans une seule vidéo générée tout en conservant avec précision les personnages et le style visuel.

“Nous apprenons à l’IA à comprendre et à simuler le monde physique en mouvement, dans le but de former des modèles qui aident les gens à résoudre des problèmes nécessitant une interaction dans le monde réel”, explique OpenAI lors de la présentation du nouvel outil de conversion texte en vidéo. “Sora peut générer des vidéos d’une durée maximale d’une minute tout en conservant la qualité visuelle et la fidélité aux instructions de l’utilisateur”, ajoute-t-il.

Lire aussi  Music App Duet d'Apple : la nouvelle application classique est cool, mais j'ai quelques notes

Pour l’instant, l’outil est mis à disposition des équipes dites rouges. Les membres de ces équipes tentent de remettre en question un produit ou un service, de le pousser dans ses retranchements, de le mettre à l’épreuve et de trouver ses défauts comme s’ils étaient des ennemis de l’entreprise. Ici, ils ont pour mission spécifique d’évaluer les zones critiques pour détecter des dommages ou des risques potentiels. Parmi eux se trouvent des experts dans des domaines tels que la désinformation, les contenus haineux et les préjugés.

Open AI donne également accès à un éventail d’artistes visuels, de designers et de cinéastes pour donner leur avis sur la façon d’améliorer le modèle afin de le rendre plus utile aux professionnels de la création.

“Nous partageons très tôt les progrès de nos recherches pour commencer à travailler avec des personnes extérieures à OpenAI et obtenir leurs commentaires, ainsi que pour donner au public une idée des capacités de l’IA à l’horizon”, explique la société. .

Défauts à polir

La société d’intelligence artificielle elle-même reconnaît que Sora présente encore des défauts très évidents. Vous pourriez avoir du mal à simuler avec précision la physique d’une scène complexe et ne pas comprendre des cas spécifiques de cause à effet. Il donne comme exemple qu’une personne peut mordre dans un biscuit, mais que le biscuit peut alors ne pas porter la marque de morsure.

Le modèle peut également confondre les détails spatiaux d’un signal, par exemple en confondant la gauche et la droite, et peut avoir des problèmes avec les descriptions précises des événements qui se produisent au fil du temps, comme le suivi d’un chemin de caméra spécifique.

Lire aussi  Le remake de "System Shock" devrait enfin arriver sur PC le 30 mai

Avant de mettre l’outil à disposition du public, OpenAI promet de prendre quelques précautions. Parmi eux figure la prise en compte des consignes des équipes rouges. De plus, il crée des outils pour aider à détecter les contenus trompeurs, avec des détecteurs capables de savoir quand une vidéo a été générée par Sora. Il a également développé de puissants classificateurs d’images qui sont utilisés pour examiner les images de toutes les vidéos générées afin de garantir qu’elles sont conformes à ses politiques d’utilisation avant de les afficher à l’utilisateur.

De plus, vous réutiliserez les méthodes de sécurité que vous avez créées pour vos produits qui utilisent DALL-E 3. Par exemple, le classificateur de texte vérifiera et rejettera les demandes de saisie de texte qui violent vos politiques d’utilisation, telles que celles qui demandent une violence extrême, du contenu sexuel. , des images incitant à la haine, des images de célébrités ou la propriété intellectuelle de tiers.

« Nous contacterons les décideurs politiques, les éducateurs et les artistes du monde entier pour entendre leurs préoccupations et identifier des cas d’utilisation positifs de cette nouvelle technologie. Malgré des recherches et des tests approfondis, nous ne pouvons pas prédire toutes les manières bénéfiques dont les gens utiliseront notre technologie, ni toutes les manières dont ils en abuseront. C’est pourquoi nous pensons que l’apprentissage de l’utilisation réelle est un élément fondamental pour créer et lancer des systèmes d’IA de plus en plus sûrs au fil du temps », conclut OpenAI.

Vous pouvez suivre Technologie EL PAÍS dans Facebook oui X ou inscrivez-vous ici pour recevoir notre bulletin d’information semanal.




#OpenAI #lance #Sora #outil #vidéo #révolutionnaire #doté #dintelligence #artificielle #Technologie
1708200055

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

ADVERTISEMENT