Révolution dans la création de mondes virtuels : Tencent dévoile Voyager, un modèle d’IA surpassant ses concurrents
Pékin, Chine – Le géant technologique Tencent a annoncé la sortie de Voyager, un nouveau modèle d’intelligence artificielle capable de générer des environnements virtuels 3D d’une complexité et d’une cohérence sans précédent. Les premiers tests, menés par les chercheurs eux-mêmes, placent Voyager au sommet du classement mondial, surpassant des modèles concurrents comme Wonderworld et Cogvideox-i2v sur le benchmark WorldScore de l’Université de Stanford.
Voyager a obtenu un score global de 77,62 sur WorldScore, surpassant les 72,69 de wonderworld et les 62,15 de Cogvideox-i2v. Le modèle excelle particulièrement dans le contrôle des objets (66,92), la cohérence du style visuel (84,89) et la qualité subjective (71,09). Bien que légèrement en retrait sur le contrôle de la caméra (85,95 contre 92,98 pour Wonderworld), Voyager démontre une capacité impressionnante à créer des mondes virtuels cohérents et visuellement attrayants.
worldscore évalue les modèles de génération mondiale sur des critères cruciaux tels que la cohérence 3D et l’alignement du contenu,des aspects essentiels pour une immersion réussie dans les environnements virtuels.
Des limitations géographiques et des exigences de license
Cependant, l’accès à Voyager est soumis à des restrictions géographiques. La licence interdit son utilisation dans l’Union Européenne, au Royaume-Uni et en Corée du Sud. De plus,toute utilisation commerciale à grande échelle,ciblant plus de 100 millions d’utilisateurs actifs mensuels,nécessitera l’obtention d’une licence spécifique de Tencent.
Un défi de puissance de calcul
La création de ces mondes virtuels complexes exige une puissance de calcul considérable.Pour pallier ce problème, les développeurs ont intégré au système la possibilité d’utiliser l’inférence parallèle sur plusieurs GPU grâce au framework Xdit. L’utilisation de huit GPU permet d’accélérer le processus de génération jusqu’à 6,69 fois par rapport à une configuration à un seul GPU.
L’avenir de l’art interactif et génératif
Bien que la puissance de calcul nécessaire et les défis liés à la génération de mondes virtuels longs et cohérents limitent pour l’instant les applications interactives en temps réel, Voyager représente une avancée significative dans le domaine de la création de contenu numérique. Cette technologie pourrait ouvrir la voie à de nouvelles formes d’art interactif et génératif, transformant potentiellement la manière dont nous interagissons avec les environnements virtuels, que ce soit dans le domaine du divertissement, de l’éducation ou de la conception. L’émergence de tels modèles, à l’instar des premiers pas de Google dans le domaine de la génération d’images, suggère que nous sommes à l’aube d’une nouvelle ère de créativité assistée par l’IA.
