La startup singapourienne Video Rebirth, qui a levé 80 millions de dollars, a positionné son modèle Bach au sixième rang mondial des classements de génération vidéo. Basée à Singapour, l’entreprise de moins de deux ans mise sur les « modèles de monde » pour simuler la réalité physique d’ici trois ans.
Le modèle Bach défie les géants sur le classement Artificial Analysis
Dans un secteur dominé par des budgets de recherche se comptant en dizaines de millions de dollars, Video Rebirth parvient à bousculer la hiérarchie. Selon un rapport de Forbes, le modèle Bach de la startup s’est hissé à la sixième place du classement text-to-video d’Artificial Analysis. Cette performance place la jeune pousse juste derrière des acteurs massifs tels qu’Alibaba, ByteDance, Kuaishou Technology et xAI.

Le classement d’Artificial Analysis est devenu une référence pour l’industrie, car il évalue non seulement la qualité visuelle, mais aussi des métriques critiques comme la latence et le débit de génération. Pour une structure de la taille de Video Rebirth, se classer parmi ces géants technologiques souligne une optimisation supérieure de leurs algorithmes. Malgré une équipe réduite de 30 personnes et un siège social à Singapour, la startup se distingue par son efficacité économique. Le modèle Bach est actuellement le plus performant parmi les dix premiers modèles en termes de coût par minute de vidéo générée, un facteur déterminant pour l’adoption par les entreprises qui cherchent à limiter les coûts d’inférence à grande échelle.
Au-delà de l’image : la quête des modèles de monde
Pour Video Rebirth, la création de contenus visuels n’est qu’une étape préliminaire. L’objectif final est le développement de modèles capables de comprendre les lois de la physique pour simuler des environnements réalistes. Cette technologie est cruciale pour des secteurs tels que la conduite autonome, la robotique et le jeu vidéo.

Contrairement aux modèles de génération purement visuels qui se contentent de prédire la disposition des pixels, les « modèles de monde » (world models) visent à intégrer une compréhension de la causalité. En apprenant comment les objets interagissent, se déplacent ou réagissent aux forces externes, ces modèles permettent de combler le fossé entre la simulation numérique et la réalité physique, un concept souvent désigné sous le terme de « sim-to-real » dans le domaine de la robotique.
« Nous faisons de la génération de vidéo afin de construire un modèle de monde. Dans trois ans, nous prouverons que le monde physique peut être simulé en temps réel. »
Liu Wei, cofondateur et PDG de Video RebirthLe PDG affirme que cette approche est « vraiment significative ». L’idée est de doter l’intelligence artificielle d’une forme de bon sens, lui permettant d’anticiper les conséquences physiques d’un mouvement ou d’une action, à l’instar d’un être humain. Cette capacité de prédiction est la clé pour que des machines puissent naviguer dans des environnements imprévisibles sans intervention humaine constante.
Un tour de table de 80 millions de dollars mené par des acteurs industriels
Pour soutenir cette vision ambitieuse, Video Rebirth a clôturé un tour de table d’amorçage de 80 millions de dollars en mars dernier. Ce financement stratégique a attiré des investisseurs issus de secteurs technologiques et industriels majeurs, créant un écosystème de soutien qui couvre à la fois le matériel, l’automobile et le divertissement.
- AMD Ventures (branche capital-risque d’AMD)
- ZER01NE (branche de Hyundai Motor Group)
- Hiven (affiliée au groupe coréen CJ Group)
- Actoz Soft (développeur de jeux coréen)
- Qiming Venture Partners
- Gaw Capital
La composition de ce tour de table reflète les débouchés potentiels de la technologie de Video Rebirth. L’implication d’AMD Ventures suggère un alignement avec les besoins de puissance de calcul nécessaires à l’entraînement de ces modèles, tandis que la présence de Hyundai et d’Actoz Soft pointe vers des applications concrètes dans la mobilité autonome et les environnements virtuels de nouvelle génération. L’entreprise prévoit déjà de lever de nouveaux fonds en juillet. Fang Wei, gestionnaire d’investissement principal chez Hyundai Cradle, a précisé que la technologie de la startup est positionnée pour débloquer des applications critiques dans l’IA physique.
Capacités de génération et avantages compétitifs
Le modèle Bach cible prioritairement les clients professionnels dans la publicité, le cinéma et le divertissement. Sa caractéristique principale réside dans sa capacité à produire des vidéos multi-plans allant jusqu’à 45 secondes à partir de textes et d’images de référence.

Dans le domaine de la génération vidéo par IA, la durée des séquences est un indicateur de la capacité du modèle à maintenir une cohérence temporelle. Plus une vidéo est longue, plus il est difficile pour l’IA d’éviter les distorsions visuelles ou les changements de morphologie des objets. Cette durée de 45 secondes surpasse nettement les capacités de certains concurrents directs. À titre de comparaison, le modèle Seedance 2.0 de ByteDance, lancé en février, est limité à des séquences de 15 secondes.
Singapour : un hub économique pour l’intelligence artificielle
L’implantation de Video Rebirth à Singapour s’inscrit dans un contexte économique de haute performance. Comme l’indique le World Factbook, la cité-état dispose d’un PIB de 372,06 milliards de dollars et d’un PIB par habitant s’élevant à 65 233,28 dollars.
Cette stabilité économique et cette position géographique stratégique en Asie du Sud-Est offrent un terreau fertile pour les entreprises technologiques de pointe. Le gouvernement singapourien soutient activement l’adoption de l’IA par le biais de cadres réglementaires clairs et d’investissements dans les infrastructures de recherche. D’après les données de World Atlas, le pays dispose d’infrastructures majeures, notamment un port de premier plan et un hub aérien international, facilitant les échanges mondiaux nécessaires à l’expansion de l’IA et à l’accès aux talents internationaux indispensables pour des projets de cette envergure.
Find more reporting in our Sciences et technologies section.
