World models génératifs : lesquels tester vraiment en 2026
Les démonstrations de mondes 3D générés par IA tournent en boucle sur les réseaux. La question que personne ne tranche clairement : lesquels peut-on réellement ouvrir et utiliser aujourd’hui ? Voici le comparatif honnête des world models génératifs en 2026, du plus accessible au plus verrouillé, avec ce que chacun produit, à quel prix et pour quel usage.
Un world model génératif crée un environnement 3D ou une vidéo qu’on peut explorer ou faire évoluer, plutôt que de décrire le monde en mots. C’est le camp « générer » des modèles du monde, distinct de l’approche non générative de JEPA, qui apprend à comprendre sans produire d’images. Pour le concept d’ensemble et les enjeux, notre dossier sur les world models pose les bases.
Le décalage entre la promesse et l’usage réel est large. Certains de ces modèles s’ouvrent ainsi dans un navigateur en deux minutes, d’autres réclament une carte graphique à plusieurs milliers d’euros, et le plus impressionnant reste réservé aux États-Unis derrière un abonnement à 250 dollars. Ce comparatif les classe par accessibilité réelle pour un utilisateur français.
Trois questions séparent un outil testable d’une démonstration inaccessible : l’accès (public, payant, limité à une région ?), le matériel (une appli web suffit, ou faut-il un GPU ?), et la sortie (un monde explorable, une vidéo, ou des données pour développeurs ?). Chaque outil ci-dessous est noté sur ces trois plans.
Marble (World Labs) : le plus accessible aujourd’hui
Marble, le modèle de World Labs fondé par Fei-Fei Li, est le world model génératif le plus simple à essayer. La plateforme génère des environnements 3D persistants, éditables et téléchargeables à partir d’un texte, d’une image, d’une vidéo ou d’un panorama. Les mondes s’exportent ensuite en Gaussian splats ou en meshes compatibles Unity et Unreal, et un éditeur intégré, Chisel, permet de les retoucher au prompt.
La tarification reste lisible. Le plan gratuit ouvre 4 générations de monde. Ensuite, l’offre Standard à 20 $ par mois en propose 12. Enfin, les formules Pro à 35 $ et Max à 95 $ montent à 25 et 75 générations, avec droits commerciaux et toutes les fonctions d’édition. Les versions Marble 1.1 et 1.1 Plus, sorties en avril 2026, améliorent la fidélité et étendent automatiquement la taille des mondes. Une API a également ouvert en janvier 2026, facturée au crédit.
La limite connue : les environnements butent encore sur des murs après quelques pas, un plafond spatial que la version 1.1 Plus repousse sans le supprimer. Pour un créatif 3D, un développeur de jeu ou un vidéaste qui veut un décor navigable en quelques minutes, l’outil est ainsi exploitable dès le palier gratuit.
HunyuanWorld (Tencent) : l’alternative open source
Du côté ouvert, HunyuanWorld de Tencent avance vite. La famille génère de vraies scènes 3D, pas seulement de la vidéo, et reste entièrement open source. HunyuanWorld 1.5 (WorldPlay) a apporté la création et l’exploration en temps réel fin 2025, puis HY-World 2.0 est arrivé en avril 2026 comme modèle de référence ouvert.
Deux chemins pour l’essayer. La démonstration web de Tencent permet également de générer une scène sans rien installer. Pour un usage local, les poids sont sur Hugging Face ; la version lite tourne sur un GPU grand public de 24 Go comme une RTX 4090, tandis que le pipeline complet vise des cartes de 40 Go et plus. C’est la voie indiquée pour qui veut un world model gratuit, modifiable et sans dépendance à un éditeur unique.
Runway GWM-1 : pour la vidéo cohérente
Runway a lancé GWM-1 (General World Model) en décembre 2025, sa première brique de world model orientée vidéo. L’objectif est de dépasser la génération image par image pour produire des environnements où les objets se déplacent avec un poids et un élan cohérents. Les gains se voient notamment dans Gen-4.5, qui a atteint un score Elo record sur le benchmark Artificial Analysis, devant Google Veo et OpenAI Sora.
L’outil s’utilise via l’abonnement Runway, déjà connu des créateurs vidéo. La sortie reste de la vidéo générée, sans monde 3D navigable à la Marble. Pour un usage centré sur le film, la pub ou le motion design, c’est ainsi la porte d’entrée la plus naturelle.
Genie 3 (Google DeepMind) : impressionnant, mais verrouillé
Genie 3 est techniquement le plus avancé de la liste : il génère des mondes interactifs en temps réel, à 720p et 24 images par seconde, où chaque pas crée la suite de l’environnement. Après une preview de recherche en août 2025, Google a ensuite ouvert l’accès via Project Genie fin janvier 2026.
Le verrou est sévère. L’accès passe par l’abonnement Google AI Ultra à 249,99 $ par mois, réservé aux États-Unis et aux 18 ans et plus, avec des sessions limitées à environ 60 secondes. Pour un lecteur français, l’outil reste donc admirable en démonstration et hors de portée en pratique. À surveiller le jour où Google élargit la disponibilité géographique.
NVIDIA Cosmos : pour les développeurs et la robotique
Cosmos joue le rôle d’infrastructure sur laquelle d’autres construisent, à l’écart du grand public. La plateforme génère des données physiques de simulation pour entraîner robots et véhicules autonomes, et dépasse les 2 millions de téléchargements début 2026. Les modèles Predict et Transfer sont également open source sur GitHub, avec des adopteurs comme Figure AI, Agility Robotics, Waymo et XPENG.
Concrètement, un créatif n’a rien à y faire. Pour une équipe robotique ou un développeur de Physical AI, c’est une brique centrale. La nuance d’usage est nette : Cosmos sert à entraîner des machines, là où Marble génère un décor à explorer.
Les autres à connaître
Deux noms complètent le tableau. Oasis, des startups Decart et Etched, génère des mondes jouables façon Minecraft en temps réel à 20 images par seconde, avec des sauts et des ramassages d’objets, mais une cohérence encore fragile : l’environnement peut changer quand on se retourne. Enfin, côté recherche, AMI Labs, la société parisienne de Yann LeCun, ne propose aucun produit : son approche JEPA est non générative et son horizon d’application se compte en années.
Le tableau comparatif des world models génératifs
| Outil | Ce que ça produit | Accès et prix | Pour qui |
|---|---|---|---|
| Marble (World Labs) | Mondes 3D explorables, éditables, exportables | Web, gratuit à 95 $/mois | Créatifs 3D, jeu, VFX |
| HunyuanWorld (Tencent) | Scènes 3D, open source | Démo web gratuite ; poids ouverts (GPU 24 Go+) | Bricoleurs, développeurs, open source |
| Runway GWM-1 / Gen-4.5 | Vidéo physiquement cohérente | Abonnement Runway | Créateurs vidéo |
| Genie 3 (Project Genie) | Mondes interactifs en temps réel | Google AI Ultra, 249,99 $/mois, US uniquement | Abonnés Ultra aux États-Unis |
| NVIDIA Cosmos | Données physiques de simulation | Open source sur GitHub | Développeurs, robotique |
| AMI Labs (JEPA) | Aucun produit (recherche) | Indisponible | Personne, pour l’instant |
Notre avis : lequel tester selon ton profil
Pour la majorité des lecteurs, le réflexe le plus rentable est de commencer par Marble, dans le navigateur, au palier gratuit. La prise en main est immédiate et le résultat est exploitable sans matériel particulier. Si tu veux du libre et que tu n’as pas peur de la technique, HunyuanWorld offre également la démo web la plus accessible et des poids ouverts pour aller plus loin sur ta propre machine.
Pour un besoin vidéo, Runway reste la voie directe. Genie 3 mérite ensuite le coup d’œil pour mesurer où va la technologie, mais son prix et son verrou géographique le réservent à une minorité. Cosmos, lui, ne sort pas du terrain des développeurs et de la robotique.
La photo honnête de 2026 tient en une ligne : deux ou trois de ces outils se testent vraiment aujourd’hui, le plus spectaculaire reste enfermé, et le world model « pur » défendu par LeCun n’a encore aucun produit. Le terrain bouge vite, alors garde cette page en favori : les accès et les prix évolueront, la grille de lecture tiendra.
Le concept, le débat face aux LLM, l’architecture JEPA et les acteurs de la course : le dossier complet pour saisir pourquoi les modèles du monde comptent.