Google Deepmind connecte son modèle de mondes Genie 3 à Street View pour créer des environnements IA explorables
D'après The Decoder (20 mai 2026 à 13h30)
Résumé
Google Deepmind relie son modèle de mondes Genie 3 aux images Street View. Les utilisateurs positionnent un repère sur une carte, choisissent un style optionnel et décrivent un personnage pour générer un monde explorable, ancré dans un lieu réel. Ces données deviennent un atout stratégique pour l’entraînement d’agents et de robots.
Les faits
Google Deepmind relie son modèle de mondes Genie 3 aux images Street View afin de générer des environnements interactifs basés sur des lieux réels. Les utilisateurs « déposent un repère sur une carte » et obtiennent « un monde généré par l’IA, explorables à pied, basé sur un lieu réel ». Pour affiner l’expérience, les utilisateurs peuvent « choisir un style optionnel comme “Ocean World”, “Desert Sands”, “Stone Age” ou “B&W film” » et « décrire un personnage ». Genie 3 « construit ensuite un monde explorable à pied dont le point de départ est lié à de véritables images Street View ». Google indique que cette fonction repose sur « Maps Imagery Grounding », une interface que les développeurs utilisent déjà pour créer des visuels dopés à l’IA à partir des données Street View. Google met en avant des démonstrations spectaculaires, comme « un Golden Gate Bridge inondé » ou les « Fort Worth Stockyards au Texas » stylisés comme dans les années 1920. L’article souligne que « la véritable histoire ici, ce sont les données » : Google a collecté pendant des années des images Street View de routes, d’intérieurs de bâtiments, de voies navigables et de zones reculées, qui servent désormais de matériel d’entraînement et d’ancrage pour ces mondes génératifs. Genie n’est pas présenté principalement comme un produit grand public. Le modèle de mondes vise à offrir aux agents d’IA et aux robots un environnement où « ils peuvent naviguer, raisonner et apprendre ». L’agent SIMA 2 de Deepmind utilise déjà Genie comme terrain d’entraînement, tandis que Waymo s’en sert pour simuler des scénarios de rue réalistes pour les voitures autonomes. La connexion à Street View permet désormais d’« ancrer ces entraînements à des lieux réels spécifiques ».
Pourquoi c’est important
En reliant Genie 3 à Street View, Google transforme des années de collecte d’images en un atout stratégique. La bibliothèque Street View de routes, d’intérieurs, de voies navigables et de zones reculées devient à la fois une base de données d’entraînement et un socle de mondes génératifs pour la recherche en IA. Au-delà des démonstrations créatives, l’enjeu majeur réside dans l’entraînement d’agents et de robots. En permettant à des systèmes comme SIMA 2 ou aux véhicules autonomes de Waymo de s’exercer dans des environnements simulés mais ancrés sur des lieux réels, Google renforce la capacité de ses modèles à « naviguer, raisonner et apprendre » dans des contextes proches du monde physique.
Questions fréquentes
Qu’est-ce que Genie 3 de Google Deepmind ?
Genie 3 est un modèle de mondes de Google Deepmind qui génère des environnements interactifs et explorables à partir d’images, désormais relié aux données Street View.
Comment Street View est-il utilisé dans Genie 3 ?
Les utilisateurs déposent un repère sur une carte et Genie 3 crée un monde explorable dont le point de départ est lié à de véritables images Street View d’un lieu réel.
Quels styles de mondes peuvent être appliqués ?
Les utilisateurs peuvent choisir des styles optionnels comme « Ocean World », « Desert Sands », « Stone Age » ou « B&W film » pour transformer l’apparence du lieu.
À quoi servent ces mondes pour l’IA ?
Ils fournissent des environnements où des agents d’IA et des robots peuvent naviguer, raisonner et apprendre, notamment via l’agent SIMA 2 et les simulations de conduite de Waymo.
Pourquoi les données Street View sont-elles stratégiques ?
La vaste bibliothèque d’images Street View de routes, d’intérieurs, de voies navigables et de zones reculées sert à la fois de matériel d’entraînement et de base pour des mondes génératifs.
Source
The DecoderAuteur
Rédaction IA-MediasRédaction spécialisée dans la veille et l'analyse de l'actualité de l'intelligence artificielle, des puces IA, des robots, des agents IA et de la recherche.