Google DeepMind conecta Street View con el modelo mundial del Proyecto Genie | TNW
TL;DRGoogle DeepMind ha conectado su modelo mundial Project Genie a las 280 mil millones de imágenes de Google Street View, permitiendo a los usuarios explorar simulaciones generadas por IA de ubicaciones reales. Anunciada en Google I/O, la función se está implementando para los suscriptores de Google AI Ultra en EE. UU., con Waymo ya utilizando Genie 3 para entrenar coches autónomos en escenarios raros.
Google DeepMind ha conectado su modelo mundial Project Genie a 20 años de imágenes de Street View, permitiendo a los usuarios vagar a través de simulaciones generadas por IA de lugares reales. La integración, anunciada en la conferencia de desarrolladores Google I/O el lunes, marca una de las demostraciones más tangibles hasta ahora de lo que los modelos generativos mundiales pueden hacer cuando se combinan con un colosal conjunto de datos del mundo real.
Project Genie, el sistema de propósito general de la compañía para crear entornos interactivos, ahora puede aprovechar más de 280 mil millones de imágenes capturadas en 110 países y los siete continentes. El resultado es una herramienta que te permite sumergirte en una versión simulada de, digamos, una manzana de Nueva York cubierta de nieve, o una calle de Londres bañada en un raro sol, y navegarla en tiempo real.
De vista previa de investigación a producto de consumo
Genie 3, la última iteración del modelo, apareció por primera vez como una vista previa de investigación en agosto de 2025, como parte de un esfuerzo más amplio de Google para integrar la IA en su pila de productos. En enero de 2026, DeepMind abrió el acceso a los suscriptores de Google AI Ultra en los Estados Unidos. La integración de Street View se está implementando ahora para algunos usuarios Ultra en EE. UU., con una expansión global planificada en las próximas semanas.
El 💜 de la tecnología de la UE
Los últimos rumores de la escena tecnológica de la UE, una historia de nuestro sabio fundador Boris, y un arte de IA cuestionable. Es gratis, cada semana, en tu bandeja de entrada. ¡Inscríbete ahora!
Jack Parker-Holder, un científico investigador del equipo de apertura de DeepMind, enmarcó la función como un servicio para dos audiencias distintas. Por un lado, los desarrolladores de robótica podrían usarlo para entrenar agentes en entornos simulados que reflejan ubicaciones reales. Por otro lado, los usuarios comunes podrían simplemente explorar por diversión.
Waymo ya es un cliente
El ángulo de la robótica no es teórico. Genie 3 ya impulsa uno de los simuladores de Waymo, donde la compañía de coches autónomos lo utiliza para entrenar en eventos raros que serían peligrosos o imprácticos de escenificar en la vida real, cosas como tornados o encuentros inesperados con elefantes en una carretera. La capacidad de fundamentar estas simulaciones en la geografía real de Street View añade otra capa de realismo.
Este tipo de pipeline de simulación a realidad se está convirtiendo en un cuello de botella crítico en la IA física. Empresas como Nvidia y Cadence han estado compitiendo para cerrar la brecha entre lo que los robots aprenden dentro de las computadoras y cómo se desempeñan una vez desplegados, y el enfoque de DeepMind de superponer modelos generativos sobre imágenes del mundo real ofrece una ruta distintiva.
Impresionante, pero lejos de ser fotorrealista
Diego Rivas, un gerente de producto en DeepMind, advirtió que la integración de Street View sigue siendo experimental. Los entornos generados se ven más como un videojuego que como una fotografía, y el modelo aún no es consciente de la física. En una demostración, un personaje corrió directamente a través de una fila de cactus sin consecuencias.
Parker-Holder reconoció la brecha directamente, estimando que la generación de mundos interactivos se queda atrás de la generación de video por aproximadamente seis a 12 meses en términos de precisión. Para dar contexto, el propio modelo Veo de Google ya entiende la física básica, y su herramienta Nano Banana puede renderizar texto perfecto en infografías. Genie aún no ha llegado allí.
El truco de la continuidad espacial
Lo que funciona bien, según Jonathan Herbert, director de Google Maps, es la continuidad espacial. Gira 360 grados dentro de un entorno generado por Genie, y la IA recuerda lo que había detrás de ti. Mantiene un modelo coherente del espacio en lugar de regenerarlo desde cero con cada cambio de perspectiva.
Herbert describió esta conciencia espacial como el verdadero avance. Google ha pasado dos décadas capturando el mundo a través de Street View, y el equipo de Maps ha considerado durante mucho tiempo cómo construir modelos más ricos sobre esos datos. Genie, parece, es la respuesta, o al menos el comienzo de una.
Lo que viene a continuación
El lanzamiento encaja dentro de un patrón más amplio en Google, donde la compañía está integrando constantemente capacidades de IA en productos que ya tienen bases de usuarios masivas. El conjunto de datos de Street View es un foso competitivo que ningún otro laboratorio de IA puede replicar fácilmente, y conectarlo a un modelo generativo del mundo convierte una herramienta de mapeo pasiva en algo mucho más dinámico.
Si las calles simuladas de Genie eventualmente rivalizarán con la fidelidad de motores de juego dedicados o producción de video profesional sigue por verse. Por ahora, la función es una prueba de concepto convincente, una que insinúa un futuro donde la línea entre navegar un mapa y explorar un mundo vivo generado por IA se vuelve cada vez más difícil de trazar.
Otros artículos
Google DeepMind conecta Street View con el modelo mundial del Proyecto Genie | TNW
Google DeepMind vincula 20 años de imágenes de Street View a su modelo mundial Genie, permitiendo a los suscriptores de AI Ultra explorar simulaciones generadas por IA de calles reales.
