Spirit AI supera a Nvidia en el benchmark de robótica RoboArena

Spirit AI supera a Nvidia en el benchmark de robótica RoboArena

      TL;DRLa startup china Spirit AI lidera la tabla de clasificación de RoboArena co-creada por Nvidia, obteniendo 1,924 frente a 1,881 de Nvidia, mientras la IA física se convierte en el próximo campo de batalla tecnológico.

      Dos días. Eso es lo que duró el último modelo de robótica de Nvidia en la cima de la tabla de clasificación de RoboArena antes de que una startup de Hangzhou lo desbancara.

      El miércoles, Spirit AI anunció que su modelo base para inteligencia incorporada, Spirit v1.6, había obtenido 1,924 en el benchmark, superando al Cosmos3-Nano-Policy de Nvidia con 1,881. Un segundo proyecto de Nvidia, DreamZero, ocupó el tercer lugar con 1,763. Es la primera vez que un modelo chino reclama el primer puesto en RoboArena, un benchmark co-desarrollado por Nvidia con la Universidad de Stanford y la Universidad de California, Berkeley.

      El momento duele. Nvidia había lanzado su omnimodelo Cosmos 3 en Computex en Taipei el 1 de junio, llamándolo el “modelo base de frontera abierta para la IA física.” Entrenado con 20 billones de tokens de datos multimodales, se suponía que Cosmos 3 demostraría el dominio de la compañía en una categoría que prácticamente inventó. Spirit AI tenía otros planes.

      Lo que realmente mide la IA física

      RoboArena no evalúa la fluidez de chatbots ni la calidad de generación de imágenes. Evalúa cuán efectivamente una política robótica generalista se traduce en acciones del mundo real: manipulación de objetos, navegación, uso de herramientas, percepción, planificación y adaptabilidad en entornos desconocidos. En resumen, mide si una máquina puede pensar y luego actuar.

      La IA física se basa en dos capacidades fundamentales. Las capacidades de política determinan la habilidad de un modelo para actuar sobre lo que observa, que es exactamente lo que mide RoboArena. Las capacidades del mundo determinan la habilidad de un modelo para simular y predecir lo que sucede a continuación si se toma una acción específica.

      La industria se está moviendo hacia la integración de ambas. En septiembre pasado, investigadores chinos introdujeron una arquitectura unificada de “Modelo de Mundo de Política” que fusiona la modelización del mundo y la planificación de trayectorias en un solo sistema. Esa convergencia ahora se está acelerando en todo el sector.

      China lidera en múltiples frentes

      El resultado de Spirit AI en RoboArena no es un punto de datos aislado. A través del ecosistema más amplio de benchmarks de IA física, las empresas chinas ocupan posiciones de liderazgo en casi todas las categorías.

      En el benchmark WorldArena, que evalúa modelos del mundo incorporados, el primer puesto pertenece a WorldScape-0.2 de Manifold AI. Supera al Cosmos-Predict 2.5 de Nvidia en la pista de evaluador de políticas. La pista de percepción está liderada por AgiBot, una de las mayores empresas de robótica de China, con su modelo GenieEnvisioner-Sim2.0-2B presentado la semana pasada. La pista del motor de datos está encabezada por DexForce, otra startup china.

      En el benchmark WorldScore, que prueba la capacidad de un modelo para generar mundos a partir de indicaciones de texto, WorldScape-0.2 de Manifold AI nuevamente lidera, superando a WonderJourney, un proyecto conjunto de Stanford y Google.

      El dinero que fluye

      Los resultados técnicos están respaldados por una ola extraordinaria de capital. Spirit AI anunció una ronda de financiamiento de 1.5 mil millones de yuanes (222 millones de dólares) el miércoles, su cuarta en solo tres meses. Ese ritmo es, según se informa, la recaudación de fondos más agresiva vista en el sector de la IA incorporada. Rondas anteriores ya habían llevado la valoración de la compañía más allá de 10 mil millones de yuanes (1.4 mil millones de dólares).

      El mismo día, XYZ Embodied AI, incubada por la Academia de Inteligencia Artificial de Beijing, dijo que había cerrado su ronda pre-A, habiendo recaudado 1 mil millones de yuanes en solo 10 meses para desarrollar “cerebros incorporados” y modelos del mundo. Manifold AI ha completado cinco rondas de financiamiento en 10 meses, con su última en abril asegurando, según se informa, cientos de millones de yuanes.

      El sector más amplio de robótica en China atrajo 3.4 mil millones de dólares en financiamiento de riesgo solo en 2025, un 42 por ciento más que Estados Unidos. Esa brecha parece estar ampliándose en 2026.

      La contraestrategia de Nvidia

      Nvidia no se está quedando quieta. En Computex, el CEO Jensen Huang anunció una asociación con la firma de robótica china Unitree, que se está preparando para una OPI de 7 mil millones de dólares, y con el fabricante de manos robóticas de Singapur Sharpa para construir un diseño de referencia de robot humanoide. La plataforma combina el cuerpo humanoide H2 Plus de Unitree, las manos táctiles Wave de Sharpa y el procesador Jetson AGX Thor T5000 de Nvidia.

      Huang también lanzó la Coalición Cosmos, reclutando laboratorios de IA como Agile Robots, Black Forest Labs, Runway y Skild AI para avanzar en modelos de mundo abiertos. El mensaje es claro: Nvidia quiere ser la capa de infraestructura para todo el ecosistema de IA física, incluso si los modelos individuales pierden coronas de benchmark.

      Pero el propio Huang identificó el cuello de botella fundamental del sector. “Para los sistemas robóticos y la IA física, los datos son el problema más difícil,” dijo en Computex. Esa admisión apunta a por qué China puede tener una ventaja estructural.

      La cuestión de los datos

      Alexandr Wang, el fundador de Scale AI que se unió a Meta como su primer director de IA en 2025, dijo el año pasado que China estaba “fundamentalmente muy bien posicionada en datos” y que muchas empresas estadounidenses dependían de datos chinos para entrenar modelos base de robótica. La afirmación no ha sido verificada de manera independiente en su totalidad, pero se alinea con políticas observables.

      En centros tecnológicos como Beijing y Shenzhen, las autoridades chinas han establecido “fábricas de datos” respaldadas por el estado para recopilar datos de entrenamiento de robótica a gran escala. La cadena de suministro de manufactura de China, con su densa red de fábricas y líneas de ensamblaje, proporciona un entorno natural para el tipo de datos de interacción robótica del mundo real que sigue siendo costoso y difícil de reunir en Occidente.

      Si los datos realmente son el problema más difícil, el país con más fábricas, más robots y más disposición para recopilar puede ya tener la respuesta.

Otros artículos

Las estafas de la Copa Mundial de la FIFA 2026 están activas: sitios falsos y malware Las estafas de la Copa Mundial de la FIFA 2026 están activas: sitios falsos y malware Más de 4,300 dominios falsos de FIFA, malware bancario en aplicaciones de streaming y credenciales robadas ya están apuntando a los aficionados de la Copa Mundial 2026, con el FBI y los investigadores advirtiendo sobre miles de millones en pérdidas potenciales. Puede que no lo desees necesariamente, pero una avalancha de Googlebooks está llegando de las principales marcas. Puede que no lo desees necesariamente, pero una avalancha de Googlebooks está llegando de las principales marcas. Googlebook podría llegar con hasta ocho dispositivos este otoño, ofreciendo a los compradores más opciones entre hardware de Intel, Snapdragon y MediaTek, pero los detalles clave sobre precios, especificaciones y disponibilidad siguen sin confirmarse. Hinge está impulsando la IA en las citas y su jefe dice que la Generación Z necesita chatbots para hablar. Hinge está impulsando la IA en las citas y su jefe dice que la Generación Z necesita chatbots para hablar. La Generación Z pasa más de dos horas al día menos en persona con otras personas que aquellos de la misma edad hace 20 años, dijo la CEO de Hinge, Jackie Jantos, a la BBC. La aplicación está implementando entrenamiento de perfil con IA y sugerencias de conversación para llenar el vacío, pero los investigadores dicen que las aplicaciones de citas ya han prometido demasiado sobre lo que la tecnología puede hacer por la soledad. AirTrunk planea una inversión de $30 mil millones en centros de datos de 5GW en India para 2030. AirTrunk planea una inversión de $30 mil millones en centros de datos de 5GW en India para 2030. AirTrunk respaldada por Blackstone planea invertir $30 mil millones en India para 2030 para construir 5GW de capacidad de centros de datos, semanas después de ingresar al mercado a través de una adquisición de Lumina CloudInfra. AirTrunk planea una inversión de $30 mil millones en centros de datos de 5GW en India para 2030 AirTrunk planea una inversión de $30 mil millones en centros de datos de 5GW en India para 2030 AirTrunk respaldada por Blackstone planea invertir $30 mil millones en India para 2030 para construir 5GW de capacidad de centros de datos, semanas después de ingresar al mercado a través de una adquisición de Lumina CloudInfra. La elección del enviado de IA de Von der Leyen genera críticas por conflicto de intereses La elección del enviado de IA de Von der Leyen genera críticas por conflicto de intereses La UE nombró al presidente de Siemens, Jim Hagemann Snabe, como enviado de IA semanas después de que la empresa ayudara a revertir la Ley de IA. Los críticos dicen que le otorga influencia en la política a los cabilderos de la industria.

Spirit AI supera a Nvidia en el benchmark de robótica RoboArena

La startup china Spirit AI encabeza la tabla de clasificación de RoboArena co-creada por Nvidia, obteniendo 1,924 frente a los 1,881 de Nvidia, mientras la IA física se convierte en el próximo campo de batalla tecnológico.