Spirit AI supera a Nvidia en el benchmark de robótica RoboArena
TL;DRLa startup china Spirit AI lidera la tabla de clasificación de RoboArena co-creada por Nvidia, obteniendo 1,924 frente a 1,881 de Nvidia, mientras la IA física se convierte en el próximo campo de batalla tecnológico.
Dos días. Eso es lo que duró el último modelo de robótica de Nvidia en la cima de la tabla de clasificación de RoboArena antes de que una startup de Hangzhou lo desbancara.
El miércoles, Spirit AI anunció que su modelo base para inteligencia incorporada, Spirit v1.6, había obtenido 1,924 en el benchmark, superando al Cosmos3-Nano-Policy de Nvidia con 1,881. Un segundo proyecto de Nvidia, DreamZero, ocupó el tercer lugar con 1,763. Es la primera vez que un modelo chino reclama el primer puesto en RoboArena, un benchmark co-desarrollado por Nvidia con la Universidad de Stanford y la Universidad de California, Berkeley.
El momento duele. Nvidia había lanzado su omnimodelo Cosmos 3 en Computex en Taipei el 1 de junio, llamándolo el “modelo base de frontera abierta para la IA física.” Entrenado con 20 billones de tokens de datos multimodales, se suponía que Cosmos 3 demostraría el dominio de la compañía en una categoría que prácticamente inventó. Spirit AI tenía otros planes.
Lo que realmente mide la IA física
RoboArena no evalúa la fluidez de chatbots ni la calidad de generación de imágenes. Evalúa cuán efectivamente una política robótica generalista se traduce en acciones del mundo real: manipulación de objetos, navegación, uso de herramientas, percepción, planificación y adaptabilidad en entornos desconocidos. En resumen, mide si una máquina puede pensar y luego actuar.
La IA física se basa en dos capacidades fundamentales. Las capacidades de política determinan la habilidad de un modelo para actuar sobre lo que observa, que es exactamente lo que mide RoboArena. Las capacidades del mundo determinan la habilidad de un modelo para simular y predecir lo que sucede a continuación si se toma una acción específica.
La industria se está moviendo hacia la integración de ambas. En septiembre pasado, investigadores chinos introdujeron una arquitectura unificada de “Modelo de Mundo de Política” que fusiona la modelización del mundo y la planificación de trayectorias en un solo sistema. Esa convergencia ahora se está acelerando en todo el sector.
China lidera en múltiples frentes
El resultado de Spirit AI en RoboArena no es un punto de datos aislado. A través del ecosistema más amplio de benchmarks de IA física, las empresas chinas ocupan posiciones de liderazgo en casi todas las categorías.
En el benchmark WorldArena, que evalúa modelos del mundo incorporados, el primer puesto pertenece a WorldScape-0.2 de Manifold AI. Supera al Cosmos-Predict 2.5 de Nvidia en la pista de evaluador de políticas. La pista de percepción está liderada por AgiBot, una de las mayores empresas de robótica de China, con su modelo GenieEnvisioner-Sim2.0-2B presentado la semana pasada. La pista del motor de datos está encabezada por DexForce, otra startup china.
En el benchmark WorldScore, que prueba la capacidad de un modelo para generar mundos a partir de indicaciones de texto, WorldScape-0.2 de Manifold AI nuevamente lidera, superando a WonderJourney, un proyecto conjunto de Stanford y Google.
El dinero que fluye
Los resultados técnicos están respaldados por una ola extraordinaria de capital. Spirit AI anunció una ronda de financiamiento de 1.5 mil millones de yuanes (222 millones de dólares) el miércoles, su cuarta en solo tres meses. Ese ritmo es, según se informa, la recaudación de fondos más agresiva vista en el sector de la IA incorporada. Rondas anteriores ya habían llevado la valoración de la compañía más allá de 10 mil millones de yuanes (1.4 mil millones de dólares).
El mismo día, XYZ Embodied AI, incubada por la Academia de Inteligencia Artificial de Beijing, dijo que había cerrado su ronda pre-A, habiendo recaudado 1 mil millones de yuanes en solo 10 meses para desarrollar “cerebros incorporados” y modelos del mundo. Manifold AI ha completado cinco rondas de financiamiento en 10 meses, con su última en abril asegurando, según se informa, cientos de millones de yuanes.
El sector más amplio de robótica en China atrajo 3.4 mil millones de dólares en financiamiento de riesgo solo en 2025, un 42 por ciento más que Estados Unidos. Esa brecha parece estar ampliándose en 2026.
La contraestrategia de Nvidia
Nvidia no se está quedando quieta. En Computex, el CEO Jensen Huang anunció una asociación con la firma de robótica china Unitree, que se está preparando para una OPI de 7 mil millones de dólares, y con el fabricante de manos robóticas de Singapur Sharpa para construir un diseño de referencia de robot humanoide. La plataforma combina el cuerpo humanoide H2 Plus de Unitree, las manos táctiles Wave de Sharpa y el procesador Jetson AGX Thor T5000 de Nvidia.
Huang también lanzó la Coalición Cosmos, reclutando laboratorios de IA como Agile Robots, Black Forest Labs, Runway y Skild AI para avanzar en modelos de mundo abiertos. El mensaje es claro: Nvidia quiere ser la capa de infraestructura para todo el ecosistema de IA física, incluso si los modelos individuales pierden coronas de benchmark.
Pero el propio Huang identificó el cuello de botella fundamental del sector. “Para los sistemas robóticos y la IA física, los datos son el problema más difícil,” dijo en Computex. Esa admisión apunta a por qué China puede tener una ventaja estructural.
La cuestión de los datos
Alexandr Wang, el fundador de Scale AI que se unió a Meta como su primer director de IA en 2025, dijo el año pasado que China estaba “fundamentalmente muy bien posicionada en datos” y que muchas empresas estadounidenses dependían de datos chinos para entrenar modelos base de robótica. La afirmación no ha sido verificada de manera independiente en su totalidad, pero se alinea con políticas observables.
En centros tecnológicos como Beijing y Shenzhen, las autoridades chinas han establecido “fábricas de datos” respaldadas por el estado para recopilar datos de entrenamiento de robótica a gran escala. La cadena de suministro de manufactura de China, con su densa red de fábricas y líneas de ensamblaje, proporciona un entorno natural para el tipo de datos de interacción robótica del mundo real que sigue siendo costoso y difícil de reunir en Occidente.
Si los datos realmente son el problema más difícil, el país con más fábricas, más robots y más disposición para recopilar puede ya tener la respuesta.
Otros artículos
Spirit AI supera a Nvidia en el benchmark de robótica RoboArena
La startup china Spirit AI encabeza la tabla de clasificación de RoboArena co-creada por Nvidia, obteniendo 1,924 frente a los 1,881 de Nvidia, mientras la IA física se convierte en el próximo campo de batalla tecnológico.
