Spirit AI batte Nvidia nel benchmark di robotica RoboArena
TL;DRLa startup cinese Spirit AI guida la classifica di RoboArena co-sviluppata da Nvidia, totalizzando 1.924 contro 1.881 di Nvidia mentre l'IA fisica diventa il prossimo campo di battaglia tecnologico.
Due giorni. È il tempo che il più recente modello di robotica di Nvidia ha trascorso in cima alla classifica di RoboArena prima che una startup di Hangzhou lo scalzasse.
Mercoledì, Spirit AI ha annunciato che il suo modello di base per l'intelligenza incarnata, Spirit v1.6, aveva totalizzato 1.924 nel benchmark, superando il Cosmos3-Nano-Policy di Nvidia a 1.881. Un secondo progetto di Nvidia, DreamZero, si è classificato terzo con 1.763. È la prima volta che un modello cinese conquista il primo posto su RoboArena, un benchmark co-sviluppato da Nvidia con l'Università di Stanford e l'Università della California, Berkeley.
Il tempismo è pungente. Nvidia aveva lanciato il suo omnimodel Cosmos 3 al Computex di Taipei il 1° giugno, definendolo il "modello di base per l'IA fisica a frontiera aperta". Addestrato su 20 trilioni di token di dati multimodali, Cosmos 3 doveva dimostrare il dominio dell'azienda in una categoria che praticamente ha inventato. Spirit AI aveva altri piani.
Cosa misura realmente l'IA fisica
RoboArena non testa la fluidità dei chatbot o la qualità della generazione di immagini. Valuta quanto efficacemente una politica robotica generalista si traduce in azioni nel mondo reale: manipolazione degli oggetti, navigazione, utilizzo degli strumenti, percezione, pianificazione e adattabilità in ambienti sconosciuti. In breve, misura se una macchina può pensare e poi agire.
L'IA fisica si basa su due capacità fondamentali. Le capacità politiche determinano l'abilità di un modello di agire su ciò che osserva, che è esattamente ciò che misura RoboArena. Le capacità mondiali determinano l'abilità di un modello di simulare e prevedere cosa accade dopo se viene intrapresa un'azione specifica.
L'industria si sta muovendo verso l'integrazione di entrambe. Lo scorso settembre, i ricercatori cinesi hanno introdotto un'architettura unificata di "Modello di Politica Mondiale" che fonde la modellazione del mondo e la pianificazione delle traiettorie in un unico sistema. Questa convergenza sta ora accelerando nel settore.
La Cina è in testa su più fronti
Il risultato di Spirit AI su RoboArena non è un dato isolato. In tutto l'ecosistema più ampio dei benchmark dell'IA fisica, le aziende cinesi occupano posizioni di leadership in quasi ogni categoria.
Nel benchmark WorldArena, che valuta i modelli mondiali incarnati, il primo posto spetta a WorldScape-0.2 di Manifold AI. Supera il Cosmos-Predict 2.5 di Nvidia nella pista di valutazione delle politiche. La pista di percezione è guidata da AgiBot, una delle più grandi aziende di robotica della Cina, con il suo modello GenieEnvisioner-Sim2.0-2B svelato la scorsa settimana. La pista del motore dati è guidata da DexForce, un'altra startup cinese.
Nel benchmark WorldScore, che testa l'abilità di un modello di generare mondi da prompt testuali, WorldScape-0.2 di Manifold AI guida nuovamente, superando WonderJourney, un progetto congiunto di Stanford e Google.
Il denaro che affluisce
I risultati tecnici sono sostenuti da un'onda straordinaria di capitale. Spirit AI ha annunciato un round di finanziamento di 1,5 miliardi di yuan (222 milioni di dollari) mercoledì, il suo quarto in appena tre mesi. Quel ritmo è riportato come il fundraising più aggressivo visto nel settore dell'IA incarnata. I round precedenti avevano già spinto la valutazione dell'azienda oltre i 10 miliardi di yuan (1,4 miliardi di dollari).
Nello stesso giorno, XYZ Embodied AI, incubata dall'Accademia di Intelligenza Artificiale di Pechino, ha dichiarato di aver chiuso il suo round pre-A, avendo raccolto 1 miliardo di yuan in soli 10 mesi per sviluppare "cervelli incarnati" e modelli mondiali. Manifold AI ha completato cinque round di finanziamento in 10 mesi, con l'ultimo di aprile che ha assicurato, secondo quanto riportato, centinaia di milioni di yuan.
Il più ampio settore della robotica cinese ha attratto 3,4 miliardi di dollari in finanziamenti di venture nel 2025, il 42% in più rispetto agli Stati Uniti. Quel divario sembra ampliarsi nel 2026.
La contro-strategia di Nvidia
Nvidia non sta fermo. Al Computex, il CEO Jensen Huang ha annunciato una partnership con l'azienda di robotica cinese Unitree, che sta preparando un'IPO da 7 miliardi di dollari, e il produttore di mani robotiche di Singapore Sharpa per costruire un design di riferimento per robot umanoidi. La piattaforma combina il corpo umanoide H2 Plus di Unitree, le mani tattili Wave di Sharpa e il processore Jetson AGX Thor T5000 di Nvidia.
Huang ha anche lanciato la Cosmos Coalition, arruolando laboratori di IA tra cui Agile Robots, Black Forest Labs, Runway e Skild AI per promuovere modelli di mondo aperto. Il messaggio è chiaro: Nvidia vuole essere lo strato di infrastruttura per l'intero ecosistema dell'IA fisica, anche se i singoli modelli perdono le corone dei benchmark.
Ma lo stesso Huang ha identificato il collo di bottiglia fondamentale del settore. "Per i sistemi robotici e l'IA fisica, i dati sono il problema più difficile," ha detto al Computex. Quell'ammissione indica perché la Cina potrebbe avere un vantaggio strutturale.
La questione dei dati
Alexandr Wang, il fondatore di Scale AI che è entrato in Meta come primo chief AI officer nel 2025, ha riferito di aver detto lo scorso anno che la Cina era "fondamentalmente molto ben posizionata sui dati" e che molte aziende statunitensi si affidavano ai dati cinesi per addestrare i modelli di base della robotica. L'affermazione non è stata verificata in modo indipendente, ma si allinea con le politiche osservabili.
Nei centri tecnologici come Pechino e Shenzhen, le autorità cinesi hanno istituito "fabbriche di dati" sostenute dallo stato per raccogliere dati di addestramento per la robotica su larga scala. La catena di approvvigionamento manifatturiera della Cina, con la sua densa rete di fabbriche e linee di assemblaggio, fornisce un ambiente naturale per il tipo di dati di interazione robotica nel mondo reale che rimane costoso e difficile da raccogliere in Occidente.
Se i dati sono davvero il problema più difficile, il paese con il maggior numero di fabbriche, il maggior numero di robot e la maggiore disponibilità a raccogliere potrebbe già avere la risposta.
Altri articoli
Spirit AI batte Nvidia nel benchmark di robotica RoboArena
La startup cinese Spirit AI guida la classifica di RoboArena co-sviluppata da Nvidia, totalizzando 1.924 contro 1.881 di Nvidia, mentre l'IA fisica diventa il prossimo campo di battaglia tecnologico.
