Spirit AI batte Nvidia nel benchmark di robotica RoboArena

Spirit AI batte Nvidia nel benchmark di robotica RoboArena

      TL;DRLa startup cinese Spirit AI guida la classifica di RoboArena co-sviluppata da Nvidia, totalizzando 1.924 contro 1.881 di Nvidia mentre l'IA fisica diventa il prossimo campo di battaglia tecnologico.

      Due giorni. È il tempo che il più recente modello di robotica di Nvidia ha trascorso in cima alla classifica di RoboArena prima che una startup di Hangzhou lo scalzasse.

      Mercoledì, Spirit AI ha annunciato che il suo modello di base per l'intelligenza incarnata, Spirit v1.6, aveva totalizzato 1.924 nel benchmark, superando il Cosmos3-Nano-Policy di Nvidia a 1.881. Un secondo progetto di Nvidia, DreamZero, si è classificato terzo con 1.763. È la prima volta che un modello cinese conquista il primo posto su RoboArena, un benchmark co-sviluppato da Nvidia con l'Università di Stanford e l'Università della California, Berkeley.

      Il tempismo è pungente. Nvidia aveva lanciato il suo omnimodel Cosmos 3 al Computex di Taipei il 1° giugno, definendolo il "modello di base per l'IA fisica a frontiera aperta". Addestrato su 20 trilioni di token di dati multimodali, Cosmos 3 doveva dimostrare il dominio dell'azienda in una categoria che praticamente ha inventato. Spirit AI aveva altri piani.

      Cosa misura realmente l'IA fisica

      RoboArena non testa la fluidità dei chatbot o la qualità della generazione di immagini. Valuta quanto efficacemente una politica robotica generalista si traduce in azioni nel mondo reale: manipolazione degli oggetti, navigazione, utilizzo degli strumenti, percezione, pianificazione e adattabilità in ambienti sconosciuti. In breve, misura se una macchina può pensare e poi agire.

      L'IA fisica si basa su due capacità fondamentali. Le capacità politiche determinano l'abilità di un modello di agire su ciò che osserva, che è esattamente ciò che misura RoboArena. Le capacità mondiali determinano l'abilità di un modello di simulare e prevedere cosa accade dopo se viene intrapresa un'azione specifica.

      L'industria si sta muovendo verso l'integrazione di entrambe. Lo scorso settembre, i ricercatori cinesi hanno introdotto un'architettura unificata di "Modello di Politica Mondiale" che fonde la modellazione del mondo e la pianificazione delle traiettorie in un unico sistema. Questa convergenza sta ora accelerando nel settore.

      La Cina è in testa su più fronti

      Il risultato di Spirit AI su RoboArena non è un dato isolato. In tutto l'ecosistema più ampio dei benchmark dell'IA fisica, le aziende cinesi occupano posizioni di leadership in quasi ogni categoria.

      Nel benchmark WorldArena, che valuta i modelli mondiali incarnati, il primo posto spetta a WorldScape-0.2 di Manifold AI. Supera il Cosmos-Predict 2.5 di Nvidia nella pista di valutazione delle politiche. La pista di percezione è guidata da AgiBot, una delle più grandi aziende di robotica della Cina, con il suo modello GenieEnvisioner-Sim2.0-2B svelato la scorsa settimana. La pista del motore dati è guidata da DexForce, un'altra startup cinese.

      Nel benchmark WorldScore, che testa l'abilità di un modello di generare mondi da prompt testuali, WorldScape-0.2 di Manifold AI guida nuovamente, superando WonderJourney, un progetto congiunto di Stanford e Google.

      Il denaro che affluisce

      I risultati tecnici sono sostenuti da un'onda straordinaria di capitale. Spirit AI ha annunciato un round di finanziamento di 1,5 miliardi di yuan (222 milioni di dollari) mercoledì, il suo quarto in appena tre mesi. Quel ritmo è riportato come il fundraising più aggressivo visto nel settore dell'IA incarnata. I round precedenti avevano già spinto la valutazione dell'azienda oltre i 10 miliardi di yuan (1,4 miliardi di dollari).

      Nello stesso giorno, XYZ Embodied AI, incubata dall'Accademia di Intelligenza Artificiale di Pechino, ha dichiarato di aver chiuso il suo round pre-A, avendo raccolto 1 miliardo di yuan in soli 10 mesi per sviluppare "cervelli incarnati" e modelli mondiali. Manifold AI ha completato cinque round di finanziamento in 10 mesi, con l'ultimo di aprile che ha assicurato, secondo quanto riportato, centinaia di milioni di yuan.

      Il più ampio settore della robotica cinese ha attratto 3,4 miliardi di dollari in finanziamenti di venture nel 2025, il 42% in più rispetto agli Stati Uniti. Quel divario sembra ampliarsi nel 2026.

      La contro-strategia di Nvidia

      Nvidia non sta fermo. Al Computex, il CEO Jensen Huang ha annunciato una partnership con l'azienda di robotica cinese Unitree, che sta preparando un'IPO da 7 miliardi di dollari, e il produttore di mani robotiche di Singapore Sharpa per costruire un design di riferimento per robot umanoidi. La piattaforma combina il corpo umanoide H2 Plus di Unitree, le mani tattili Wave di Sharpa e il processore Jetson AGX Thor T5000 di Nvidia.

      Huang ha anche lanciato la Cosmos Coalition, arruolando laboratori di IA tra cui Agile Robots, Black Forest Labs, Runway e Skild AI per promuovere modelli di mondo aperto. Il messaggio è chiaro: Nvidia vuole essere lo strato di infrastruttura per l'intero ecosistema dell'IA fisica, anche se i singoli modelli perdono le corone dei benchmark.

      Ma lo stesso Huang ha identificato il collo di bottiglia fondamentale del settore. "Per i sistemi robotici e l'IA fisica, i dati sono il problema più difficile," ha detto al Computex. Quell'ammissione indica perché la Cina potrebbe avere un vantaggio strutturale.

      La questione dei dati

      Alexandr Wang, il fondatore di Scale AI che è entrato in Meta come primo chief AI officer nel 2025, ha riferito di aver detto lo scorso anno che la Cina era "fondamentalmente molto ben posizionata sui dati" e che molte aziende statunitensi si affidavano ai dati cinesi per addestrare i modelli di base della robotica. L'affermazione non è stata verificata in modo indipendente, ma si allinea con le politiche osservabili.

      Nei centri tecnologici come Pechino e Shenzhen, le autorità cinesi hanno istituito "fabbriche di dati" sostenute dallo stato per raccogliere dati di addestramento per la robotica su larga scala. La catena di approvvigionamento manifatturiera della Cina, con la sua densa rete di fabbriche e linee di assemblaggio, fornisce un ambiente naturale per il tipo di dati di interazione robotica nel mondo reale che rimane costoso e difficile da raccogliere in Occidente.

      Se i dati sono davvero il problema più difficile, il paese con il maggior numero di fabbriche, il maggior numero di robot e la maggiore disponibilità a raccogliere potrebbe già avere la risposta.

Altri articoli

La Russia prepara uno Starlink più piccolo e una scadenza del 2027 che continua a spostare. La Russia prepara uno Starlink più piccolo e una scadenza del 2027 che continua a spostare. Il Bureau 1440 della Russia prevede di avviare internet satellitare commerciale nel 2027 con la sua costellazione Rassvet, una risposta deliberatamente più piccola a Starlink. Audi affronta la febbre Luce di Ferrari con la Nuvolari ibrida, la sua auto più veloce e potente di sempre. Audi affronta la febbre Luce di Ferrari con la Nuvolari ibrida, la sua auto più veloce e potente di sempre. Audi ha svelato la Nuvolari, la sua prima supercar ibrida con 1.001 PS, una velocità massima di oltre 350 km/h e una produzione limitata a sole 499 unità. Mira Murati riemerge con un avviso sulla governance dell'IA e un nuovo prodotto Mira Murati riemerge con un avviso sulla governance dell'IA e un nuovo prodotto L'ex CTO di OpenAI anticipa i modelli di interazione di Thinking Machines, riflette sul licenziamento di Altman e sostiene che l'IA ha troppi pochi controlli strutturali nella sua prima apparizione dopo 18 mesi. Hinge sta spingendo l'IA nel dating e il suo capo afferma che la Gen Z ha bisogno di chatbot per comunicare Hinge sta spingendo l'IA nel dating e il suo capo afferma che la Gen Z ha bisogno di chatbot per comunicare La Gen Z trascorre più di due ore al giorno in meno di persona con altre persone rispetto a quelle della stessa età 20 anni fa, ha dichiarato il CEO di Hinge, Jackie Jantos, alla BBC. L'app sta implementando coaching del profilo tramite IA e suggerimenti per le conversazioni per colmare il divario, ma i ricercatori affermano che le app di incontri hanno già promesso troppo su ciò che la tecnologia può fare per la solitudine. Claude scrive l'80% del suo codice, chiede una pausa per l'IA Claude scrive l'80% del suo codice, chiede una pausa per l'IA Claude ora scrive l'80% del codice di produzione di Anthropic. Il nuovo documento dell'azienda mappa il percorso verso il miglioramento auto-recursivo e chiede un meccanismo di pausa globale. La scelta dell'inviato per l'IA di Von der Leyen suscita polemiche per conflitto di interessi La scelta dell'inviato per l'IA di Von der Leyen suscita polemiche per conflitto di interessi L'UE ha nominato il presidente di Siemens, Jim Hagemann Snabe, come inviato per l'IA poche settimane dopo che l'azienda ha contribuito a far retrocedere l'Atto sull'IA. I critici affermano che ciò conferisce influenza politica ai lobbisti dell'industria.

Spirit AI batte Nvidia nel benchmark di robotica RoboArena

La startup cinese Spirit AI guida la classifica di RoboArena co-sviluppata da Nvidia, totalizzando 1.924 contro 1.881 di Nvidia, mentre l'IA fisica diventa il prossimo campo di battaglia tecnologico.