Spirit AI обошел Nvidia по бенчмарку RoboArena в области робототехники
TL;DR Китайский стартап Spirit AI возглавил таблицу лидеров RoboArena, созданную совместно с Nvidia, набрав 1,924 против 1,881 у Nvidia, поскольку физический ИИ становится следующим полем битвы технологий.
Два дня. Именно столько времени последняя модель робототехники Nvidia находилась на вершине таблицы лидеров RoboArena, прежде чем стартап из Ханчжоу сбросил её с пьедестала.
В среду Spirit AI объявил, что его базовая модель для воплощенного интеллекта, Spirit v1.6, набрала 1,924 балла по бенчмарку, опередив Cosmos3-Nano-Policy от Nvidia с 1,881. Второй проект Nvidia, DreamZero, занял третье место с 1,763. Это первый случай, когда китайская модель заняла первое место в RoboArena, бенчмарке, который Nvidia разработала совместно со Стэнфордским университетом и Университетом Калифорнии в Беркли.
Сроки обидны. Nvidia запустила свой омнимодель Cosmos 3 на Computex в Тайбэе 1 июня, назвав его «моделью открытой границы для физического ИИ». Обученный на 20 триллионах токенов мультимодальных данных, Cosmos 3 должен был продемонстрировать доминирование компании в категории, которую она практически изобрела. У Spirit AI были другие планы.
Что на самом деле измеряет физический ИИ
RoboArena не тестирует беглость чат-ботов или качество генерации изображений. Он оценивает, насколько эффективно общая политика робота переводится в реальные действия: манипуляция объектами, навигация, использование инструментов, восприятие, планирование и адаптация в незнакомых условиях. Короче говоря, он измеряет, может ли машина думать и затем действовать.
Физический ИИ полагается на две основные способности. Политические способности определяют способность модели действовать на основе наблюдаемого, что именно и измеряет RoboArena. Мировые способности определяют способность модели моделировать и предсказывать, что произойдет дальше, если будет предпринято конкретное действие.
Отрасль движется к интеграции обоих. В сентябре прошлого года китайские исследователи представили единую архитектуру «Мировая модель политики», которая объединяет моделирование мира и планирование траекторий в единую систему. Это слияние сейчас ускоряется по всему сектору.
Китай лидирует на нескольких фронтах
Результат Spirit AI в RoboArena не является изолированной точкой данных. В более широком экосистеме бенчмарков физического ИИ китайские компании занимают ведущие позиции почти в каждой категории.
На бенчмарке WorldArena, который оценивает воплощенные мировые модели, первое место занимает WorldScape-0.2 от Manifold AI. Он превосходит Cosmos-Predict 2.5 от Nvidia в треке оценивания политики. В треке восприятия лидирует AgiBot, одна из крупнейших робототехнических компаний Китая, с моделью GenieEnvisioner-Sim2.0-2B, представленную на прошлой неделе. В треке данных лидирует DexForce, еще один китайский стартап.
На бенчмарке WorldScore, который тестирует способность модели генерировать миры из текстовых подсказок, WorldScape-0.2 от Manifold AI снова на первом месте, превосходя WonderJourney, совместный проект Стэнфорда и Google.
Деньги поступают
Технические результаты подкреплены необычной волной капитала. Spirit AI объявил о раунде финансирования в 1,5 миллиарда юаней (222 миллиона долларов) в среду, это четвертый раунд всего за три месяца. Эта скорость, как сообщается, является самой агрессивной в сборе средств в секторе воплощенного ИИ. Ранее раунды уже повысили оценку компании до более чем 10 миллиардов юаней (1,4 миллиарда долларов).
В тот же день XYZ Embodied AI, инкубированный Пекинской академией искусственного интеллекта, сообщил, что закрыл свой раунд пред-A, собрав 1 миллиард юаней всего за 10 месяцев для разработки «воплощенных мозгов» и мировых моделей. Manifold AI завершила пять раундов финансирования за 10 месяцев, последний из которых в апреле обеспечил, как сообщается, сотни миллионов юаней.
Широкий китайский сектор робототехники привлек 3,4 миллиарда долларов венчурного финансирования только в 2025 году, что на 42 процента больше, чем в Соединенных Штатах. Этот разрыв, похоже, расширяется в 2026 году.
Контрстратегия Nvidia
Nvidia не стоит на месте. На Computex генеральный директор Дженсен Хуанг объявил о партнерстве с китайской робототехнической компанией Unitree, которая готовит IPO на 7 миллиардов долларов, и сингапурским производителем роботизированных рук Sharpa для создания эталонного дизайна гуманоидного робота. Платформа объединяет гуманоидное тело H2 Plus от Unitree, тактильные руки Wave от Sharpa и процессор Nvidia Jetson AGX Thor T5000.
Хуанг также запустил Космическую коалицию, привлекая ИИ-лаборатории, включая Agile Robots, Black Forest Labs, Runway и Skild AI, для продвижения открытых мировых моделей. Сообщение ясно: Nvidia хочет быть инфраструктурным слоем для всей экосистемы физического ИИ, даже если отдельные модели теряют короны бенчмарков.
Но сам Хуанг определил основное узкое место сектора. «Для роботизированных систем и физического ИИ данные являются самой сложной проблемой», — сказал он на Computex. Это признание указывает на то, почему Китай может иметь структурное преимущество.
Вопрос данных
Александр Ванг, основатель Scale AI, который в 2025 году стал первым главным ИИ-офицером Meta, якобы сказал в прошлом году, что Китай «фундаментально очень хорошо позиционирован в области данных» и что многие американские компании полагаются на китайские данные для обучения моделей основного ИИ в робототехнике. Это утверждение не было полностью независимо проверено, но оно соответствует наблюдаемой политике.
В технологических центрах, таких как Пекин и Шэньчжэнь, китайские власти создали поддерживаемые государством «фабрики данных» для сбора данных для обучения робототехники в больших масштабах. Производственная цепочка Китая, с её плотной сетью фабрик и сборочных линий, предоставляет естественную среду для такого рода данных о взаимодействии роботов с реальным миром, которые остаются дорогими и трудными для сбора на Западе.
Если данные действительно являются самой сложной проблемой, то страна с наибольшим количеством фабрик, наибольшим количеством роботов и наибольшей готовностью к сбору может уже иметь ответ.
Другие статьи
Spirit AI обошел Nvidia по бенчмарку RoboArena в области робототехники
Китайский стартап Spirit AI возглавил таблицу лидеров RoboArena, созданную совместно с Nvidia, набрав 1,924 очка против 1,881 у Nvidia, поскольку физический ИИ становится следующим полем битвы технологий.
