SpaceX арендовала Colossus 1 у Anthropic, потому что не смогла заставить дата-центр работать для Grok.
TL;DRSpaceX арендовала Colossus 1 у Anthropic после возникновения проблем с задержками и несовместимостью чипов при попытке использовать его для Grok. Новые объекты используют унифицированные чипы Blackwell.
SpaceX арендовала свой дата-центр Colossus 1 у Anthropic не потому, что у нее была избыточная мощность, а потому, что она не смогла заставить объект работать для своих собственных моделей ИИ. Bloomberg сообщила в пятницу, что SpaceX столкнулась с проблемами задержки при попытке соединить сайт в Мемфисе с двумя другими кампусами дата-центров, расположенными более чем в 10 милях, что усугублялось устаревшей сетевой инфраструктурой.
Компания планировала обучать свои самые современные модели Grok, используя кластер из трех объектов, работающих вместе. Обучение крупных моделей ИИ требует ультрабыстрых соединений между объектами. Если соединения старые или имеют низкую пропускную способность, они создают задержки, которые замедляют весь кластер. SpaceX определила, что объект будет более ценным, генерируя доход, чем оставаясь недоиспользованным.
Несоответствие аппаратного обеспечения усугубило ситуацию. Colossus 1 содержит смесь поколений чипов Nvidia, включая системы Hopper и Blackwell наряду со старыми ускорителями. Colossus 2 и 3 были построены более однородно вокруг чипов Blackwell от Nvidia. В распределенном учебном кластере рабочая нагрузка распределяется между машинами, которые должны оставаться синхронизированными. Старые чипы создают узкие места, заставляя более быстрые ускорители ждать. В результате кластер работает ближе к своему самому медленному оборудованию, а не к самому быстрому.
💜 технологий ЕС Последние новости из технологической сцены ЕС, история от нашего мудрого основателя Бориса и немного сомнительного ИИ-искусства. Это бесплатно, каждую неделю, в вашем почтовом ящике. Подпишитесь сейчас! В результате Anthropic теперь платит 1,25 миллиарда долларов в месяц за использование объекта, который инженеры SpaceX не смогли полностью использовать. В сочетании с месячным соглашением с Google на 920 миллионов долларов, SpaceX собирает примерно 2,17 миллиарда долларов в месяц в виде дохода от вычислений от инфраструктуры, которую она изначально построила для себя.
Это откровение усложняет нарратив, который SpaceX представила во время своего роудшоу IPO. Компания Маска неоднократно подчеркивала, что Colossus 1 был построен всего за 122 дня, превысив средние показатели по отрасли. Скорость строительства была важным аргументом. Сообщения Bloomberg предполагают, что скорость имела свою цену: объект не был построен достаточно однородно, чтобы служить частью более крупного учебного кластера.
Финансовый директор SpaceX Брэт Джонсен сказал, что компания не отказалась от внутренних ИИ-сервисов, включая Grok. Маск описал соглашение с Anthropic как аренду на 180 дней с правом взаимного расторжения через 90 дней, сохраняя возможность вернуть мощность. "Если вычислительные мощности станут очень ограниченными, я сказал, что нам может понадобиться вернуть это в какой-то момент," - сказал он.
Но траектория Grok делает возврат вычислительных мощностей менее срочным. Загрузки упали с 20 миллионов в январе до 8,3 миллиона в апреле. Платная конверсия составляет пятую часть от ChatGPT. Федеральное принятие застопорилось. Продукт, который должен был оправдать инвестиции в дата-центр, показывает низкие результаты, в то время как арендный доход от Anthropic и Google теперь составляет 26 миллиардов долларов в год. SpaceX построила дата-центр для обучения ИИ и случайно стала арендодателем ИИ.
Получите рассылку TNW
Получайте самые важные новости технологий в вашем почтовом ящике каждую неделю.
Также отмечено с
Другие статьи
SpaceX арендовала Colossus 1 у Anthropic, потому что не смогла заставить дата-центр работать для Grok.
Bloomberg: SpaceX столкнулась с проблемами задержки и несовпадением чипов при подключении Colossus 1 к другим своим дата-центрам. Она арендовала объект у Anthropic за 1,25 миллиарда долларов в месяц.
