Sail привлекла 80 миллионов долларов, чтобы сделать работу ИИ-агентов дешевле.
Sail Research привлекла 80 миллионов долларов, чтобы сделать работу AI-агентов дешевле. Стартап, основанный бывшими инженерами Apple и NVIDIA, утверждает, что может обслуживать токены, которые агенты сжигают, с затратами до 10 раз ниже.
AI-агенты голодны. Оставьте одного работающим на часы, и он может переработать миллиарды токенов за одно задание. Это быстро становится дорогим, и именно счет останавливает многих агентов от выхода из лаборатории. Новый стартап под названием Sail Research считает, что может исправить экономику.
Sail привлекла 80 миллионов долларов в виде комбинированного начального и раунда Series A финансирования при оценке в 450 миллионов долларов. Sequoia возглавила начальный раунд, а Kleiner Perkins - раунд Series A. Также присоединились Redpoint Ventures, Theory Ventures, Vine Ventures, CRV, A* и Abstract Ventures.
Список ангелов выглядит как собственный заголовок. В него входят Джон Хеннесси, председатель Alphabet, Лип-Бу Тан, генеральный директор Intel, и Три Дао, главный ученый Together AI. Компания из Сан-Франциско также привлекла ангелов из Anthropic, OpenAI, SpaceX и Thinking Machines.
Создано для агентов, а не для людей
Предложение Sail начинается с простого наблюдения. Инженеры построили сегодняшнюю AI-инфраструктуру для человека, ожидающего нажатия клавиши. Этот пользователь хочет одного больше всего: скорости. Агент отличается. Он работает самостоятельно в течение часов или дней, и ему важны масштаб, надежность и стоимость. 💜 технологий ЕС
Последние слухи из технологической сцены ЕС, история от нашего мудрого основателя Бориса и несколько сомнительных AI-артов. Это бесплатно, каждую неделю, в вашем почтовом ящике. Подпишитесь сейчас!
Этот разрыв - вся возможность. Человеку нужен быстрый ответ. Агенту нужно поддерживать тысячи вызовов на протяжении длительного времени, не увеличивая цену. Sail утверждает, что существующий стек оптимизирует не то.
«Большинство инфраструктур для вывода было разработано для минимизации задержки на одном запросе, но это неправильная оптимизация для агентов», - сказал Самир Менон, соучредитель и главный технический директор. Агенты, по его словам, должны поддерживать пропускную способность на тысячах одновременных вызовов в течение часов. Sail перестроила стек вокруг этого ограничения.
У этой теории есть название. Sail называет это «обильным интеллектом», идея заключается в том, что чем больше вычислительных ресурсов и контекста получает агент, тем лучше его работа. Задача состоит в том, чтобы сделать эти вычисления достаточно дешевыми, чтобы передавать их бесплатно.
Как они утверждают, что снижают стоимость
Sail продает две вещи. Сначала идет движок вывода. Sail перестроила его для пропускной способности, а не скорости, чтобы обслуживать агентов, тратящих миллиарды токенов на одно задание. Компания утверждает, что она предлагает до 10 раз более низкую стоимость за токен, чем конкуренты.
Второе - это песочница, которую она называет Sailboxes. Эти среды работают в течение часов или дней, а не секунд. Ключевым моментом является то, что они взимают плату только за время, когда агент действительно работает, что сокращает затраты на «мертвое время», которые накапливаются при длительных задачах.
Экономия достигается за счет оптимизации всего стека. Sail настраивает движки вывода с открытым исходным кодом, чтобы повысить производительность GPU до предела. Она распределяет нагрузки между провайдерами для обеспечения надежности. Она также ищет дешевые, недоиспользуемые вычисления, где бы они ни находились.
Есть эталон, на который можно сослаться. Sail утверждает, что ее вывод превзошел BrowseComp-Plus, глубокую оценку исследований. Он достиг 90,72% точности при стоимости до 10 раз ниже, чем у ведущих альтернатив. Платформа также легко интегрируется. Ее API работает с существующими рабочими процессами OpenAI и поддерживает открытые модели, включая DeepSeek, Gemma, GLM, Kimi и Nemotron.
Основатели и ставка
Команда пришла из аппаратной части AI. Соучредитель и генеральный директор Нил Мовва провел годы в NVIDIA, доводя производительность GPU до предела, затем работал над инфраструктурой в Apple и Together AI. Менон также пришел из Apple, где он строил системы в большом масштабе.
Этот опыт формирует продукт. Преимущество Sail, утверждают основатели, заключается в тесной интеграции от кремния до API. Контролируя весь путь, можно открыть компромисс между стоимостью и задержкой таким образом, как это не может сделать один слой.
«Sail существует, чтобы сделать интеллект обильным», - сказал Мовва. «Каждое решение, которое мы принимаем, от уровня чипа до API, направлено на то, чтобы дать командам токены, масштаб и время выполнения для создания агентов без ограничений». Формулировка намеренно большая. Компания хочет звучать как инфраструктура для гораздо более масштабного будущего.
Kleiner Perkins поддерживает эту идею. «Инфраструктурный слой для эпохи агентов - одна из самых важных ставок в AI прямо сейчас», - сказал партнер Адитья Наганат. Он похвалил сочетание экспертности в вычислениях и системной строгости основателей, которые приходят от построения на пределе масштабов.
Переполненный, дорогой рынок
Сроки соответствуют четкой тенденции. Вывод, стоимость фактического выполнения модели, стал самым ценным слоем в AI-инфраструктуре. Nebius недавно заплатила 643 миллиона долларов за стартап Eigen AI с 20 сотрудниками, что свидетельствует о том, как сильно индустрия нуждается в людях, которые могут заставить чипы производить больше токенов за меньшие деньги.
Деньги преследуют реальную проблему. Цены на токены обрушились, но счета за корпоративный AI утроились, потому что агенты потребляют гораздо больше токенов на задачу. Снижение цены за токен - один из немногих рычагов, который может вернуть кривую обратно вниз.
Sail не одинока в этом. Другие атакуют ту же стоимость с разных углов. Fractile разрабатывает чипы вывода как альтернативу NVIDIA, в то время как облака GPU, такие как RunPod, арендуют сырой вычислительный ресурс по часам. Этот слой быстро заполняется.
Капитал это подтверждает. Специалист по выводу Baseten недавно привлек 1,5 миллиарда долларов при оценке до 13 миллиардов долларов. По сравнению с этими цифрами, оценка Sail в 450 миллионов долларов выглядит скромной, что оставляет ей много пространства для роста, если теория подтвердится.
Открытый вопрос
Фон огромен. Прогнозы ожидают, что глобальные расходы на AI достигнут 2,5 триллиона долларов в 2026 году, однако самые амбициозные рабочие нагрузки агентов остаются недоступными для большинства компаний. Sail хочет стать причиной, по которой это изменится.
У нее уже есть платящие клиенты, на которых можно указать. Веб-данные компании Parallel, платформа для проверки кода Detail.dev и стартап Jack and Jill все работают на Sail. Detail.dev утверждает, что она пропустила триллионы токенов через платформу и довольна экономикой.
Риск заключается в том, что эффективность - это подвижная цель. Каждый соперник гонится за тем же 10-кратным увеличением, а передовые лаборатории продолжают снижать свои цены. Преимущество в стоимости, основанное на умной инженерии, может исчезнуть по мере удешевления всей области.
Sail ставит на то, что ее подход с полным стеком сложнее скопировать, чем один трюк. Если агенты действительно станут основным способом использования AI, компания, которая сделает их доступными для работы, может иметь огромное значение. Будет ли этой компанией Sail, на уровне триллионов токенов, - это вопрос, который оставляет открытым этот раунд.
Другие статьи
Sail привлекла 80 миллионов долларов, чтобы сделать работу ИИ-агентов дешевле.
Sail Research привлекла 80 миллионов долларов, возглавляемая Sequoia и Kleiner Perkins, для запуска долгосрочных AI-агентов с затратами на токен до 10 раз ниже.
