Цены на токены ИИ упали на 98%, но счета предприятий утроились.

Цены на токены ИИ упали на 98%, но счета предприятий утроились.

      TL;DREnterprise AI счета утроились, несмотря на 98%-ное снижение цен за токен, поскольку агентные инструменты увеличивают потребление в 18,6 раз на разработчика. Фонд Linux запускает Фонд Токеномики, чтобы ввести дисциплину затрат в расходах на ИИ.

      Uber исчерпал весь свой бюджет на кодирование ИИ на 2026 год к апрелю. Microsoft отозвала лицензии на Claude Code у своих разработчиков через шесть месяцев после их активации. Одна компания, как сообщается, накопила счет на $500 миллионов за Claude всего за один месяц, забыв установить лимиты на использование. Сотрудник Priceline сообщил TechCrunch, что обычное продление контракта на Cursor обошлось в четыре-пять раз дороже.

      Ситуация одинакова повсюду. Цены за токен обрушились, но стремление к автономным ИИ-агентам привело к резкому увеличению потребления. Компании, которые объедались подписками "все, что можешь съесть" в начале 2025 года, теперь пытаются понять, куда ушли деньги и принесло ли что-то из этого прибыль.

      Парадокс в цифрах

      Производительность, эквивалентная GPT-4, теперь стоит примерно $0,40 за миллион токенов, снизившись с $20 за миллион в конце 2022 года. Это снижение на 98%. Тем не менее, счета за ИИ в корпоративном секторе, по оценкам нескольких отраслевых анализов, выросли на 320%. Средний бюджет на ИИ в корпоративном секторе увеличился с $1,2 миллиона в год в 2024 году до $7 миллионов в 2026 году.

      Виновник — объем. Агентные инструменты ИИ, выпущенные с ноября 2025 года, включая Claude Opus 4.5 от Anthropic, GPT-5.1 от OpenAI и Gemini 3 Pro от Google, увеличили потребление токенов на задачу. Простая линейная рабочая схема в 2023 году стоила около $0,04 за взаимодействие. Оркестрованная агентная система в 2026 году стоит примерно $1,20, что в 30 раз больше. Индивидуальные инженеры в Microsoft, как сообщается, тратили от $500 до $2,000 в месяц на токены до того, как лицензии были отозваны.

      Николас Арколано, глава исследований на платформе управления инженерией Jellyfish, сообщил TechCrunch, что потребление на разработчика увеличилось примерно в 18,6 раз за девять месяцев. Инженеры, использующие больше всего токенов, были примерно в два раза более продуктивными, чем менее активные пользователи, но они тратили в 10 раз больше токенов, чтобы достичь этого. "Прибыль от экстремальных расходов сводится к конечной бизнес-ценности выпущенного кода, которую большинство компаний все еще не может измерить", — сказал Арколано.

      От токенмаксинга к рамкам

      "Шесть месяцев назад я бы разговаривал с клиентом, и разговор был бы о 'Что он может сделать? Достаточно ли это хорошо?'" — сказал Александр Эмбирикос, глава корпоративного отдела OpenAI, в интервью TechCrunch. "Теперь разговоры идут о 'Мы тратим так много. Какую видимость вы имеете? Какие у вас есть контрольные механизмы для токенов?'"

      Дж.Р. Стормент, исполнительный директор Фонда FinOps, описал этот сдвиг прямо. "В апреле и мае я начал слышать от компаний: 'О боже, мы превышаем наш бюджет на токены на 3x за весь 2026 год, и это только апрель.' Весь разговор изменился с токенмаксинга и 'идти быстро' на 'нам нужны рамки, как мы можем это контролировать?'"

      Старший директор по финансам ИТ Priceline, Крис Рид, провел сравнение с эпохой выставления счетов в телекоммуникациях. "Это как эпидемия кокаиновой зависимости. Они дают вам попробовать, чтобы вы подсели, а теперь вы как бы зависите от этого." Компания начала устанавливать лимиты на токены для определенных групп. Рид сказал, что уже видит несоответствия между данными о потреблении, предоставленными поставщиками, и внутренними данными Priceline.

      Фонд Токеномики

      На этом фоне Фонд Linux на этой неделе представил планы по созданию Фонда Токеномики, нового стандартного органа, целью которого является введение такой же дисциплины затрат на токены ИИ, какую FinOps ввел в облачные расходы.

      Фонд планирует разработать каноническое определение "токеномики", открытые стандарты для использования токенов ИИ и выставления счетов, а также новые метрики, включая стоимость за интеллект и токены за ватт. Официальный запуск запланирован на июль. Нишант Гупта, главный директор по доступности в Salesforce, заявил в своем заявлении, что "токеномика по своей сути более абстрактна и непрозрачна, чем что-либо, с чем мы справлялись на таком уровне ранее."

      Задача огромна. "Отслеживание затрат на облако — это проблема данных на сотни миллионов строк в месяц," — сказал Стормент. "Отслеживание затрат на токены — это проблема данных на триллионы строк в месяц."

      Рынок формируется вокруг проблемы

      Стартапы и устоявшиеся поставщики спешат заполнить пробел. Pay-i отслеживает и оптимизирует расходы на ИИ. Paid позволяет разработчикам выставлять счета на основе фактической ценности, а не подписных сборов. Jellyfish, Waydev и Faros AI предоставляют мониторинг агентов, чтобы доказать ROI инструментов для разработчиков. Ramp вошел в управление расходами на ИИ. Datadog и New Relic добавили наблюдаемость на уровне токенов.

      Маршрутизация моделей становится основным рычагом затрат. Factory, стартап по кодированию ИИ для предприятий, на этой неделе запустил маршрутизатор моделей, который автоматически выбирает самый дешевый адекватный модель для каждой задачи. Виталий Гордон, генеральный директор Faros AI, сказал, что пограничные лаборатории уже делают это внутри компании. "Финансовый отчет о том, сколько вы тратите на Anthropic, даже если вы называете модель Opus, часть расходов будет на Sonnet или Haiku, потому что они достаточно умны, чтобы это сделать," — сказал он.

      Goldman Sachs прогнозирует, что глобальное использование токенов умножится на 24 к 2030 году. Компании, уже превышающие бюджет, нуждаются в решениях сейчас, а первый результат работы Фонда Токеномики все еще за несколько месяцев. Как сказал Гордон: "Может быть, мы создали паровой двигатель, но мы все еще не разобрались с конвейерной лентой."

Другие статьи

Чески планирует лабораторию ИИ, вступая в конкуренцию с OpenAI Алтмана Чески планирует лабораторию ИИ, вступая в конкуренцию с OpenAI Алтмана Генеральный директор Airbnb Брайан Чески поддерживает новую лабораторию ИИ, сосредоточенную на взаимодействии с пользователями и дизайне, что свидетельствует о том, что крупнейшие основатели Кремниевой долины больше не доверяют пограничным лабораториям создавать то, что им нужно. Клод пишет 80% своего кода, призывает к паузе в разработке ИИ Клод пишет 80% своего кода, призывает к паузе в разработке ИИ Клод теперь пишет 80% производственного кода Anthropic. Новая статья компании описывает путь к рекурсивному самоулучшению и призывает к созданию глобального механизма паузы. Spirit AI обходит Nvidia по бенчмарку RoboArena в области робототехники Spirit AI обходит Nvidia по бенчмарку RoboArena в области робототехники Китайский стартап Spirit AI возглавил таблицу лидеров RoboArena, созданную совместно с Nvidia, набрав 1,924 против 1,881 у Nvidia, поскольку физический ИИ становится следующим полем битвы технологий. Spirit AI обошел Nvidia по бенчмарку RoboArena в области робототехники Spirit AI обошел Nvidia по бенчмарку RoboArena в области робототехники Китайский стартап Spirit AI возглавил таблицу лидеров RoboArena, созданную совместно с Nvidia, набрав 1,924 очка против 1,881 у Nvidia, поскольку физический ИИ становится следующим полем битвы технологий. Россия готовит меньший Starlink и постоянно сдвигает срок до 2027 года Россия готовит меньший Starlink и постоянно сдвигает срок до 2027 года Бюро 1440 России планирует начать коммерческий спутниковый интернет в 2027 году с помощью своей констелляции Рассвет, которая является преднамеренно меньшим ответом на Starlink. Япония рискует стать «колонией ИИ», предупреждает ее цифровой министр Япония рискует стать «колонией ИИ», предупреждает ее цифровой министр Цифровой министр Хисаши Мацуомото предупредил, что Япония может стать «колонией ИИ», если отстанет, защищая законопроект, который упрощает правила согласия на использование данных.

Цены на токены ИИ упали на 98%, но счета предприятий утроились.

Uber, Microsoft и Priceline спешат после того, как счета за токены ИИ резко возросли. Фонд Linux запускает Фонд Токеномики, чтобы ввести дисциплину затрат в расходы на ИИ.