Anthropic запускает Claude Sonnet 5, более дешевую модель агента

Anthropic запускает Claude Sonnet 5, более дешевую модель агента

      Anthropic запустила Claude Sonnet 5, свою самую агентную модель среднего уровня на сегодняшний день. Она близка к флагманской Opus 4.8 по многим задачам, но стоит менее половины от ее цены.

      Anthropic сообщила 30 июня 2026 года, что Sonnet 5 доступна сегодня по всем планам. Компания создала ее для того, чтобы она действовала, а не просто отвечала. Она может составлять планы, управлять браузерами и терминалами, а также работать самостоятельно в течение длительных периодов. Такой вид работы требовал более крупных и дорогих моделей всего несколько месяцев назад.

      Предложение простое. Sonnet 5 предлагает производительность, близкую к флагманской, по цене среднего уровня. Она близка к Opus 4.8, самой мощной модели Anthropic, по логике, использованию инструментов, программированию и интеллектуальной работе. Она явно превосходит своего предшественника, Sonnet 4.6. И ее эксплуатационные расходы значительно ниже, чем у Opus.

      Дешевые агенты, намеренно

      Цена находится в центре этого запуска. Sonnet 5 начинается с $2 за миллион входных токенов и $10 за миллион выходных токенов. Эта вводная ставка сохраняется до 31 августа 2026 года. После этого она изменится на $3 и $15. Opus 4.8, напротив, стоит $5 и $25. TechCrunch охарактеризовал модель как более дешевый способ запуска агентов, и это суть дела.

      Время имеет значение. Компании спешили развернуть ИИ-агентов, а затем отшатнулись от счетов. Агенты работают в цикле, вызывают инструменты и быстро расходуют токены. Модель, которая приближается к качеству Opus за небольшую часть стоимости, напрямую отвечает на эту проблему. Она также обращается к рынку, который ищет способы экономии после того, как счета за корпоративный ИИ взлетели.

      Есть уловка в мелком шрифте. Sonnet 5 использует новый токенизатор, поэтому один и тот же текст может соответствовать до 1.35 раза большему количеству токенов, чем раньше. Anthropic установила вводную цену так, чтобы переход оставался примерно безубыточным. Заголовочная ставка выглядит низкой, но количество токенов может увеличиваться.

      Насколько она хороша?

      По собственным бенчмаркам Anthropic, Sonnet 5 явно превосходит 4.6, не дотягивая до Opus. На тесте по программированию она набрала 63.2 процента, против 69.2 процента для Opus 4.8 и 58.1 процента для Sonnet 4.6, согласно ранним отчетам. На одном из бенчмарков по интеллектуальной работе она немного опередила Opus. Anthropic также предлагает регулятор "усилий", позволяя разработчикам обменивать стоимость на точность между двумя моделями.

      Ранние тестировщики сообщили Anthropic, что модель завершает сложные задачи, где старые Sonnets сдавались, и что она проверяет свои собственные результаты без запроса. Эти утверждения исходят из материалов запуска компании, поэтому им следует проявлять обычную осторожность. Независимое тестирование расскажет настоящую историю.

      Безопаснее, с кибер-ограничениями

      Anthropic утверждает, что Sonnet 5 ведет себя лучше, чем 4.6 по безопасности. Она чаще отказывается от злонамеренных запросов и сопротивляется атакам с внедрением подсказок, когда скрытые инструкции пытаются захватить агента. Она также меньше галлюцинирует и льстит. На автоматизированном аудите несоответствующего поведения она набрала более безопасный результат, чем 4.6, хотя хуже, чем Opus 4.8 и предварительный просмотр Mythos.

      Кибербезопасность является более острым вопросом. Anthropic не обучала Sonnet 5 для киберзадач, и она плохо справляется с созданием программных эксплойтов. В тестовом запуске с Mozilla на браузере Firefox модель никогда не создала работающий эксплойт. Тем не менее, Anthropic выпустила ее с включенными по умолчанию средствами киберзащиты в реальном времени, теми же, что использовались в Opus 4.7 и 4.8. Эти защитные меры остаются легче, чем те, что окружают Fable 5, ее закрытую публичную модель.

      Скидка с стратегией за ней

      Низкая цена не является благотворительностью. Anthropic соревнуется с конкурентами за разработчиков, и способный, доступный агент — это то, как их завоевать. Компания также пишет большую часть своего кода с помощью Claude, поэтому лучший и более дешевый Sonnet помогает и ее собственным инженерам. Она также движется к запланированному публичному размещению акций, где рост доходов и охват разработчиков имеют значение.

      Широкий контекст — это стоимость. Работа агентов круглосуточно может привести к огромным счетам, и Anthropic поставила амбициозные цели по доходам для финансирования своей работы над моделями. Sonnet 5 — это ее ответ на оба вопроса. Снизить возможности по кривой цен, удержать разработчиков внутри экосистемы и позволить регулятору усилий справляться с остальным.

      Claude Sonnet 5 теперь доступен в приложениях Claude, Claude Code и API с повышенными лимитами по всем направлениям. Для большинства разработчиков вопрос больше не в том, достаточно ли умна модель. Вопрос в том, достаточно ли она дешева, чтобы работать весь день. Anthropic ставит на то, что ответ наконец "да".

Другие статьи

Blue Origin все еще не знает, почему New Glenn взорвался, но планирует снова совершить полет в этом году. Blue Origin все еще не знает, почему New Glenn взорвался, но планирует снова совершить полет в этом году. Генеральный директор Blue Origin Дэйв Лимп сообщает, что причина взрыва в мае остается неизвестной, при этом первоначальный анализ указывает на кормовую часть первой ступени. Следующий телефон Motorola Edge может сделать момент MagSafe для Android дешевле, чем это сделал Google. Следующий телефон Motorola Edge может сделать момент MagSafe для Android дешевле, чем это сделал Google. Motorola Edge 70 Max появился с сертификатом Qi2.2.1, что намекает на наличие встроенных магнитов, беспроводной зарядки мощностью 25 Вт и поддержку аксессуаров для Android в стиле MagSafe. Meta выдала себя за подростков, чтобы протестировать конкурирующие AI-чат-боты Meta выдала себя за подростков, чтобы протестировать конкурирующие AI-чат-боты Сотни подрядчиков на проекте Meta выдавали себя за подростков, чтобы проверить, как ChatGPT, Gemini и Character.AI справляются с темами самоубийств, наркотиков и секса, выяснил WIRED. FAA разрешает взлетно-посадочную полосу для полетов на скорости Маха, которые могут сократить время в пути почти вдвое FAA разрешает взлетно-посадочную полосу для полетов на скорости Маха, которые могут сократить время в пути почти вдвое FAA объявила о новых предложенных правилах, которые позволят сверхзвуковым пассажирским рейсам в США, прокладывая путь для самолетов, которые могут сократить время в пути почти вдвое. 60-секундные видео NotebookLM превратили мое проклятие бесконечного скроллинга в нечто полезное. 60-секундные видео NotebookLM превратили мое проклятие бесконечного скроллинга в нечто полезное. Что если те же 60 секунд, которые вы тратите на бездумный скроллинг, могли бы помочь вам сдать тест? Новейшая функция NotebookLM делает довольно убедительное предложение. Blue Origin все еще не знает, почему New Glenn взорвался, но планирует снова летать в этом году. Blue Origin все еще не знает, почему New Glenn взорвался, но планирует снова летать в этом году. Генеральный директор Blue Origin Дэйв Лимп говорит, что коренная причина взрыва в мае остается неизвестной, при этом предварительный анализ указывает на кормовую часть первой ступени.

Anthropic запускает Claude Sonnet 5, более дешевую модель агента

Клод Сонет 5 предлагает производительность, близкую к Opus 4.8, по средней цене от $2/$10 за миллион токенов до 31 августа. Вот что нового.