OpenAI запускает GPT-5.5, свою первую полностью переобученную базовую модель с момента GPT-4.5.

      Модель с кодовым названием «Спад» предназначена для выполнения сложных многоступенчатых задач с минимальным человеческим руководством. Она устанавливает новые стандарты в агентном кодировании, использовании компьютеров и интеллектуальной работе, при этом соответствуя задержке по токенам GPT-5.4. Доступ к API задерживается в ожидании дополнительных мер безопасности.

      В течение нескольких месяцев открытым секретом в индустрии ИИ было то, что Claude от Anthropic завоевывает рынок предприятий. OpenAI находилась в состоянии, которое внутренние источники описали как «Код Красный», как минимум с декабря 2025 года, наблюдая, как ARR Anthropic стремительно растет с 9 миллиардов до 30 миллиардов долларов, в то время как собственные позиции B2B компании ослабевали.

      В четверг OpenAI ответила. GPT-5.5, первая полностью переобученная базовая модель компании с момента GPT-4.5, начинает внедрение для пользователей Plus, Pro, Business и Enterprise в ChatGPT и Codex. Модель предназначена для выполнения работы с ограниченным человеческим руководством, работая с электронной почтой, таблицами, календарями и другими приложениями.

      Основная идея GPT-5.5 — читаемость. Если предыдущие модели требовали тщательно структурированных подсказок и многоступенчатого контроля, OpenAI утверждает, что 5.5 может взять «неаккуратную, многочастную задачу» и самостоятельно планировать, использовать инструменты, проверять свою работу, ориентироваться в неопределенности и продолжать до завершения задачи.

      Улучшения сосредоточены в четырех областях: агентное кодирование, использование компьютеров, интеллектуальная работа и ранние научные исследования. OpenAI описывает эти области как «где прогресс зависит от рассуждений в контексте и действий со временем». 💜 технологий ЕС Последние слухи из технологической сцены ЕС, история от нашего мудрого основателя Бориса и немного сомнительного ИИ-арта. Это бесплатно, каждую неделю, в вашем почтовом ящике. Подпишитесь сейчас!

      Показатели производительности сильные. GPT-5.5 достигает 82.7% на Terminal-Bench 2.0, который тестирует сложные рабочие процессы командной строки, требующие планирования, итерации и координации инструментов.

      На SWE-Bench Pro, который оценивает решение реальных проблем на GitHub на четырех языках программирования, он набирает 58.6%, решая больше задач за один проход, чем предыдущие модели.

      На GDPval, который тестирует агентов в 44 профессиях интеллектуальной работы, он набирает 84.9%. На OSWorld-Verified, который измеряет, может ли модель автономно работать в реальных компьютерных средах, он достигает 78.7%.

      На Tau2-bench Telecom он достигает 98.0% без настройки подсказок. Во всех этих случаях OpenAI утверждает, что GPT-5.5 улучшает результаты GPT-5.4, используя меньше токенов.

      Заявление о эффективности имеет коммерческое значение. Более крупные и мощные модели, как правило, медленнее обслуживают, что создает компромисс между стоимостью и качеством для корпоративных клиентов. OpenAI утверждает, что GPT-5.5 соответствует задержке по токенам GPT-5.4 в реальном обслуживании, что означает, что он обеспечивает повышение интеллекта без соответствующего увеличения времени отклика.

      Он также использует значительно меньше токенов для выполнения эквивалентных задач в Codex, что напрямую снижает стоимость за задачу для корпоративных развертываний. GPT-5.5 стоит дороже за токен, чем GPT-5.4, но OpenAI утверждает, что чистый эффект — это лучшие результаты при более низкой общей стоимости в большинстве рабочих процессов.

      Формулировка безопасности заметно более осторожна, чем в предыдущих запусках. OpenAI утверждает, что оценивала GPT-5.5 по всей своей «полной линейке мер безопасности и готовности», работала с внутренними и внешними командами по безопасности, добавила целевое тестирование для продвинутых возможностей кибербезопасности и биологии и собрала отзывы от почти 200 доверенных партнеров раннего доступа перед выпуском.

      Кибербезопасность — это область, где осторожность наиболее заметна: OpenAI описывает внедрение «строгих классификаторов для потенциального киберриска, которые некоторые пользователи могут изначально считать раздражающими».

      Компания признает, что GPT-5.5 представляет собой значительный скачок в киберспособностях и формулирует улучшенные меры безопасности как необходимую инвестицию в ответственное развертывание.

      API заметно отсутствует в запуске. GPT-5.5 доступен сейчас в ChatGPT и Codex для платных подписчиков, но развертывания API, по словам OpenAI, «требуют других мер безопасности, и мы тесно работаем с партнерами и клиентами над требованиями безопасности и защиты для масштабного обслуживания».

      Компания обещает доступ к API «очень скоро», но не указала дату. Для корпоративных клиентов, которые строят на API, а не на интерфейсе ChatGPT, это значительная задержка. GPT-5.5 Pro, вариант с расширенным рассуждением, доступен только для подписчиков Pro, Business и Enterprise.

      Конкурентный фон явно отражается в каждом дизайнерском решении. GPT-5.5 — это модель, вокруг которой OpenAI строит свое унифицированное настольное «супер-приложение», объединяя ChatGPT, Codex и агент браузера Atlas в одну сессию.

      Модель предназначена для обеспечения интуитивного рассуждения внутри этого унифицированного рабочего пространства, продуктовой категории, которая не существовала шесть месяцев назад. GPT-5.2 Thinking останется доступным в качестве наследственного варианта в течение трех месяцев, прежде чем будет выведен из обращения 5 июня 2026 года.

      Скорость выпуска модели, GPT-5, 5.1, 5.2, 5.3-Codex, 5.4 и теперь 5.5 за менее чем год, отражает как темпы разработки ИИ, так и интенсивность конкуренции со стороны Anthropic, Google и экосистемы с открытым исходным кодом.

      OpenAI не стесняется говорить о том, с кем она конкурирует. Формулировка Bloomberg, модель, предназначенная для «поддержания темпа с конкурентами, такими как Anthropic», является правильной.

      GPT-5.5 — это самый ясный сигнал о том, что OpenAI усвоила угрозу от доли рынка Claude в сфере предприятий и пытается вернуть сегмент B2B с моделью, которая действительно может работать, а не просто отвечать на вопросы.

      Успех зависит от того, сохранятся ли приросты производительности в рабочих процессах, прибудет ли API до того, как корпоративные клиенты примут свои следующие решения о закупках, и сможет ли «Спад» выполнить то, что обещают его показатели, когда подсказки неаккуратны, а задачи реальны.

Другие статьи

ЕС готовится заставить Google открыть Android для ChatGPT и Claude в рамках Закона о цифровых рынках Европейская комиссия разрабатывает меры, требующие от Google предоставить конкурентным AI-ассистентам такой же доступ к Android, как у Gemini, с обязательным решением, ожидаемым к июлю 2026 года.

Продажи Tesla и высокие цены на бензин: интерес к электромобилям растет, но рынок США сократился на 28% после истечения налогового кредита Цены на газ в США превысили 4 доллара за галлон, а интерес к электромобилям достиг рекордов 2026 года, но в целом продажи электромобилей упали на 28%, и Tesla не выполнила прогнозы по доставкам. Налоговый кредит оказался важнее цен на топливо.

Продажи Tesla и высокие цены на бензин: интерес к электромобилям растет, но рынок США сократился на 28% после истечения налогового кредита Цены на газ в США превысили 4 доллара за галлон, а интерес к электромобилям достиг максимума 2026 года, но в целом продажи электромобилей упали на 28%, и Tesla не выполнила прогнозы по доставкам. Налоговый кредит оказался важнее цен на топливо.

Данные UK Biobank от 500,000 волонтеров выставлены на продажу на Alibaba после того, как китайские исследовательские учреждения нарушили соглашения о доступе. Данные о здоровье 500,000 волонтеров UK Biobank появились на продажу на Alibaba после того, как три китайских исследовательских учреждения нарушили контракты на обмен данными. ICO проводит расследование.

Материнская компания Volvo только что выпустила стильный электрический седан за 14 300 долларов, который ускользнет от покупателей в США. Электромобиль Geely Galaxy A7 сочетает в себе массовый дизайн, заявленный запас хода в 550 км и цены, которые все еще ниже, чем у многих конкурентов, но этот электрический седан, запущенный в Китае, похоже, останется недоступным для покупателей в США. Zapata Quantum привлекла 15 миллионов долларов после выхода из банкротства Zapata Quantum привлекла 15 миллионов долларов после выхода из почти ликвидации в 2024 году и двухфазной реструктуризации, которая позволила решить проблему с долгом в 18,7 миллиона долларов.

OpenAI запускает GPT-5.5, свою первую полностью переобученную базовую модель с момента GPT-4.5.

OpenAI запускает GPT-5.5, свою первую полностью переобученную базовую модель с момента GPT-4.5, нацеленную на предприятия с агентным кодированием, использованием компьютеров и интеллектуальным трудом.