DeepSeek возвращается с V4-Pro и V4-Flash, через год после своего «момента Спутника»
Стартап из Ханчжоу выпустил предварительные версии обеих моделей на Hugging Face в пятницу. V4-Pro утверждает, что демонстрирует лучшие результаты в кодировании и математике среди открытых моделей, уступая только Gemini 3.1-Pro по мировым знаниям и "незначительно отстает" от GPT-5.4 и Gemini 3.1-Pro, разрыв, который DeepSeek оценивает как "примерно 3-6 месяцев". Обе модели являются открытыми исходниками.
DeepSeek, стартап в области ИИ из Ханчжоу, который потряс Кремниевую долину своей моделью R1 в январе 2025 года, выпустил предварительные версии своих последних флагманских моделей в пятницу, примерно через год после того первоначального шока.
Компания разместила DeepSeek-V4-Pro и DeepSeek-V4-Flash на Hugging Face, описывая релиз как самую мощную открытую платформу ИИ и прямой вызов конкурентам от OpenAI до Anthropic.
Обе модели следуют открытому исходному коду, использованному их предшественниками, что означает, что разработчики могут свободно использовать и модифицировать исходный код.
Главное техническое достижение в V4 — это Гибридная Архитектура Внимания, техника, которую DeepSeek утверждает, что улучшает способность модели сохранять контекст в длинных разговорах. 💜 технологий ЕС Последние новости из технологической сцены ЕС, история от нашего мудрого основателя Бориса и некоторые сомнительные ИИ-арты. Это бесплатно, каждую неделю, в вашем почтовом ящике. Подпишитесь сейчас!
В сочетании с контекстным окном на 1 миллион токенов, достаточным для обработки целой кодовой базы или документа длиной в книгу за один запрос, архитектура предназначена для агентных и долгосрочных задач рассуждения, где предыдущие модели ухудшали качество по мере увеличения длины контекста. Вариант Flash оптимизирован для скорости и экономической эффективности; вариант Pro — для максимальной производительности.
Собственные тесты DeepSeek ставят V4-Pro как самую сильную открытую модель в кодировании и математике, с производительностью, которая уступает только закрытой модели Gemini 3.1-Pro от Google по мировым знаниям.
По сравнению с текущими закрытыми моделями, такими как GPT-5.4 и Gemini 3.1-Pro от OpenAI — компания утверждает, что V4-Pro "незначительно отстает" и предлагает откровенную самооценку: его "траектория развития" отстает от современных передовых моделей примерно на 3-6 месяцев.
Такое представление необычно для релизов моделей ИИ, которые обычно подчеркивают сравнения, где новая модель лидирует. То, что DeepSeek публикует оценку разрыва, а не утверждает о равенстве, отражает либо необычную интеллектуальную честность, либо стратегический ход, чтобы установить консервативные ожидания перед независимой оценкой.
История с чипами является геополитически заряженным элементом. DeepSeek работал с китайскими производителями ИИ-чипов Huawei и Cambricon, чтобы оптимизировать V4 для их последнего оборудования, согласно Reuters, ссылаясь на The Information.
Компания не предоставила Nvidia или AMD ранний доступ для оптимизации, что является обратным стандартной практике в отрасли, когда западные производители чипов обычно первыми получают новые веса моделей для настройки производительности.
Запуск модели класса фронтира такого масштаба на чипах Ascend от Huawei, а не на Nvidia H100 или H200, стал бы значительным доказательством концепции для внутренней цепочки поставок ИИ-аппаратного обеспечения Китая, которая находится под ограничениями экспорта США с октября 2022 года. Выпуск V4 не заканчивает это геополитическое ограничение, но проверяет его пределы в коммерчески заметном формате.
Время выпуска, пятница, 24 апреля 2026 года, примерно через год после DeepSeek-R1, является преднамеренным. Запуск DeepSeek-R1 в январе 2025 года стер примерно 600 миллиардов долларов с рыночной капитализации Nvidia за один день, поскольку инвесторы пересмотрели свои предположения о вычислениях, необходимых для создания фронтального ИИ.
Марк Андриссен назвал это "Сатурновым моментом ИИ". Практическое утверждение заключалось в том, что китайская лаборатория достигла уровня лучшей модели рассуждений OpenAI, потратив менее 6 миллионов долларов на вычисления, что некоторые аналитики оспаривали, но тем не менее это сбросило глобальные предположения о экономике разработки фронтального ИИ.
V4 выходит на другой рынок: на тот, где OpenAI выпустил GPT-5.5 в тот же день, где Anthropic оценивается в 1 триллион долларов на вторичных рынках, и где конкуренция в области ИИ между США и Китаем стала явным измерением торговой и технологической политики. Второй акт DeepSeek происходит в гораздо более конкурентной арене, чем первый.
Обе модели являются предварительными релизами, а не финальными производственными версиями. Независимое тестирование еще не завершено на момент написания, и собственные тесты DeepSeek следует рассматривать как предварительные, пока сторонняя оценка не подтвердит их.
Та же оговорка применима к R1, чьи утверждения были в целом подтверждены внешним тестированием в течение нескольких дней после выпуска. Будет ли V4 выдерживать такое же внимание, станет ясно в течение недели.
Другие статьи
DeepSeek возвращается с V4-Pro и V4-Flash, через год после своего «момента Спутника»
DeepSeek выпускает предварительные версии V4-Pro и V4-Flash на Hugging Face, с открытым исходным кодом, с контекстным окном на 1 миллион токенов и оптимизацией под чипы Huawei.
