DeepSeek возвращается с V4-Pro и V4-Flash, через год после своего «момента Спутника»

      Стартап из Ханчжоу выпустил предварительные версии обеих моделей на Hugging Face в пятницу. V4-Pro утверждает, что демонстрирует лучшие результаты в кодировании и математике среди открытых моделей, уступая только Gemini 3.1-Pro по мировым знаниям и "незначительно отстает" от GPT-5.4 и Gemini 3.1-Pro, разрыв, который DeepSeek оценивает как "примерно 3-6 месяцев". Обе модели являются открытыми исходниками.

      DeepSeek, стартап в области ИИ из Ханчжоу, который потряс Кремниевую долину своей моделью R1 в январе 2025 года, выпустил предварительные версии своих последних флагманских моделей в пятницу, примерно через год после того первоначального шока.

      Компания разместила DeepSeek-V4-Pro и DeepSeek-V4-Flash на Hugging Face, описывая релиз как самую мощную открытую платформу ИИ и прямой вызов конкурентам от OpenAI до Anthropic.

      Обе модели следуют открытому исходному коду, использованному их предшественниками, что означает, что разработчики могут свободно использовать и модифицировать исходный код.

      Главное техническое достижение в V4 — это Гибридная Архитектура Внимания, техника, которую DeepSeek утверждает, что улучшает способность модели сохранять контекст в длинных разговорах. 💜 технологий ЕС Последние новости из технологической сцены ЕС, история от нашего мудрого основателя Бориса и некоторые сомнительные ИИ-арты. Это бесплатно, каждую неделю, в вашем почтовом ящике. Подпишитесь сейчас!

      В сочетании с контекстным окном на 1 миллион токенов, достаточным для обработки целой кодовой базы или документа длиной в книгу за один запрос, архитектура предназначена для агентных и долгосрочных задач рассуждения, где предыдущие модели ухудшали качество по мере увеличения длины контекста. Вариант Flash оптимизирован для скорости и экономической эффективности; вариант Pro — для максимальной производительности.

      Собственные тесты DeepSeek ставят V4-Pro как самую сильную открытую модель в кодировании и математике, с производительностью, которая уступает только закрытой модели Gemini 3.1-Pro от Google по мировым знаниям.

      По сравнению с текущими закрытыми моделями, такими как GPT-5.4 и Gemini 3.1-Pro от OpenAI — компания утверждает, что V4-Pro "незначительно отстает" и предлагает откровенную самооценку: его "траектория развития" отстает от современных передовых моделей примерно на 3-6 месяцев.

      Такое представление необычно для релизов моделей ИИ, которые обычно подчеркивают сравнения, где новая модель лидирует. То, что DeepSeek публикует оценку разрыва, а не утверждает о равенстве, отражает либо необычную интеллектуальную честность, либо стратегический ход, чтобы установить консервативные ожидания перед независимой оценкой.

      История с чипами является геополитически заряженным элементом. DeepSeek работал с китайскими производителями ИИ-чипов Huawei и Cambricon, чтобы оптимизировать V4 для их последнего оборудования, согласно Reuters, ссылаясь на The Information.

      Компания не предоставила Nvidia или AMD ранний доступ для оптимизации, что является обратным стандартной практике в отрасли, когда западные производители чипов обычно первыми получают новые веса моделей для настройки производительности.

      Запуск модели класса фронтира такого масштаба на чипах Ascend от Huawei, а не на Nvidia H100 или H200, стал бы значительным доказательством концепции для внутренней цепочки поставок ИИ-аппаратного обеспечения Китая, которая находится под ограничениями экспорта США с октября 2022 года. Выпуск V4 не заканчивает это геополитическое ограничение, но проверяет его пределы в коммерчески заметном формате.

      Время выпуска, пятница, 24 апреля 2026 года, примерно через год после DeepSeek-R1, является преднамеренным. Запуск DeepSeek-R1 в январе 2025 года стер примерно 600 миллиардов долларов с рыночной капитализации Nvidia за один день, поскольку инвесторы пересмотрели свои предположения о вычислениях, необходимых для создания фронтального ИИ.

      Марк Андриссен назвал это "Сатурновым моментом ИИ". Практическое утверждение заключалось в том, что китайская лаборатория достигла уровня лучшей модели рассуждений OpenAI, потратив менее 6 миллионов долларов на вычисления, что некоторые аналитики оспаривали, но тем не менее это сбросило глобальные предположения о экономике разработки фронтального ИИ.

      V4 выходит на другой рынок: на тот, где OpenAI выпустил GPT-5.5 в тот же день, где Anthropic оценивается в 1 триллион долларов на вторичных рынках, и где конкуренция в области ИИ между США и Китаем стала явным измерением торговой и технологической политики. Второй акт DeepSeek происходит в гораздо более конкурентной арене, чем первый.

      Обе модели являются предварительными релизами, а не финальными производственными версиями. Независимое тестирование еще не завершено на момент написания, и собственные тесты DeepSeek следует рассматривать как предварительные, пока сторонняя оценка не подтвердит их.

      Та же оговорка применима к R1, чьи утверждения были в целом подтверждены внешним тестированием в течение нескольких дней после выпуска. Будет ли V4 выдерживать такое же внимание, станет ясно в течение недели.

Другие статьи

После Австралии Норвегия запретит социальные сети для лиц младше 16 лет Правительство труда Норвегии предложит запретить социальные сети для лиц младше 16 лет и сделать платформы ответственными за проверку возраста.

Cohere и Aleph Alpha объединяются в трансантлантическую AI-компанию стоимостью 20 миллиардов долларов. Cohere и Aleph Alpha объявляют о слиянии, создавая трансантлантическую компанию в сфере ИИ стоимостью около 20 миллиардов долларов с двойной штаб-квартирой в Канаде и Германии.

Verda привлекла 117 миллионов долларов для расширения своей облачной платформы GPU Гельсинкская компания Verda привлекла 117 миллионов долларов, возглавляемых Lifeline Ventures, для расширения своей положительно генерирующей денежный поток облачной платформы GPU в США, Великобритании и Азии.

OpenAI продвигает ChatGPT к автономной работе с GPT-5.5. OpenAI запустила GPT-5.5, сосредоточив внимание на улучшении способности ChatGPT справляться со сложными задачами и реальными рабочими процессами.

Холдинг «Росэл» представил промышленного помощника на основе искусственного интеллекта. Государственная корпорация Ростех через свой холдинг «Росэл» объявила о запуске новой платформы на основе искусственного интеллекта, получившей название ShokinGPT. Это решение предназначено для управления документами и данными в рамках предприятий.

DeepSeek возвращается с V4-Pro и V4-Flash, через год после своего «момента Спутника»

DeepSeek выпускает предварительные версии V4-Pro и V4-Flash на Hugging Face, с открытым исходным кодом, с контекстным окном на 1 миллион токенов и оптимизацией под чипы Huawei.