Google запустил Gemma 4
Созданная на основе тех же исследований, что и Gemini 3, новая семья охватывает модель с 2B параметрами, работающую на Raspberry Pi, до плотной модели с 31B параметрами, которая в настоящее время занимает третье место в открытом рейтинге моделей Arena AI. Лицензия Apache 2.0 является значительным изменением по сравнению с предыдущими релизами Gemma.
Google выпустила Gemma 4, последнее поколение своей семьи моделей с открытыми весами, в четырех размерах, предназначенных для всего, от вывода на устройствах на смартфонах до развертываний класса рабочих станций.
Модели созданы на основе тех же исследований и технологий, которые лежат в основе Gemini 3, проприетарной модели Google, и выпущены под лицензией Apache 2.0, которая имеет более либеральные условия, чем предыдущие поколения Gemma, и изменение, которое соучредитель Hugging Face Клеман Деланж описал как «огромный рубеж».
Демис Хасабис, генеральный директор Google DeepMind, назвал новые модели «лучшими открытыми моделями в мире для их соответствующих размеров».
Четыре варианта — это модели Effective 2B (E2B) и Effective 4B (E4B) для периферийных устройств, предназначенные для работы на телефонах, Raspberry Pi и оборудовании Jetson Nano, разработанном в сотрудничестве с командой Pixel, Qualcomm и MediaTek; а также модели 26B Mixture-of-Experts (MoE) и 31B Dense, предназначенные для оффлайн-использования на аппаратном обеспечении разработчиков и потребительских графических процессорах.
Модель 31B Dense в настоящее время занимает третье место среди всех открытых моделей в текстовом рейтинге Arena AI; модель 26B MoE занимает шестое место. Google утверждает, что обе большие модели превосходят модели до 20 раз большего размера по этому критерию.
Невзвешенные параметры 31B помещаются на одну 80GB графическую карту Nvidia H100; квантованные версии работают на потребительском оборудовании.
Все четыре модели являются мультимодальными, нативно обрабатывающими видео и изображения, и обучены на более чем 140 языках. Модели E2B и E4B дополнительно поддерживают нативный аудиоввод для распознавания речи. Контекстные окна составляют 128K токенов для моделей периферийных устройств и 256K для двух больших вариантов.
Что касается возможностей, Google подчеркивает улучшения многошагового рассуждения, нативный вызов функций и структурированный JSON-вывод для агентных рабочих процессов, а также оффлайн-генерацию кода. Что касается производительности, блог разработчиков Android отмечает, что модель E2B работает в три раза быстрее, чем E4B, в то время как вся семья периферийных моделей в целом работает в четыре раза быстрее, чем предыдущие версии Gemma, и использует до 60% меньше энергии.
Модели E2B и E4B также являются основой для Gemini Nano 4, модели следующего поколения для Android от Google, которая появится на потребительских устройствах позже в этом году.
Gemma накопила более 400 миллионов загрузок и более 100 000 вариантов, созданных сообществом, с момента своего первого выпуска, что Google указывает как доказательство широкого принятия разработчиками.
Gemma 4 доступна немедленно на Hugging Face, Kaggle и Ollama, при этом модели 31B и 26B доступны через Google AI Studio, а модели для периферийных устройств — через AI Edge Gallery.
Решение о лицензировании Apache 2.0 является самым значительным коммерческим сигналом при запуске: оно снимает ограничения, которые мешали некоторым корпоративным и коммерческим развертываниям по предыдущим условиям Gemma, открывая экосистему для более широкого спектра производственных случаев использования.
Другие статьи
Google запустил Gemma 4
Google запустил Gemma 4, четыре модели с открытым весом от E2B edge до 31B Dense, созданные на основе исследований Gemini 3, выпущенные под лицензией Apache 2.0.
