Google ha lanciato Gemma 4
Costruita sulla stessa ricerca di Gemini 3, la nuova famiglia comprende un modello edge da 2B che funziona su un Raspberry Pi fino a un modello denso da 31B attualmente classificato al terzo posto nella classifica dei modelli open di Arena AI. La licenza Apache 2.0 rappresenta un cambiamento significativo rispetto alle precedenti versioni di Gemma.
Google ha rilasciato Gemma 4, l'ultima generazione della sua famiglia di modelli a peso aperto, in quattro dimensioni progettate per coprire tutto, dall'inferenza su dispositivo su smartphone a distribuzioni di classe workstation.
I modelli sono costruiti sulla stessa ricerca e tecnologia che sostiene Gemini 3, il modello proprietario di Google, e sono rilasciati sotto una licenza Apache 2.0, termini più permissivi rispetto alle precedenti generazioni di Gemma, e un cambiamento che il co-fondatore di Hugging Face, Clément Delangue, ha descritto come “un enorme traguardo.”
Demis Hassabis, CEO di Google DeepMind, ha definito i nuovi modelli “i migliori modelli open al mondo per le loro rispettive dimensioni.”
Le quattro varianti sono i modelli edge Effective 2B (E2B) e Effective 4B (E4B), progettati per funzionare su dispositivo su telefoni, hardware Raspberry Pi e Jetson Nano sviluppato in collaborazione con il team di Pixel, Qualcomm e MediaTek; e i modelli Mixture-of-Experts (MoE) da 26B e Dense da 31B, destinati all'uso offline su hardware per sviluppatori e GPU consumer.
Il modello Dense da 31B attualmente si classifica al terzo posto tra tutti i modelli open nella classifica testuale di Arena AI; il 26B MoE si trova al sesto posto. Google afferma che entrambi i modelli più grandi superano modelli fino a 20 volte le loro dimensioni su quel benchmark.
I pesi non quantizzati del 31B si adattano a una singola GPU Nvidia H100 da 80GB; le versioni quantizzate funzionano su hardware consumer.
Tutti e quattro i modelli sono multimodali, elaborando nativamente video e immagini, e sono addestrati in oltre 140 lingue. I modelli E2B e E4B supportano inoltre l'input audio nativo per il riconoscimento vocale. Le finestre di contesto sono di 128K token per i modelli edge e 256K per le due varianti più grandi.
In termini di capacità, Google evidenzia i miglioramenti nel ragionamento multi-step, la chiamata di funzioni nativa e l'output JSON strutturato per flussi di lavoro agentici, e la generazione di codice offline. In termini di prestazioni, il blog degli sviluppatori Android nota che il modello E2B funziona tre volte più veloce dell'E4B, mentre l'intera famiglia edge è fino a quattro volte più veloce rispetto alle versioni precedenti di Gemma e utilizza fino al 60% in meno di batteria.
I modelli E2B e E4B sono anche la base per Gemini Nano 4, il modello di nuova generazione di Google per Android, che arriverà sui dispositivi consumer entro la fine dell'anno.
Gemma ha accumulato oltre 400 milioni di download e oltre 100.000 varianti create dalla comunità dalla sua prima release, un dato che Google indica come prova dell'adozione da parte degli sviluppatori su larga scala.
Gemma 4 è disponibile immediatamente su Hugging Face, Kaggle e Ollama, con i modelli da 31B e 26B accessibili tramite Google AI Studio e i modelli edge tramite AI Edge Gallery.
La decisione di licenza Apache 2.0 è il segnale commerciale più significativo nel lancio: rimuove le restrizioni che impedivano alcune distribuzioni aziendali e commerciali secondo i termini precedenti di Gemma, aprendo l'ecosistema a una gamma più ampia di casi d'uso in produzione.
Altri articoli
Google ha lanciato Gemma 4
Google ha lanciato Gemma 4, quattro modelli a peso aperto da E2B edge a 31B Dense, costruiti sulla ricerca di Gemini 3, rilasciata sotto Apache 2.0.
