Google ha lanciato Gemma 4

      Costruita sulla stessa ricerca di Gemini 3, la nuova famiglia comprende un modello edge da 2B che funziona su un Raspberry Pi fino a un modello denso da 31B attualmente classificato al terzo posto nella classifica dei modelli open di Arena AI. La licenza Apache 2.0 rappresenta un cambiamento significativo rispetto alle precedenti versioni di Gemma.

      Google ha rilasciato Gemma 4, l'ultima generazione della sua famiglia di modelli a peso aperto, in quattro dimensioni progettate per coprire tutto, dall'inferenza su dispositivo su smartphone a distribuzioni di classe workstation.

      I modelli sono costruiti sulla stessa ricerca e tecnologia che sostiene Gemini 3, il modello proprietario di Google, e sono rilasciati sotto una licenza Apache 2.0, termini più permissivi rispetto alle precedenti generazioni di Gemma, e un cambiamento che il co-fondatore di Hugging Face, Clément Delangue, ha descritto come “un enorme traguardo.”

      Demis Hassabis, CEO di Google DeepMind, ha definito i nuovi modelli “i migliori modelli open al mondo per le loro rispettive dimensioni.”

      Le quattro varianti sono i modelli edge Effective 2B (E2B) e Effective 4B (E4B), progettati per funzionare su dispositivo su telefoni, hardware Raspberry Pi e Jetson Nano sviluppato in collaborazione con il team di Pixel, Qualcomm e MediaTek; e i modelli Mixture-of-Experts (MoE) da 26B e Dense da 31B, destinati all'uso offline su hardware per sviluppatori e GPU consumer.

      Il modello Dense da 31B attualmente si classifica al terzo posto tra tutti i modelli open nella classifica testuale di Arena AI; il 26B MoE si trova al sesto posto. Google afferma che entrambi i modelli più grandi superano modelli fino a 20 volte le loro dimensioni su quel benchmark.

      I pesi non quantizzati del 31B si adattano a una singola GPU Nvidia H100 da 80GB; le versioni quantizzate funzionano su hardware consumer.

      Tutti e quattro i modelli sono multimodali, elaborando nativamente video e immagini, e sono addestrati in oltre 140 lingue. I modelli E2B e E4B supportano inoltre l'input audio nativo per il riconoscimento vocale. Le finestre di contesto sono di 128K token per i modelli edge e 256K per le due varianti più grandi.

      In termini di capacità, Google evidenzia i miglioramenti nel ragionamento multi-step, la chiamata di funzioni nativa e l'output JSON strutturato per flussi di lavoro agentici, e la generazione di codice offline. In termini di prestazioni, il blog degli sviluppatori Android nota che il modello E2B funziona tre volte più veloce dell'E4B, mentre l'intera famiglia edge è fino a quattro volte più veloce rispetto alle versioni precedenti di Gemma e utilizza fino al 60% in meno di batteria.

      I modelli E2B e E4B sono anche la base per Gemini Nano 4, il modello di nuova generazione di Google per Android, che arriverà sui dispositivi consumer entro la fine dell'anno.

      Gemma ha accumulato oltre 400 milioni di download e oltre 100.000 varianti create dalla comunità dalla sua prima release, un dato che Google indica come prova dell'adozione da parte degli sviluppatori su larga scala.

      Gemma 4 è disponibile immediatamente su Hugging Face, Kaggle e Ollama, con i modelli da 31B e 26B accessibili tramite Google AI Studio e i modelli edge tramite AI Edge Gallery.

      La decisione di licenza Apache 2.0 è il segnale commerciale più significativo nel lancio: rimuove le restrizioni che impedivano alcune distribuzioni aziendali e commerciali secondo i termini precedenti di Gemma, aprendo l'ecosistema a una gamma più ampia di casi d'uso in produzione.

Altri articoli

Questo nuovo attacco AI ruba modelli senza toccare il sistema I modelli di intelligenza artificiale potrebbero non essere più al sicuro dietro le mura, poiché i ricercatori dimostrano che i segnali delle GPU possono rivelare il loro design interno senza hacking, utilizzando una piccola antenna e analisi side-channel da diverse metri di distanza.

I video dell'equipaggio di Artemis II mostrano gli astronauti che si divertono con un iPhone nello spazio I nuovi video di Artemis II mostrano gli astronauti che giocano con un iPhone nello spazio, rendendo la prima missione lunare con equipaggio della NASA dopo oltre 50 anni sorprendentemente familiare.

Quanscient e Haiqu hanno eseguito una simulazione di fluido quantistico non lineare a 15 passaggi. Quanscient e Haiqu hanno eseguito quella che descrivono come la simulazione CFD quantistica più fisicamente complessa fino ad oggi su hardware quantistico IBM reale.

Tieni traccia delle tue squadre di Coppa del Mondo direttamente sul tuo iPhone con questo aggiornamento Apple Sports Apple Sports aggiunge il supporto per la Coppa del Mondo, permettendoti di tenere traccia di squadre, punteggi e partite in tempo reale con aggiornamenti sulla schermata di blocco. Ecco come la nuova funzione cambia il modo in cui segui il torneo del 2026.

Prima che il tuo iPhone entrasse nella tua tasca, riempiva un tagliere. L'archivio di Apple rivela prototipi di iPhone e Apple Watch sovradimensionati, mostrando come i suoi prodotti più grandi siano iniziati in modo grezzo prima di evolversi nei dispositivi rifiniti che le persone usano ogni giorno.

Quanscient e Haiqu hanno eseguito una simulazione non lineare di fluidi quantistici in 15 passaggi. Quanscient e Haiqu hanno eseguito quella che descrivono come la simulazione CFD quantistica più fisicamente complessa fino ad oggi su hardware quantistico IBM reale.

Google ha lanciato Gemma 4

Google ha lanciato Gemma 4, quattro modelli a peso aperto da E2B edge a 31B Dense, costruiti sulla ricerca di Gemini 3, rilasciata sotto Apache 2.0.