Meituan della Cina afferma che il suo nuovo modello di intelligenza artificiale è stato addestrato su chip nazionali.
LongCat-2.0, un modello da 1,6 trilioni di parametri, è il primo della sua dimensione ad essere addestrato end-to-end su silicio di produzione nazionale, afferma l'azienda, in una risposta mirata ai controlli all'esportazione degli Stati Uniti.
L'affermazione più sorprendente riguardo al nuovo modello di intelligenza artificiale di Meituan non è quanto sia grande, anche se è grande, ma su cosa è stato eseguito.
Il gigante cinese della consegna e dei servizi ha lanciato LongCat-2.0 martedì e ha dichiarato che è il primo modello della sua scala ad essere addestrato interamente su chip sviluppati a livello nazionale, un traguardo mirato direttamente ai controlli all'esportazione che Washington ha utilizzato per mantenere il suo miglior silicio lontano dalle mani cinesi.
Le specifiche sono serie. LongCat-2.0 ha 1,6 trilioni di parametri e una finestra di contesto di un milione di token, e Meituan afferma che le sue prestazioni sono comparabili a quelle del Gemini 3.1 Pro di Google, rilasciato a febbraio.
L'azienda lo descrive come "il primo modello da un trilione di parametri dell'industria a completare l'addestramento e l'inferenza end-to-end su un cluster di calcolo domestico da 50.000 chip."
Il modello è stato open-sourced, mettendo i pesi nelle mani di chiunque voglia eseguirli o esaminarli.
Il dettaglio cruciale è la frase "end-to-end." Molti modelli cinesi eseguono inferenze su hardware nazionale, il compito relativamente leggero di rispondere a una query una volta che un modello è addestrato.
L'addestramento preliminare è la parte pesante, il processo computazionalmente brutale in cui un modello digerisce vasti set di dati per apprendere i suoi schemi di base, ed è qui che i chip più avanzati hanno avuto maggiore importanza.
L'affermazione di Meituan che LongCat-2.0 sia stato sia pre-addestrato che servito su silicio nazionale è ciò che rende l'annuncio più di una semplice linea di marketing.
Se l'affermazione si rivela vera, parla direttamente alla questione strategica che pende sul settore dell'IA cinese: se può costruire modelli di frontiera senza Nvidia.
Washington limita le esportazioni dei chip più all'avanguardia per motivi di sicurezza nazionale, e Pechino ha risposto investendo risorse in un'alternativa nazionale, accelerando gli sforzi per progettare e produrre silicio in grado di sostenere il carico che l'hardware americano stava portando.
Questo sforzo ha prodotto una serie costante di traguardi. La Cina ha recentemente rivendicato la corona del supercalcolo senza chip americani, e un gruppo di sfidanti nazionali è emerso per contestare il dominio di Nvidia, con l'unità T-Head di Alibaba che promuove la sua GPU Zhenwu M890 come acceleratore di produzione nazionale.
LongCat-2.0 è il corrispondente software di quella spinta hardware, un grande modello progettato per dimostrare che la pila nazionale funziona su scala.
Meituan è un portabandiera improbabile per la causa, che è essa stessa parte della storia. Meglio conosciuta per la consegna di cibo che per l'IA di frontiera, l'azienda è una delle diverse grandi aziende internet cinesi che si sono mosse aggressivamente nello sviluppo di modelli, trattandolo come infrastruttura fondamentale piuttosto che come un progetto secondario.
Open-sourcing un modello da 1,6 trilioni di parametri è anche una mossa competitiva, seminando adozione tra gli sviluppatori e segnalando fiducia che i chip sottostanti possono tenere il passo.
Per un'azienda che gestisce una delle più grandi operazioni di logistica on-demand al mondo, l'appeal di un'IA più economica e sicura a livello nazionale è concreto piuttosto che astratto: il routing, la previsione della domanda e il servizio clienti si basano tutti sul calcolo, e un modello addestrato su silicio di produzione nazionale isola quel calcolo dalla prossima svolta della vite dei controlli all'esportazione.
La verifica indipendente arriverà dalla comunità open-source, che ora può eseguire LongCat-2.0 contro i benchmark citati da Meituan e testare se corrisponde realmente a un modello come il Gemini 3.1 Pro.
L'affermazione sull'hardware di addestramento è più difficile da confermare direttamente per gli esterni, poiché si basa sul racconto di Meituan della propria infrastruttura, e quella avvertenza vale la pena tenerla a mente insieme alla fiducia dell'azienda.
Ciò che non è in dubbio è la direzione del viaggio. La corsa per il dominio dell'IA tra Cina e Stati Uniti è diventata, alla base, una corsa sui chip, e ogni modello addestrato senza hardware americano riduce il divario che i controlli all'esportazione erano destinati ad ampliare.
L'annuncio di Meituan è un ulteriore punto di dati in una competizione che Washington ha progettato le sue restrizioni per vincere, e che Pechino è determinata a dimostrare di poter gestire secondo i propri termini.
Altri articoli
Meituan della Cina afferma che il suo nuovo modello di intelligenza artificiale è stato addestrato su chip nazionali.
Il LongCat-2.0 di Meituan, un modello da 1,6 trilioni di parametri, è il primo del suo genere addestrato end-to-end su un cluster domestico da 50.000 chip, afferma la Cina, in mezzo alle restrizioni all'esportazione degli Stati Uniti.
