Le restrizioni all'esportazione degli Stati Uniti spingono i chip AI della Cina a passare dalle GPU agli ASIC personalizzati.
TL;DRI controlli all'esportazione degli Stati Uniti stanno spingendo l'industria dei chip AI della Cina lontano dalle GPU di uso generale e verso ASIC personalizzati. Huawei guida con una quota di mercato prevista del 62%, mentre Alibaba e Cambricon perseguono architetture alternative che potrebbero creare un ecosistema strutturalmente diverso da quello dominato da Nvidia in Occidente.
L'industria dei chip AI della Cina non sta più cercando di costruire un clone di Nvidia. Sotto controlli all'esportazione statunitensi sostenuti che bloccano l'accesso alle GPU di uso generale più potenti, le più grandi aziende tecnologiche del paese stanno cambiando verso circuiti integrati specifici per applicazione, chip personalizzati progettati per fare una cosa estremamente bene piuttosto che gestire qualsiasi carico di lavoro. Questo cambiamento sta creando un ecosistema di semiconduttori domestico che potrebbe risultare architettonicamente distinto dal modello dominato da Nvidia che alimenta l'AI in Occidente.
Al centro di questa divergenza c'è una scelta progettuale che i controlli all'esportazione hanno accelerato. Le GPU di uso generale, il tipo venduto da Nvidia, sono flessibili e programmabili, rendendole ideali per la fase di ricerca in rapida evoluzione dello sviluppo dell'AI, dove le architetture dei modelli cambiano costantemente. Gli ASIC sacrificano quella flessibilità per l'efficienza grezza, offrendo prestazioni più veloci a un consumo energetico inferiore per compiti specifici di AI. In un mercato in cui il miglior hardware Nvidia non è disponibile, l'economia del silicio personalizzato diventa molto più convincente.
Tre percorsi verso chip personalizzati
Le aziende cinesi stanno perseguendo tre architetture ASIC distinte. Huawei sta puntando su unità di elaborazione neurale attraverso la sua serie Ascend, inclusi il 910C ampiamente distribuito e il prossimo Ascend 950. Cambricon Technologies sta costruendo architetture specifiche per dominio con le sue serie Siyuan 590 e 690. Alibaba sta seguendo un terzo percorso attraverso la sua unità di semiconduttori T-Head, che ha lanciato l'unità di elaborazione parallela Zhenwu M890 al suo summit annuale sul cloud computing la scorsa settimana, affermando di avere tre volte le prestazioni del suo predecessore.
Sul fronte delle GPU, Moore Threads guida lo sforzo domestico. Fondata nel 2020 da Zhang Jianzhong, ex dirigente di Nvidia in Cina, l'azienda si è dedicata a chip di uso generale come la serie MTT S5000. Biren Technology, Enflame e Iluvatar CoreX stanno anche competendo in questo spazio, ma nessuna ha raggiunto la scala dei leader degli ASIC.
Un rapporto di Morgan Stanley pubblicato l'8 maggio ha chiarito le dinamiche di mercato. Si prevede che Huawei catturerà il 62% del mercato domestico degli acceleratori AI in Cina nel 2026, seguita da Cambricon con il 14%. Tra le grandi aziende tecnologiche che costruiscono chip proprietari, Baidu e Alibaba si prevede che prenderanno ciascuna circa il 5%. I pesi massimi degli ASIC stanno vincendo in volume e slancio.
Le prestazioni non sono più il collo di bottiglia
Il divario di prestazioni tra i chip cinesi e l'hardware conforme all'esportazione di Nvidia si è notevolmente ridotto. I dati di Morgan Stanley mostrano che le schede Ascend 950 di Huawei e le Siyuan 690 di Cambricon possono superare l'H20 di Nvidia, il chip più potente che Nvidia è attualmente autorizzata a vendere in Cina, dal 50 al 150% misurato in token al secondo.
Huawei prevede che i ricavi dai chip AI raggiungeranno circa 12 miliardi di dollari nel 2026, rispetto ai 7,5 miliardi di dollari nel 2025. La quota di Nvidia nel mercato cinese degli acceleratori AI è effettivamente crollata a zero, uno sviluppo che il CEO Jensen Huang ha descritto come un "risultato orribile" per gli Stati Uniti perché rompe la dipendenza software dall'ecosistema CUDA di Nvidia che ha richiesto due decenni per essere costruito.
Per il mercato AI altamente commercializzato della Cina, che si concentra sul dispiegare applicazioni a centinaia di milioni di utenti piuttosto che condurre ricerche all'avanguardia, l'approccio ASIC ha un senso particolare. L'inferenza, il processo di esecuzione di un modello addestrato su larga scala, premia il tipo di ottimizzazione ristretta che il silicio personalizzato fornisce. L'addestramento di nuovi modelli beneficia ancora della flessibilità delle GPU, ma il ricavo è nel dispiegamento.
Il problema dello stack software
Le prestazioni hardware sono solo metà dell'equazione. La sfida più profonda per l'industria dei chip della Cina è rompere il lock-in creato dalla piattaforma CUDA di Nvidia, il livello software che milioni di sviluppatori di AI in tutto il mondo utilizzano per scrivere codice per l'hardware Nvidia. Gli effetti di rete di CUDA sono enormi. Praticamente ogni framework AI, ogni articolo di ricerca e ogni modello pre-addestrato presume la compatibilità con CUDA.
Huawei sta costruendo CANN come sua alternativa, mentre Moore Threads ha sviluppato MUSA. DeepSeek ha trascorso mesi a riscrivere il proprio codice principale per funzionare con il framework CANN di Huawei, allontanandosi dall'ecosistema CUDA. Ma l'analista di semiconduttori Zhang Haijun osserva che man mano che i modelli AI diventano più complessi, i confini tra ASIC personalizzati e GPU flessibili stanno "diventando sempre più sfocati", suggerendo che l'architettura vincente potrebbe alla fine combinare elementi di entrambi.
L'analista capo di Omdia Su Lian Jye inquadra la scelta in modo pratico: le imprese con robuste capacità di ingegneria AI e una chiara tabella di marcia beneficiano degli ASIC, mentre quelle che eseguono carichi di lavoro misti tendono ancora verso le GPU di uso generale. Per ora, il slancio di mercato in Cina favorisce l'approccio specialistico, in parte per scelta e in parte perché l'opzione di uso generale di Nvidia rimane o non disponibile o limitata.
Un ecosistema strutturalmente diverso
La conseguenza a lungo termine di questa divergenza potrebbe essere più significativa rispetto ai benchmark di prestazione a breve termine. Se l'industria AI della Cina standardizza su un mix di NPU di Huawei, PPU di Alibaba e chip specifici per dominio di Cambricon, ognuno con il proprio stack software, il risultato sarà un ecosistema frammentato ma autosufficiente a livello domestico che opera su assunzioni architettoniche fondamentalmente diverse da quelle dell'Occidente.
Quella frammentazione comporta costi. Gli sviluppatori che costruiscono per il mercato cinese potrebbero dover supportare più piattaforme hardware simultaneamente, aumentando la complessità. La collaborazione AI transfrontaliera diventa più difficile quando gli stack di calcolo sottostanti sono incompatibili. E la mancanza di una singola piattaforma dominante significa che nessun produttore di chip cinese beneficia del tipo di lock-in ecosistemico che ha reso così potente CUDA di Nvidia in primo luogo.
Ma la direzione è tracciata. I controlli all'esportazione statunitensi destinati a rallentare i progressi dell'AI in Cina hanno invece accelerato una riprogettazione strutturale della sua industria dei chip, spingendola verso il silicio personalizzato, stack software domestici e un'architettura che non dipende più dall'hardware americano. Se quell'ecosistema può eguagliare il ritmo di innovazione nell'Occidente alimentato da Nvidia è la domanda decisiva della corsa ai chip AI.
Altri articoli
Le restrizioni all'esportazione degli Stati Uniti spingono i chip AI della Cina a passare dalle GPU agli ASIC personalizzati.
Tagliati fuori dal miglior hardware di Nvidia, i giganti tecnologici cinesi stanno costruendo chip AI specializzati. Huawei guida con il 62% di quota di mercato mentre l'ecosistema si discosta dal modello occidentale.
