Google ha venduto così tanta capacità TPU che i suoi stessi ricercatori stanno facendo la fila per il resto.

Alphabet gestisce il stack di infrastruttura AI più invidiabile del settore. Il successo degli accordi con terze parti con Anthropic e Meta è il motivo per cui l'accesso interno è diventato una risorsa competitiva. Google ha trascorso un decennio costruendo silenziosamente la posizione più invidiabile nell'infrastruttura AI: un'attività cloud sana, i propri chip personalizzati e accordi di fornitura che rendono i suoi TPU l'alternativa predefinita a Nvidia per i principali clienti esterni. Il successo di quella strategia ha prodotto un problema interno che l'azienda non aveva previsto. Julia Love di Bloomberg ha riportato lunedì che i ricercatori AI di Google, inclusi i team all'interno di Google DeepMind, stanno ora lottando per accedere alle risorse di calcolo che il loro datore di lavoro sta anche vendendo ad Anthropic e Meta. Il 💜 della tecnologia UE Gli ultimi rumori dalla scena tecnologica dell'UE, una storia del nostro saggio fondatore Boris e alcune opere d'arte AI discutibili. È gratuito, ogni settimana, nella tua casella di posta. Iscriviti ora! La causa strutturale è semplice. Google ha accettato di investire fino a 40 miliardi di dollari in Anthropic in un accordo che include cinque gigawatt di capacità TPU per cinque anni e accesso fino a un milione di chip Ironwood di settima generazione. Una linea di fornitura separata, mediata da Broadcom, copre ulteriori 3,5 GW di capacità TPU per Anthropic dal 2027, costruendo sui 1 GW che l'azienda sta già ricevendo nel 2026. Anthropic stessa ha descritto pubblicamente lo stack TPU di Google come centrale per la sua roadmap di addestramento e servizio. Meta, l'altro cliente TPU su scala commerciale nominato da Bloomberg, ha firmato il proprio accordo all'inizio di quest'anno. La capacità che quegli impegni bloccano è capacità non disponibile per i team interni di modelli di Google senza mettersi in coda. Il CEO di DeepMind, Demis Hassabis, ha dichiarato all'inizio di quest'anno che il vincolo si taglia in due direzioni. Parte del collo di bottiglia è hardware: "alcuni fornitori di alcuni componenti chiave", come ha detto, con la memoria ad alta larghezza di banda di Samsung, Micron e SK Hynix che è il punto di strozzatura più citato. Parte di esso è il throughput della ricerca, perché, nelle parole di Hassabis, i ricercatori "hanno bisogno di molti chip per poter sperimentare nuove idee su una scala sufficientemente grande". Il vincolo hardware è in parte al di fuori del controllo di Google. Il vincolo di allocazione interna non lo è. L'aritmetica sottostante è grande. Alphabet è su un intervallo di capex guidato di 175 miliardi di dollari - 185 miliardi di dollari per il 2026, all'interno di una spesa combinata di Big Tech per l'infrastruttura AI che ha superato i 650 miliardi di dollari quest'anno. Google ha, secondo i propri commenti, portato online ben oltre un gigawatt di nuova capacità di calcolo AI nel 2026. La scommessa decennale sui TPU sta finalmente producendo il tipo di vantaggio economico unitario che consente all'azienda di vendere i propri chip, ospitare i modelli dei propri concorrenti e condurre la propria ricerca all'avanguardia sullo stesso tessuto. Il tessuto non è più abbastanza grande per tutti e tre gli usi contemporaneamente. I rapporti di Bloomberg nominano due segnali specifici della tensione. Ricercatori, tra cui Ioannis Antonoglou, un collaboratore di lunga data di DeepMind, hanno lasciato per ruoli in startup negli ultimi 18 mesi, un modello che è accelerato man mano che l'accesso al calcolo è diventato più difficile da garantire all'interno di Google. Oren Etzioni, l'ex CEO dell'Allen Institute for AI citato nell'articolo, ha inquadrato dinamicamente pubblicamente come il risultato prevedibile di un mercato interno in cui il calcolo è razionato dalla seniority manageriale piuttosto che dalla logica economica dei costi unitari che governano i contratti con i clienti esterni. Google ha trascorso gli ultimi 18 mesi in una posizione delicata: ha bisogno che il suo programma TPU dimostri un'attrazione di volume con clienti esterni nominati per convalidare la tecnologia rispetto a Nvidia, mantenendo al contempo abbastanza capacità interna per le sessioni di addestramento di Gemini e la ricerca di DeepMind. La catena di fornitura di chip di inferenza a quattro partner con Broadcom, MediaTek e Marvell è una copertura progettata per alleviare il vincolo aggiungendo capacità a valle dell'addestramento TPU. Non è ancora stata spedita alla scala richiesta dalla curva di domanda. Google non ha contestato il quadro di allocazione interna di Bloomberg ufficialmente; ha fatto riferimento alla sua postura di investimento in infrastrutture più ampia e al fatto che i vincoli di calcolo sono una condizione a livello di categoria piuttosto che specifica di Google. Questo è vero secondo le evidenze: ogni fornitore di modelli principale è, nella lettura più pulita degli utili del Q1 2026, vincolato dal calcolo rispetto alle proprie aspirazioni di ricerca. Ciò che rende la versione di Google degna di nota è il confronto: l'azienda è, allo stesso tempo, diventata il principale fornitore di infrastrutture dei suoi concorrenti. Se può continuare a vendere l'asset e utilizzarlo è la domanda che i prossimi trimestri risolveranno.

Altri articoli

XPeng avvia la sua linea di robotaxi a Guangzhou, tre anni dietro i leader e davanti a qualsiasi altro costruttore automobilistico cinese. XPeng ha iniziato la produzione di robotaxi a Guangzhou lunedì con VLA 2.0, quattro chip Turing e un obiettivo senza conducente per il 2027.

Stati Uniti e Filippine si muovono Il Sottosegretario Helberg ha visitato il sito di New Clark City con aziende americane. Il BCDA ha offerto un periodo di grazia di due anni per il contratto di locazione, ma ha respinto la richiesta di Washington per l'immunità diplomatica presso la struttura.

Gli Stati Uniti e le Filippine si muovono Il Sottosegretario Helberg ha visitato il sito di New Clark City con aziende americane. Il BCDA ha offerto un periodo di grazia di due anni per il contratto di locazione, ma ha rifiutato la richiesta di Washington per l'immunità diplomatica presso la struttura.

Forse, abbandona Gemini e ChatGPT per le tue immagini AI. Prova un'alternativa che ho appena scoperto. Ideogram non può sostituire ogni generatore di immagini AI, ma la sua precisione testuale, i controlli di formato e gli strumenti di remix lo rendono degno di essere provato per poster, miniature, grafiche social e altri visual pesanti di design.

Google ha venduto così tanta capacità TPU che i suoi stessi ricercatori stanno facendo la fila per il resto.

Il stack TPU di Google finanzia accordi con Anthropic e Meta. Bloomberg riporta che lo stesso successo ha reso l'accesso ai calcoli interni di Google e DeepMind una risorsa contesa.