Il chip Jalapeño di OpenAI: una via d'uscita da Nvidia

Il chip Jalapeño di OpenAI: una via d'uscita da Nvidia

      OpenAI ha appena presentato Jalapeño, il suo primo chip AI sviluppato internamente, realizzato con Broadcom. È progettato per l'inferenza, non per l'addestramento. Ed è il segnale più chiaro finora che l'azienda più dipendente da Nvidia cerca una via d'uscita.

      OpenAI ha ora un chip. Mercoledì ha svelato Jalapeño, il primo pezzo di silicio progettato autonomamente. È una risposta diretta a una domanda che incombe sull'azienda da anni. Cosa succede quando il più grande acquirente di calcolo AI al mondo decide che non vuole più noleggiare tutto da Nvidia?

      Il chip è stato costruito con Broadcom, ha riportato per primo Axios. OpenAI ha fatto il design centrale. Broadcom ha fornito la connettività e il know-how di rete, oltre al suo silicio di commutazione Tomahawk. Un terzo partner, Celestica, ha gestito le schede e i rack.

      OpenAI sta già eseguendo i primi campioni nei suoi laboratori. Lì rispondono alle query di Codex e gestiscono carichi di lavoro per un modello che chiama GPT-5.3-Codex-Spark.

      OpenAI non sta cercando di sostituire Nvidia da un giorno all'altro. Sta cercando di smettere di essere un cliente in cattività. Questa è la vera storia qui.

      Cosa è realmente Jalapeño

      Jalapeño è costruito per l'inferenza: il lavoro quotidiano di risposta alle query degli utenti. Non è costruito per addestrare nuovi modelli. OpenAI lo chiama un "Processore di Intelligenza". Sottolinea che si tratta di un design da zero, non di un acceleratore a uso generale adattato per il lavoro. L'obiettivo è l'efficienza.

      I primi test, afferma l'azienda, mostrano prestazioni per watt "sostanzialmente migliori rispetto allo stato dell'arte attuale". Anche il comportamento termico è risultato migliore del previsto.

      Questi sono i numeri di OpenAI, e un rapporto tecnico completo è ancora a mesi di distanza. Per ora, la rivendicazione da tenere d'occhio è ristretta ma reale. Un chip sintonizzato per un lavoro può superare uno flessibile in quel lavoro. L'inferenza è dove l'AI incontra gli utenti reali. Quindi anche piccoli guadagni in costi e velocità si accumulano rapidamente su centinaia di milioni di query quotidiane.

      Il piano è di mettere Jalapeño al lavoro entro la fine di quest'anno. Broadcom prevede che i primi chip siano in uso commerciale presso Microsoft e altri partner entro la fine del 2026, anche se OpenAI afferma che il vero volume arriverà l'anno prossimo. L'obiettivo a lungo termine è ancora più grande. OpenAI vuole che i suoi chip personalizzati alimentino 10 gigawatt di calcolo entro il 2029, circa l'output di dieci reattori nucleari.

      Una corsa di nove mesi, progettata in parte da AI

      La tempistica è flessibile. OpenAI e Broadcom affermano di aver portato Jalapeño dal primo design alla produzione in nove mesi, il che credono sia il ciclo più veloce mai registrato per un chip avanzato e ad alte prestazioni. Le tape-out a questo livello di solito richiedono molto più tempo.

      Parte di come ci sono riusciti presenta una curiosa svolta. OpenAI ha utilizzato i propri modelli per accelerare parti del design del chip.

      Gli stessi sistemi che le persone interrogano tramite ChatGPT hanno aiutato a costruire l'hardware che presto li eseguirà. Se l'AI può davvero aiutare gli ingegneri a progettare chip migliori più velocemente, ciò riduce il costo del calcolo per tutti, che è esattamente il tipo di ciclo auto-rinforzante di cui OpenAI ama parlare. Aiuta anche a spiegare il recente afflusso di startup che utilizzano l'AI per progettare chip.

      Perché costruire il proprio chip

      Il motivo è il controllo tanto quanto il costo. "Questo dà a OpenAI il controllo completo dello stack", ha detto Richard Ho, che guida il programma hardware dell'azienda. OpenAI ora progetta il modello, il software, i sistemi di erogazione e, sempre di più, il chip sottostante. Possedere ogni strato consente di sintonizzare tutto verso un obiettivo: intelligenza più economica e veloce.

      Il CEO di Broadcom, Hock Tan, ha messo il caso in modo più diretto. "Alla fine della giornata, non puoi, non dovresti fare affidamento su qualche altro GPU di terze parti per farlo per te, perché è una parte così fondamentale", ha detto. L'obiettivo non così sottile è Nvidia, i cui chip hanno alimentato quasi tutto l'addestramento e l'inferenza di OpenAI fino ad oggi, e il cui lock-in ecosistemico è esattamente ciò che i grandi clienti ora vogliono allentare.

      OpenAI si unisce a un club affollato

      OpenAI è in ritardo a una festa che i suoi rivali più grandi hanno organizzato anni fa. Google ha i suoi TPU, Amazon le sue linee Trainium e Graviton, e Microsoft i suoi acceleratori Maia. Ognuno abbina silicio personalizzato con chip Nvidia piuttosto che sostituirli completamente. Anche Anthropic sta esplorando i propri chip.

      La logica è condivisa tra tutti loro: a questa scala, progettare il proprio silicio è più economico che pagare per sempre i margini di Nvidia.

      Un nome continua a ricorrere dall'altra parte di questi accordi. Broadcom ora si trova dietro una quota notevole degli acceleratori personalizzati dell'industria, da Google a Jalapeño, e ha recentemente stipulato un enorme accordo di calcolo con Anthropic e Google.

      L'azienda è diventata silenziosamente il kingmaker della corsa ai chip post-Nvidia, fornendo la connettività e la forza produttiva che i laboratori AI mancano.

      OpenAI ha già iniziato a diversificare le sue scommesse. Oltre a Nvidia, ha recentemente iniziato a utilizzare chip Cerebras per l'inferenza, parte di una sfida più ampia a Nvidia specificamente nell'inferenza, dove i rivali vedono la migliore opportunità per rompere la presa. Jalapeño trasforma quella diversificazione in qualcosa che OpenAI possiede completamente.

      Il caso per la cautela

      Un primo chip non è una strategia finita. Jalapeño gestisce l'inferenza, non l'addestramento, e l'addestramento è dove il vantaggio di Nvidia è più difficile da sfidare. OpenAI ammette che Nvidia rimane un partner chiave in questo ambito. Quindi questa è diversificazione ai margini, non un divorzio.

      Le rivendicazioni sulle prestazioni si basano anche sui primi test di OpenAI, con il rapporto dettagliato ancora da arrivare. I benchmark dei fornitori al lancio meritano un sopracciglio alzato fino a quando non arrivano numeri indipendenti. Costruire chip è un lavoro lento, affamato di capitale e spietato, e una tape-out di nove mesi è lontana dalla produzione affidabile su scala di gigawatt.

      Nessuna di queste considerazioni rende la mossa sbagliata. La rende un primo passo.

      La domanda aperta è se OpenAI possa davvero costruire la propria via d'uscita da Nvidia, o se possedere una fetta del proprio silicio semplicemente le dia leva al tavolo delle trattative. In ogni caso, l'azienda che acquista più calcolo AI di quasi chiunque ha deciso che preferirebbe produrne una parte.

      Il resto dell'industria osserverà quanto bene Jalapeño regge sotto carico reale.

Altri articoli

iOS 27 developer beta 2 è qui. Ecco tutte le nuove funzionalità che ottieni. iOS 27 developer beta 2 è qui. Ecco tutte le nuove funzionalità che ottieni. La beta 2 per sviluppatori di iOS 27 di Apple è qui con una Siri molto più veloce, un bug di ritaglio risolto, Wallet Insight, risposte RCS inline e una manciata di altre modifiche gradite. Ecco tutto ciò che c'è di nuovo. LastPass subisce un'altra violazione dei dati, ma questa volta il tuo vault delle password è al sicuro LastPass subisce un'altra violazione dei dati, ma questa volta il tuo vault delle password è al sicuro LastPass ha confermato che i nomi dei clienti, i dettagli di contatto e i registri dei casi di supporto sono stati esposti in una violazione presso Klue, anche se l'azienda afferma che i vault delle password rimangono sicuri. I fornitori di Apple corrono a Hong Kong: 4 miliardi di dollari in una settimana I fornitori di Apple corrono a Hong Kong: 4 miliardi di dollari in una settimana I fornitori di Apple Luxshare e Lingyi stanno correndo verso Hong Kong, raccogliendo miliardi per passare dai componenti per smartphone all'hardware per l'IA e ai robot umanoidi. I fornitori di Apple corrono a Hong Kong: 4 miliardi di dollari in una settimana I fornitori di Apple corrono a Hong Kong: 4 miliardi di dollari in una settimana I fornitori di Apple Luxshare e Lingyi stanno correndo verso Hong Kong, raccogliendo miliardi per passare dai componenti per smartphone all'hardware per l'IA e ai robot umanoidi. Non è necessario pagare troppo per un tablet Android premium con questa offerta Galaxy Tab S11. Non è necessario pagare troppo per un tablet Android premium con questa offerta Galaxy Tab S11. Il Galaxy Tab S11 di Samsung riceve un taglio di prezzo per il Prime Day, rendendo il suo schermo AMOLED, il design sottile e la S Pen inclusa molto più facili da giustificare per gli acquirenti di tablet Android in questo momento. Il Google Home Speaker è impressionante, fino a quando non guardi il cavo di alimentazione. Il Google Home Speaker è impressionante, fino a quando non guardi il cavo di alimentazione. Un acquirente ha ottenuto in anteprima il nuovo Google Home Speaker e ha condiviso le prime impressioni. Il suono impressiona, la configurazione è rapida, ma il cavo di alimentazione fisso è una vera delusione per la riparabilità.

Il chip Jalapeño di OpenAI: una via d'uscita da Nvidia

OpenAI ha svelato Jalapeño, il suo primo chip AI, realizzato con Broadcom per l'inferenza, mentre si muove per ridurre la sua forte dipendenza da Nvidia.