Apple ricostruisce Siri su chip Google AI e Nvidia al WWDC

Apple ricostruisce Siri su chip Google AI e Nvidia al WWDC

      TL;DRApple ha ricostruito Siri su un modello Gemini personalizzato da 1,2 trilioni di parametri che gira su GPU Nvidia Blackwell nel Google Cloud. Federighi afferma che le richieste non vengono mai memorizzate. L'azienda ha svelato cinque nuovi modelli di intelligenza artificiale e un'architettura di privacy a tre livelli.

      L'annuncio di intelligenza artificiale più importante di Apple al WWDC 2026 non è stata una funzionalità. È stata un'architettura.

      La Siri ricostruita gira su un modello personalizzato da 1,2 trilioni di parametri costruito sulla tecnologia Gemini di Google, ospitato su server Google Cloud alimentati da GPU Nvidia Blackwell B200. Per l'azienda che ha reso la privacy il suo prodotto premium, esternalizzare l'inferenza AI nel cloud del suo più grande concorrente richiede un'enorme quantità di ingegneria della fiducia.

      Il sistema a tre livelli

      Apple ora instrada le query di Siri attraverso tre livelli. I compiti semplici rimangono sul dispositivo utilizzando i modelli di Apple. Le richieste moderatamente complesse vanno ai server Apple Private Cloud Compute.

      Il 💜 della tecnologia UE

      Le ultime novità dalla scena tecnologica dell'UE, una storia del nostro saggio fondatore Boris e alcune opere d'arte AI discutibili. È gratuito, ogni settimana, nella tua casella di posta. Iscriviti ora!

      I compiti di ragionamento più pesanti vengono instradati verso Google Cloud. In ciascun livello, Apple afferma che le query sono anonimizzate e tokenizzate in modo che né il personale di Apple né Google possano collegare le richieste a singoli utenti.

      Cosa ha detto Federighi

      “Non utilizziamo nessuno dei modelli che Google distribuisce ai suoi clienti,” ha detto il capo software Craig Federighi durante un evento stampa del WWDC. “Le tue richieste sono completamente private per te. Non vengono mai memorizzate. Non sono mai accessibili a nessuno.”

      Il contratto con Google vieterebbe all'azienda di addestrare modelli futuri sui dati degli utenti Apple. La funzione di calcolo riservato di Nvidia crittografa i dati mentre vengono elaborati sulle GPU Blackwell, aggiungendo una protezione a livello hardware oltre a quella contrattuale. Non è stata pubblicata alcuna verifica indipendente del livello Google Cloud, e i divieti contrattuali sull'addestramento possono essere rinegoziati in futuri accordi.

      I cinque nuovi modelli

      Apple ha svelato la terza generazione dei suoi Apple Foundation Models (AFM), una famiglia di cinque modelli distillati da Gemini: AFM Core, Core Advanced, Cloud, Cloud Pro e Cloud Image. Il più potente, AFM Cloud Pro, offre una qualità “simile” a quella dei modelli frontier Gemini di Google, secondo il VP AI Amar Subramanya, anche se nessun benchmark indipendente ha confermato il confronto.

      Tutti e cinque sono costruiti su misura per Apple Silicon, addestrati con dati proprietari e apprendimento per rinforzo. I modelli on-device gestiscono compiti di base senza che alcun dato lasci il telefono.

      Perché questo è imbarazzante

      Un anno fa, Federighi e il capo marketing Greg Joswiak hanno respinto l'idea di un “chatbot aggiunto” al WWDC 2025. Ora Siri è un chatbot conversazionale. Quando gli è stato chiesto cosa fosse cambiato, Federighi ha detto: “Vediamo Siri non come un chatbot separato, ma piuttosto come uno strumento integrale ma conversazionale che usi nel momento.”

      Apple ha anche risolto un'azione collettiva da 250 milioni di dollari il mese scorso riguardo alle funzionalità di marketing AI nel 2024 che non erano pronte al lancio dell'iPhone 16. L'azienda ha riconosciuto attraverso il responsabile dell'ingegneria di Siri Mike Rockwell che i tentativi precedenti di rinnovare l'assistente “non hanno soddisfatto gli standard di Apple.”

      La questione della dipendenza da Google

      L'accordo con Google vale circa 1 miliardo di dollari all'anno. Dà ad Apple accesso a intelligenza artificiale di classe frontier senza doverla costruire da zero, ma crea anche una dipendenza da un'azienda che è contemporaneamente il più grande rivale di Apple nei sistemi operativi mobili e la sua più grande fonte di entrate pubblicitarie.

      Per gli utenti, la domanda è se l'architettura di privacy di Apple sia abbastanza forte da sopravvivere alla combinazione di modelli Google, hardware Nvidia e inferenza cloud. Per gli investitori, la domanda è se l'ingresso tardivo di Apple nell'AI possa recuperare il terreno perso mentre cercava di costruire tutto internamente. Il WWDC 2026 è la risposta di Apple a entrambe le domande. Settembre, quando le funzionalità saranno disponibili, è quando gli utenti potranno decidere se ci credono.

Altri articoli

La Cina redige un piano da 295 miliardi di dollari per centri dati AI per escludere Nvidia La Cina redige un piano da 295 miliardi di dollari per centri dati AI per escludere Nvidia La Cina sta redigendo un piano quinquennale da circa 295 miliardi di dollari per costruire una rete nazionale di data center per l'IA gestita per l'80% da tecnologia nazionale, escludendo Nvidia e AMD. Perplexity mantiene il piano di IPO del 2028 mentre OpenAI e Anthropic presentano domanda Perplexity mantiene il piano di IPO del 2028 mentre OpenAI e Anthropic presentano domanda Perplexity AI punta a un'IPO nel 2028, scegliendo la pazienza rispetto all'urgenza mentre OpenAI e Anthropic presentano entrambe in modo riservato. Il CEO afferma che la tempistica non è cambiata. Perplexity mantiene il piano IPO del 2028 mentre OpenAI e Anthropic presentano la domanda Perplexity mantiene il piano IPO del 2028 mentre OpenAI e Anthropic presentano la domanda Perplexity AI punta a un'IPO nel 2028, scegliendo la pazienza rispetto all'urgenza mentre OpenAI e Anthropic presentano entrambe in modo riservato. Il CEO afferma che la tempistica non è cambiata. ICEYE raggiunge una valutazione di 10 miliardi di euro in un aumento di 450 milioni di euro ICEYE raggiunge una valutazione di 10 miliardi di euro in un aumento di 450 milioni di euro ICEYE della Finlandia ha raccolto 450 milioni di euro guidati da General Atlantic a una valutazione di 10 miliardi di euro, quadruplicando in sei mesi mentre i governi si affrettano a possedere satelliti radar sovrani. ICEYE raggiunge una valutazione di 10 miliardi di euro in un aumento di 450 milioni di euro ICEYE raggiunge una valutazione di 10 miliardi di euro in un aumento di 450 milioni di euro ICEYE della Finlandia ha raccolto 450 milioni di euro guidati da General Atlantic a una valutazione di 10 miliardi di euro, quadruplicando in sei mesi mentre i governi si affrettano a possedere satelliti radar sovrani. La Cina elabora un piano da 295 miliardi di dollari per i centri dati AI per escludere Nvidia. La Cina elabora un piano da 295 miliardi di dollari per i centri dati AI per escludere Nvidia. La Cina sta redigendo un piano quinquennale da circa 295 miliardi di dollari per costruire una rete nazionale di data center per l'IA gestita per l'80% da tecnologia nazionale, escludendo Nvidia e AMD.

Apple ricostruisce Siri su chip Google AI e Nvidia al WWDC

Il nuovo Siri di Apple funziona su un modello Gemini personalizzato e GPU Nvidia Blackwell. Federighi afferma che i dati non vengono mai memorizzati. Cinque nuovi modelli di intelligenza artificiale utilizzano un'architettura di privacy a tre livelli.