DeepSeek torna con V4-Pro e V4-Flash, un anno dopo il suo 'momento Sputnik'

      La startup di Hangzhou ha rilasciato versioni di anteprima di entrambi i modelli su Hugging Face venerdì. V4-Pro afferma di avere prestazioni superiori nella programmazione e nella matematica tra i modelli open source, supera solo Gemini 3.1-Pro per conoscenza generale e si trova “leggermente indietro” rispetto a GPT-5.4 e Gemini 3.1-Pro, un divario che DeepSeek afferma essere “circa 3-6 mesi.” Entrambi i modelli sono open source.

      DeepSeek, la startup di intelligenza artificiale con sede a Hangzhou che ha sconvolto la Silicon Valley con il suo modello R1 nel gennaio 2025, ha rilasciato versioni di anteprima dei suoi ultimi modelli di punta venerdì, circa un anno dopo quel colpo originale.

      L'azienda ha pubblicato DeepSeek-V4-Pro e DeepSeek-V4-Flash su Hugging Face, descrivendo il rilascio come la piattaforma di intelligenza artificiale open source più potente disponibile e una sfida diretta ai rivali da OpenAI ad Anthropic.

      Entrambi i modelli seguono il modello open source utilizzato dai loro predecessori, il che significa che gli sviluppatori sono liberi di utilizzare e modificare il codice sorgente.

      Il principale avanzamento tecnico in V4 è l'Architettura di Attenzione Ibrida, una tecnica che DeepSeek afferma migliori la capacità del modello di mantenere il contesto durante lunghe conversazioni. Il 💜 della tecnologia UE. Gli ultimi rumori dalla scena tecnologica dell'UE, una storia del nostro saggio fondatore Boris e alcune opere d'arte AI discutibili. È gratuito, ogni settimana, nella tua casella di posta. Iscriviti ora!

      Combinata con una finestra di contesto di 1 milione di token, sufficiente per elaborare un intero codice sorgente o un documento lungo come un libro in un'unica richiesta, l'architettura è progettata per compiti di ragionamento agentico e a lungo termine, dove i modelli precedenti degradavano in qualità man mano che aumentava la lunghezza del contesto. La variante Flash è ottimizzata per velocità ed efficienza dei costi; la variante Pro per capacità massima.

      Il benchmark di DeepSeek posiziona V4-Pro come il modello open source più forte nella programmazione e nella matematica, con prestazioni che superano solo il Gemini 3.1-Pro closed source di Google in conoscenza generale.

      Rispetto all'attuale frontiera closed source, GPT-5.4 di OpenAI e Gemini 3.1-Pro — l'azienda afferma che V4-Pro è solo “leggermente indietro,” e offre una valutazione onesta di se stessa: la sua “traiettoria di sviluppo” è indietro rispetto ai modelli di frontiera all'avanguardia di circa 3-6 mesi.”

      Questa impostazione è insolita nei rilasci di modelli di intelligenza artificiale, che tipicamente enfatizzano i confronti in cui il nuovo modello è in vantaggio. Il fatto che DeepSeek stia pubblicando una stima del divario piuttosto che rivendicare parità riflette o una rara onestà intellettuale o una mossa strategica per impostare aspettative conservative prima di una valutazione indipendente.

      La questione dei chip è l'elemento geopoliticamente carico. DeepSeek ha collaborato con i produttori cinesi di chip AI Huawei e Cambricon per ottimizzare V4 per il loro ultimo hardware, secondo Reuters, citando The Information.

      L'azienda non ha dato accesso anticipato a Nvidia o AMD per l'ottimizzazione, una inversione della prassi standard del settore in cui i produttori di chip occidentali sono tipicamente i primi a ricevere i pesi dei nuovi modelli per la messa a punto delle prestazioni.

      Eseguire un modello di classe frontiera a questa scala sui chip Ascend di Huawei, piuttosto che su Nvidia H100 o H200, sarebbe una significativa prova di concetto per la catena di fornitura di hardware AI domestico della Cina, che è stata soggetta a restrizioni all'esportazione degli Stati Uniti da ottobre 2022. Il rilascio di V4 non pone fine a quella restrizione geopolitica, ma ne testa i limiti in modo commercialmente visibile.

      Il tempismo del rilascio, venerdì 24 aprile 2026, circa un anno dopo DeepSeek-R1, è deliberato. Il lancio di DeepSeek-R1 nel gennaio 2025 ha cancellato circa 600 miliardi di dollari dalla capitalizzazione di mercato di Nvidia in un solo giorno, mentre gli investitori ricalibravano le loro assunzioni riguardo al calcolo necessario per costruire intelligenza artificiale di frontiera.

      Marc Andreessen lo ha definito “il momento Sputnik dell'AI.” La rivendicazione pratica era che un laboratorio cinese avesse eguagliato il miglior modello di ragionamento di OpenAI spendendo meno di 6 milioni di dollari in calcolo, una cifra che alcuni analisti hanno contestato ma che ha comunque ripristinato le assunzioni globali riguardo all'economia dello sviluppo dell'AI di frontiera.

      V4 arriva in un mercato diverso: uno in cui OpenAI ha rilasciato GPT-5.5 lo stesso giorno, dove Anthropic è valutata 1 trilione di dollari nei mercati secondari e dove la competizione AI tra Stati Uniti e Cina è diventata una dimensione esplicita della politica commerciale e tecnologica. Il secondo atto di DeepSeek si sta svolgendo in un'arena molto più contestata rispetto al primo.

      Entrambi i modelli sono rilasci di anteprima, non versioni finali di produzione. La valutazione indipendente non è ancora stata completata al momento della scrittura, e i benchmark di DeepSeek dovrebbero essere considerati preliminari fino a quando una valutazione di terze parti non li confermerà.

      La stessa avvertenza si applicava a R1, le cui affermazioni sono state ampiamente validate da test esterni entro pochi giorni dal rilascio. Se V4 resisterà alla stessa scrutinio sarà chiaro entro la settimana.

Altri articoli

Cohere e Aleph Alpha si fondono in un'azienda di intelligenza artificiale transatlantica da 20 miliardi di dollari Cohere e Aleph Alpha annunciano una fusione che crea un'azienda di intelligenza artificiale transatlantica del valore di circa 20 miliardi di dollari con sede centrale canadese-tedesca.

Dopo l'Australia, la Norvegia vieta i social media per i minori di 16 anni. Il governo laburista norvegese proporrà di vietare i social media per i minori di 16 anni e di rendere le piattaforme responsabili della verifica dell'età.

OpenAI spinge ChatGPT verso un lavoro autonomo con GPT-5.5. OpenAI ha lanciato GPT-5.5, concentrandosi sul miglioramento della capacità di ChatGPT di gestire compiti complessi e flussi di lavoro nel mondo reale.

La startup nucleare sostenuta da Amazon, X-Energy, raccoglie 1,02 miliardi di dollari in IPO. X-Energy, sostenuta da Amazon, ha raccolto 1,02 miliardi di dollari nella sua IPO al Nasdaq a 23 dollari per azione, mentre la domanda di elettricità per i data center AI alimenta il boom degli investimenti nei reattori modulari piccoli.

Risparmia $250 sul Google Pixel 10: Tensor G5, tripla fotocamera posteriore e Gemini Live per meno di $550 Il Google Pixel 10 è sceso a 549 dollari in un'offerta a tempo limitato, un risparmio di 250 dollari rispetto al prezzo di listino di 799 dollari, ed è il telefono Android sbloccato verso cui indirizzerei la maggior parte delle persone a questo prezzo in questo momento. Il chip Tensor G5, un nuovo sistema di tripla fotocamera posteriore con teleobiettivo 5x e Gemini AI integrato da […]

Il holding "Rosel" ha presentato un assistente industriale basato su intelligenza artificiale. La corporazione statale Rostec, attraverso il suo holding "Rosel", ha annunciato il lancio di una nuova piattaforma basata sull'intelligenza artificiale chiamata ShokinGPT. La soluzione è destinata a lavorare con documenti e dati all'interno delle imprese.

DeepSeek torna con V4-Pro e V4-Flash, un anno dopo il suo 'momento Sputnik'

DeepSeek rilascia versioni anteprima di V4-Pro e V4-Flash su Hugging Face, open-source, con una finestra di contesto di 1 milione di token e ottimizzazione per chip Huawei.