
Cosa sorprenderà il mercato del nuovo DeepSeek R2 Cinese
La startup Cinese DeepSeek si sta ancora una volta preparando a sorprendere il mercato dell'intelligenza artificiale. Questa volta stiamo parlando del modello R2, le cui informazioni hanno già suscitato un'ondata di discussioni grazie agli impressionanti progressi tecnologici su tre fronti contemporaneamente.
In rete
sono trapelate le caratteristiche del nuovo modello DeepSeek R2, in grado, secondo le stime preliminari, di superare i leader del settore. DeepSeek è la principale startup cinese nel campo DELL'IA. La società è stata fondata nel 2023 con l'obiettivo di «esplorare l'essenza dell'intelligenza artificiale generale». IT-World ha esaminato ciò che è previsto " sotto il cofano» della nuova versione.
Il primo e forse il principale vantaggio del nuovo sviluppo è la sua rivoluzionaria architettura Hybrid MoE 3.0. DeepSeek può gestire 1,2 trilioni di parametri con un carico effettivo di soli 78 miliardi. grazie a questa ottimizzazione, il costo dell'elaborazione dei dati (Token) è diventato inferiore di un impressionante 97,3% rispetto al GPT-4 Turbo di OpenAI. Sullo sfondo di tali numeri, anche i leader di mercato stanno iniziando a sembrare leggermente obsoleti.
La seconda area chiave è stata il raggiungimento di un'elevata efficienza computazionale sulle apparecchiature domestiche. DeepSeek R2 ha registrato un utilizzo dell ' 82% della capacità del cluster di chip Huawei Ascend 910B, producendo 512 PetaFLOPS di prestazioni. Ciò equivale al 91% della potenza dei famosi chip NVIDIA A100, ma già sulla tecnologia cinese. Sembra intrigante e un po'provocatorio: i leader occidentali potrebbero presto rimanere in panchina?
La terza svolta è nei problemi multimodali. Qui, R2 sorprende di nuovo: la precisione della segmentazione degli oggetti sul noto set di dati COCO ha raggiunto il 92,4%, che è quasi 12 punti migliore del popolare modello CLIP. Nel controllo di produzione, il tasso di falsi positivi è sceso a un incredibile 7,2 E-6. E nella diagnosi medica dai raggi X del torace, il nuovo modello ha superato i radiologi professionisti con una precisione del 98,1%, superando la media (96,3%).
Sotto il cofano, DeepSeek R2 è un'enorme quantità di dati di 5,2 petabyte che copre finanza, diritto e brevetti. Nei test C-Eval 2.0, Il modello mostra una precisione di esecuzione delle istruzioni dell ' 89,7%. Un altro vantaggio è la tecnologia di quantizzazione, che riduce le dimensioni del modello dell ' 83%, praticamente senza perdere precisione quando si passa alla precisione a 8 bit. Ciò rende R2 accessibile anche a dispositivi con capacità di Elaborazione Limitata, ampliando le sue applicazioni nell'industria, nella sanità e nella gestione urbana.
Il progetto su larga scala è ovviamente supportato da importanti partner tecnologici: Tuowei Information fornisce oltre la metà dell'infrastruttura Ascend di Huawei, Zhongke Shuguang fornisce Server raffreddati a liquido, Inspur Information è responsabile di oltre 5.000 server con chip ibridi NVIDIA e Huawei e Xinyisheng ha sviluppato soluzioni di risparmio energetico basate sulla fotonica al silicio.
Se i dati ufficiali sono confermati, DeepSeek R2 ha tutte le possibilità di cambiare l'equilibrio di potere nel mercato dell'intelligenza artificiale, e molto rapidamente e inaspettatamente per i concorrenti occidentali. Sembra che la gara ai abbia appena iniziato a entrare nella fase più interessante.

Altri articoli






Cosa sorprenderà il mercato del nuovo DeepSeek R2 Cinese
La startup Cinese DeepSeek si sta ancora una volta preparando a sorprendere il mercato dell'intelligenza artificiale. Questa volta stiamo parlando del modello R2, le cui informazioni hanno già suscitato un'ondata di discussioni grazie agli impressionanti progressi tecnologici su tre fronti contemporaneamente.