Oriole lancia la prima rete AI puramente fotonica, affermando un taglio dell'81%

      TL;DRUK startup Oriole Networks sta implementando la prima rete AI puramente fotonica al mondo su larga scala, affermando una riduzione del 81% della potenza del core e un tempo di inattività della GPU inferiore all'1%. Il sistema si abbina all'hardware AMD all'interno del laboratorio ARIA Scaling Inference da 50 milioni di sterline nel Regno Unito.

      Per decenni, le reti all'interno dei data center hanno funzionato con interruttori elettrici. Sono affamati di energia, generano enormi calore e sono sempre più il collo di bottiglia che limita la velocità con cui i sistemi AI possono elaborare e scambiare dati. Oriole Networks, una startup del Regno Unito, afferma di avere una soluzione: sostituire ogni interruttore elettrico nella rete centrale con circuiti ottici su scala nanosecondo che instradano i dati come fotoni anziché elettroni.

      Lunedì, Oriole ha annunciato che implementerà quello che descrive come il primo sistema AI su larga scala al mondo alimentato da una rete puramente fotonica, come parte del laboratorio ARIA Scaling Inference del Regno Unito. Il sistema abbina la piattaforma di rete PRISM di Oriole con GPU AMD Instinct e CPU AMD EPYC. Segna il primo dispiegamento commerciale dell'azienda, con un rollout più ampio previsto per il 2027.

      Cosa fa PRISM

      PRISM elimina completamente gli interruttori di pacchetti elettronici dal core della rete. In un data center convenzionale, gli interruttori elettrici si trovano tra le GPU e introducono latenza, consumano energia e generano calore. Oriole li sostituisce con switching di circuiti ottici a velocità nanosecondo, consentendo ai fotoni di viaggiare direttamente da chip a chip.

      L'azienda afferma che questo riduce il consumo di energia della rete centrale dell'81%. Affermano anche che il tempo di inattività della GPU scende da circa il 60% nei sistemi attuali a meno dell'1%, poiché la rete non è più il vincolo. Il risultato, secondo Oriole, è un aumento di un ordine di grandezza nella capacità di elaborazione delle inferenze, il che significa più token al secondo e più utenti serviti simultaneamente dallo stesso hardware.

      Queste sono affermazioni significative. La riduzione del 81% della potenza e il tempo di inattività della GPU inferiore all'1% non sono stati valutati in modo indipendente su scala di produzione. Il dispiegamento ARIA sarà il primo vero test per verificare se le prestazioni in laboratorio si traducono in carichi di lavoro commerciali.

      Il laboratorio ARIA Scaling Inference

      Il dispiegamento si trova all'interno del laboratorio ARIA Scaling Inference, un banco di prova da 50 milioni di sterline (68 milioni di dollari) finanziato dal governo del Regno Unito attraverso l'Advanced Research and Invention Agency per affrontare i collo di bottiglia nell'inferenza AI su larga scala. ARIA è stata creata da un atto del Parlamento ed è sponsorizzata dal Dipartimento per la Scienza, l'Innovazione e la Tecnologia. Il laboratorio è ospitato da CommonAI ed è progettato per testare e ottimizzare i sistemi AI in condizioni reali.

      L'inferenza, la fase operativa in cui i modelli addestrati forniscono previsioni e generano output, rappresenta la maggior parte del costo di calcolo e dell'uso energetico dell'AI. È la fase in cui l'espansione dell'infrastruttura AI globale è maggiormente limitata dalle prestazioni della rete.

      “AMD è entusiasta di collaborare con Oriole sul cluster del laboratorio ARIA Scaling Inference,” ha dichiarato Madhu Rangarajan, vicepresidente aziendale di calcolo e AI aziendale di AMD. “Il networking AI di backend di Oriole con switching di circuiti ottici a nanosecondo rappresenta un modo fondamentalmente diverso di connettere gli acceleratori su larga scala.”

      Dalla R&D al dispiegamento in tre anni

      Oriole è stata fondata nel Regno Unito e ha raccolto circa 35 milioni di dollari fino ad oggi da investitori tra cui Plural, UCL Technology Fund, Clean Growth Fund, XTX Ventures e Dorilton Ventures. L'azienda è passata dalla ricerca al dispiegamento commerciale in tre anni, un lasso di tempo insolitamente veloce per l'hardware fotonico.

      Il CEO James Regan ha inquadrato l'annuncio come una transizione dalla prova fisica alla prova commerciale. “Un anno fa, stavamo dimostrando la fisica; oggi, stiamo dimostrando il business,” ha detto. “Questo è ciò che sembra quando il networking fotonico smette di essere una curiosità di ricerca e inizia a essere la base di come viene costruita un'infrastruttura AI seria.”

      Fondamentalmente, PRISM è progettato per essere agnostico rispetto ai chip. Funziona su qualsiasi piattaforma di acceleratori, non solo AMD, offrendo agli operatori di data center un percorso per migliorare le prestazioni della rete senza doversi impegnare in uno stack proprietario. Il rollout più ampio nel 2027 testerà se quell'agnosticismo regge su larga scala attraverso diverse configurazioni hardware.

      Perché è importante

      Si prevede che il consumo energetico dei data center AI raddoppi entro il 2030. Il raffreddamento da solo rappresenta circa il 40% dell'uso di energia di un data center. Le reti aggiungono un ulteriore strato di spreco: ogni interruttore elettrico che si trova tra le GPU consuma energia convertendo fotoni in elettroni e viceversa, riscaldando la stanza nel processo.

      Se PRISM mantiene le sue promesse, le implicazioni si estendono oltre i risparmi energetici. Una comunicazione più veloce da chip a chip significa un uso più efficiente della costosa capacità GPU, il che significa un costo di inferenza inferiore per token. In un mercato in cui le aziende stanno già lottando con bollette AI fuori controllo, una rete che consente all'hardware esistente di produrre più output senza acquistare altro hardware ha un evidente caso commerciale.

      La riserva è la distanza tra un banco di prova finanziato dal governo e un data center commerciale a iperscala. Il dispiegamento ARIA di Oriole è reale, ma non opera ancora alla scala di un cluster Meta o Google. Il rollout del 2027 determinerà se PRISM può sopravvivere al salto da un laboratorio sostenuto da 50 milioni di sterline di denaro pubblico ai piani di produzione di aziende che spendono centinaia di miliardi per l'infrastruttura AI. Questo è il divario in cui la maggior parte delle startup hardware fallisce.

Altri articoli

Gli Stati Uniti esortano gli alleati della NATO a utilizzare i fondi per la difesa per sostituire Huawei. Un funzionario statunitense ha detto agli alleati di utilizzare i budget per la difesa della NATO per rimuovere l'attrezzatura Huawei dalle loro reti, ma l'idea è stata accolta con freddezza poiché l'Europa rimane divisa su un divieto.

Bending Spoons presenta domanda per un'IPO negli Stati Uniti su Nasdaq Bending Spoons, il gruppo milanese dietro Evernote, WeTransfer e Vimeo, ha presentato domanda per un'IPO negli Stati Uniti su Nasdaq, con un fatturato previsto per il 2025 di 1,31 miliardi di dollari e un obiettivo riportato di 20 miliardi di dollari.

Companion.energy raccoglie 7,8 milioni di euro per l'energia aziendale in tempo reale Il Companion.energy di Gand ha raccolto 7,8 milioni di euro, guidato da Realyze Ventures e Pi Labs, per automatizzare l'energia aziendale in tempo reale ed espandersi in Germania e Spagna.

Uber apre la lista d'attesa a Londra per i robotaxi Wayve Uber ha aperto una lista d'attesa a Londra per corse autonome alimentate dalla startup britannica Wayve, in vista di un trial nel 2026, mentre Waymo si prepara a un lancio concorrente.

Cosine raduna i giganti del Regno Unito per costruire un modello di intelligenza artificiale sovrana Durante la London Tech Week, la britannica Cosine ha coinvolto BT, HSBC, BAE e altri per costruire Lumen Sovereign, un modello di intelligenza artificiale di frontiera del Regno Unito addestrato sul supercomputer Isambard-AI.

Oriole lancia la prima rete AI puramente fotonica, affermando un taglio dell'81%

La startup britannica Oriole Networks sta implementando la prima rete AI puramente fotonica su larga scala con AMD, sostenendo una riduzione del consumo energetico dell'81% e un tempo di inattività della GPU inferiore all'1% nel laboratorio ARIA del Regno Unito.