Oriole despliega la primera red de IA puramente fotónica, afirma un recorte del 81%
TL;DR La startup británica Oriole Networks está desplegando la primera red de IA puramente fotónica del mundo a gran escala, afirmando una reducción del 81% en el consumo de energía del núcleo y un tiempo de inactividad de GPU por debajo del 1%. El sistema se empareja con hardware de AMD dentro del laboratorio de inferencia ARIA de £50 millones del Reino Unido. Durante décadas, las redes dentro de los centros de datos han funcionado con interruptores eléctricos. Son consumidores de energía, generan un calor enorme y son cada vez más el cuello de botella que limita la velocidad a la que los sistemas de IA pueden procesar e intercambiar datos. Oriole Networks, una startup del Reino Unido, dice que tiene una solución: reemplazar cada interruptor eléctrico en la red central con circuitos ópticos a escala de nanosegundos que dirigen los datos como fotones en lugar de electrones. El lunes, Oriole anunció que desplegará lo que describe como el primer sistema de IA a gran escala del mundo impulsado por una red puramente fotónica, como parte del laboratorio de inferencia ARIA del Reino Unido. El sistema empareja la plataforma de red PRISM de Oriole con GPUs AMD Instinct y CPUs AMD EPYC. Marca el primer despliegue comercial de la compañía, con un lanzamiento más amplio en la industria planeado para 2027. Lo que hace PRISM PRISM elimina completamente los interruptores de paquetes electrónicos del núcleo de la red. En un centro de datos convencional, los interruptores eléctricos se sitúan entre las GPUs e introducen latencia, consumen energía y generan calor. Oriole los reemplaza con conmutación de circuitos ópticos a velocidades de nanosegundos, permitiendo que los fotones viajen directamente de chip a chip. La compañía afirma que esto reduce el consumo de energía de la red central en un 81%. También dice que el tiempo de inactividad de la GPU cae de aproximadamente el 60% en los sistemas actuales a menos del 1%, porque la red ya no es la limitación. El resultado, según Oriole, es un aumento de un orden de magnitud en el rendimiento de inferencia, lo que significa más tokens por segundo y más usuarios atendidos simultáneamente desde el mismo hardware. Estas son afirmaciones significativas. La reducción del 81% en el consumo de energía y el tiempo de inactividad de GPU por debajo del 1% no han sido evaluados de manera independiente a escala de producción. El despliegue de ARIA será la primera prueba real de si el rendimiento en laboratorio se traduce en cargas de trabajo comerciales. El laboratorio de inferencia ARIA El despliegue se sitúa dentro del laboratorio de inferencia ARIA, un banco de pruebas de £50 millones ($68 millones) financiado por el gobierno del Reino Unido a través de la Agencia de Investigación e Invención Avanzada para abordar los cuellos de botella en la inferencia de IA a gran escala. ARIA fue creado por un Acta del Parlamento y es patrocinado por el Departamento de Ciencia, Innovación y Tecnología. El laboratorio es alojado por CommonAI y diseñado para probar y optimizar sistemas de IA en condiciones del mundo real. La inferencia, la fase operativa donde los modelos entrenados sirven predicciones y generan salidas, representa la mayor parte del costo de computación y uso de energía de la IA. Es la fase donde la construcción de la infraestructura global de IA está más restringida por el rendimiento de la red. “AMD está emocionado de colaborar con Oriole en el clúster del laboratorio de inferencia ARIA”, dijo Madhu Rangarajan, vicepresidente corporativo de computación e IA empresarial en AMD. “La red de backend de IA de Oriole con conmutación de circuitos ópticos a nanosegundos representa una forma fundamentalmente diferente de conectar aceleradores a gran escala.” De I+D a despliegue en tres años Oriole fue fundada en el Reino Unido y ha recaudado aproximadamente $35 millones hasta la fecha de inversores como Plural, UCL Technology Fund, Clean Growth Fund, XTX Ventures y Dorilton Ventures. La compañía pasó de la investigación al despliegue comercial en tres años, un cronograma inusualmente rápido para hardware fotónico. El CEO James Regan enmarcó el anuncio como una transición de la prueba física a la prueba comercial. “Hace un año, estábamos probando la física; hoy, estamos probando el negocio,” dijo. “Así es como se ve cuando la red fotónica deja de ser una curiosidad de investigación y comienza a ser la base de cómo se construye una infraestructura de IA seria.” Crucialmente, PRISM está diseñado para ser agnóstico al chip. Funciona en cualquier plataforma de acelerador, no solo en AMD, dando a los operadores de centros de datos un camino hacia un mejor rendimiento de red sin comprometerse a una pila propietaria. El lanzamiento más amplio en 2027 probará si ese agnosticismo se mantiene a gran escala en diferentes configuraciones de hardware. Por qué es importante Se proyecta que el consumo de energía de los centros de datos de IA se duplique para 2030. Solo la refrigeración representa aproximadamente el 40% del uso de energía de un centro de datos. Las redes añaden otra capa de desperdicio: cada interruptor eléctrico que se sitúa entre las GPUs quema energía convirtiendo fotones en electrones y viceversa, calentando la habitación en el proceso. Si PRISM cumple con sus afirmaciones, las implicaciones se extienden más allá del ahorro de energía. Una comunicación más rápida de chip a chip significa un uso más eficiente de la costosa capacidad de GPU, lo que significa un costo de inferencia más bajo por token. En un mercado donde las empresas ya están luchando con facturas de IA descontroladas, una red que hace que el hardware existente produzca más salida sin comprar más hardware tiene un caso comercial obvio. La advertencia es la distancia entre un banco de pruebas financiado por el gobierno y un centro de datos comercial a hiperescala. El despliegue de ARIA de Oriole es real, pero aún no está operando a la escala de un clúster de Meta o Google. El lanzamiento de 2027 determinará si PRISM puede sobrevivir el salto de un laboratorio respaldado por £50 millones de dinero público a las plantas de producción de empresas que gastan cientos de miles de millones en infraestructura de IA. Esa es la brecha donde la mayoría de las startups de hardware fracasan.
Otros artículos
Oriole despliega la primera red de IA puramente fotónica, afirma un recorte del 81%
La startup británica Oriole Networks está implementando la primera red de IA puramente fotónica a gran escala con AMD, afirmando una reducción del 81% en el consumo de energía y un tiempo de inactividad de GPU inferior al 1% en el laboratorio ARIA del Reino Unido.
