Foxconn e Intel se unen a SambaNova para construir infraestructura de IA a escala de rack
La línea más trascendental en el anuncio de Intel en Computex no trató sobre un chip. Se trató de una proporción. A medida que las cargas de trabajo de IA pasan del entrenamiento a la inferencia, argumentó la compañía, el arreglo de larga data de cuatro GPUs por cada CPU colapsa hacia algo más cercano a uno a uno, y el procesador que Intel realmente vende bien se mueve de nuevo hacia el centro del centro de datos.
Esa es la apuesta detrás de la asociación revelada en Taipéi el 2 de junio. Intel, SambaNova y Foxconn dijeron que tienen la intención de construir infraestructura de IA a escala de rack para centros de datos, hiperescalas y lo que Intel llama implementaciones de centros de inteligencia, todo construido sobre procesadores Intel Xeon.
Las empresas mostraron racks listos para producción que emparejan chips Xeon con las Unidades de Flujo de Datos Reconfigurables SN-50 de SambaNova, una combinación presentada en función del rendimiento de inferencia por vatio y por dólar en lugar de la potencia bruta de entrenamiento.
El papel de Foxconn es la capa de integración. El mayor fabricante de electrónica del mundo proporcionará integración de sistemas para la plataforma a escala de rack y planea construir una variante densa en CPU para cargas de trabajo que no necesitan aceleración adicional, incluyendo inferencia optimizada en costos, procesamiento de datos e IA híbrida.
Las dos compañías también dijeron que explorarían la colaboración en servicios de diseño y desarrollo de silicio personalizado, la parte más abierta del anuncio y la que Intel más querrá convertir en algo concreto.
El director ejecutivo de Intel, Lip-Bu Tan, enmarcó el momento en términos generacionales, citando “el auge de la inferencia, la IA agente y la IA física” y las cinco décadas de Intel construyendo tecnología fundamental junto a socios en Taiwán.
El caso analítico se encontraba debajo de la retórica. Ben Bajarin, principal de Creative Strategies, citado por Intel, expuso el cambio de manera clara: donde la era de entrenamiento funcionaba aproximadamente con una CPU por cada cuatro GPUs, la inferencia agente lo mueve a una CPU por una GPU o menos.
Foxconn fue un nombre en una lista más larga. Intel también detalló colaboraciones ampliadas o nuevas con Siemens, Hitachi, Echo Neurotechnologies y Greenstone Biosciences, cada una dirigida a silicio específico de la industria.
Por separado, una nueva nube de inferencia empresarial llamada Vector Core Compute, formada por Vista Equity Partners y Cambium Capital, demostró un sistema de inferencia completamente desagregado que ejecuta Xeon para orquestación, RDUs de SambaNova para decodificación y GPUs Nvidia Blackwell para prellenado, con Together.ai como su primer cliente comercial.
Sustentando la historia de los racks está el nuevo procesador Xeon 6+ de Intel, su primera CPU de centro de datos construida en el proceso 18A. Intel dijo que un solo rack refrigerado por líquido puede entregar 36,864 núcleos en 32U de espacio a aproximadamente 100 kilovatios, una cifra de densidad dirigida directamente a los operadores que intentan alojar agentes sin rediseñar sus instalaciones.
Lo que el anuncio no incluyó fue una cifra en dólares, una participación en capital o un compromiso de volumen por parte de Foxconn. Es una declaración de intención entre un fabricante de chips que intenta recuperar relevancia en IA, un fabricante por contrato con la escala para construir lo que el mercado ordene, y una startup de chips de flujo de datos apostando a que la economía de la inferencia recompensará algo diferente a la GPU incumbente. Si la proporción uno a uno se mantiene es la pregunta sobre la que descansa todo el arreglo. Los racks son reales. La tesis aún se está probando.
Otros artículos
Foxconn e Intel se unen a SambaNova para construir infraestructura de IA a escala de rack
Intel, SambaNova y Foxconn construirán infraestructura de IA a escala de rack en Xeon, apostando a que la inferencia devolverá la CPU al centro del centro de datos.
