Nebius adquiere Eigen AI, de 20 personas, por $643 millones, ya que la optimización de inferencias se convierte en la capa más valiosa de la infraestructura de IA.

Nebius adquiere Eigen AI, de 20 personas, por $643 millones, ya que la optimización de inferencias se convierte en la capa más valiosa de la infraestructura de IA.

      TL;DRNebius, la neocloud holandesa que se separó de Yandex en 2024, acordó adquirir Eigen AI por $643 millones, valorando la startup de 20 personas, formada por exalumnos del MIT, en aproximadamente $32 millones por empleado. La tecnología de optimización de inferencias de Eigen maximiza los tokens por GPU de Nvidia, la capacidad más valiosa en la infraestructura de IA. El acuerdo fortalece la plataforma de inferencias Token Factory de Nebius a medida que el mercado de neoclouds se expande rápidamente con CoreWeave y FluidStack recaudando miles de millones.

      Nebius Group, la empresa de computación en la nube holandesa que se separó del proveedor de internet ruso Yandex en 2024, ha acordado adquirir Eigen AI por aproximadamente $643 millones en acciones y efectivo. El acuerdo, anunciado el 1 de mayo, es para una startup de 20 personas fundada por exalumnos del HAN Lab del MIT. En un mercado donde las empresas de IA más grandes están valoradas en cientos de miles de millones y las adquisiciones más prominentes involucran a miles de ingenieros, $643 millones por 20 personas requiere una explicación. La explicación es la inferencia. La tecnología de Eigen AI maximiza el número de tokens, las unidades básicas de datos en modelos de lenguaje grandes, que cada chip de Nvidia puede generar al ejecutar modelos de IA. “Esto es como el deporte olímpico del mercado actual: ¿quién puede extraer más tokens por el mismo precio?” dijo Roman Chernin, cofundador y director comercial de Nebius. Los miembros del equipo de Eigen, dijo, son “como corredores olímpicos en esta disciplina.” La disciplina, resulta, vale $32 millones por persona.

      La economía

      El problema más costoso de la industria de la IA no es entrenar modelos. Es ejecutarlos. Entrenar un modelo de frontera es un gasto de capital único, medido en cientos de millones de dólares, que produce un conjunto de pesos. La inferencia, el proceso de ejecutar esos pesos para generar respuestas para los usuarios, es un costo operativo recurrente que se escala con cada consulta, cada llamada a la API y cada token producido. Para las empresas que venden IA como servicio, la inferencia es la línea de costo dominante. Cada punto porcentual de eficiencia ganado en inferencia, cada token adicional extraído del mismo GPU de Nvidia, se traduce directamente en costos más bajos o márgenes más altos. Eigen AI se especializa precisamente en esto: optimizar el rendimiento de modelos de código abierto de OpenAI, Alibaba, Meta y Nvidia para que cada chip produzca más salida por la misma entrada de electricidad y silicio.

      La técnica que hizo que los fundadores de Eigen AI fueran notables en el campo es la cuantización de pesos consciente de la activación, un método para comprimir modelos de IA de formatos numéricos de mayor precisión a formatos de menor precisión sin pérdida significativa en la calidad de salida. El cofundador Wei-Chen Wang recibió el Premio al Mejor Artículo de MLSys 2024 por este trabajo. En la práctica, la cuantización permite que un modelo que normalmente requeriría cuatro GPUs funcione en dos, o permite que un modelo que se ejecuta en una GPU genere tokens el doble de rápido. Para un proveedor de nube como Nebius, que recaudó $700 millones de Nvidia y Accel para ampliar su flota de GPUs, la capacidad de extraer más valor de cada chip cambia la economía unitaria de todo el negocio.

      El adquirente

      El 💜 de la tecnología de la UE Las últimas novedades de la escena tecnológica de la UE, una historia de nuestro sabio fundador Boris, y un arte de IA cuestionable. Es gratis, cada semana, en tu bandeja de entrada. ¡Inscríbete ahora! Nebius ocupa una posición específica en el mercado de infraestructura de IA. Es uno de un grupo de empresas llamadas “neoclouds”, proveedores de nube que alquilan capacidad de computación de IA a empresas en lugar de construir productos de consumo. Los hiperescaladores establecidos, AWS, Microsoft Azure y Google Cloud, dominan el mercado de la nube en general, pero los neoclouds han encontrado un nicho al ofrecer infraestructura optimizada para IA con menores costos generales y un despliegue más rápido. Nebius ha estado triplicando su capacidad de GPU de Nvidia en su centro de datos en Finlandia, desplegando los chips H200 de Nvidia, y lanzó un centro de datos en París como parte de un plan de inversión europeo de $1 mil millones. En noviembre, presentó Token Factory, un producto de inferencia gestionada que compite con startups como Fireworks y Baseten, así como con las propias ofertas de inferencia de los hiperescaladores.

      La adquisición de Eigen AI está destinada a hacer de Token Factory la plataforma de inferencia más eficiente del mercado. Con la capa de optimización de Eigen integrada en Token Factory, Nebius puede ofrecer a los clientes precios más bajos por token o un mayor rendimiento del mismo hardware, una ventaja competitiva en un mercado donde los precios son transparentes y los costos de cambio son bajos. El mercado de neoclouds se está expandiendo rápidamente, con empresas como CoreWeave firmando acuerdos de infraestructura por decenas de miles de millones. FluidStack, otro neocloud, está en conversaciones para recaudar $1 mil millones a una valoración de $18 mil millones. Las dinámicas competitivas son claras: quien pueda ofrecer más tokens por dólar por GPU gana.

      La estrategia

      El acuerdo con Eigen es la segunda adquisición de Nebius en tres meses, tras su compra en febrero de Tavily, una empresa de búsqueda de agentes de IA, por $275 millones. Chernin dijo que la empresa está buscando otras oportunidades de acuerdo. El patrón sugiere una estrategia de adquisición de equipos pequeños y técnicamente excelentes cuyas capacidades llevarían años construir internamente. Eigen AI aporta 20 personas y un stack de optimización de grado de producción. Tavily trajo infraestructura de búsqueda para agentes de IA. Ambas adquisiciones añaden capacidades que mueven a Nebius hacia arriba en la cadena, desde alquilar capacidad de GPU en bruto hacia proporcionar servicios de mayor valor que interactúan directamente con los clientes.

      “No queremos ser la infraestructura y que alguien por encima de nosotros trabaje con los verdaderos clientes,” dijo Chernin. Este es el dilema de neocloud en una frase. Alquilar capacidad de GPU es rentable pero está commoditizado. Los márgenes mejoran a medida que te acercas a la capa de aplicación: desde computación en bruto, hasta inferencia gestionada, hasta servicio de modelos optimizados, hasta pipelines de ajuste fino, hasta puntos finales de grado empresarial. La tecnología de Eigen AI opera en la intersección de la computación y el servicio de modelos, que es precisamente donde se está migrando el valor en la infraestructura de IA. La etiqueta de precio de $643 millones, aproximadamente $32 millones por empleado, refleja un mercado en el que el recurso más escaso no son los chips o el capital, sino las personas que saben cómo hacer que los chips produzcan más tokens por menos dinero. Con la capacidad de los centros de datos en escasez, Nebius está reservando parte de su poder de computación para Token Factory en lugar de venderlo en acuerdos a granel de varios años, cobrando precios premium por contratos de inferencia a corto plazo. La economía solo funciona si cada GPU genera tantos tokens como sea posible. Eso es lo que Nebius acaba de comprar.

Otros artículos

El programa de IA de Meta de $145 mil millones eclipsa las demandas por seguridad infantil que podrían costar más. El programa de IA de Meta de $145 mil millones eclipsa las demandas por seguridad infantil que podrían costar más. Meta perdió su primer juicio por adicción, enfrenta más de 40 demandas de fiscales generales estatales y las prohibiciones se están extendiendo. La llamada de ganancias de Zuckerberg fue sobre IA. Ningún inversor preguntó sobre niños. Meta adquiere Assured Robot Intelligence para construir el Android de los robots humanoides Meta adquiere Assured Robot Intelligence para construir el Android de los robots humanoides Meta compró ARI, una startup de IA en robótica, y la incorporó a Superintelligence Labs. El objetivo: ser la plataforma que necesita cada fabricante de humanoides. El programa de IA de Meta de $145 mil millones eclipsa las demandas por seguridad infantil que podrían costar más. El programa de IA de Meta de $145 mil millones eclipsa las demandas por seguridad infantil que podrían costar más. Meta perdió su primer juicio por adicción, enfrenta más de 40 demandas de fiscales generales estatales y las prohibiciones se están extendiendo. La llamada de ganancias de Zuckerberg fue sobre IA. Ningún inversor preguntó sobre niños. Meta adquiere Assured Robot Intelligence para construir el Android de los robots humanoides Meta adquiere Assured Robot Intelligence para construir el Android de los robots humanoides Meta compró ARI, una startup de IA en robótica, y la incorporó a Superintelligence Labs. El objetivo: ser la plataforma que todos los fabricantes de humanoides necesitan. Founders Fund recauda $6 mil millones después de gastar $4.6 mil millones en menos de un año en Anthropic, Anduril y OpenAI. Founders Fund recauda $6 mil millones después de gastar $4.6 mil millones en menos de un año en Anthropic, Anduril y OpenAI. El fondo de $6 mil millones de Founders Fund reemplaza a un predecesor de $4.6 mil millones gastado en menos de un año. Cheque promedio: $600 millones. Portafolio: Anthropic, Anduril, SpaceX, OpenAI. El Pentágono firma acuerdos clasificados de IA con Nvidia, Microsoft y AWS después de expulsar a Anthropic por límites de seguridad. El Pentágono firma acuerdos clasificados de IA con Nvidia, Microsoft y AWS después de expulsar a Anthropic por límites de seguridad. Siete empresas ahora operan IA en redes clasificadas del Pentágono bajo términos de "uso operativo legal". Anthropic, que se negó a eliminar sus límites de seguridad, fue reemplazada.

Nebius adquiere Eigen AI, de 20 personas, por $643 millones, ya que la optimización de inferencias se convierte en la capa más valiosa de la infraestructura de IA.

Nebius paga $643 millones por Eigen AI, una empresa derivada del MIT de 20 personas que maximiza los tokens por GPU. En la carrera del neocloud, la optimización de la inferencia es la ventaja competitiva.