Sail recauda $80 millones para hacer que los agentes de IA sean más baratos de operar

      Sail Research ha recaudado 80 millones de dólares para hacer que los agentes de IA sean más baratos de operar. La startup, fundada por exingenieros de Apple y NVIDIA, dice que puede servir los tokens que los agentes consumen a un costo hasta 10 veces menor.

      Los agentes de IA son voraces. Deja uno funcionando durante horas y puede consumir miles de millones de tokens en una sola tarea. Eso se vuelve caro rápidamente, y la factura es lo que detiene a muchos agentes de salir del laboratorio. Una nueva startup llamada Sail Research cree que puede arreglar la economía.

      Sail ha recaudado 80 millones de dólares en financiamiento combinado de semillas y Serie A a una valoración de 450 millones de dólares. Sequoia lideró la ronda de semillas y Kleiner Perkins lideró la Serie A. Redpoint Ventures, Theory Ventures, Vine Ventures, CRV, A* y Abstract Ventures también se unieron.

      La lista de ángeles parece un titular por sí misma. Incluye a John Hennessy, el presidente de Alphabet, Lip-Bu Tan, el director ejecutivo de Intel, y Tri Dao, el científico jefe de Together AI. La empresa de San Francisco también atrajo ángeles de Anthropic, OpenAI, SpaceX y Thinking Machines.

      Construido para agentes, no para personas

      La propuesta de Sail comienza con una observación simple. Los ingenieros construyeron la infraestructura de IA actual para un humano esperando en un aviso. Ese usuario quiere una cosa por encima de todo: velocidad. Un agente es diferente. Funciona por su cuenta durante horas o días, y le importa la escala, la fiabilidad y el costo. El 💜 de la tecnología de la UE Las últimas novedades de la escena tecnológica de la UE, una historia de nuestro sabio fundador Boris, y un arte de IA cuestionable. Es gratis, cada semana, en tu bandeja de entrada. ¡Regístrate ahora!

      Esa brecha es toda la oportunidad. Una persona necesita una respuesta rápida. Un agente necesita sostener miles de llamadas durante un largo período sin que el precio se dispare. Sail argumenta que la pila existente optimiza para lo incorrecto.

      "La mayoría de la infraestructura de inferencia fue diseñada para minimizar la latencia en una sola solicitud, pero esa es la optimización incorrecta para los agentes", dijo Samir Menon, cofundador y director de tecnología. Los agentes, dice, necesitan mantener el rendimiento a través de miles de llamadas concurrentes durante horas. Sail reconstruyó la pila en torno a esa restricción.

      La tesis tiene un nombre. Sail la llama "inteligencia abundante", la idea de que cuanto más cómputo y contexto recibe un agente, mejor es su trabajo. El trabajo es hacer que ese cómputo sea lo suficientemente barato como para entregarlo libremente.

      Cómo afirma reducir el costo

      Sail vende dos cosas. Primero viene el motor de inferencia. Sail lo reconstruyó para el rendimiento, no para la velocidad, para servir a los agentes que gastan miles de millones de tokens en una tarea. La empresa afirma que ofrece hasta 10 veces menor costo por token que sus rivales.

      El segundo es un entorno de pruebas que llama Sailboxes. Estos entornos funcionan durante horas o días, no segundos. Crucialmente, solo cobran por el tiempo que un agente está realmente trabajando, lo que reduce los costos de tiempo muerto que se acumulan en tareas largas.

      Los ahorros provienen de exprimir toda la pila. Sail personaliza motores de inferencia de código abierto para impulsar el rendimiento de GPU hacia la frontera. Distribuye cargas de trabajo entre proveedores para resiliencia. También busca cómputo barato y poco utilizado donde sea que se encuentre.

      Hay un punto de referencia al que señalar. Sail dice que su inferencia superó a BrowseComp-Plus, una evaluación de investigación profunda. Alcanzó una precisión del 90.72% a un costo hasta 10 veces menor que las alternativas líderes. La plataforma también se integra fácilmente. Su API funciona con flujos de trabajo existentes de OpenAI y admite modelos abiertos, incluidos DeepSeek, Gemma, GLM, Kimi y Nemotron.

      Los fundadores y la apuesta

      El equipo proviene del lado del hardware de la IA. El cofundador y director ejecutivo Neil Movva pasó años en NVIDIA empujando el rendimiento de GPU a sus límites, luego trabajó en infraestructura en Apple y Together AI. Menon también proviene de Apple, donde construyó sistemas a gran escala.

      Ese trasfondo da forma al producto. La ventaja de Sail, argumentan los fundadores, proviene de una integración estrecha desde el silicio hasta la API. Controlar todo el camino permite abrir el intercambio entre costo y latencia de una manera que una sola capa no puede.

      "Sail existe para hacer que la inteligencia sea abundante", dijo Movva. "Cada decisión que tomamos, desde el nivel del chip hasta la API, se trata de dar a los equipos los tokens, la escala y el tiempo de ejecución para construir agentes sin límites." El marco es deliberadamente grande. La empresa quiere sonar como la plomería para un futuro mucho más grande.

      Kleiner Perkins está comprando la premisa. "La capa de infraestructura para la era de los agentes es una de las apuestas más importantes en IA en este momento", dijo el socio Aditya Naganath. Elogió la mezcla de experiencia en cómputo y rigor de sistemas de los fundadores, el tipo que proviene de construir en los límites de la escala.

      Un mercado abarrotado y costoso

      El momento encaja en una tendencia clara. La inferencia, el costo de ejecutar realmente un modelo, se ha convertido en la capa más valiosa en la infraestructura de IA. Nebius pagó recientemente 643 millones de dólares por la startup Eigen AI de 20 personas, una señal de cuán desesperadamente la industria quiere personas que puedan hacer que los chips produzcan más tokens por menos.

      El dinero está persiguiendo un problema real. Los precios de los tokens se han desplomado, sin embargo, las facturas de IA empresarial se han triplicado, porque los agentes consumen muchos más tokens por tarea. Reducir el precio por token es una de las pocas palancas que inclinan la curva hacia abajo.

      Sail no está sola en esto. Otros atacan el mismo costo desde diferentes ángulos. Fractile está construyendo chips de inferencia como una alternativa a NVIDIA, mientras que nubes de GPU como RunPod alquilan cómputo en bruto por hora. La capa se está llenando rápidamente.

      El capital respalda eso. El especialista en inferencia Baseten recaudó recientemente 1.5 mil millones de dólares a una valoración tan alta como 13 mil millones de dólares. Contra esos números, la valoración de 450 millones de dólares de Sail parece modesta, lo que le deja mucho espacio para crecer si la tesis se mantiene.

      La pregunta abierta

      El telón de fondo es enorme. Los pronosticadores esperan que el gasto global en IA alcance los 2.5 billones de dólares en 2026, sin embargo, las cargas de trabajo de agentes más ambiciosas siguen fuera del alcance de la mayoría de las empresas. Sail quiere ser la razón por la que eso cambie.

      Ya tiene clientes que pagan a los que señalar. La firma de datos web Parallel, la plataforma de revisión de código Detail.dev y la startup Jack and Jill funcionan con Sail. Detail.dev dice que ha procesado billones de tokens a través de la plataforma y le gusta la economía.

      El riesgo es que la eficiencia es un objetivo en movimiento. Cada rival está persiguiendo el mismo 10x, y los laboratorios de frontera siguen reduciendo sus propios precios. Una ventaja de costo construida sobre una ingeniería inteligente puede erosionarse a medida que todo el campo se vuelve más barato.

      Sail está apostando a que su enfoque de pila completa es más difícil de copiar que un solo truco. Si los agentes realmente se convierten en la principal forma en que se utiliza la IA, la empresa que los haga asequibles para operar podría importar enormemente. Si esa empresa es Sail, a la escala de billones de tokens, es la pregunta que esta ronda deja abierta.

Otros artículos

Microsoft aumenta los precios de Xbox por tercera vez en 13 meses, ya que la escasez de memoria lleva a la Series X a $800. Las consolas Xbox aumentarán entre $100 y $150 el 1 de agosto, llevando el precio de la Series X a $800. Microsoft culpa a los costos de memoria que se han más que duplicado.

Sail recauda $80 millones para hacer que los agentes de IA sean más baratos de operar Sail Research ha recaudado $80 millones, liderado por Sequoia y Kleiner Perkins, para operar agentes de IA a largo plazo a un costo por token hasta 10 veces más bajo.

Netris recauda $15 millones en una ronda de financiación Serie A de a16z para automatizar la red que ralentiza las nubes de GPU. Netris ha recaudado $15 millones de Andreessen Horowitz para escalar su plataforma de automatización de redes, que ahora está activa en más de 35 clústeres de GPU en todo el mundo.

Coval recauda $28 millones para poner a prueba la resistencia de los agentes de voz de IA Coval ha recaudado $28 millones, liderado por Norwest, para simular y probar agentes de voz de IA empresarial antes de que fallen en llamadas reales de clientes.

Google Finance sale de beta con una aplicación dedicada para Android, seguimiento de cartera y breves programados impulsados por IA. Google Finance sale de beta con una nueva aplicación para Android, paneles de cartera, una herramienta de investigación de IA y breves informativos del mercado programados impulsados por Gemini.

Sail recauda $80 millones para hacer que los agentes de IA sean más baratos de operar

Sail Research ha recaudado $80 millones, liderado por Sequoia y Kleiner Perkins, para operar agentes de IA a largo plazo a un costo por token hasta 10 veces menor.