Sail raccoglie 80 milioni di dollari per rendere più economico il funzionamento degli agenti AI

Sail raccoglie 80 milioni di dollari per rendere più economico il funzionamento degli agenti AI

      Sail Research ha raccolto 80 milioni di dollari per rendere più economico il funzionamento degli agenti AI. La startup, fondata da ex ingegneri di Apple ed ex ingegneri di NVIDIA, afferma di poter servire i token che gli agenti consumano a un costo fino a 10 volte inferiore.

      Gli agenti AI sono affamati. Lasciare uno in funzione per ore può far consumare miliardi di token su un singolo compito. Questo diventa costoso rapidamente, e il costo è ciò che impedisce a molti agenti di lasciare il laboratorio. Una nuova startup chiamata Sail Research pensa di poter risolvere l'economia.

      Sail ha raccolto 80 milioni di dollari in finanziamenti combinati seed e Serie A a una valutazione di 450 milioni di dollari. Sequoia ha guidato il round seed e Kleiner Perkins ha guidato la Serie A. Redpoint Ventures, Theory Ventures, Vine Ventures, CRV, A* e Abstract Ventures hanno anche partecipato.

      La lista degli angel investor sembra un titolo a sé stante. Include John Hennessy, il presidente di Alphabet, Lip-Bu Tan, l'amministratore delegato di Intel, e Tri Dao, il capo scienziato di Together AI. L'azienda di San Francisco ha anche attratto angel investor da Anthropic, OpenAI, SpaceX e Thinking Machines.

      Costruito per agenti, non per persone

      La presentazione di Sail inizia con un'osservazione semplice. Gli ingegneri hanno costruito l'infrastruttura AI di oggi per un umano in attesa a un prompt. Quell'utente desidera una cosa sopra ogni altra: velocità. Un agente è diverso. Lavora da solo per ore o giorni e si preoccupa di scala, affidabilità e costo. Il 💜 della tecnologia UE Le ultime novità dalla scena tecnologica dell'UE, una storia dal nostro saggio fondatore Boris e alcune opere d'arte AI discutibili. È gratuito, ogni settimana, nella tua casella di posta. Iscriviti ora!

      Quella lacuna è l'intera opportunità. Una persona ha bisogno di una risposta rapida. Un agente deve sostenere migliaia di chiamate per un lungo periodo senza che il prezzo salga alle stelle. Sail sostiene che l'attuale stack ottimizza per la cosa sbagliata.

      "La maggior parte dell'infrastruttura di inferenza è stata progettata per minimizzare la latenza su una singola richiesta, ma questa è l'ottimizzazione sbagliata per gli agenti", ha detto Samir Menon, co-fondatore e chief technology officer. Gli agenti, dice, devono mantenere il throughput attraverso migliaia di chiamate concorrenti per ore. Sail ha ricostruito lo stack attorno a quel vincolo.

      La tesi ha un nome. Sail la chiama "intelligenza abbondante", l'idea che più calcolo e contesto un agente riceve, migliore sarà il suo lavoro. Il compito è rendere quel calcolo abbastanza economico da poterlo offrire liberamente.

      Come afferma di ridurre i costi

      Sail vende due cose. Prima arriva il motore di inferenza. Sail lo ha ricostruito per il throughput, non per la velocità, per servire agenti che spendono miliardi di token su un compito. L'azienda afferma di offrire fino a 10 volte un costo per token inferiore rispetto ai concorrenti.

      Il secondo è un sandbox che chiama Sailboxes. Questi ambienti funzionano per ore o giorni, non per secondi. Fondamentale, addebitano solo il tempo in cui un agente sta effettivamente lavorando, il che riduce i costi di inattività che si accumulano su compiti lunghi.

      I risparmi derivano dalla compressione dell'intero stack. Sail personalizza i motori di inferenza open-source per spingere le prestazioni delle GPU verso il limite. Distribuisce i carichi di lavoro tra i fornitori per resilienza. Cerca anche calcolo economico e sottoutilizzato ovunque si trovi.

      C'è un benchmark a cui fare riferimento. Sail afferma che la sua inferenza ha superato BrowseComp-Plus, una valutazione di ricerca approfondita. Ha raggiunto il 90,72% di accuratezza a un costo fino a 10 volte inferiore rispetto alle alternative leader. La piattaforma si integra anche facilmente. La sua API funziona con i flussi di lavoro esistenti di OpenAI e supporta modelli aperti tra cui DeepSeek, Gemma, GLM, Kimi e Nemotron.

      I fondatori e la scommessa

      Il team proviene dal lato hardware dell'AI. Il co-fondatore e amministratore delegato Neil Movva ha trascorso anni in NVIDIA spingendo le prestazioni delle GPU ai suoi limiti, poi ha lavorato sull'infrastruttura in Apple e Together AI. Menon proviene anche da Apple, dove ha costruito sistemi su larga scala.

      Quella formazione plasma il prodotto. Il vantaggio di Sail, sostengono i fondatori, deriva da una stretta integrazione che va dal silicio all'API. Controllare l'intero percorso consente di aprire il compromesso tra costo e latenza in un modo che un singolo strato non può.

      "Sail esiste per rendere l'intelligenza abbondante", ha detto Movva. "Ogni decisione che prendiamo, dal livello del chip all'API, riguarda il dare ai team i token, la scala e il runtime per costruire agenti senza limiti." La cornice è volutamente ampia. L'azienda vuole suonare come un'infrastruttura per un futuro molto più grande.

      Kleiner Perkins sta acquistando il presupposto. "Lo strato di infrastruttura per l'era degli agenti è una delle scommesse più importanti nell'AI in questo momento", ha detto il partner Aditya Naganath. Ha lodato il mix di competenze di calcolo e rigore dei sistemi dei fondatori, il tipo che deriva dalla costruzione ai limiti della scala.

      Un mercato affollato e costoso

      Il tempismo si adatta a una chiara tendenza. L'inferenza, il costo di eseguire effettivamente un modello, è diventato lo strato più prezioso nell'infrastruttura AI. Nebius ha recentemente pagato 643 milioni di dollari per la startup Eigen AI, composta da 20 persone, un segno di quanto l'industria desideri persone in grado di far produrre ai chip più token per meno.

      Il denaro sta inseguendo un problema reale. I prezzi dei token sono crollati, eppure le fatture dell'AI aziendale sono triplicate, perché gli agenti consumano molti più token per compito. Ridurre il prezzo per token è uno dei pochi leve che piega la curva verso il basso.

      Sail non è sola in questo. Altri attaccano lo stesso costo da angolazioni diverse. Fractile sta costruendo chip di inferenza come alternativa a NVIDIA, mentre le nuvole GPU come RunPod affittano calcolo grezzo per ora. Lo strato si sta riempiendo rapidamente.

      Il capitale lo sostiene. Lo specialista in inferenza Baseten ha recentemente raccolto 1,5 miliardi di dollari a una valutazione fino a 13 miliardi di dollari. Rispetto a quei numeri, la valutazione di 450 milioni di dollari di Sail appare modesta, il che le lascia ampio margine di crescita se la tesi si mantiene.

      La domanda aperta

      Lo sfondo è enorme. Gli analisti si aspettano che la spesa globale per l'AI raggiunga i 2,5 trilioni di dollari nel 2026, eppure i carichi di lavoro degli agenti più ambiziosi rimangono fuori portata per la maggior parte delle aziende. Sail vuole essere la ragione per cui questo cambia.

      Ha già clienti paganti a cui fare riferimento. L'azienda di dati web Parallel, la piattaforma di revisione del codice Detail.dev e la startup Jack and Jill funzionano tutte su Sail. Detail.dev afferma di aver spinto trilioni di token attraverso la piattaforma e apprezza l'economia.

      Il rischio è che l'efficienza sia un obiettivo mobile. Ogni rivale sta inseguendo lo stesso 10x, e i laboratori di frontiera continuano a ridurre i propri prezzi. Un vantaggio di costo costruito su ingegneria intelligente può erodere man mano che l'intero campo diventa più economico.

      Sail scommette che il suo approccio full-stack sia più difficile da copiare rispetto a un singolo trucco. Se gli agenti diventano davvero il modo principale in cui viene utilizzata l'AI, l'azienda che li rende accessibili potrebbe avere un'importanza enorme. Se quell'azienda sia Sail, a livello di trilioni di token, è la domanda che questo round lascia aperta.

Altri articoli

Klue afferma che gli hacker che hanno rubato i dati dei suoi clienti li stanno cancellando, ma è emerso un secondo gruppo con richieste di estorsione. Klue afferma che gli hacker che hanno rubato i dati dei suoi clienti li stanno cancellando, ma è emerso un secondo gruppo con richieste di estorsione. Klue afferma che il gruppo di hacker Icarus sta cancellando i dati dei clienti rubati, ma un secondo gruppo non nominato sostiene di avere i dati e sta estorcendo direttamente le vittime. Microsoft aumenta i prezzi di Xbox per la terza volta in 13 mesi mentre la carenza di memoria porta il Series X a 800 dollari Microsoft aumenta i prezzi di Xbox per la terza volta in 13 mesi mentre la carenza di memoria porta il Series X a 800 dollari Le console Xbox aumenteranno di $100 a $150 il 1° agosto, portando il prezzo della Series X a $800. Microsoft attribuisce la colpa ai costi della memoria che sono più che raddoppiati. Coval raccoglie 28 milioni di dollari per testare la resistenza degli agenti vocali AI Coval raccoglie 28 milioni di dollari per testare la resistenza degli agenti vocali AI Coval ha raccolto 28 milioni di dollari, guidati da Norwest, per simulare e testare agenti vocali AI per le imprese prima che falliscano durante le chiamate reali con i clienti. Coval raccoglie 28 milioni di dollari per testare la resistenza degli agenti vocali AI Coval raccoglie 28 milioni di dollari per testare la resistenza degli agenti vocali AI Coval ha raccolto 28 milioni di dollari, guidati da Norwest, per simulare e testare agenti vocali AI per le imprese prima che falliscano durante le chiamate reali con i clienti. L'AI non convenzionale rilascia il suo primo modello, costruito su un'architettura ad oscillatore che potrebbe ridurre il consumo energetico dell'AI di 1000 volte. L'AI non convenzionale rilascia il suo primo modello, costruito su un'architettura ad oscillatore che potrebbe ridurre il consumo energetico dell'AI di 1000 volte. L'AI non convenzionale di Naveen Rao ha rilasciato Un-0, un modello di generazione di immagini che funziona su un'architettura di chip oscillatore simulato che afferma potrebbe ridurre il consumo energetico. Netris raccoglie 15 milioni di dollari in un round di finanziamento di Serie A da a16z per automatizzare il networking che rallenta i cloud GPU. Netris raccoglie 15 milioni di dollari in un round di finanziamento di Serie A da a16z per automatizzare il networking che rallenta i cloud GPU. Netris ha raccolto 15 milioni di dollari da Andreessen Horowitz per scalare la sua piattaforma di automazione della rete, ora attiva in oltre 35 cluster GPU in tutto il mondo.

Sail raccoglie 80 milioni di dollari per rendere più economico il funzionamento degli agenti AI

Sail Research ha raccolto 80 milioni di dollari, guidata da Sequoia e Kleiner Perkins, per gestire agenti AI a lungo termine a un costo per token fino a 10 volte inferiore.