Gli agenti AI hanno bisogno di più della semplice ragione: devono effettivamente utilizzare il web.
Un'azienda lancia un assistente clienti AI. Il modello alla base è attuale e sufficientemente capace per il lavoro. L'assistente va online. Entro una settimana, i ticket di supporto stanno peggiorando, non migliorando.
Il modello non è il problema. È il sito web dell'azienda a esserlo. La politica di reso che l'assistente deve citare si trova in un PDF. Il calcolatore di spedizione a cui deve fare riferimento è un modulo a più passaggi. Le specifiche del prodotto che dovrebbe estrarre si trovano dietro un'interfaccia a schede che si carica solo dopo un clic. Per un visitatore umano, il sito funziona bene. Per l'AI che cerca di leggerlo, metà del sito non esiste.
Questo è il muro contro cui la maggior parte delle implementazioni di AI agentiche sta urtando in questo momento, e ha quasi nulla a che fare con il modello.
Il rapporto sullo stato dell'AI di McKinsey del 2025 ha rilevato che il 23% delle organizzazioni sta ora scalando sistemi di AI agentici in almeno una funzione aziendale, con un ulteriore 39% che sta sperimentando. La maggior parte di queste implementazioni si scontrerà con lo stesso muro: un web progettato per gli esseri umani, utilizzato da software che ha bisogno di qualcosa che gli esseri umani non hanno mai richiesto. Il prossimo passo per gli agenti AI non è un ragionamento più intelligente. È la capacità di navigare e utilizzare effettivamente internet in tempo reale.
Le tre cose che un agente AI deve fare sul web
Il lavoro si suddivide in tre compiti, e tutti e tre devono funzionare affinché un agente sia utile in produzione.
Cercare. L'agente deve trovare le informazioni giuste. Non URL a un elenco di link, ma contenuti reali che può leggere e ragionare. Se un cliente chiede a un chatbot assicurativo se la propria polizza copre un evento specifico, l'agente deve estrarre la sezione pertinente della polizza, non una pagina di risultati di ricerca.
Raccogliere. Una volta che l'agente trova la pagina, deve leggerla chiaramente. La maggior parte dei siti web moderni non rende questo facile. Le pagine si caricano tramite JavaScript che deve essere eseguito prima. I contenuti si trovano all'interno di accordioni espandibili, schede e sezioni caricate in modo lazy. L'HTML che l'agente riceve spesso non assomiglia a ciò che un umano vede nel proprio browser.
Interagire. Questo è il punto in cui la maggior parte delle dimostrazioni di agenti fallisce in produzione. Molte delle informazioni che interessano agli esseri umani non si trovano su un semplice URL. Sono dietro un pulsante "carica di più", una casella di ricerca, un modulo a più passaggi, un menu di navigazione o un login. Un scraper che può solo leggere pagine statiche non può raggiungere nulla di tutto ciò. Un agente che può interagire (cliccare, navigare, compilare, inviare) può farlo. La differenza tra i due determina se l'AI può effettivamente svolgere il proprio lavoro.
Tra i tre, l'interazione è la più recente e la più difficile. È anche dove si trovano le applicazioni più utili per gli agenti: assistenti per lo shopping che confrontano i prezzi tra i siti, strumenti di ricerca che estraggono dati da dashboard interattive, bot di supporto clienti che navigano nei portali di documentazione come farebbe un vero utente.
Firecrawl sta costruendo il livello sottostante
Firecrawl è una delle aziende che costruisce infrastrutture progettate per supportare tutte e tre le funzioni. La piattaforma si colloca tra gli agenti AI e il web in tempo reale, gestendo ricerca, scraping e interazione come capacità gestite dietro un'unica API. Il suo progetto open-source ha più di 120.000 stelle su GitHub. Clienti tra cui Lovable, Replit e Zapier lo utilizzano in produzione. Nexus Venture Partners ha guidato il finanziamento di 14,5 milioni di dollari nella Serie A dell'azienda nel 2025, con il CEO di Shopify Tobi Lütke che si è unito come investitore dopo aver utilizzato Firecrawl come cliente.
La proposta è semplice: un agente AI costruito su Firecrawl non ha bisogno che il suo team di sviluppo scriva codice personalizzato per ogni sito che tocca. Chiama un'API, e la piattaforma gestisce gran parte del lavoro tecnico sottostante: rendering di JavaScript, navigazione di pagine dinamiche, interazione con elementi e restituzione di output strutturati che i sistemi AI possono utilizzare.
“Ogni azienda AI aveva bisogno di dati web puliti e nessuno lo stava risolvendo bene,” dice Eric Ciarla, uno dei cofondatori di Firecrawl. “Quindi abbiamo costruito Firecrawl.”
Ciarla e i suoi cofondatori si sono imbattuti direttamente nel problema mentre costruivano la loro azienda precedente, Mendable, una piattaforma di ricerca AI utilizzata da una serie di organizzazioni. Il prodotto di ricerca funzionava. L'infrastruttura che estraeva dati dal sito web di ciascun cliente per alimentarlo non funzionava. Ogni nuova integrazione significava ricostruire codice di estrazione fragile che si rompeva la volta successiva che il sito del cliente cambiava. Mendable non era insolito nell'imbattersi in quel muro. Molte aziende AI che integrano dati web affrontano sfide simili, ricostruendo ripetutamente strumenti di estrazione interni.
Come l'AI sta diventando il nuovo modo in cui le persone trovano le cose
C'è un cambiamento che sta avvenendo insieme a quello tecnico, e cambia le scommesse per le aziende che non hanno ancora pensato agli agenti AI che leggono i loro siti web.
Per due decenni, il percorso da “un cliente sta cercando qualcosa” a “un cliente trova la tua azienda” spesso passava attraverso i motori di ricerca tradizionali. Gli assistenti AI sono sempre più il punto di partenza per le persone quando vogliono una raccomandazione, un confronto o una risposta. L'assistente AI si attiva, estrae informazioni dai siti web pertinenti per conto della persona e torna con una risposta sintetizzata. Se l'AI non può interpretare il tuo sito, la tua azienda non appare nella risposta.
Ciarla sostiene che questo cambia completamente il modo in cui le aziende dovrebbero pensare ai crawler AI. “Dietro ogni agente AI c'è un umano che cerca qualcosa,” dice. Il quadro dominante dell'industria ha trattato i crawler AI come automazione indesiderata: bot da difendere, traffico che prosciuga le risorse del server senza inviare visitatori umani in cambio. Quel quadro aveva senso quando le uniche cose che leggevano i siti web su larga scala erano i motori di ricerca che indicizzavano per i visitatori umani in seguito. Ha meno senso quando gli agenti AI sono il percorso che l'umano sta utilizzando per trovare.
Nella visione di Ciarla, bloccare i crawler AI oggi potrebbe essere paragonabile a limitare la visibilità su un canale di scoperta emergente. Sostiene che farlo potrebbe ridurre le opportunità per le aziende di essere trovate attraverso comportamenti di ricerca dei clienti in evoluzione.
Ciò che rende la posizione di Firecrawl in questo cambiamento insolita è che non richiede alle aziende di fare nulla. La maggior parte degli approcci alla visibilità AI pone il lavoro sul proprietario del sito: aggiungere nuovi markup, esporre nuovi endpoint, ristrutturare le pagine, apprendere una nuova disciplina di ottimizzazione oltre a quella SEO esistente. Firecrawl lavora nella direzione opposta. La piattaforma gestisce automaticamente la conversione tra il sito leggibile dagli esseri umani e i dati leggibili dalle macchine, in tempo reale. Un'azienda non ha mai bisogno di sapere che gli agenti AI stanno leggendo la pagina. Gli agenti ottengono comunque ciò di cui hanno bisogno.
La domanda più grande sottostante
Man mano che gli agenti estraggono più informazioni da più siti, la relazione tra i sistemi AI e le fonti da cui dipendono diventa una vera questione. Un modello in cui l'AI estrae valore dai contenuti web senza che nulla fluisca indietro verso le persone che li hanno creati non è durevole. Gli editori stanno opponendo resistenza attraverso cause legali e blocchi di accesso, e i siti principali stanno sempre più isolando i loro contenuti dai crawler AI. L'ecosistema sottostante non è sano, e il costo a lungo termine si farà sentire da qualche parte.
Nel marzo 2026, Firecrawl ha collaborato con Wikimedia Enterprise per instradare tutto il suo traffico di Wikipedia – 2-3 milioni di richieste al mese – attraverso le API commerciali di Wikimedia piuttosto che continuare a estrarre direttamente le pagine di Wikipedia. L'accordo sostituisce lo scraping intensivo di risorse con
Altri articoli
Gli agenti AI hanno bisogno di più della semplice ragione: devono effettivamente utilizzare il web.
Un'azienda lancia un assistente clienti AI. Il modello alla base è attuale e sufficientemente capace per il lavoro. L'assistente diventa operativo. Entro una settimana, i ticket di supporto stanno peggiorando, non migliorando. Il modello non è il problema. È il sito web dell'azienda. La politica di reso che l'assistente deve citare si trova in […]
