Los agentes de IA necesitan más que razonamiento: necesitan usar realmente la web.
Una empresa lanza un asistente de servicio al cliente basado en IA. El modelo detrás de él es actual y lo suficientemente capaz para el trabajo. El asistente entra en funcionamiento. Dentro de una semana, los tickets de soporte están empeorando, no mejorando.
El modelo no es el problema. El problema es el propio sitio web de la empresa. La política de devoluciones que el asistente necesita citar está en un PDF. El calculador de envíos al que necesita hacer referencia es un formulario de varios pasos. Las especificaciones del producto que debería extraer están detrás de una interfaz con pestañas que solo se carga después de un clic. Para un visitante humano, el sitio funciona bien. Para la IA que intenta leerlo, la mitad del sitio no existe.
Este es el muro con el que la mayoría de los despliegues de IA agentiva están chocando en este momento, y casi no tiene nada que ver con el modelo.
El informe sobre el Estado de la IA de McKinsey de 2025 encontró que el 23% de las organizaciones están escalando sistemas de IA agentiva en al menos una función empresarial, con otro 39% experimentando. La mayoría de esos despliegues se encontrarán con el mismo muro: una web diseñada para humanos, utilizada por software que necesita algo que los humanos nunca requirieron. El siguiente paso para los agentes de IA no es un razonamiento más inteligente. Es la capacidad de navegar y usar realmente internet en vivo.
Las tres cosas que un agente de IA tiene que hacer en la web
El trabajo se descompone en tres tareas, y las tres tienen que funcionar para que un agente sea útil en producción.
Buscar. El agente necesita encontrar la información correcta. No URLs a una lista de enlaces, sino contenido real que pueda leer y razonar. Si un cliente pregunta a un chatbot de seguros si su póliza cubre un evento específico, el agente necesita mostrar la sección relevante de la póliza, no una página de resultados de búsqueda.
Raspar. Una vez que el agente encuentra la página, necesita leerla de manera clara. La mayoría de los sitios web modernos no facilitan esto. Las páginas se cargan a través de JavaScript que debe ejecutarse primero. El contenido vive dentro de acordeones expandibles, pestañas y secciones que se cargan de forma perezosa. El HTML que el agente recibe a menudo no se parece en nada a lo que un humano ve en su navegador.
Interactuar. Aquí es donde la mayoría de las demostraciones de agentes se desmoronan en producción. Mucha de la información que a los humanos les importa no está en una URL simple. Está detrás de un botón de "cargar más", un cuadro de búsqueda, un formulario de varios pasos, un menú de navegación o un inicio de sesión. Un raspador que solo puede leer páginas estáticas no puede acceder a nada de eso. Un agente que puede interactuar (clicar, navegar, llenar, enviar) sí puede. La diferencia entre los dos determina si la IA puede realmente hacer su trabajo.
De las tres, la interacción es la más nueva y la más difícil. También es donde viven las aplicaciones de agentes más útiles: asistentes de compras que comparan precios entre sitios, herramientas de investigación que extraen datos de paneles interactivos, bots de soporte al cliente que navegan por portales de documentación como lo haría un usuario real.
Firecrawl está construyendo la capa subyacente
Firecrawl es una de las empresas que construyen infraestructura diseñada para soportar las tres funciones. La plataforma se sitúa entre los agentes de IA y la web en vivo, manejando búsqueda, raspado e interacción como capacidades gestionadas detrás de una única API. Su proyecto de código abierto tiene más de 120,000 estrellas en GitHub. Clientes como Lovable, Replit y Zapier lo utilizan en producción. Nexus Venture Partners lideró la Serie A de la empresa de 14.5 millones de dólares en 2025, con el CEO de Shopify, Tobi Lütke, uniéndose como inversor después de usar Firecrawl como cliente.
La propuesta es sencilla: un agente de IA construido sobre Firecrawl no necesita que su equipo de desarrollo escriba código personalizado para cada sitio que toca. Llama a una API, y la plataforma maneja gran parte del trabajo técnico subyacente: renderizando JavaScript, navegando por páginas dinámicas, interactuando con elementos y devolviendo una salida estructurada que los sistemas de IA pueden usar.
“Cada empresa de IA necesitaba datos web limpios y nadie lo estaba resolviendo bien”, dice Eric Ciarla, uno de los cofundadores de Firecrawl. “Así que construimos Firecrawl”.
Ciarla y sus cofundadores se encontraron directamente con el problema mientras construían su empresa anterior, Mendable, una plataforma de búsqueda de IA que fue utilizada por una variedad de organizaciones. El producto de búsqueda funcionaba. La infraestructura que extraía datos del sitio web de cada cliente para alimentarlo no. Cada nueva integración significaba reconstruir un código de extracción frágil que se rompía la próxima vez que cambiaba el sitio del cliente. Mendable no era inusual al chocar con ese muro. Muchas empresas de IA que integran datos web enfrentaron desafíos similares, reconstruyendo repetidamente herramientas internas de extracción.
Cómo la IA se está convirtiendo en la nueva forma en que las personas encuentran cosas
Está ocurriendo un cambio junto al cambio técnico, y cambia las apuestas para las empresas que aún no han pensado en que los agentes de IA lean sus sitios web.
Durante dos décadas, el camino desde “un cliente está buscando algo” a “un cliente encuentra tu negocio” a menudo pasaba por motores de búsqueda tradicionales. Los asistentes de IA son cada vez más donde las personas comienzan cuando quieren una recomendación, una comparación o una respuesta. El asistente de IA se va, extrae información de los sitios web relevantes en nombre de la persona y regresa con una respuesta sintetizada. Si la IA no puede analizar tu sitio, tu negocio no aparece en la respuesta.
Ciarla argumenta que esto cambia completamente cómo las empresas deberían pensar sobre los rastreadores de IA. “Detrás de cada agente de IA hay un humano tratando de encontrar algo”, dice. El marco dominante de la industria ha tratado a los rastreadores de IA como una automatización no deseada: bots a los que defenderse, tráfico que drena recursos del servidor sin enviar visitantes humanos a cambio. Ese marco tenía sentido cuando las únicas cosas que leían sitios web a gran escala eran motores de búsqueda indexando para visitantes humanos más tarde. Tiene menos sentido cuando los agentes de IA son el camino que el humano está utilizando para encontrar.
En la opinión de Ciarla, bloquear a los rastreadores de IA hoy puede ser comparable a limitar la visibilidad en un canal de descubrimiento emergente. Argumenta que hacerlo podría reducir las oportunidades para que las empresas sean encontradas a través de los comportamientos de búsqueda de clientes en evolución.
Lo que hace inusual la posición de Firecrawl en este cambio es que no requiere que las empresas hagan nada. La mayoría de los enfoques para la visibilidad de IA ponen el trabajo en el propietario del sitio: agregar nuevas marcas, exponer nuevos puntos finales, reestructurar páginas, aprender una nueva disciplina de optimización además de la existente de SEO. Firecrawl trabaja desde la dirección opuesta. La plataforma maneja la conversión entre un sitio legible por humanos y datos legibles por máquinas automáticamente, en tiempo real. Un negocio nunca necesita saber que los agentes de IA están leyendo la página. Los agentes obtienen lo que necesitan de todos modos.
La pregunta más grande debajo
A medida que los agentes extraen más información de más sitios, la relación entre los sistemas de IA y las fuentes de las que dependen se convierte en una pregunta real. Un modelo donde la IA extrae valor del contenido web sin que nada fluya de regreso a las personas que lo crearon no es duradero. Los editores están respondiendo a través de demandas y bloqueos de acceso, y los sitios importantes están cerrando cada vez más su contenido de los rastreadores de IA por completo. El ecosistema subyacente no es saludable, y el costo a largo plazo eventualmente recaerá en algún lugar.
En marzo de 2026, Firecrawl se asoció con Wikimedia Enterprise para dirigir todo su tráfico de Wikipedia – 2 a 3 millones de solicitudes por mes – a través de las APIs comerciales de Wikimedia en lugar de continuar raspando páginas de Wikipedia directamente. El acuerdo reemplaza el raspado intensivo en recursos con acceso estructurado y pagado, y ayuda a apoyar a la comunidad de voluntarios que mantiene una de las fuentes de información más citadas en la web abierta.
“Los miembros de la comunidad que escriben y editan estos artículos tienen un inmenso poder en la era de la IA”, dijo Ciarla cuando se anunció la asociación. “Están proporcionando el servicio esencial de definir qué es verdad. Queremos asegurarnos de que nuestra infraestructura apoye su trabajo en lugar de solo consumirlo”.
El acuerdo con Wikimedia es un modelo. Enfoques similares pueden surgir en otras partes de la industria. A medida que los productos de IA pasan de demostraciones a producción a gran escala, las empresas que construyen la infraestructura subyacente están ayudando a dar forma a cómo los sistemas de IA interactúan con la web.
Lo que esto significa si estás prestando atención
Si estás construyendo con IA, la conclusión práctica es simple. El modelo ya no es el diferenciador. Casi todos tienen acceso a los mismos modelos fronterizos, y las brechas entre
Otros artículos
Los agentes de IA necesitan más que razonamiento: necesitan usar realmente la web.
Una empresa lanza un asistente de atención al cliente basado en IA. El modelo detrás de él es actual y lo suficientemente capaz para el trabajo. El asistente se activa. Dentro de una semana, los tickets de soporte están empeorando, no mejorando. El modelo no es el problema. El propio sitio web de la empresa lo es. La política de devoluciones que el asistente necesita citar se encuentra en […]
