Агентам ИИ нужно больше, чем просто рассуждения: им действительно нужно использовать веб.
Компания запускает AI-ассистента для обслуживания клиентов. Модель, стоящая за ним, актуальна и достаточно способна для этой работы. Ассистент начинает работать. В течение недели количество обращений в службу поддержки только увеличивается, а не уменьшается.
Проблема не в модели. Проблема в самом сайте компании. Политика возврата, которую ассистент должен цитировать, находится в PDF-документе. Калькулятор доставки, на который ему нужно ссылаться, представляет собой многоступенчатую форму. Технические характеристики продукта, которые он должен извлекать, находятся за вкладками, которые загружаются только после клика. Для человеческого посетителя сайт работает нормально. Для AI, пытающегося его прочитать, половина сайта не существует.
Это стена, с которой сталкиваются большинство внедрений агентного AI в настоящее время, и это почти не связано с моделью.
Отчет McKinsey о состоянии AI в 2025 году показал, что 23% организаций сейчас масштабируют агентные AI-системы как минимум в одной бизнес-функции, еще 39% экспериментируют. Большинство из этих внедрений столкнется с той же стеной: веб, разработанный для людей, используется программным обеспечением, которому нужно то, что людям никогда не требовалось. Следующий шаг для AI-агентов — это не более умное рассуждение. Это способность фактически ориентироваться и использовать живой интернет.
Три вещи, которые AI-агент должен делать в интернете
Работа делится на три задачи, и все три должны работать, чтобы агент был полезен в производстве.
Поиск. Агент должен находить правильную информацию. Не URL-адреса со списком ссылок, а фактический контент, который он может прочитать и проанализировать. Если клиент спрашивает чат-бота по страхованию, покрывает ли его полис конкретное событие, агент должен предоставить соответствующий раздел полиса, а не страницу с результатами поиска.
Скрейпинг. Как только агент находит страницу, ему нужно прочитать ее корректно. Большинство современных веб-сайтов не делают это легким. Страницы загружаются через JavaScript, который должен сначала выполниться. Контент находится внутри раздвижных аккордеонов, вкладок и секций с ленивой загрузкой. HTML, который получает агент, часто выглядит совершенно иначе, чем то, что видит человек в своем браузере.
Взаимодействие. Здесь большинство демонстраций агентов распадаются в производстве. Многие из сведений, которые интересуют людей, не находятся по простому URL. Они находятся за кнопкой «загрузить еще», поисковой строкой, многоступенчатой формой, навигационным меню или входом в систему. Скрейпер, который может читать только статические страницы, не может получить к ним доступ. Агент, который может взаимодействовать (кликать, навигировать, заполнять, отправлять), может. Разница между ними определяет, может ли AI действительно выполнять свою работу.
Из трех взаимодействие является самым новым и самым сложным. Это также место, где находятся самые полезные приложения агентов: помощники по покупкам, которые сравнивают цены на разных сайтах, инструменты для исследований, которые извлекают данные из интерактивных панелей, боты поддержки клиентов, которые навигируют по порталам документации так, как это сделал бы реальный пользователь.
Firecrawl строит слой под этим
Firecrawl — одна из компаний, создающих инфраструктуру, предназначенную для поддержки всех трех функций. Платформа находится между AI-агентами и живым вебом, обрабатывая поиск, скрейпинг и взаимодействие как управляемые возможности через единый API. Его проект с открытым исходным кодом имеет более 120,000 звезд на GitHub. Клиенты, включая Lovable, Replit и Zapier, используют его в производстве. Nexus Venture Partners возглавил раунд финансирования Series A компании на сумму 14,5 миллиона долларов в 2025 году, а CEO Shopify Тоби Лютке присоединился в качестве инвестора после того, как сначала использовал Firecrawl как клиент.
Предложение простое: AI-агент, построенный на Firecrawl, не нуждается в том, чтобы его команда разработки писала пользовательский код для каждого сайта, с которым он взаимодействует. Он вызывает API, а платформа обрабатывает большую часть основной технической работы: рендеринг JavaScript, навигация по динамическим страницам, взаимодействие с элементами и возврат структурированного вывода, который могут использовать AI-системы.
«Каждой AI-компании нужны чистые веб-данные, и никто не решал эту задачу хорошо», — говорит Эрик Чиарла, один из соучредителей Firecrawl. «Поэтому мы построили Firecrawl».
Чиарла и его соучредители столкнулись с этой проблемой напрямую, создавая свою предыдущую компанию, Mendable, платформу AI-поиска, которая использовалась различными организациями. Продукт поиска работал. Инфраструктура, извлекающая данные с сайта каждого клиента, чтобы их обработать, не работала. Каждая новая интеграция означала восстановление хрупкого кода извлечения, который ломался в следующий раз, когда сайт клиента изменялся. Mendable не была уникальной в том, что столкнулась с этой стеной. Многие AI-компании, интегрирующие веб-данные, сталкивались с аналогичными проблемами, многократно восстанавливая внутренние инструменты извлечения.
Как AI становится новым способом поиска информации
Происходит сдвиг, который происходит параллельно с техническим, и он меняет ставки для бизнеса, который еще не думал о том, что AI-агенты читают их веб-сайты.
На протяжении двух десятилетий путь от «клиент ищет что-то» к «клиент находит ваш бизнес» часто проходил через традиционные поисковые системы. AI-ассистенты становятся все более популярными, когда люди хотят получить рекомендацию, сравнение или ответ. AI-ассистент уходит, извлекает информацию с соответствующих веб-сайтов от имени человека и возвращается с синтезированным ответом. Если AI не смог проанализировать ваш сайт, ваш бизнес не появится в ответе.
Чиарла утверждает, что это меняет то, как бизнес должен думать о AI-скрейперах. «За каждым AI-агентом стоит человек, который пытается что-то найти», — говорит он. Преобладающая рамка в индустрии рассматривала AI-скрейперов как нежелательную автоматизацию: боты, против которых нужно защищаться, трафик, который истощает ресурсы сервера, не отправляя человеческих посетителей в ответ. Эта рамка имела смысл, когда единственными вещами, которые в большом масштабе читали веб-сайты, были поисковые системы, индексирующие для человеческих посетителей позже. Это имеет меньше смысла, когда AI-агенты являются путем, который использует человек для поиска.
С точки зрения Чиарлы, блокировка AI-скрейперов сегодня может быть сопоставима с ограничением видимости на новом канале открытия. Он утверждает, что это может уменьшить возможности для бизнеса быть найденным через развивающееся поведение поиска клиентов.
Что делает позицию Firecrawl в этом сдвиге необычной, так это то, что она не требует от бизнеса ничего делать. Большинство подходов к видимости AI возлагают работу на владельца сайта: добавлять новую разметку, открывать новые конечные точки, реорганизовывать страницы, изучать новую дисциплину оптимизации поверх существующей SEO. Firecrawl работает в противоположном направлении. Платформа автоматически обрабатывает преобразование между читаемым человеком сайтом и машинно-читаемыми данными в реальном времени. Бизнес никогда не должен знать, что AI-агенты читают страницу. Агенты все равно получают то, что им нужно.
Более важный вопрос под поверхностью
По мере того как агенты извлекают больше информации с большего числа сайтов, отношение между AI-системами и источниками, от которых они зависят, становится реальным вопросом. Модель, при которой AI извлекает ценность из веб-контента, не возвращая ничего людям, которые его создали, не устойчива. Издатели сопротивляются через иски и блокировки доступа, а крупные сайты все чаще полностью закрывают свой контент от AI-скрейперов. Основная экосистема не здорова, и долгосрочные затраты в конечном итоге окажутся где-то.
В марте 2026 года Firecrawl сотрудничала с Wikimedia Enterprise, чтобы перенаправить весь свой трафик с Википедии — 2-3 миллиона запросов в месяц — через коммерческие API Wikimedia, а не продолжать скрейпить страницы Википедии напрямую. Это соглашение заменяет ресурсоемкий скрейпинг на платный, структурированный доступ и помогает поддерживать волонтерское сообщество, которое
Другие статьи
Агентам ИИ нужно больше, чем просто рассуждения: им действительно нужно использовать веб.
Компания запускает AI-ассистента для обслуживания клиентов. Модель, стоящая за ним, актуальна и достаточно способна для этой работы. Ассистент начинает работать. В течение недели количество обращений в службу поддержки ухудшается, а не улучшается. Проблема не в модели. Проблема в собственном сайте компании. Политика возврата, которую ассистент должен цитировать, находится в […]
