Агентам ИИ нужно больше, чем просто рассуждения: им нужно на самом деле использовать веб.

      Компания запускает AI-ассистента для обслуживания клиентов. Модель, стоящая за ним, актуальна и достаточно способна для этой работы. Ассистент начинает свою работу. В течение недели количество обращений в службу поддержки только увеличивается, а не уменьшается.

      Проблема не в модели. Проблема в самом сайте компании. Политика возврата, которую ассистент должен цитировать, находится в PDF-файле. Калькулятор доставки, на который ему нужно ссылаться, представляет собой многошаговую форму. Спецификации продукта, которые он должен извлекать, находятся за вкладками, которые загружаются только после клика. Для человеческого посетителя сайт работает нормально. Для AI, пытающегося его прочитать, половина сайта не существует.

      Это стена, с которой сталкиваются большинство внедрений агентного AI в настоящее время, и это почти не связано с моделью.

      Отчет McKinsey о состоянии AI в 2025 году показал, что 23% организаций сейчас масштабируют агентные AI-системы как минимум в одной бизнес-функции, еще 39% экспериментируют. Большинство из этих внедрений столкнется с той же стеной: веб-сайт, разработанный для людей, используется программным обеспечением, которому нужно то, что людям никогда не требовалось. Следующий шаг для AI-агентов — это не более умное рассуждение. Это способность фактически ориентироваться и использовать живой интернет.

      Три вещи, которые AI-агент должен делать в интернете

      Работа делится на три задачи, и все три должны работать, чтобы агент был полезен в производстве.

      Поиск. Агент должен найти нужную информацию. Не URL-адреса со списком ссылок, а фактический контент, который он может читать и анализировать. Если клиент спрашивает чат-бота по страхованию, покрывает ли его полис конкретное событие, агент должен предоставить соответствующий раздел полиса, а не страницу с результатами поиска.

      Скрейпинг. Как только агент находит страницу, ему нужно прочитать ее корректно. Большинство современных веб-сайтов не делают это легким. Страницы загружаются через JavaScript, который должен сначала выполниться. Контент находится внутри расширяемых аккордеонов, вкладок и секций с ленивой загрузкой. HTML, который получает агент, часто выглядит совершенно иначе, чем то, что видит человек в своем браузере.

      Взаимодействие. Здесь большинство демонстраций агентов разваливаются в производстве. Многие из сведений, которые интересуют людей, не находятся по простому URL. Они находятся за кнопкой «загрузить больше», в поисковом окне, многошаговой форме, навигационном меню или в системе входа. Скрейпер, который может читать только статические страницы, не может получить к ним доступ. Агент, который может взаимодействовать (кликать, навигировать, заполнять, отправлять), может. Разница между ними определяет, может ли AI фактически выполнять свою работу.

      Из трех взаимодействие является самым новым и самым сложным. Это также место, где находятся самые полезные приложения агентов: помощники по покупкам, которые сравнивают цены на разных сайтах, инструменты для исследований, которые извлекают данные из интерактивных панелей, боты поддержки клиентов, которые навигируют по порталам документации так, как это сделал бы реальный пользователь.

      Firecrawl создает слой под этим

      Firecrawl — одна из компаний, создающих инфраструктуру, предназначенную для поддержки всех трех функций. Платформа находится между AI-агентами и живым интернетом, обрабатывая поиск, скрейпинг и взаимодействие как управляемые возможности через единый API. Его проект с открытым исходным кодом имеет более 120 000 звезд на GitHub. Клиенты, включая Lovable, Replit и Zapier, используют его в производстве. Nexus Venture Partners возглавил раунд финансирования Series A компании на сумму 14,5 миллиона долларов в 2025 году, а CEO Shopify Тоби Лютке присоединился в качестве инвестора после того, как впервые использовал Firecrawl в качестве клиента.

      Предложение простое: AI-агент, построенный на Firecrawl, не нуждается в своей команде разработчиков, чтобы писать пользовательский код для каждого сайта, с которым он взаимодействует. Он вызывает API, а платформа обрабатывает большую часть основной технической работы: рендеринг JavaScript, навигация по динамическим страницам, взаимодействие с элементами и возврат структурированного вывода, который могут использовать AI-системы.

      «Каждой AI-компании нужны чистые веб-данные, и никто не решал эту задачу хорошо», — говорит Эрик Чиарла, один из соучредителей Firecrawl. «Поэтому мы создали Firecrawl».

      Чиарла и его соучредители столкнулись с этой проблемой напрямую, создавая свою предыдущую компанию, Mendable, платформу AI-поиска, которая использовалась различными организациями. Продукт поиска работал. Инфраструктура, извлекающая данные с веб-сайта каждого клиента для его питания, не работала. Каждая новая интеграция означала восстановление хрупкого кода извлечения, который ломался в следующий раз, когда сайт клиента изменялся. Mendable не была уникальной в том, что столкнулась с этой стеной. Многие AI-компании, интегрирующие веб-данные, сталкивались с аналогичными проблемами, многократно восстанавливая внутренние инструменты извлечения.

      Как AI становится новым способом поиска информации

      Происходит сдвиг, который происходит параллельно с техническим, и он меняет ставки для бизнеса, который еще не думал о том, что AI-агенты читают их веб-сайты.

      На протяжении двух десятилетий путь от «клиент ищет что-то» до «клиент находит ваш бизнес» часто проходил через традиционные поисковые системы. AI-ассистенты становятся все более популярными, когда люди хотят получить рекомендацию, сравнение или ответ. AI-ассистент уходит, извлекает информацию с соответствующих веб-сайтов от имени человека и возвращается с синтезированным ответом. Если AI не может разобрать ваш сайт, ваш бизнес не появится в ответе.

      Чиарла утверждает, что это меняет то, как бизнес должен думать о AI-скрейперах. «За каждым AI-агентом стоит человек, пытающийся что-то найти», — говорит он. Доминирующая индустриальная рамка рассматривала AI-скрейперов как нежелательную автоматизацию: боты, против которых нужно защищаться, трафик, который истощает ресурсы сервера, не отправляя человеческих посетителей в ответ. Эта рамка имела смысл, когда единственными вещами, читающими веб-сайты в больших масштабах, были поисковые системы, индексирующие для человеческих посетителей позже. Это имеет меньше смысла, когда AI-агенты являются путем, который использует человек для поиска.

      С точки зрения Чиарлы, блокировка AI-скрейперов сегодня может быть сопоставима с ограничением видимости на новом канале открытия. Он утверждает, что это может уменьшить возможности для бизнеса быть найденным через развивающееся поведение поиска клиентов.

      Что делает позицию Firecrawl в этом сдвиге необычной, так это то, что она не требует от бизнеса ничего делать. Большинство подходов к видимости AI возлагают работу на владельца сайта: добавлять новый разметку, открывать новые конечные точки, реорганизовывать страницы, изучать новую дисциплину оптимизации поверх существующей SEO. Firecrawl работает в противоположном направлении. Платформа автоматически обрабатывает преобразование между читаемым человеком сайтом и машинно-читаемыми данными в реальном времени. Бизнес никогда не должен знать, что AI-агенты читают страницу. Агенты все равно получают то, что им нужно.

      Более важный вопрос под поверхностью

      По мере того как агенты извлекают больше информации с большего количества сайтов, отношения между AI-системами и источниками, от которых они зависят, становятся реальным вопросом. Модель, при которой AI извлекает ценность из веб-контента, не возвращая ничего людям, которые его создали, не является устойчивой. Издатели сопротивляются через иски и блокировки доступа, а крупные сайты все чаще полностью закрывают свой контент от AI-скрейперов. Основная экосистема нездорова, и долгосрочные затраты в конечном итоге окажутся где-то.

      В марте 2026 года Firecrawl сотрудничала с Wikimedia Enterprise, чтобы направить весь свой трафик с Википедии — 2-3 миллиона запросов в месяц — через коммерческие API Wikimedia, а не продолжать скрейпинг страниц Википедии напрямую. Это соглашение заменяет ресурсоемкий скрейпинг на платный, структурированный доступ и помогает поддерживать волонтерское сообщество, которое поддерживает один из самых цитируемых источников информации

Другие статьи

Asus запрашивает $4,799 за игровой ноутбук с RTX 5080, который стоит дороже, чем модель RTX 5090 прошлого года. Asus представила ROG Zephyrus G16 2026 года с RTX 5080 по цене 4,799 долларов. Модель 2025 года с более быстрой RTX 5090 и 64 ГБ ОЗУ продается на 200 долларов дешевле.

Asus запрашивает $4,799 за игровой ноутбук RTX 5080, который стоит больше, чем модель RTX 5090 прошлого года. Asus представила ROG Zephyrus G16 2026 года с RTX 5080 по цене 4,799 долларов. Модель 2025 года с более быстрой RTX 5090 и 64 ГБ оперативной памяти продается на 200 долларов дешевле.

Норвегия запрещает генеративный ИИ в начальных школах, начиная с этой осени. Норвегия запретит детям в возрасте от 6 до 13 лет использовать генеративные инструменты ИИ в школе с конца августа. Подростки 14-16 лет смогут использовать их только под наблюдением учителя.

Этот монструозный игровой ноутбук ASUS стоит столько же, сколько три новых MacBook Pro. Asus ROG Strix SCAR 18 2026 теперь доступен по всему миру с передовым оборудованием и высокой ценой, которая делает MacBook Pro дешевыми.

Это бесплатное приложение придаёт вашим фотографиям культовый вид камеры Game Boy, без необходимости в картридже. Новый Flashback приложение от Epilogue воссоздает зернистый, низкокачественный стиль фотографий Game Boy Camera с помощью камеры вашего телефона.

Лауреат Нобелевской премии Джон Джампер покидает Google DeepMind и переходит в Anthropic после почти девяти лет. Джон Джампер, который выиграл Нобелевскую премию по химии 2024 года за AlphaFold, покидает Google DeepMind, чтобы присоединиться к Anthropic, на следующий день после того, как Шазир ушел в OpenAI.

Агентам ИИ нужно больше, чем просто рассуждения: им нужно на самом деле использовать веб.

Компания запускает AI-ассистента для обслуживания клиентов. Модель, стоящая за ним, актуальна и достаточно способна для этой работы. Ассистент начинает работать. В течение недели количество обращений в службу поддержки ухудшается, а не улучшается. Проблема не в модели. Проблема в собственном сайте компании. Политика возврата, которую ассистент должен цитировать, находится в […]