Как остановить сдерживание ИИ-агентов

      Разработчики агентного ИИ делают большие заявления. Обещание заключается в автономных системах, которые могут делать всё, от бронирования наших рейсов и мониторинга конкурентов в реальном времени до управления целыми циклами закупок, всё это без необходимости, чтобы реальный человек нажимал «подтвердить». И хотя технологии, необходимые для достижения большинства из этих чудес, уже в значительной степени существуют, инфраструктура, необходимая для надежной работы на большом масштабе, всё ещё оставляет желать лучшего.

      Gartner недавно спрогнозировала, что более 40% проектов агентного ИИ будут отменены до конца 2027 года, ссылаясь на растущие затраты, неясную бизнес-ценность и недостаточные меры контроля рисков. Это довольно поразительно, особенно с учетом ожидания, что автономные агенты наконец-то ознаменуют взросление ИИ. И всё же это не должно удивлять никого, кто видел неоспоримые ограничения, которые эти агенты проявляют в реальном мире. Большинство людей предполагают, что основная проблема связана с качеством самих моделей. Хотя это может показаться правдоподобным, это немного не так.

      Почему веб противится агентам

      Подумайте, что на самом деле нужно способному агенту. Доступ к веб-сайту и получение ответа — это только начало, затем ему нужно перевести этот ответ во что-то полезное. И не только это, ему нужно делать это последовательно, в реальном времени и в масштабе, который делает всё это стоящим с самого начала.

      Учитывая текущее состояние веба, это сложная задача. Просто возьмите онлайн-платформы в качестве примера. Нет технической причины, по которой независимый агент не мог бы сравнить разные платформы и сделать выбор, который лучше всего соответствует предпочтениям пользователей.

      Тем не менее, эти же платформы в настоящее время зависят от того, чтобы эта информация не была легко доступна. Чтобы сохранить свои преимущества, они работают над всё более персонализированными результатами, спонсируемыми размещениями и сигналами срочности, чтобы формировать поведение пользователей и склонять чашу весов в свою пользу. Без доступа к соответствующим данным ни один ИИ-агент никогда не сможет выполнять задачи в вебе или автоматизировать выбор лучшего варианта для своих пользователей.

      Результатом этого является веб, который работает достаточно хорошо для общего просмотра, но систематически отговаривает от автоматизированного доступа. Я дам краткий обзор некоторых выводов, которые предоставляют ясную иллюстрацию.

      Oxylabs собирается выпустить Индекс Открытости Веба, который оценивает более 120 стран на основе различных аспектов доступности веба. Результаты показывают:

      Глобальный средний балл за практическую доступность, по сути, насколько хорошо сайт отвечает на стандартные автоматизированные HTTP-запросы, составляет 83.4 из 100.

      Баллы за анти-автоматизированное трение (чем ниже, тем больше трения), такие как CAPTCHA, ограничение частоты, отпечатки пальцев и обнаружение ботов, в среднем составляют 62.8.

      А совместимость структурированных данных, то есть возвращают ли сайты данные в форматах, с которыми машины могут действительно работать, падает ещё ниже до 60.3.

      Эти различия более чем на 20 пунктов отражают структурный разрыв. Сайты, как правило, отвечают на запросы на автоматизированный доступ. В то же время ограничения повсюду, и данные часто возвращаются в недружественных к машинам форматах. Агенты, которые зависят от надежной, своевременной, структурированной информации, часто попадают в этот разрыв.

      Недостаток данных для ИИ

      Внутри организаций агенты сталкиваются с другой, но связанной проблемой: нехваткой пригодных данных. Другими словами, соответствующие данные существуют, но не были очищены, помечены или структурированы таким образом, чтобы система ИИ могла их понять.

      То же самое касается приложений, ориентированных на клиентов, построенных на агентных системах. Без данных веба в реальном времени, текущих цен, живого инвентаря, обновлений политик, рыночных движений, у них нет другого выбора, кроме как рассуждать на основе замороженной версии мира.

      Задержка — это ещё одна проблема. Проще говоря, агент, который в конечном итоге возвращает правильный ответ, гораздо менее полезен, чем тот, который возвращает его достаточно быстро, чтобы на него можно было действовать. При работе с автономными системами допустимость задержки ещё ниже.

      В каждом случае ограничение одно и то же: агентам нужен контекст, которому они могут доверять, а они его не получают, ни из своих собственных организационных данных, ни из веба.

      Решение проблемы, которая уже была решена

      Легко забыть, но это на самом деле не первый случай, когда объем информации затмевает нашу способность её обрабатывать. Ранний веб здесь особенно поучителен. Он уже содержал так много знаний, но не мог быть полезным в своём сыром состоянии. Что изменило ситуацию тогда, так это инфраструктура, построенная для масштабирования. А именно, веб-краулеры были развернуты для индексации страниц, скрейперы использовались для сравнения цен в интернете, а системы мониторинга были внедрены для отслеживания мошеннической рекламы и подделки брендов на тысячах доменов. Все эти инновации требуют способности надежно собирать публичные данные веба и в большом масштабе.

      Более недавний пример приходит от наших партнеров по проекту 4β Debunk.org. Эта некоммерческая организация, борющаяся с онлайн-дезинформацией и мошенничеством, провела расследование, которое выявило крупномасштабную многоязычную мошенническую операцию, нацеленную на бывших жертв мошенничества. Расследование выявило более 50,000 объявлений, 459 доменов и более 1,100 связанных веб-страниц с предполагаемым охватом 52 миллиона человек по всей Европе. Такой охват требует систематического, автоматизированного сбора данных в большом масштабе.

      Агентному ИИ нужна инфраструктура такого же рода, только с ещё более высокими требованиями, потому что агенты делают с данными больше, чем любое предыдущее приложение. Им нужна информация, которая структурирована, актуальна, полна и возвращается достаточно быстро, чтобы поддерживать действия в реальном времени.

      Три «C» надежной инфраструктуры агента

      Как уже упоминалось, всё это вряд ли произойдёт органически. Для платформ открытие для беспрепятственного автоматизированного доступа означает уступку контроля над открытием, рейтингом и отношениями с клиентами. Хотя это полезно для потребителя и предполагает пересмотр бизнес-моделей соответственно, это также угроза краткосрочным доходам.

      Инфраструктура, которая делает агентные системы надежными, должна быть построена независимо. Три требования, или три «C», выделяются:

      Последовательность: агенты, которые сталкиваются с ненадежными источниками данных, производят ненадежное поведение, а ненадежное поведение — это самый быстрый путь к отмене проектов.

      Актуальность: доступ в реальном времени к ценам, инвентарю, доступности и политике — это то, что отделяет агента, рассуждающего на основе текущих фактов, от агента, рассуждающего на основе устаревших предположений; в большинстве коммерческих контекстов последние создают больше проблем, чем решают.

      Соответствие: доступ, построенный вне справедливых стандартов, как правило, вызывает контрмеры, которые повышают барьеры для всех автоматизированных систем, поэтому любая инфраструктура, которую стоит строить, должна быть устойчивой, не только технически, но и на практике.

      Веб не был разработан для агентов. Внутри организаций контекст, который нужен агентам, часто недоступен для них или даже не готов. Это проблемы качества данных, которые можно решить, и проблемы инфраструктуры, которые мы активно решаем. Наконец, то, что нам как обществу действительно нужно, — это решить, готовы ли мы приветствовать ИИ-агентов или хотим продолжать их сдерживать.

Другие статьи

Приложение Hulu на грани закрытия, и вы скоро можете увидеть его каталог на Disney+. Сообщается, что Disney работает над тем, чтобы сделать отдельное приложение Hulu устаревшим, перемещая больше контента Hulu, профили, историю просмотров, функции Live TV и функциональность DVR в Disney+.

Фонд Норвегии в размере 2,3 трлн долларов поддерживает обзор прав человека в Palantir Управление инвестициями Норвежского банка проголосует за предложения акционеров по соблюдению прав человека в Palantir перед его годовым собранием акционеров 3 июня.

Браузер Chrome получает улучшение безопасности, которое вы не увидите, но это хорошо иметь. DBSC теперь по умолчанию активирован в Chrome на Windows, связывая ваши куки сессии входа в систему с вашим конкретным устройством, так что украденные куки становятся бесполезными для злоумышленников.

Фонд Норвегии в размере 2,3 трлн долларов поддерживает обзор прав человека в Palantir Инвестиционное управление Норвежского банка проголосует за предложения акционеров по соблюдению прав человека в Palantir перед его годовщиной 3 июня.

Dell растет на фоне спроса на серверы с ИИ на базе Nvidia, так как повышает свой прогноз Акции Dell выросли после рекордных результатов за первый квартал и повышения прогноза на весь год, так как резерв заказов на серверы с ИИ на сумму 51,3 миллиарда долларов сигнализирует о продолжающемся росте спроса на оборудование Nvidia.

Аполлон и Блэкстоун обсуждают сделку по долговым обязательствам на сумму 36 миллиардов долларов для покупки Anthropic и её активов. Аполлон и Блэкстоун организуют финансирование в размере 36 миллиардов долларов для покупки TPU Google и их аренды Anthropic, при этом Broadcom обеспечивает старший долг.

Как остановить сдерживание ИИ-агентов

COO Oxylabs Юрас Юрсенас утверждает, что настоящим узким местом для агентного ИИ является не качество модели, а веб, созданный для сопротивления автоматизированному доступу, и корпоративные данные, которые не готовы для агентов.