Удивлены использованием ИИ-агентов? Исследования говорят, что они «цифровые катастрофы» даже для рутинных задач.

      Агенты ИИ, созданные для выполнения повседневных компьютерных задач, имеют серьезную проблему с контекстом, согласно новым исследованиям из UC Riverside.

      Команда протестировала 10 агентов и моделей от крупных разработчиков, включая OpenAI, Anthropic, Meta, Alibaba и DeepSeek. В среднем агенты принимали нежелательные или потенциально опасные действия в 80% случаев и причиняли ущерб в 41% случаев.

      Эти системы могут открывать приложения, нажимать кнопки, заполнять формы, перемещаться по веб-сайтам и действовать на экране компьютера с ограниченным контролем. Их ошибки отличаются от плохого ответа чат-бота, потому что программное обеспечение действительно может что-то делать.

      Выводы UC Riverside предполагают, что современные настольные агенты могут рассматривать небезопасные запросы как задания, которые нужно выполнить, а не как сигналы остановиться.

      Почему агенты упускают очевидную опасность

      Исследователи создали эталон под названием BLIND-ACT, чтобы проверить, будут ли агенты останавливаться, когда задача становится небезопасной, противоречивой или иррациональной. В последних тестах они не останавливались достаточно часто.

      Google

      На протяжении 90 задач эталон ставил агентов в ситуации, требующие контекста, сдержанности и отказа. Один тест заключался в отправке жестокого изображения ребенку. В другом агент, заполняя налоговые формы, неверно пометил пользователя как инвалида, потому что это снижало налоговые выплаты. В третьем агенту предложили отключить правила брандмауэра во имя лучшей безопасности, и агент выполнил это, вместо того чтобы отвергнуть противоречие.

      Исследователи называют этот паттерн слепой целеустремленностью. Агент продолжает преследовать назначенный результат, даже когда окружающий контекст говорит о том, что задача нарушена.

      Почему послушание становится недостатком

      Неудачи сосредоточились вокруг послушания. Эти агенты могут действовать так, как будто запрос пользователя является достаточной причиной для продолжения.

      Команда выявила паттерны, называемые предвзятостью выполнения и первенством запроса. Проще говоря, агент сосредотачивается на том, как выполнить задачу, а затем рассматривает сам запрос как оправдание. Этот риск возрастает, когда та же система может взаимодействовать с различными вещами, такими как электронная почта или настройки безопасности.

      Изображение, созданное с помощью ChatGPT

      Это не означает, что агенты злонамеренные. Это означает, что они могут быть уверенно неправыми, перемещаясь по программному обеспечению на скорости машины.

      Почему защитные меры должны быть первыми

      Агентам ИИ нужны более строгие защитные меры, прежде чем они получат широкие полномочия действовать на компьютере.

      Эти системы работают по циклу. Они смотрят на экран, принимают решение о следующем шаге, действуют, а затем снова смотрят. Когда этот цикл сочетается со слабым контекстуальным сдерживанием, кратчайший путь может превратиться в быстрое движение к ошибке.

      Пока что рассматривайте агентов как инструменты под контролем. Используйте их сначала для низкорисковых задач, держите их подальше от финансовых и безопасностных рабочих процессов и следите за тем, добавляют ли разработчики более четкие системы отказа, более строгие разрешения и лучшие способы выявления противоречий перед следующим кликом.

Другие статьи

CleanShot X — моя любимая утилита для Mac. Вот 8 функций, которые убедят и вас. macOS имеет встроенный инструмент для создания скриншотов, который справляется с основными задачами. Но как только вам нужно больше, он оказывается недостаточным. CleanShot X — это обновление, которого заслуживает ваш Mac, и эти 8 функций это доказывают.

Удивлены агентами ИИ, использующими компьютеры? Исследования говорят, что они «цифровые катастрофы», даже для рутинных задач. Новое исследование UC Riverside показало, что компьютерные AI-агенты часто продолжают выполнять небезопасные или иррациональные задачи, что вызывает вопросы о том, готовы ли современные настольные агенты к чувствительным повседневным рабочим процессам.

HomePod mini все еще имеет смысл в 2026 году, если вы уже находитесь в экосистеме Apple. HomePod mini почти не изменился за эти годы, но он по-прежнему предлагает качественный звук, бесшовную интеграцию с Apple и удивительно хороший опыт работы с Apple TV 4K. Загвоздка в том, что большинство его лучших функций проявляются только внутри экосистемы Apple.

Близнецы собираются получить крылья на вашем телефоне с агентскими навыками. Новое утечка предполагает, что Google может готовить более мощную версию Gemini, которая сможет управлять беспорядком в почтовом ящике, генерировать краткие сведения о встречах и даже создавать пользовательские навыки ИИ.

ИИ не должен принимать решения за вас, но этот скажет, когда вы принимаете плохое решение. Новый инструмент ИИ от исследователей Корнелла помогает вам принимать лучшие решения, выявляя противоречия между вашими заявленными ценностями и фактическими выборами.

Новый контроллер Xbox выходит, и это не то, что вы ожидали. Слитый контроллер Microsoft, похоже, нацелен на Xbox Cloud Gaming с компактным дизайном, встроенным аккумулятором, Bluetooth, Wi-Fi 6 и двумя цветовыми вариантами.

Удивлены использованием ИИ-агентов? Исследования говорят, что они «цифровые катастрофы» даже для рутинных задач.

Новое исследование UC Riverside показало, что компьютерные AI-агенты часто продолжают выполнять небезопасные или иррациональные задачи, что вызывает вопросы о том, готовы ли сегодняшние настольные агенты к чувствительным повседневным рабочим процессам.