Возможно, ваш любимый чат-бот с искусственным интеллектом говорит неправду

Возможно, ваш любимый чат-бот с искусственным интеллектом говорит неправду

      Поисковые инструменты с искусственным интеллектом становятся все более популярными, и каждый четвертый американец сообщает, что использует искусственный интеллект вместо традиционных поисковых систем. Однако, вот важное замечание: эти чат-боты с искусственным интеллектом не всегда предоставляют точную информацию.

      Недавнее исследование Центра цифровой журналистики Tow, опубликованное Columbia Journalism Review, показывает, что чат-ботам трудно находить и точно цитировать новостной контент. Еще большее беспокойство вызывает их склонность выдумывать информацию, когда у них нет правильного ответа.

      Чат-боты с искусственным интеллектом, протестированные для участия в опросе, включали в себя многие из “лучших”, в том числе ChatGPT, Perplexity, Perplexity Pro, DeepSeek, Microsoft Copilot, Grok-2, Grok-3 и Google Gemini.

      В ходе тестирования чат-ботам с искусственным интеллектом были предоставлены прямые выдержки из 10 онлайн-статей, опубликованных различными изданиями. Каждый чат-бот получил 200 запросов, представляющих 10 статей от 20 различных издательств, на 1600 запросов. Чат-ботам было предложено указать заголовок каждой статьи, ее оригинального издателя, дату публикации и URL-адрес.

      Аналогичные тесты, проведенные с использованием традиционных поисковых систем, успешно предоставили правильную информацию. Однако чат-боты с искусственным интеллектом показали себя не так хорошо.

      Результаты показали, что чат-боты часто пытаются отклонить вопросы, на которые они не могут дать точный ответ, и часто вместо этого дают неверные или спекулятивные ответы. Чат-боты премиум-класса, как правило, дают заведомо неверные ответы чаще, чем их бесплатные аналоги. Кроме того, многие чат-боты, по-видимому, игнорируют настройки протокола исключения роботов (REP), который веб-сайты используют для взаимодействия с веб-роботами, такими как поисковые роботы.

      Опрос также показал, что инструменты генерирующего поиска склонны к созданию ссылок и цитированию синдицированных или скопированных версий статей. Более того, соглашения о лицензировании контента с новостными источниками не гарантировали точного цитирования в ответах чат-ботов.

      Что вы можете сделать?

      Что особенно бросается в глаза в результатах этого опроса, так это не только то, что чат-боты с искусственным интеллектом часто предоставляют неверную информацию, но и то, что они делают это с пугающей уверенностью. Вместо того чтобы признать, что они не знают ответа, они склонны отвечать такими фразами, как “похоже”, “это возможно” или “могло бы быть”.

      Например, ChatGPT неправильно определил 134 статьи, но только в 15 случаях из 200 ответов указал на неопределенность и ни разу не воздержался от ответа.

      Исходя из результатов опроса, вероятно, разумно не полагаться исключительно на чат-ботов с искусственным интеллектом в поисках ответов. Вместо этого рекомендуется сочетание традиционных методов поиска и инструментов искусственного интеллекта. По крайней мере, использование нескольких чат-ботов с искусственным интеллектом для поиска ответа может оказаться полезным. В противном случае вы рискуете получить неверную информацию.

      Забегая вперед, я бы не удивился, если бы увидел консолидацию чат-ботов с искусственным интеллектом, поскольку лучшие из них отличаются от некачественных. В конечном счете, их результаты будут такими же точными, как у традиционных поисковых систем. Когда это произойдет, остается только гадать.

Другие статьи

Благодаря чипсету Apple M4 MacBook Air 13 стал лучшим маленьким ноутбуком в мире Благодаря чипсету Apple M4 MacBook Air 13 стал лучшим маленьким ноутбуком в мире Модель Apple MacBook Air 13 M4 получила высокую оценку как лучший 13-дюймовый (или 14-дюймовый) ноутбук, который вы можете купить сегодня. А его базовая модель стала еще лучше, чем когда-либо. Новости NYT сегодня: подсказки, текст и ответы на вопросы во вторник, 11 марта Новости NYT сегодня: подсказки, текст и ответы на вопросы во вторник, 11 марта Strands - это сложный вариант классического поиска слов из NYT Games. Если вы застряли и не можете решить сегодняшнюю головоломку, у нас есть для вас помощь и подсказки. Компания LG представила информацию о ценах на OLED-дисплеи G5 и C5 2025 года выпуска Компания LG представила информацию о ценах на OLED-дисплеи G5 и C5 2025 года выпуска Модели LG серий C5 и G5 поступят в продажу в марте, а до конца месяца для тех, кто приобретет их, будут доступны специальные предложения по настройке и звуковой панели. Две новые колонки серии Reference от Fluance ориентированы на экономных меломанов Две новые колонки серии Reference от Fluance ориентированы на экономных меломанов Канадский производитель аудиосистем Fluance анонсировал свои колонки Ri71 bookshelf и Ri91 tower, которые являются недорогими эталонными динамиками высокого качества и рассчитаны на начинающих аудиофилов. Следующее обновление iOS может вынудить вас обновить Apple Home Следующее обновление iOS может вынудить вас обновить Apple Home Согласно коду, обнаруженному в бета-версии iOS 18.4, следующее обновление iOS может вынудить пользователей HomeKit перейти на новейшую архитектуру приложений для дома или потерять поддержку. Вместо Disco Elysium 2, ZA/UM выпускает совершенно новую шпионскую игру Вместо Disco Elysium 2, ZA/UM выпускает совершенно новую шпионскую игру Следующая игра ZA/ UM - это не Disco Elysium 2, это совершенно новая шпионская игра под названием C4.

Возможно, ваш любимый чат-бот с искусственным интеллектом говорит неправду

Чат-боты с искусственным интеллектом не так умны, как можно было бы ожидать. На самом деле, иногда они ничего не знают и дают неверные ответы.