Оказывается, если попросить ИИ сыграть роль эксперта, он становится менее надежным.

Оказывается, если попросить ИИ сыграть роль эксперта, он становится менее надежным.

      Просить ИИ притвориться экспертом может обернуться против вас, но исследователи, возможно, нашли решение.

      Вы, вероятно, видели совет, который гуляет по интернету: скажите ИИ вести себя как эксперт в какой-либо области, и вы получите лучшие ответы. Это популярный совет, и он действительно работает, иногда. Однако новое исследование предполагает, что использование персон ИИ может быть не таким эффективным, как мы думали.

      Исследователи из Университета Калифорнии протестировали 12 различных персон на шести языковых моделях. Персоны варьировались от экспертов по математике и программированию до креативных писателей и контролеров безопасности. Цель заключалась в том, чтобы выяснить, насколько хорошо ИИ справляется с задачей, когда ему поручено действовать как эксперт.

      Результаты были смешанными. Принятие персоны сделало ИИ более профессиональным и лучше следящим за правилами. Но это также ухудшило способность ИИ вспоминать факты. Согласно исследованию, использование персоны ИИ переводит его в режим выполнения инструкций, а не в режим извлечения знаний, и эта замена обходится вам в точности.

      Каково решение?

      Чтобы решить эту проблему, исследователи разработали PRISM, что расшифровывается как Persona Routing via Intent-based Self-Modeling. Вместо того чтобы всегда использовать персону или никогда ее не использовать, PRISM учит ИИ решать, что лучше для него самого.

      Когда вы задаете вопрос, PRISM генерирует два ответа: один из его стандартного режима и один из его персоны. Затем он сравнивает оба и предоставляет ответ, который лучше подходит для конкретного запроса.

      Экспертный ответ не отбрасывается, даже когда стандартный ответ выигрывает. Вместо этого стиль рассуждений сохраняется в легком компоненте, называемом адаптером LoRA, из которого ИИ может черпать информацию позже, когда это необходимо. Решение кажется простым, и все же оно эффективно.

      Как показал себя PRISM?

      PRISM повысил общий балл ИИ на один-два пункта по MT-Bench, тесту, который измеряет, насколько хорошо ИИ выполняет инструкции и остается полезным. Для задач написания и безопасности персоны помогли. Для вопросов о чистых знаниях отказ от персоны оказался лучшим вариантом.

      Исследователи планируют протестировать PRISM с большим количеством персон и улучшить его способность предоставлять лучшие ответы. Это еще ранние дни, но это может изменить то, как мы запрашиваем ИИ на благо.

      Рачит — опытный технический журналист с более чем семилетним стажем, освещающий рынок потребительских технологий.

      Следующее поколение ИИ обещает чат-ботов, которые могут лучше читать атмосферу

      Исследователи учат ИИ-чат-ботов читать между строк

      Вы когда-нибудь спрашивали чат-бота что-то и чувствовали, что он совершенно не уловил вашу мысль? Вы говорите что-то с небольшим нюансом, и ИИ полностью упускает эту тонкость. Именно это проблема, которую исследователи пытаются решить. Хотя эмоциональная связь с ИИ для многих пользователей может казаться глубже, чем человеческий разговор, большинство ИИ-систем сегодня все еще рассматривают предложение как единый блок эмоций. Если вы смешиваете похвалу и критику, нюанс часто теряется.

      ЧатGPT не получит эротический режим, в конце концов

      OpenAI отказывается от "взрослого режима", так как он сталкивается с большими проблемами

      Если вы ожидали, что ЧатGPT получит "эротический режим", эта идея официально снята с повестки дня. Согласно Financial Times, острый режим OpenAI приостановлен "на неопределенный срок". Внутри борьбы OpenAI за реализацию взрослого режима

      Samsung приносит свой браузер на ПК с множеством классных функций

      Один браузер, чтобы управлять вашим телефоном, вашим ПК и бесконечным количеством вкладок, которые у вас открыты прямо сейчас.

      Samsung официально запустил браузер Samsung для Windows, и это больше, чем просто настольная версия браузера вашего телефона. Он предлагает кросс-устройственную непрерывность и ИИ-ассистента, который кажется действительно полезным. Непрерывный просмотр, чтобы помочь вам контролировать ваши вкладки.

Оказывается, если попросить ИИ сыграть роль эксперта, он становится менее надежным. Оказывается, если попросить ИИ сыграть роль эксперта, он становится менее надежным. Оказывается, если попросить ИИ сыграть роль эксперта, он становится менее надежным. Оказывается, если попросить ИИ сыграть роль эксперта, он становится менее надежным. Оказывается, если попросить ИИ сыграть роль эксперта, он становится менее надежным. Оказывается, если попросить ИИ сыграть роль эксперта, он становится менее надежным.

Другие статьи

WhatsApp наконец-то позволяет пользователям iPhone использовать два аккаунта на одном устройстве WhatsApp наконец-то позволяет пользователям iPhone использовать два аккаунта на одном устройстве Два аккаунта на одном iPhone, более умные средства управления хранилищем, бесшовные передачи чата между платформами и редактирование фотографий с помощью ИИ: обновление WhatsApp в марте 2026 года — это практическое обновление, которого ждали опытные пользователи. Самый дешевый iPad от Apple, возможно, наконец-то догонит по производительности Самый дешевый iPad от Apple, возможно, наконец-то догонит по производительности Бюджетный iPad следующего поколения от Apple может получить значительное обновление производительности с чипом A18, что обеспечит более высокие скорости и функции ИИ. Google расширяет Search Live по всему миру с помощью ИИ для голоса и камеры Google расширяет Search Live по всему миру с помощью ИИ для голоса и камеры Google расширил Search Live на глобальном уровне, предоставив голосовой и камерный поиск на базе ИИ более чем в 200 странах и на нескольких языках. WYBOT S3: Первый в мире самоопустошающийся очиститель бассейна превращает уход за бассейном из стрессового в роскошный WYBOT S3: Первый в мире самоопустошающийся очиститель бассейна превращает уход за бассейном из стрессового в роскошный Чистка бассейна не должна быть стрессовой задачей. С WYBOT S3, первым в мире самоопустошающимся роботизированным очистителем бассейна, вы получаете поистине бесконтактный уход за бассейном. Сочетая беспроводное удобство с интеллектуальной очисткой на основе ИИ, он позволяет вам наслаждаться вашим открытым пространством, не поднимая больше ни пальца. Прорыв в области ИИ следующего поколения обещает чат-ботов, которые лучше понимают атмосферу. Прорыв в области ИИ следующего поколения обещает чат-ботов, которые лучше понимают атмосферу. Этот новый подход ИИ обучает чат-ботов сосредотачиваться на эмоционально важных словах и связывать их с правильной темой, что помогает им лучше понимать нюансированные сообщения и отвечать более уместно. Ваш Apple TV теперь может рекомендовать шоу и фильмы на основе ваших привычек просмотра. Ваш Apple TV теперь может рекомендовать шоу и фильмы на основе ваших привычек просмотра. tvOS 26.4 от Apple приходит с четырьмя значительными изменениями в вашем опыте использования Apple TV, включая персонализированный браузер контента, исправление Dolby audio, которое оценят аудиофилы, и прощание с iTunes.

Оказывается, если попросить ИИ сыграть роль эксперта, он становится менее надежным.

Сказать ИИ "вести себя как эксперт" звучит как отличная идея, но новое исследование предполагает, что это на самом деле может навредить его точности.