Модели ИИ, такие как ChatGPT и Claude, переоценивают, насколько люди на самом деле умны.

      Проблема предсказания реального выбора

      Sensor Tower

      Новое исследование показывает, что представление искусственного интеллекта о нас может быть слегка чрезмерно оптимистичным. Исследователи обнаружили, что популярные модели ИИ, такие как ChatGPT от OpenAI и Claude от Anthropic, склонны считать людей более рациональными и логичными, чем они есть на самом деле, особенно в ситуациях, требующих стратегического мышления.

      Разрыв между тем, как ИИ ожидает, что люди будут себя вести, и тем, что люди делают на самом деле, может иметь последствия для того, как эти системы предсказывают человеческие решения в экономике и за её пределами.

      Сравнение ИИ с человеческим мышлением

      Unsplash

      Исследователи протестировали модели ИИ, включая ChatGPT-4o и Claude-Sonnet-4, в классической игровой теории под названием кейнсианский конкурс красоты. Понимание этой игры помогает объяснить, почему полученные результаты имеют значение (через TechXplore).

      В конкурсе красоты участникам нужно предсказать, что выберут другие, чтобы выиграть, а не просто выбрать то, что им самим нравится. Теоретически рациональная игра означает выход за пределы первых впечатлений и фактическое размышление о том, что думают другие — глубокий уровень стратегического мышления, с которым люди на практике часто испытывают трудности.

      Чтобы оценить, как модели ИИ выглядят на этом фоне, исследователи предложили системам сыграть в версию этой игры под названием «Угадай число», где каждый игрок выбирает число от нуля до ста. Побеждает тот, чей выбор ближе всего к половине среднего выбора всех игроков.

      Tim Witzdam / Pexels

      Моделям ИИ предоставляли описания их человеческих соперников — от первокурсников до опытных теоретиков игр — и просили не только выбрать число, но и объяснить своё рассуждение.

      Модели действительно корректировали свои числа в зависимости от того, с кем, по их мнению, они сталкиваются, что показывает наличие некоторого стратегического мышления. Тем не менее они последовательно предполагали уровень логического рассуждения у людей, которого большинство реальных игроков на самом деле не проявляет, часто «играя слишком умно» и промахиваясь из‑за этого.

      U

      Хотя исследование также показало, что эти системы могут адаптировать выборы на основе таких характеристик, как возраст или опыт, им по-прежнему было сложно выявлять доминирующие стратегии, которые люди могли бы использовать в играх вдвоём. Исследователи утверждают, что это подчёркивает продолжающуюся проблему настройки ИИ в соответствии с реальным человеческим поведением, особенно для задач, требующих предвидения решений других людей.

      Эти результаты также резонируют с более широкими опасениями по поводу современных чат‑ботов, включая исследования, показывающие, что даже лучшие системы ИИ точны всего примерно на 69%, и предупреждения экспертов о том, что модели ИИ могут убедительно имитировать человеческую личность, что вызывает опасения по поводу манипуляций. По мере того как ИИ продолжают использовать в экономическом моделировании и других сложных областях, крайне важно понимать, где его предположения расходятся с человеческой реальностью.

      Маниша любит освещать технологии, которые являются частью повседневной жизни — от смартфонов и приложений до игр и стриминга…

      Мировой первый 6K‑монитор с 3D‑просмотром без очков уже здесь

      Samsung Odyssey 3D сочетает сверхчёткую 6K‑панель с технологией отслеживания глаз, чтобы возродить 3D без очков — амбициозно, экспериментально и удивительно сложно пройти мимо.

      Перед CES 2026 южнокорейский технологический гигант Samsung выпустил то, что называет «первым в отрасли 6K‑монитором с 3D‑просмотром без очков». 32‑дюймовый монитор оснащён IPS‑панелью, поддерживает пиковую частоту обновления 165 Гц и имеет порты HDMI 2.1 и DP 2.1, но его главная особенность — рендеринг 3D без очков. В отличие от традиционных 3D‑дисплеев, которые требуют громоздких очков (и немалого терпения), 6K 3D Odyssey G9 (G90XH) от Samsung использует продвинутую систему лентикуллярных линз в сочетании с камерами отслеживания глаз, чтобы определить направление вашего взгляда и настроить перспективу для каждого глаза, создавая иллюзию глубины и трёхмерный эффект.

      Читать далее

      Новый Odyssey G6 от Samsung с частотой 1 040 Гц доказывает, что игровые мониторы продолжают эволюционировать

      С Odyssey G6 Samsung выводит частоты обновления в четырёхзначную область, переопределяя пределы дисплеев для соревновательных игр.

      В преддверии CES 2026 Samsung представила свою последнюю линейку игровых мониторов Odyssey. Пока один из мониторов обеспечивает 3D‑изображение без очков, другой позиционируется как первый в мире монитор с частотой обновления 1 040 Гц. Называемый Odyssey G6 (G60H), монитор предлагает более чем в четыре раза большую частоту обновления по сравнению с нынешними панелями 240 Гц, которым клянутся киберспортсмены.

      По умолчанию 27‑дюймовая IPS‑панель QHD обеспечивает частоту обновления 600 Гц, что уже немало, но в режиме Dual Mode монитор может разгоняться до 1 040 Гц (в HD‑разрешении). Для тех, кто не в курсе, режим Dual Mode меняет работу панели, отдавая приоритет частоте обновления над разрешением.

      Читать далее

      Экономьте 500 долларов на этом ПК iBUYPOWER с RTX 5080 и забудьте про головную боль сборки

      Сэкономьте 500 долларов на полностью укомплектованном игровом ПК с RTX 5080, 32 ГБ ОЗУ и SSD на 2 ТБ.

      Если вы хотите высокую игровую производительность без ночей, потраченных на сравнение комплектующих и просмотр руководств по сборке, это предложение на iBUYPOWER Y40 Pro очень сложно игнорировать. Сейчас он стоит $1 949,99 (по сравнению с комплектной стоимостью $2 449,99), что означает экономию $500 на готовом настольном компьютере, который готов справляться с современными играми сразу из коробки.

      С RTX 5080, 12‑ядерным Ryzen 9 7900X, 32 ГБ DDR5 и просторным NVMe‑SSD на 2 ТБ эта сборка безусловно относится к «премиальному» сегменту. Вы получаете железо, способное справляться с играми в 1440p и 4K, тяжёлой многозадачностью и созданием контента, не создавая ощущения, что вы платите налог раннего приверженца за каждую деталь.

      Читать далее

Другие статьи

Смотрите, как TriFold от Samsung впервые терпит неудачу в этом тесте на прочность. Рождественским подарком Зака Нельсона для его 9,7 миллиона подписчиков на YouTube стал тест на прочность смартфона Samsung TriFold. «Время от времени на мой стол попадает такое устройство, что мне почти жаль того, что с ним собираются сделать… почти», — говорит в начале теста создатель канала JerryRigEverything, […]

Новая утечка о iPhone Air 2 возрождает надежду на запуск в 2026 году. Новая утечка указывает, что Apple, возможно, всё-таки не будет ждать до 2027 года, чтобы выпустить iPhone Air 2. Противоречивые сообщения теперь намекают на возможный дебют в 2026 году, возрождая надежды на более раннее возвращение ультратонкого iPhone от Apple.

Google может наконец-то позволить вам изменить имя вашего адреса Gmail. Google может наконец-то позволить вам изменить имя вашего адреса Gmail.

TCL связывает внедрение ИИ с повышением эффективности и более экологичным производством. В этом месяце TCL на Конференции по глобальным технологическим инновациям TCL 2025 года продемонстрировала свои новейшие приложения искусственного интеллекта, изложив, как китайский производитель электроники

Этот утекший в сеть Lenovo Yoga Mini i может стать вашим самым лёгким настольным ПК с Copilot+. Windows Latest сообщает, что Lenovo работает над Yoga Mini i, цилиндрическим мини‑ПК весом 600 г. По данным утечки, в нём будет Intel Core Ultra X7 358H и поддержка до четырёх дисплеев с высоким разрешением.

Предстоящий «батарейный монстр» OnePlus показал своё лицо, и он выглядит подозрительно знакомо. Предстоящий «батарейный монстр» OnePlus показал своё лицо, и он выглядит подозрительно знакомо.

Модели ИИ, такие как ChatGPT и Claude, переоценивают, насколько люди на самом деле умны.

Новое исследование показывает, что модели ИИ, такие как ChatGPT и Claude, систематически переоценивают, насколько люди на самом деле рациональны, что приводит к неверной оценке их поведения в стратегических ситуациях.