Модели ИИ, такие как ChatGPT и Claude, переоценивают, насколько люди на самом деле умны.
Проблема предсказания реального выбора
Sensor Tower
Новое исследование показывает, что представление искусственного интеллекта о нас может быть слегка чрезмерно оптимистичным. Исследователи обнаружили, что популярные модели ИИ, такие как ChatGPT от OpenAI и Claude от Anthropic, склонны считать людей более рациональными и логичными, чем они есть на самом деле, особенно в ситуациях, требующих стратегического мышления.
Разрыв между тем, как ИИ ожидает, что люди будут себя вести, и тем, что люди делают на самом деле, может иметь последствия для того, как эти системы предсказывают человеческие решения в экономике и за её пределами.
Сравнение ИИ с человеческим мышлением
Unsplash
Исследователи протестировали модели ИИ, включая ChatGPT-4o и Claude-Sonnet-4, в классической игровой теории под названием кейнсианский конкурс красоты. Понимание этой игры помогает объяснить, почему полученные результаты имеют значение (через TechXplore).
В конкурсе красоты участникам нужно предсказать, что выберут другие, чтобы выиграть, а не просто выбрать то, что им самим нравится. Теоретически рациональная игра означает выход за пределы первых впечатлений и фактическое размышление о том, что думают другие — глубокий уровень стратегического мышления, с которым люди на практике часто испытывают трудности.
Чтобы оценить, как модели ИИ выглядят на этом фоне, исследователи предложили системам сыграть в версию этой игры под названием «Угадай число», где каждый игрок выбирает число от нуля до ста. Побеждает тот, чей выбор ближе всего к половине среднего выбора всех игроков.
Tim Witzdam / Pexels
Моделям ИИ предоставляли описания их человеческих соперников — от первокурсников до опытных теоретиков игр — и просили не только выбрать число, но и объяснить своё рассуждение.
Модели действительно корректировали свои числа в зависимости от того, с кем, по их мнению, они сталкиваются, что показывает наличие некоторого стратегического мышления. Тем не менее они последовательно предполагали уровень логического рассуждения у людей, которого большинство реальных игроков на самом деле не проявляет, часто «играя слишком умно» и промахиваясь из‑за этого.
U
Хотя исследование также показало, что эти системы могут адаптировать выборы на основе таких характеристик, как возраст или опыт, им по-прежнему было сложно выявлять доминирующие стратегии, которые люди могли бы использовать в играх вдвоём. Исследователи утверждают, что это подчёркивает продолжающуюся проблему настройки ИИ в соответствии с реальным человеческим поведением, особенно для задач, требующих предвидения решений других людей.
Эти результаты также резонируют с более широкими опасениями по поводу современных чат‑ботов, включая исследования, показывающие, что даже лучшие системы ИИ точны всего примерно на 69%, и предупреждения экспертов о том, что модели ИИ могут убедительно имитировать человеческую личность, что вызывает опасения по поводу манипуляций. По мере того как ИИ продолжают использовать в экономическом моделировании и других сложных областях, крайне важно понимать, где его предположения расходятся с человеческой реальностью.
Маниша любит освещать технологии, которые являются частью повседневной жизни — от смартфонов и приложений до игр и стриминга…
Мировой первый 6K‑монитор с 3D‑просмотром без очков уже здесь
Samsung Odyssey 3D сочетает сверхчёткую 6K‑панель с технологией отслеживания глаз, чтобы возродить 3D без очков — амбициозно, экспериментально и удивительно сложно пройти мимо.
Перед CES 2026 южнокорейский технологический гигант Samsung выпустил то, что называет «первым в отрасли 6K‑монитором с 3D‑просмотром без очков». 32‑дюймовый монитор оснащён IPS‑панелью, поддерживает пиковую частоту обновления 165 Гц и имеет порты HDMI 2.1 и DP 2.1, но его главная особенность — рендеринг 3D без очков. В отличие от традиционных 3D‑дисплеев, которые требуют громоздких очков (и немалого терпения), 6K 3D Odyssey G9 (G90XH) от Samsung использует продвинутую систему лентикуллярных линз в сочетании с камерами отслеживания глаз, чтобы определить направление вашего взгляда и настроить перспективу для каждого глаза, создавая иллюзию глубины и трёхмерный эффект.
Читать далее
Новый Odyssey G6 от Samsung с частотой 1 040 Гц доказывает, что игровые мониторы продолжают эволюционировать
С Odyssey G6 Samsung выводит частоты обновления в четырёхзначную область, переопределяя пределы дисплеев для соревновательных игр.
В преддверии CES 2026 Samsung представила свою последнюю линейку игровых мониторов Odyssey. Пока один из мониторов обеспечивает 3D‑изображение без очков, другой позиционируется как первый в мире монитор с частотой обновления 1 040 Гц. Называемый Odyssey G6 (G60H), монитор предлагает более чем в четыре раза большую частоту обновления по сравнению с нынешними панелями 240 Гц, которым клянутся киберспортсмены.
По умолчанию 27‑дюймовая IPS‑панель QHD обеспечивает частоту обновления 600 Гц, что уже немало, но в режиме Dual Mode монитор может разгоняться до 1 040 Гц (в HD‑разрешении). Для тех, кто не в курсе, режим Dual Mode меняет работу панели, отдавая приоритет частоте обновления над разрешением.
Читать далее
Экономьте 500 долларов на этом ПК iBUYPOWER с RTX 5080 и забудьте про головную боль сборки
Сэкономьте 500 долларов на полностью укомплектованном игровом ПК с RTX 5080, 32 ГБ ОЗУ и SSD на 2 ТБ.
Если вы хотите высокую игровую производительность без ночей, потраченных на сравнение комплектующих и просмотр руководств по сборке, это предложение на iBUYPOWER Y40 Pro очень сложно игнорировать. Сейчас он стоит $1 949,99 (по сравнению с комплектной стоимостью $2 449,99), что означает экономию $500 на готовом настольном компьютере, который готов справляться с современными играми сразу из коробки.
С RTX 5080, 12‑ядерным Ryzen 9 7900X, 32 ГБ DDR5 и просторным NVMe‑SSD на 2 ТБ эта сборка безусловно относится к «премиальному» сегменту. Вы получаете железо, способное справляться с играми в 1440p и 4K, тяжёлой многозадачностью и созданием контента, не создавая ощущения, что вы платите налог раннего приверженца за каждую деталь.
Читать далее
Другие статьи
Модели ИИ, такие как ChatGPT и Claude, переоценивают, насколько люди на самом деле умны.
Новое исследование показывает, что модели ИИ, такие как ChatGPT и Claude, систематически переоценивают, насколько люди на самом деле рациональны, что приводит к неверной оценке их поведения в стратегических ситуациях.
