ИИ может пройти тест Тьюринга в живых чатах и казаться более человечным, чем мы. Мне сейчас страшно.

      Исследователи UC San Diego обнаружили, что GPT-4.5 оценивался как человек 73% времени в живых беседах

      Искусственный интеллект может пройти тест Тьюринга в живых чатах, и последний результат вызывает тревогу. В исследовании UC San Diego GPT-4.5 превзошел реальных участников в умении убеждать судей, что на другой стороне находится человек.

      Настройка была сложнее, чем стандартный тест. Судьи реагировали на обмены в реальном времени, а не на статические подсказки, а затем быстро принимали решение, основываясь только на разговоре.

      Тревожная часть заключается в том, насколько знакомым выглядит это умение. Модели не нужен был тело, голос или биография. Ей нужно было лишь звучать как кто-то.

      Как ИИ обошел человеческий тест

      В исследовании использовалась трехсторонняя версия теста. Судьи общались как с человеком, так и с моделью ИИ, а затем выбирали, кто из них, по их мнению, был реальным.

      Четыре примера игр из двух популяций: (A) Prolific, (B) Undergraduate, (C) Undergraduate и (D) Prolific. На каждой панели один разговор с человеческим свидетелем, а другой — с системой ИИ. C.R. Jones и B.K. Bergen / Труды Национальной академии наук

      GPT-4.5 был идентифицирован как человек 73% времени, когда ему давали подсказку о персонаже. LLaMa-3.1-405B также пересек поразительную черту, его выбрали как человека 56% времени с подсказкой о персонаже.

      Эти цифры придают находке вес. Модель не просто избегала обнаружения, она давала судьям достаточно социальных сигналов, чтобы воспринимать ее как человека в чате.

      Почему этот тест все еще важен

      Тест Тьюринга — это многолетний способ задать вопрос, может ли машина имитировать человеческий разговор достаточно хорошо, чтобы обмануть человека. В классической версии оценщик общается, не видя участников, а затем пытается отличить человека от машины.

      Он всегда был больше культурным символом, чем чистым измерением. Тем не менее, это остается тестом, который люди признают, когда хотят узнать, может ли программное обеспечение сойти за одного из нас.

      Алан Тьюринг Yiming Ma / Unslpash

      Это делает новый результат более острым. Чат-боту не нужно сознание, эмоции или самосознание, чтобы создать впечатление, что реальный человек отвечает. Ему нужно лишь быть правдоподобным в данный момент.

      Риск проявляется в обычных местах. Поддержка клиентов, приложения для знакомств, социальные платформы, образование и политические сообщения все полагаются на быстрые суждения о личности, намерении и подлинности.

      Что нам следует наблюдать дальше

      Исследование далеко от того, чтобы утверждать, что чат-боты понимают людей. Его более практическое открытие заключается в том, что некоторые модели теперь могут очень хорошо выполнять роль личности в коротких обменах.

      Ясное раскрытие должно стать следующим важным моментом. Когда бот может сливаться в повседневный разговор, пользователям нужны более сильные сигналы о том, что они имеют дело с программным обеспечением, особенно в местах, где убеждение или эмоциональная уязвимость формируют обмен.

      Следующая борьба развернется вокруг маркировки в чатах, где люди принимают быстрые решения о доверии.

      Пауло Варгас — специалист по английскому языку, ставший репортером, а затем техническим писателем, с карьерой, которая всегда возвращалась к…

      ИИ, возможно, только что выиграл литературную премию. Моё сердце плачет, видя, как он отравляет нашу любовь к книгам.

      Мне было трудно осознать эту новость. Как человек, который с детства глубоко любил истории и вырос на произведениях Артура Конан Дойла, Терри Пратчетта, Дж. Р. Р. Толкина и других таких уважаемых авторов, видеть, как история, написанная ИИ, выигрывает престижную литературную премию, трудно переварить.

      Если вы не в курсе, были объявлены победители Премии за короткий рассказ Содружества за 2026 год, и три из пяти выигравших региональных рассказов были полностью или частично написаны ИИ. Или, по крайней мере, таково общее мнение среди читателей. Как читатель и любитель художественной прозы, это ранило меня глубже, чем любая другая история о том, как ИИ разъедает нашу жизнь.

      Читать далее

      Канва и Адобе приходят в Джемини, и они хотят сделать все разговорчивым

      Адобе и Канва подключаются к помощнику Google, ставя на то, что творческая работа начинается с подсказки, а не с иконки приложения.

      Канва и Адобе углубляются в Google Gemini, придавая помощнику большую роль до того, как пользователи откроют приложение для дизайна.

      Адобе сообщает, что его соединитель "Adobe for creativity" появится в Джемини в ближайшие недели, предоставляя пользователям возможность описывать задачи и отправлять их через инструменты Adobe для обработки изображений, дизайна и видео. Канва уже запускает свое подключенное приложение для Джемини на некоторых рынках англоязычных стран, полная доступность будет скоро.

      Читать далее

      Google хочет, чтобы Джемини помог построить следующий большой научный прорыв

      Джемини для науки углубляет агентный ИИ в реальные исследовательские рабочие процессы.

      Google строит Джемини глубже в исследовательский рабочий процесс, начиная с идей, тестов и научной литературы.

      На Google I/O 2026 компания объявила о Джемини для науки, экспериментальном наборе, построенном вокруг агентного ИИ в науке. Он нацелен на ручную работу, стоящую за открытиями, включая построение гипотез, вычислительное тестирование и обзор литературы.

      Читать далее

Другие статьи

Ugreen выпустила милое зарядное устройство в карманном размере для вашего MacBook и iPhone Новая серия Air от Ugreen уменьшает громоздкость вашей зарядной системы Apple с помощью двух компактных настенных зарядных устройств и магнитного power bank, созданного для путешествий.

Primer привлекает $100 млн в рамках раунда Series C для расширения в США и автономных AI-платежей Primer, лондонский стартап в области платежей, объявил о раунде финансирования серии C в размере 86,2 миллиона евро для расширения своей платформы AI для платежей и финансов.

GitHub был взломан через зараженное расширение VS Code, 3,800 репозиториев украдено TeamPCP экстрагировала 3,800 внутренних репозиториев GitHub после заражения расширения VS Code. По словам компании, данные клиентов не пострадали.

Primer привлекает $100 млн в рамках раунда Series C для расширения в США и автономных AI-платежей Primer, лондонский стартап в области платежей, объявил о раунде финансирования серии C на сумму 86,2 миллиона евро для расширения своей платформы AI для платежей и финансов.

Утечка о Samsung Galaxy Z Fold 8 предсказывает душераздирающий набор отсутствующих функций Следующий складной телефон Samsung, возможно, снова стремится к совершенству, что означает, что настоящие обновления все еще не скоро. Новый утечка от известного информатора Ice Universe утверждает, что серия Galaxy Z Fold 8 пропустит три ключевых обновления, которые сделали бы следующий флагманский складной телефон Samsung гораздо более захватывающим. Это может сделать […]

Figma запускает ИИ-агента, который проектирует на холсте Новый AI-ассистент Figma генерирует и редактирует дизайны на основе текстовых подсказок на своем совместном холсте, поскольку компания углубляет свои усилия в области ИИ после приобретения Weavy.

ИИ может пройти тест Тьюринга в живых чатах и казаться более человечным, чем мы. Мне сейчас страшно.

Исследование UC San Diego показало, что GPT-4.5 чаще оценивался как человек, чем реальные люди в живых чатах, что поднимает более острые вопросы о раскрытии информации об ИИ, доверии и онлайн-идентичности.