'Извините, я не понял': ИИ понимает слова одних людей чаще, чем других

'Извините, я не понял': ИИ понимает слова одних людей чаще, чем других

      Идея человекоподобного помощника с искусственным интеллектом, с которым можно разговаривать, живет в воображении многих людей с момента выхода фильма "Она", снятого Спайком Джонзе в 2013 году, о человеке, который влюбляется в Siri-подобный ИИ по имени Саманта. На протяжении всего фильма главный герой пытается понять, что Саманта, какой бы реальной она ни казалась, не является и никогда не будет человеком. 12 лет спустя это уже не является предметом научной фантастики. Инструменты генеративного ИИ, такие как ChatGPT, и цифровые помощники, такие как Siri от Apple и Alexa от Amazon, помогают людям получать указания по вождению, составлять списки продуктов и многое другое. Но, как и Саманта, системы автоматического распознавания речи все еще не могут сделать все то, что может сделать человек. Вы наверняка сталкивались с неприятной ситуацией, когда звоните в банк или коммунальную компанию и вынуждены повторять, чтобы цифровой бот, обслуживающий клиентов на другой линии, понял вас. Возможно, вы надиктовывали записку на телефон, а потом тратили время на редактирование непонятных слов. Исследователи в области лингвистики и информатики показали, что для одних людей эти системы работают хуже, чем для других. Они склонны допускать больше ошибок, если у вас неродной или региональный акцент, если вы чернокожий, если вы говорите на афроамериканском разговорном английском, если вы переходите на другой язык, если вы женщина, если вы стары, слишком молоды или если у вас есть дефекты речи. Оловянное ухо В отличие от нас с вами, системы автоматического распознавания речи не являются теми, кого исследователи называют "сочувствующими слушателями" Вместо того чтобы попытаться понять вас, используя другие полезные подсказки, например интонацию или мимику, они просто сдаются. В то время как компании и государственные учреждения все чаще используют инструменты автоматического распознавания речи, чтобы сократить расходы, у людей не остается другого выбора, кроме как взаимодействовать с ними. Но чем больше эти системы будут использоваться в критически важных сферах, от оказания первой помощи в чрезвычайных ситуациях и здравоохранения до образования и правоохранительных органов, тем больше вероятность серьезных последствий, когда они не смогут распознать, что говорят люди. Представьте, что в недалеком будущем вы попали в автомобильную аварию. Вы набираете 911, чтобы позвать на помощь, но вместо того, чтобы соединиться с человеком-диспетчером, вам отвечает бот, призванный отсеивать неэкстренные звонки. Чтобы вас поняли, требуется несколько раундов, что приводит к потере времени и повышению уровня тревожности в самый неподходящий момент. Что приводит к подобным ошибкам? Некоторые из неравенств, возникающих в результате работы таких систем, заложены в массивах лингвистических данных, которые разработчики используют для создания больших языковых моделей. Разработчики обучают системы искусственного интеллекта понимать и имитировать человеческую речь, скармливая им огромное количество текстовых и аудиофайлов, содержащих настоящую человеческую речь. Но чью речь они им скармливают? Если система показывает высокие показатели точности при общении с обеспеченными белыми американцами в возрасте от 30 лет, можно предположить, что она обучалась на большом количестве аудиозаписей людей, которые соответствуют этому профилю. При тщательном сборе данных из различных источников разработчики ИИ могли бы уменьшить количество таких ошибок. Но для создания систем ИИ, способных понимать бесконечные вариации человеческой речи, обусловленные такими факторами, как пол, возраст, раса, первый и второй язык, социально-экономический статус, способности и многое другое, требуются значительные ресурсы и время. "Правильный" английский Для людей, не говорящих по-английски, то есть для большинства людей во всем мире, проблемы еще больше. Большинство крупнейших в мире генеративных систем ИИ были созданы на английском языке, и они работают на нем гораздо лучше, чем на любом другом языке. На бумаге ИИ обладает большим гражданским потенциалом для перевода и расширения доступа людей к информации на разных языках, но пока большинство языков имеют меньший цифровой след, что затрудняет использование больших языковых моделей. Даже в языках, хорошо обслуживаемых большими языковыми моделями, таких как английский и испанский, ваш опыт зависит от того, на каком диалекте языка вы говорите. Сейчас большинство систем распознавания речи и генеративных чат-ботов ИИ отражают лингвистические предубеждения наборов данных, на которых они обучаются. Они повторяют предписанные, иногда предвзятые представления о "правильности" речи. Доказано, что ИИ "сглаживает" языковое разнообразие. В настоящее время существуют стартапы, предлагающие стереть акцент пользователей, исходя из предположения, что их основными клиентами будут поставщики услуг по обслуживанию клиентов с колл-центрами в зарубежных странах, таких как Индия или Филиппины. Это предложение закрепляет идею о том, что некоторые акценты являются менее правильными, чем другие. Предполагается, что ИИ, связанный с человеком, будет лучше обрабатывать язык, учитывая такие переменные, как акценты, кодовые переключения и тому подобное. В США государственные службы обязаны в соответствии с федеральным законом гарантировать равный доступ к услугам независимо от того, на каком языке говорит человек. Однако неясно, будет ли это достаточным стимулом для технологической индустрии, чтобы двигаться в направлении устранения языкового неравенства. Многие люди предпочтут поговорить с реальным человеком, задавая вопросы о счетах или медицинских проблемах, или, по крайней мере, иметь возможность отказаться от взаимодействия с автоматизированными системами при обращении за ключевыми услугами. Это не значит, что в межличностном общении никогда не случается недопонимания, но когда вы разговариваете с реальным человеком, он настроен на сочувствие. С искусственным интеллектом, по крайней мере сейчас, это либо работает, либо нет. Если система может обработать ваши слова, вы можете начинать. Если же нет, то вся ответственность за то, чтобы вас поняли, лежит на вас. Роберто Рей Агудо, доцент-исследователь испанского и португальского языков, Дартмутский колледж Эта статья была перепечатана с сайта The Conversation по лицензии Creative Commons. Читайте оригинал статьи. Получайте рассылку TNW Получайте самые важные новости технологий в свой почтовый ящик каждую неделю. Также отмечено с

'Извините, я не понял': ИИ понимает слова одних людей чаще, чем других

Другие статьи

Google Сообщения могут позволить вам отменять неудобные сообщения в чатах RCS Google Сообщения могут позволить вам отменять неудобные сообщения в чатах RCS Google Сообщения могут получить функцию "Удалить для всех", позволяющую вызывать сообщения, но только в чатах с поддержкой RCS. Поступление нового iPad Air? Предупреждение о низком уровне запасов Поступление нового iPad Air? Предупреждение о низком уровне запасов Следующий iPad Air может быть представлен уже через несколько недель. Этичный ИИ превращает Нидерланды в лидера инноваций Этичный ИИ превращает Нидерланды в лидера инноваций Нидерланды формируют будущее Европы благодаря искусственному интеллекту, устойчивому развитию и этическим инновациям, привлекая 2,5 млрд долларов глобальных инвестиций. Кроссворд NYT: ответы на пятницу, 7 февраля Кроссворд NYT: ответы на пятницу, 7 февраля Кроссворд New York Times может быть непростым, даже если это не воскресный выпуск! Если вы застряли, мы готовы помочь вам с помощью сегодняшних подсказок и ответов. Джет-монстр шириной 200 000 световых лет из ранней Вселенной Джет-монстр шириной 200 000 световых лет из ранней Вселенной Астрономы обнаружили джет, ширина которого в два раза превышает ширину всего Млечного Пути. NYT Connections: подсказки и ответы на пятницу, 7 февраля NYT Connections: подсказки и ответы на пятницу, 7 февраля Connections - это новая головоломка от New York Times, и она может быть довольно сложной. Если вам нужна помощь в решении сегодняшней головоломки, мы готовы помочь.

'Извините, я не понял': ИИ понимает слова одних людей чаще, чем других

Системы распознавания речи менее точны для женщин и чернокожих, а также других демографических групп, говорится в новом исследовании.