Chrome становится лучше в понимании пауз и знаков препинания, которые вы никогда не произносите вслух.
Google тихо делает голосовой ввод в Chrome гораздо более естественным. С последней бета-версией Chrome 151 компания вводит новую возможность, которая позволяет движку распознавания речи браузера автоматически определять пунктуацию на основе того, как люди говорят, устраняя необходимость явно произносить команды, такие как «запятая» или «точка».
Обновление может показаться незначительным на первый взгляд, но оно решает одну из самых больших проблем с голосовым набором: естественная речь часто приводит к тексту, который не содержит пунктуации, если пользователи сознательно не диктуют каждый знак препинания. Обучая Chrome понимать паузы, ритм и речевые паттерны, Google делает еще один шаг к тому, чтобы разговоры с компьютерами казались более человеческими.
Chrome хочет понимать, как вы говорите, а не только то, что вы говорите
Новая функция появляется через Web Speech API в Chrome 151 Beta. Google добавил новый булевый атрибут unspokenPunctuation в интерфейс SpeechRecognition. Когда он включен, движок распознавания речи автоматически вставляет пунктуацию на основе пауз, интонации и просодии, вместо того чтобы требовать от пользователей произносить команды пунктуации вслух.
На практике это означает, что пользователи могут диктовать электронное письмо, документ или сообщение в более естественном разговорном стиле, в то время как Chrome определяет, где должны находиться запятые, точки и другие знаки препинания.
Саймон Хилл / Digital Trends
Улучшение особенно полезно для более длительных сеансов диктовки, когда повторное произнесение «запятая», «точка» или «вопросительный знак» прерывает естественный поток речи. Это также может сделать инструменты транскрипции на базе браузера, приложения для заметок, программное обеспечение для доступности и помощников по написанию на базе ИИ значительно более плавными.
Разработчики тоже получат выгоду
Поскольку функция является частью Web Speech API Chrome, веб-приложения, которые полагаются на распознавание речи, могут реализовать эту функциональность, не создавая свои собственные модели пунктуации.
Google утверждает, что функция работает, анализируя паузы в речи и просодию, а не полагаясь исключительно на произнесенные слова, приближая распознавание речи в браузере к тому, как люди естественно общаются.
Digital Trends
Это дополнение также отражает более широкую тенденцию в экосистеме программного обеспечения Google. Поскольку Gemini и языковые модели на базе ИИ становятся все более интегрированными в продукты, такие как Chrome, Android и Workspace, компания уделяет большее внимание пониманию естественного человеческого разговора, а не требует от пользователей адаптировать свою речь для машин.
Chrome 151 Beta уже включает эту функцию для тестирования разработчиками, хотя более широкая доступность будет зависеть от графика стабильного выпуска браузера. Как и с многими экспериментальными API, в конечном итоге разработчики определят, насколько широко она будет принята в веб-приложениях.
Хотя автоматическая пунктуация не преобразит голосовой ввод за одну ночь, это тот вид улучшения качества жизни, который пользователи, вероятно, заметят каждый раз, когда они диктуют сообщение или транскрибируют разговор. Иногда самые большие обновления не являются яркими новыми функциями ИИ, а небольшими изменениями, которые делают технологии лучше в понимании того, как люди уже общаются.
Другие статьи
Chrome становится лучше в понимании пауз и знаков препинания, которые вы никогда не произносите вслух.
Chrome 151 Beta вводит автоматическую пунктуацию для распознавания голоса, позволяя браузеру выводить запятые и точки из естественной речи без устных команд.
