Эта ИИ-технология может понимать слова, которые даже не произносятся вслух.
Эта новая технология позволяет вам говорить, не издавая звука
Исследователи из Университета науки и технологий Поханга (POSTECH) разработали прорывную носимую технологию, которая может преобразовывать беззвучную речь в слышимый голос, считывая тонкие движения мышц шеи. Исследование, проведенное профессором Сунг-Мином Паком и доктором Сунгуком Хонгом, было опубликовано в журнале Cyborg and Bionic Systems, что стало значительным шагом вперед в коммуникации между человеком и машиной.
От мышечных движений к произнесенным словам
Инновация основана на простой, но мощной идее: речь — это не только звук. Когда человек говорит — или даже пытается говорить беззвучно — происходят крошечные движения в мышцах и коже вокруг шеи. Эти движения формируют своего рода «невидимую карту» предполагаемой речи.
Чтобы это зафиксировать, исследователи создали носимое устройство под названием многослойный датчик деформации. Система сочетает в себе миниатюрную камеру с гибким силиконом, в который встроены опорные маркеры, что позволяет обнаруживать даже самые маленькие деформации кожи. Датчик, предназначенный для повседневного использования, можно удобно носить на шее, и он автоматически перекалибруется при изменении положения.
Собранные данные затем обрабатываются с помощью искусственного интеллекта, который интерпретирует паттерны деформации и восстанавливает предполагаемые слова или предложения. Сочетая это с синтезом речи, обученным на голосовом профиле пользователя, система может генерировать речь, которая близка к естественному голосу человека — даже когда звук не производится.
Практический шаг вперед по сравнению с существующими системами
Традиционные методы восстановления голоса полагаются на технологии, такие как электромиография (ЭМГ) или электроэнцефалография (ЭЭГ), которые часто требуют громоздкого оборудования и могут быть неудобными при длительном использовании.
Подход команды POSTECH устраняет эти барьеры, предлагая легкую, носимую альтернативу. В ходе испытаний система продемонстрировала высокую точность в восстановлении речи, даже в шумной обстановке, такой как промышленные условия, где традиционные микрофоны испытывают трудности.
Влияние на реальный мир и будущее
Последствия этой технологии далеко идущие. Она может предоставить новый путь коммуникации для пациентов, которые потеряли голос из-за повреждения голосовых связок или ларингальной хирургии, позволяя им снова «говорить» с использованием своего голосового профиля.
Помимо здравоохранения, система может обеспечить бесшумную коммуникацию в средах, где говорить вслух непрактично — таких как библиотеки, собрания или рабочие места с высоким уровнем шума. Это также открывает двери для более естественных интерфейсов человек-ИИ, где намерение может быть переведено в речь без физической вокализации.
Смотрим в будущее
Исследователи стремятся усовершенствовать технологию для более широкого развертывания в реальном мире, улучшая точность и расширяя языковые возможности. Будущие версии могут более бесшовно интегрироваться с потребительскими устройствами, потенциально трансформируя то, как люди общаются как в личных, так и в профессиональных условиях.
Поскольку ИИ продолжает сливаться с носимыми технологиями, такие инновации, как эта, сигнализируют о переходе к более интуитивным, ненавязчивым формам взаимодействия — где даже невысказанные слова наконец могут быть услышаны.
Otros artículos
Эта ИИ-технология может понимать слова, которые даже не произносятся вслух.
Исследователи разработали носимый ИИ-датчик, который считывает движения шеи, чтобы преобразовать тихую речь в слышимый голос, открывая новые возможности для общения.
