Это новое обновление голоса от OpenAI заставляет Сири и Алексу выглядеть так, будто им нужно вернуться в школу.

Это новое обновление голоса от OpenAI заставляет Сири и Алексу выглядеть так, будто им нужно вернуться в школу.

      Универсальный переводчик только что вышел из научной фантастики и приземлился в вашем магазине приложений.

      

      

      

      

      

      

      

      

      

       Рачит Агарвал / Digital Trends

      

      

      

       OpenAI запустила три новые аудиомодели в своем API Realtime, и это большое событие для всех, кто разрабатывает приложения с голосовым управлением. Три модели — GPT-Realtime-2, GPT-Realtime-Translate и GPT-Realtime-Whisper. 

      Вместе они выводят голосовой ИИ за пределы простых ответов и создают нечто, что может вас понять, предпринять действия и поддерживать реальный разговор.

      Если их демонстрация о чем-то говорит, мы только что стали свидетелями следующей эволюции в том, как работают модели голосового ИИ. 

      Так что же могут делать эти модели на самом деле?

      GPT-Realtime-2 — это главная модель. Она приносит рассуждения уровня GPT-5 в живые голосовые взаимодействия, что означает, что она может обрабатывать более сложные запросы, не теряя нить разговора. 

      Она может одновременно вызывать несколько инструментов и даже рассказывать, что она делает, с помощью фраз, таких как «проверяю ваш календарь» или «позвольте мне разобраться с этим». У нее также есть более широкий контекстный диапазон в 128K токенов, что означает более длинные и последовательные сессии. Разработчики могут даже настраивать усилия по рассуждению в зависимости от сложности запроса.

      

      

      GPT-Realtime-Translate, вероятно, моя любимая модель. Это ближайшее, что мы имеем к универсальному переводчику из Звездного пути в реальной жизни. Она поддерживает живой перевод речи на более чем 70 языках ввода и 13 языках вывода. 

      Лучшая часть демонстрации заключалась в том, что даже когда новый человек присоединялся и говорил на другом языке, GPT-Realtime-Translate без проблем переводила обоих собеседников на английский в реальном времени. 

      OpenAI

      Наконец, есть GPT-Realtime-Whisper. Большинство моделей распознавания речи ждут, пока говорящий закончит, прежде чем предоставить полный перевод. Эта модель является моделью потоковой транскрипции, которая преобразует речь в текст по мере того, как говорит говорящий. Она полезна для живых субтитров, заметок на встречах и любого рабочего процесса с голосовым управлением, где ожидание транскрипции не является вариантом.

      Может ли кто-то использовать эти новые модели голосового ИИ?

      В настоящее время OpenAI выпустила эти модели для разработчиков. Но приложения, которые они создадут, повлияют на всех. Например, разработчик может создать приложение для реального времени переводчика, позволяющее пользователям общаться с людьми на разных языках. 

      Многие компании уже тестируют эти новые модели. Zillow разрабатывает голосового помощника, который может искать дома и планировать экскурсии по единственному устному запросу. Priceline может проверять ваши рейсы и отели, отменять их и бронировать новые. Vimeo использует это для транскрипции в реальном времени и так далее. 

      OpenAI

      Цены начинаются от $0.017 за минуту для Whisper, $0.034 за минуту для Translate и $32 за 1M токенов аудиоввода для GPT-Realtime-2.

      

      

      

      

      

      

      

      

      

      

       Рачит — опытный технический журналист с более чем семилетним опытом освещения потребительских технологий.

      

      

      

      

      

      

       Корея приветствует роботизированного буддийского монаха в настоящем монастыре. Это знак грядущих событий.

      

       Буддизм вошел в эпоху роботов с монахом по имени Габи

      

       Человекообразный робот присоединился к буддийской церемонии в Сеуле, и это было зрелище. Робот по имени Габи был представлен в храме Джогеса в центре Сеула во время церемонии, проведенной перед празднованием Дня рождения Будды. 1,3-метровый робот получил имя Дхармы "Габи" во время специальной церемонии прибежища, проведенной Орденом Джогье корейского буддизма, крупнейшим буддийским орденом Южной Кореи.

      Почему робот стал настоящим монахом в настоящем храме

      

       Читать далее

      

      

      

       ChatGPT теперь позволяет вам назвать кого-то, чтобы проверить, если все станет мрачным

      

       OpenAI создает человеческую сеть безопасности в ChatGPT для кризисных моментов

      

       AI-чат-боты сделали удивительно легким обсуждение любых тем, включая некоторые из самых тяжелых тем, которые можно представить. Эта открытость всегда была двусторонним мечом. Теперь OpenAI предпринимает шаги, чтобы решить эту проблему, с новой функцией, которая привносит доверенное лицо в картину, когда все становится серьезно.

      Компания запускает новую функцию под названием Доверенный контакт, и она начинает появляться в настройках ChatGPT для взрослых пользователей. Она позволяет пользователям назвать одно лицо, которое может быть уведомлено, если ChatGPT обнаружит серьезную проблему с самоповреждением.

      

       Читать далее

      

      

      

       Двигатель ответов AI Perplexity не появится в Snapchat, в конце концов

      

       Perplexity больше не интегрируется в чаты Snapchat

      

       Запланированная интеграция Perplexity в Snapchat больше не состоится. Snap сообщил в своем письме для инвесторов за первый квартал 2026 года, что обе компании «договорились о прекращении отношений в первом квартале», завершив сделку на сумму 400 миллионов долларов наличными и акциями, объявленную в прошлом ноябре.

      Сделка должна была принести двигатель ответов AI Perplexity непосредственно в интерфейс чата Snapchat. Пользователи могли бы задавать вопросы и получать разговорные, основанные на источниках ответы, не покидая приложение. Snap ранее заявлял, что партнерство начнет приносить доход в 2026 году, но его последние прогнозы по продажам теперь предполагают отсутствие вклада от Perplexity.

      

       Читать далее

Это новое обновление голоса от OpenAI заставляет Сири и Алексу выглядеть так, будто им нужно вернуться в школу. Это новое обновление голоса от OpenAI заставляет Сири и Алексу выглядеть так, будто им нужно вернуться в школу. Это новое обновление голоса от OpenAI заставляет Сири и Алексу выглядеть так, будто им нужно вернуться в школу. Это новое обновление голоса от OpenAI заставляет Сири и Алексу выглядеть так, будто им нужно вернуться в школу. Это новое обновление голоса от OpenAI заставляет Сири и Алексу выглядеть так, будто им нужно вернуться в школу. Это новое обновление голоса от OpenAI заставляет Сири и Алексу выглядеть так, будто им нужно вернуться в школу. Это новое обновление голоса от OpenAI заставляет Сири и Алексу выглядеть так, будто им нужно вернуться в школу.

Другие статьи

Персональный компьютер Perplexity может работать автономно на вашем Mac, и теперь он доступен для всех Персональный компьютер Perplexity может работать автономно на вашем Mac, и теперь он доступен для всех Новое приложение Perplexity для Mac приносит Персональный Компьютер на ваш рабочий стол, позволяя ИИ-агентам работать с вашими локальными файлами, родными приложениями и интернетом, чтобы вам не пришлось. Следующие AirPods от Apple могут дать Сири глаза, и их уже тестируют. Следующие AirPods от Apple могут дать Сири глаза, и их уже тестируют. AirPods с камерами звучат дико, но они могут быть именно тем, что нужно Siri, чтобы перестать чувствовать себя застрявшей в прошлом. Это новое обновление голоса от OpenAI заставляет Сири и Алексу выглядеть так, будто им нужно вернуться в школу. Это новое обновление голоса от OpenAI заставляет Сири и Алексу выглядеть так, будто им нужно вернуться в школу. OpenAI запустила три новые аудиомодели, которые могут рассуждать, переводить на более чем 70 языков и транскрибировать речь в реальном времени, что делает голос действительно полезным интерфейсом для разработчиков. Персональный компьютер Perplexity может работать автономно на вашем Mac, и теперь он доступен для всех Персональный компьютер Perplexity может работать автономно на вашем Mac, и теперь он доступен для всех Новое приложение Perplexity для Mac приносит Персональный Компьютер на ваш рабочий стол, позволяя ИИ-агентам работать с вашими локальными файлами, родными приложениями и интернетом, чтобы вам не пришлось. ChatGPT теперь позволяет вам назначить кого-то, чтобы проверить, если ситуация станет тяжелой. ChatGPT теперь позволяет вам назначить кого-то, чтобы проверить, если ситуация станет тяжелой. ChatGPT теперь может предупредить кого-то, кому вы доверяете, если ситуация станет серьезной. Это простая функция, но она может быть одной из самых человеческих вещей, которые OpenAI когда-либо встроила в свой чат-бот. Lime подала документы на IPO на Nasdaq под тикером LIME Lime подала документы на IPO на Nasdaq под тикером LIME Lime, оператор микромобильности, поддерживаемый Uber, подал заявку на IPO в США под корпоративным названием Neutron Holdings. Goldman Sachs и JPMorgan ведут.

Это новое обновление голоса от OpenAI заставляет Сири и Алексу выглядеть так, будто им нужно вернуться в школу.

OpenAI запустила три новые аудиомодели, которые могут рассуждать, переводить на более чем 70 языков и транскрибировать речь в реальном времени, делая голос действительно полезным интерфейсом для разработчиков.