Создано для помощи, а не замены: внутри реального времени ИИ Intercall для профессиональных переводчиков
Среди интерпретаторов, которые на него полагаются, вердикт единогласен: наконец-то что-то, созданное для того, как они на самом деле работают. Предпосылка проста. Устный перевод лучше всего работает, когда человек и машина работают вместе, а не когда машина заменяет человека.
Устный перевод — одна из самых сложных задач, которые человек может выполнять в реальном времени. Переводчику нужно слушать, понимать, переформулировать и говорить почти одновременно, часто через незнакомый акцент или поток чисел, который приходит быстрее, чем кто-либо может его записать. Исследователи описывают «гипотезу каната»: большую часть задания переводчики работают на самом краю своих умственных возможностей, и точность снижается, как только эта нагрузка возрастает. Напряжение также физическое. Давление времени повышает уровень стресса и частоту сердечных сокращений, а качество снижается на отрезках, превышающих полчаса, поэтому переводчики меняются примерно каждые 30 минут.
Это давление только возросло, когда работа переместилась в онлайн. Устный перевод — это индустрия стоимостью 11,7 миллиарда долларов по оценкам Nimdzi, и растущая доля этого рынка теперь происходит удаленно: через видео, через неравномерный звук, на гибридных встречах, которые едва существовали пять лет назад. Системы субтитров, к которым могли обратиться переводчики, никогда не были созданы для них. Intercall был создан, чтобы закрыть этот разрыв.
Создан для переводчика
Intercall — это платформа для субтитров и перевода в реальном времени с участием человека, созданная для одной аудитории: профессиональных переводчиков. Участие человека означает именно это. Человек остается у руля, программное обеспечение помогает. Пока переводчик работает, Intercall выводит на экран все, что говорится, в текстовом виде на обоих языках в момент произнесения.
Его основатель, Баходир Раджабов, начал с того, что большинство продуктов упускает. Переводчику не нужен аккуратный транскрипт после встречи; им нужно правильное слово в моменте, достаточно быстро, чтобы это не отвлекало их внимание. Имя, которое они не уловили. Цифра, которая прошла слишком быстро. Технический термин из области, в которой они не работают каждый день.
Раджабов начал программировать в 14 лет в Бухаре, Узбекистан, а затем присоединился к команде IBM по генеративному ИИ. Он создал Intercall, чтобы решить проблему, которую остальной рынок упустил, и он был основным архитектором его ядра: захват аудио, нативная транскрипция с низкой задержкой, система терминологии и кроссплатформенный рабочий процесс на настольных ПК. Общие системы субтитров, доступные переводчикам, отставали от говорящего на три-пять секунд. Это нормально для субтитров. Это настоящая проблема для медицинского переводчика, передающего симптомы по мере их произнесения, или в суде, где полсекунды может изменить значение заявления.
Как он говорит: «Никто не создал ничего для переводчиков. Они мастера своего дела, работающие с заимствованными инструментами. Субтитры созданы для зрителей, приложения для перевода — для путешественников. Им просто нужно что-то, созданное для них».
Как это работает
Переломный момент наступил, когда они покинули браузер. Intercall работает как нативное программное обеспечение на собственном компьютере переводчика, устанавливается как Word или Zoom, а не открывается как веб-сайт. Написанное на C++, оно работает напрямую с операционной системой и захватывает аудио прямо из любого открытого вызова, будь то Zoom, Microsoft Teams или Google Meet. Нет расширения для браузера, нет бота для встреч и нет совместного использования экрана.
Он выполняет три задачи. Он транскрибирует разговор по мере его протекания, достаточно быстро, чтобы текст оставался на одном уровне с говорящим, а не отставал. «Это должно ощущаться мгновенно», — говорит Раджабов. «Как только текст отстает от говорящего, он бесполезен, и переводчики просто закрывают его». Он захватывает части, которые легче всего потерять и которые стоят дороже всего, если их неправильно понять, собственные имена и специальные термины, и позволяет переводчикам загружать до 600 своих собственных перед сессией: словарь кардиологии перед кардиологическим приемом, названия дел перед слушанием. И в многоязычном вызове он самостоятельно переключается между языками и диалектами, охватывая десятки из них. Английский врача и русский пациента, захваченные рядом, в одном разговоре, так, как это действительно происходит в интерпретируемых вызовах.
Для большинства переводчиков это одно окно заменяет набор инструментов, созданных для других людей: субтитры для встреч, блокнот, вкладка перевода, оставленная открытой в браузере. Разница проявляется в самой работе. Меньше запросов на повторение. Длинные, плотные отрывки передаются без нарушения потока разговора. Гораздо меньше беспокойной записи, которая истощает переводчиков к концу смены, так что энергия, потраченная на захват и удержание деталей, возвращается в интерпретацию.
Intercall создан для помощи, а не для замены. Он не интерпретирует за пользователя. Он выводит то, что в противном случае могло бы ускользнуть, и возвращает это, оставляя переводчикам контроль над частью, которую может сделать только человек: смысл и суждение. Этот выбор поставил Intercall на раннюю позицию в категории с участием человека, которую аналитики теперь отслеживают, ИИ, который поддерживает профессиональных переводчиков во время живой работы, а не заменяет их. Более крупные компании также пошли по тому же пути. Boostlingo добавила инструмент продуктивности ИИ в 2024 году, KUDO внедрила помощь в свою консоль переводчика в 2025 году, а аналитики Slator и Nimdzi теперь охватывают эту категорию.
Конфиденциальность
Переводчики почти сразу поднимают очевидное возражение: если это ИИ, сохраняет ли он мой аудиофайл и обучается на частных разговорах моих клиентов? Ответ компании заключается в том, как построена платформа, а не в политике конфиденциальности. Согласно Intercall, аудио, транскрипты и переводы существуют только в памяти и исчезают, когда сессия заканчивается; ничего не записывается на сервер, и ничего не используется для обучения моделей. Все, что генерирует переводчик, остается за ним. Это зашифровано и создано для конфиденциальности, которую требуют медицинская работа, регулируемая HIPAA, и суды, где утечка транскрипта является нарушением, а не неудобством.
Принятие и влияние
Intercall работает уже более полутора лет. Более 3000 профессиональных переводчиков из 18 стран использовали его, и тысячи часов живого перевода теперь проходят через платформу каждый месяц. Что выделяется, так это охват. Наибольшая группа пользователей находится в Доминиканской Республике, платные переводчики также работают в Соединенных Штатах, Польше, Перу, Гондурасе, Мексике, Канаде и за ее пределами, многие из них работают через провайдеров перевода, включая Propio Language Services, iCall International и других. Они используют его на живых заданиях в больницах, залах суда и конференц-залах. Его рост в основном произошел благодаря самой профессии: переводчики рекомендуют его коллегам и говорят об этом публично.
Влияние, которое они описывают, сводится к двум словам: эффективность и точность.
Эффективность, потому что инструмент поглощает ту часть работы, которая истощает переводчиков, удерживая имена, числа и детали в памяти, одновременно слушая и говоря. Переводчики сообщают о том, что работают дольше с гораздо меньшей усталостью. Некоторые описывают завершение смен с энергией, которую раньше тратили на беспокойную запись. Некоторые говорят, что он вернул их от выгорания, которое почти вытолкнуло их из профессии. В области, где рабочий предел — это умственная усталость, а не навык, это разница между устойчивой карьерой и ранним выходом.
Точность — это другая половина. Все, что сказано на вызове, транскрибируется и переводится в реальном времени, на обоих языках, перед переводчиком, так что запросы на повторение резко снижаются, и детали, которые стоят дороже всего, если их
Другие статьи
Создано для помощи, а не замены: внутри реального времени ИИ Intercall для профессиональных переводчиков
Intercall предоставляет живую транскрипцию и перевод на экран на обоих языках, пока работают переводчики, фиксируя имена, номера и термины, которые ускользают под когнитивной нагрузкой. Более 3000 переводчиков в 18 странах используют его.
