Construido para asistir, no para reemplazar: dentro de la IA en tiempo real de Intercall para intérpretes profesionales
Entre los intérpretes que dependen de él, el veredicto es consistente: por fin, algo construido para la forma en que realmente trabajan. La premisa es simple. La interpretación funciona mejor como un humano y una máquina juntos, no como una máquina en lugar del humano.
La interpretación es una de las cosas más difíciles que una persona puede hacer en tiempo real. El intérprete tiene que escuchar, entender, reformular y hablar casi al instante, a menudo a través de un acento desconocido o una serie de números que llega más rápido de lo que cualquiera podría anotarlo. Los investigadores describen una “hipótesis de la cuerda floja”: durante la mayor parte de una asignación, los intérpretes trabajan al borde de su capacidad mental, y la precisión disminuye tan pronto como esa carga aumenta. La tensión es física también. La presión del tiempo aumenta el estrés y la frecuencia cardíaca, y la calidad disminuye en turnos más largos de media hora, razón por la cual los intérpretes son rotados aproximadamente cada 30 minutos.
Esa presión solo ha crecido a medida que el trabajo se trasladó en línea. La interpretación es una industria de $11.7 mil millones según la estimación de Nimdzi, y una parte creciente de ella ahora ocurre de forma remota: a través de video, mediante audio desigual, en reuniones híbridas que apenas existían hace cinco años. Los sistemas de subtitulado a los que los intérpretes podrían recurrir nunca fueron construidos para ellos. Intercall fue creado para cerrar esa brecha.
Construido para el intérprete
Intercall es una plataforma de subtitulado y traducción en tiempo real, con humanos en el bucle, hecha para una audiencia: intérpretes profesionales. Humano en el bucle significa exactamente eso. El humano se mantiene a cargo, el software asiste. Mientras el intérprete trabaja, Intercall muestra todo lo que se dice en pantalla, como texto, en ambos idiomas, en el momento en que se habla.
Su fundador, Bahodir Rajabov, comenzó desde algo que la mayoría de los productos pasan por alto. Un intérprete no necesita una transcripción ordenada después de la reunión; necesita la palabra correcta en el momento, lo suficientemente rápido como para que no rompa su concentración. El nombre que no captaron. La cifra que pasó demasiado rápido. El término técnico de un campo en el que no trabajan todos los días.
Rajabov comenzó a programar a los 14 años en Bukhara, Uzbekistán, y más tarde se unió al equipo de IA generativa de IBM. Construyó Intercall para resolver un problema que el resto del mercado había pasado por alto, y fue el arquitecto principal de su núcleo: la captura de audio nativa, la tubería de transcripción de baja latencia, el sistema de terminología y el flujo de trabajo de escritorio multiplataforma. Los sistemas de subtitulado generales disponibles para los intérpretes funcionaban de tres a cinco segundos detrás del hablante. Eso está bien para subtítulos. Es un verdadero problema para un intérprete médico que transmite síntomas a medida que se hablan, o en un tribunal donde medio segundo puede cambiar lo que significa una declaración.
Como él mismo dice: “Nadie había construido nada para los intérpretes. Son maestros de su oficio, trabajando con herramientas prestadas. Subtítulos hechos para espectadores, aplicaciones de traducción hechas para viajeros. Solo necesitaban algo hecho para ellos.”
Cómo funciona
El punto de inflexión fue salir del navegador. Intercall funciona como software nativo en la propia máquina del intérprete, instalado como Word o Zoom en lugar de abrirse como un sitio web. Escrito en C++, trabaja directamente con el sistema operativo y toma el audio directamente de cualquier llamada que esté abierta, ya sea Zoom, Microsoft Teams o Google Meet. No hay extensión de navegador, no hay bot de reunión y no hay compartición de pantalla.
Hace tres cosas. Transcribe la conversación a medida que sucede, lo suficientemente rápido como para que el texto se mantenga al nivel del hablante en lugar de quedarse atrás. “Tiene que sentirse instantáneo”, dice Rajabov. “En el momento en que el texto se queda atrás del hablante, es inútil, y los intérpretes simplemente lo cierran.” Captura las partes que son más fáciles de perder y más costosas de errar, los nombres propios y términos especializados, y permite a los intérpretes cargar hasta 600 de los suyos antes de una sesión: el vocabulario de cardiología antes de una cita de cardiología, los nombres de los casos antes de una audiencia. Y en una llamada multilingüe, se mueve entre idiomas y dialectos por sí solo, a través de docenas de ellos. El inglés del médico y el ruso del paciente, capturados uno al lado del otro, en una conversación, de la manera en que realmente ocurren las llamadas interpretadas.
Para la mayoría de los intérpretes, esa única ventana reemplaza un mosaico de herramientas construidas para otras personas: subtítulos de reuniones, un bloc de notas, una pestaña de traducción mantenida abierta en el navegador. La diferencia se refleja en el trabajo mismo. Menos solicitudes de repetición. Pasajes largos y densos transmitidos sin romper el flujo de la conversación. Mucho menos de la frenética toma de notas que agota a los intérpretes al final de un turno, por lo que la energía que se dedicaba a captar y retener detalles vuelve a la interpretación.
Intercall está diseñado para asistir, no para tomar el control. No interpreta por el usuario. Superficie lo que de otro modo se deslizaría y lo devuelve, dejando al intérprete a cargo de la parte que solo una persona puede hacer: el significado y el juicio. Esa elección colocó a Intercall temprano en una categoría de humano en el bucle que los analistas ahora rastrean, IA que apoya a los intérpretes profesionales durante el trabajo en vivo en lugar de reemplazarlos. Los nombres más grandes se han movido en la misma dirección. Boostlingo agregó una herramienta de productividad de IA en 2024, KUDO trajo asistencia a su consola de intérpretes en 2025, y los analistas de Slator y Nimdzi ahora cubren la categoría.
Confidencialidad
Los intérpretes plantean la objeción obvia casi de inmediato: si es IA, ¿está almacenando mi audio y entrenando con las conversaciones privadas de mis clientes? La respuesta de la empresa está en cómo se construye la plataforma, no en una política de privacidad. Según Intercall, el audio, las transcripciones y las traducciones viven solo en la memoria y se eliminan cuando termina la sesión; nada se escribe en un servidor, y nada se utiliza para entrenar los modelos. Lo que un intérprete genera permanece siendo suyo. Está encriptado y construido para la confidencialidad que exige el trabajo médico regulado por HIPAA y los tribunales, los entornos donde una transcripción filtrada es una violación, no un inconveniente.
Adopción e impacto
Intercall ha estado funcionando durante más de un año y medio. Más de 3,000 intérpretes profesionales en 18 países lo han utilizado, y miles de horas de interpretación en vivo ahora se realizan a través de la plataforma cada mes. Lo que destaca es el alcance. El grupo más grande de usuarios está en la República Dominicana, con intérpretes de pago también en Estados Unidos, Polonia, Perú, Honduras, México, Canadá y más allá, muchos de ellos trabajando a través de proveedores de interpretación como Propio Language Services, iCall International y otros. Lo utilizan en asignaciones en vivo en hospitales, tribunales y salas de conferencias. Su crecimiento ha venido principalmente a través de la profesión misma: intérpretes recomendándolo a colegas y diciéndolo en público.
El impacto que describen se reduce a dos palabras: eficiencia y precisión.
Eficiencia, porque la herramienta absorbe la parte del trabajo que agota a los intérpretes, manteniendo nombres, números y detalles en la memoria mientras sigue escuchando y hablando. Los intérpretes informan que trabajan más horas con mucha menos fatiga. Algunos describen terminar turnos con energía que solían gastar en la frenética toma de notas. Algunos dicen que los ha alejado del burnout que casi los había empujado fuera de la profesión. En un campo donde el límite de trabajo es la fatiga mental en lugar de la habilidad, esa es la diferencia entre una carrera sostenible y una salida temprana.
La precisión es la otra mitad. Todo lo que se dice en una llamada es transcrito y traducido en tiempo real, en ambos idiomas, frente al intérprete, por lo que las solicitudes de repetición disminuyen drásticamente y los detalles más costosos de errar, nombres de medicamentos, dosis, números de casos, direcciones, dejan de deslizarse. En un hospital, eso significa que el paciente que no habla inglés recibe instrucciones de alta exactamente como se las dio el médico. En un tribunal, significa que el testimonio entra en el registro completo.
Un intérprete de Propio Language Services en Colombia, remoto durante más de cinco años, describió trabajar semanas de 48 horas con notas en papel y una Boogie Board: “Al final del día, a menudo me sentía mentalmente agotado por depender constantemente de la memoria y la toma de notas.” Incluso con herramientas
Otros artículos
Construido para asistir, no para reemplazar: dentro de la IA en tiempo real de Intercall para intérpretes profesionales
Intercall muestra la transcripción y traducción en vivo en pantalla en ambos idiomas mientras los intérpretes trabajan, capturando los nombres, números y términos que se escapan bajo la carga cognitiva. Más de 3,000 intérpretes en 18 países lo utilizan.
