Progettato per assistere, non per sostituire: all'interno dell'AI in tempo reale di Intercall per interpreti professionisti

Progettato per assistere, non per sostituire: all'interno dell'AI in tempo reale di Intercall per interpreti professionisti

      Tra gli interpreti che si affidano a questo strumento, il verdetto è unanime: finalmente, qualcosa costruito per il modo in cui lavorano realmente. La premessa è semplice. L'interpretazione funziona meglio quando uomo e macchina collaborano, non quando la macchina sostituisce l'uomo.

      Interpretare è una delle cose più difficili che una persona possa fare in tempo reale. L'interprete deve ascoltare, comprendere, riformulare e parlare quasi all'istante, spesso attraverso un accento sconosciuto o una sequenza di numeri che arriva più veloce di quanto chiunque possa annotarla. I ricercatori descrivono un'“ipotesi del funambolo”: per la maggior parte di un incarico, gli interpreti lavorano al limite della loro capacità mentale, e la precisione diminuisce non appena quel carico aumenta. La tensione è fisica, inoltre. La pressione del tempo aumenta lo stress e la frequenza cardiaca, e la qualità diminuisce in turni più lunghi di mezz'ora, motivo per cui gli interpreti vengono ruotati all'incirca ogni 30 minuti.

      Quella pressione è aumentata solo con il passaggio del lavoro online. L'interpretazione è un'industria da 11,7 miliardi di dollari secondo la stima di Nimdzi, e una quota crescente di essa avviene ora a distanza: tramite video, attraverso audio irregolare, in riunioni ibride che esistevano a malapena cinque anni fa. I sistemi di sottotitolazione a cui gli interpreti potevano accedere non sono mai stati costruiti per loro. Intercall è stato creato per colmare questa lacuna.

      Costruito per l'interprete

      Intercall è una piattaforma di sottotitolazione e traduzione in tempo reale, con l'uomo nel loop, realizzata per un solo pubblico: interpreti professionisti. Umano nel loop significa esattamente questo. L'uomo rimane al comando, il software assiste. Mentre l'interprete lavora, Intercall mostra tutto ciò che viene detto sullo schermo, come testo, in entrambe le lingue, nel momento in cui viene pronunciato.

      Il suo fondatore, Bahodir Rajabov, è partito da qualcosa che la maggior parte dei prodotti ignora. Un interprete non ha bisogno di una trascrizione ordinata dopo la riunione; ha bisogno della parola giusta al momento giusto, abbastanza veloce da non interrompere la sua concentrazione. Il nome che non ha colto. La cifra che è passata troppo in fretta. Il termine tecnico di un campo in cui non lavora ogni giorno.

      Rajabov ha iniziato a programmare a 14 anni a Bukhara, Uzbekistan, e in seguito è entrato a far parte del team di intelligenza artificiale generativa di IBM. Ha costruito Intercall per risolvere un problema che il resto del mercato aveva trascurato, ed è stato l'architetto principale del suo nucleo: la cattura audio nativa, la pipeline di trascrizione a bassa latenza, il sistema di terminologia e il flusso di lavoro desktop cross-platform. I sistemi di sottotitolazione generali disponibili per gli interpreti erano in ritardo di tre-cinque secondi rispetto al relatore. Va bene per i sottotitoli. È un vero problema per un interprete medico che trasmette sintomi mentre vengono pronunciati, o in un'aula di tribunale dove mezzo secondo può cambiare il significato di una dichiarazione.

      Come dice lui: “Nessuno aveva costruito nulla per gli interpreti. Sono maestri del loro mestiere, che lavorano con strumenti presi in prestito. Sottotitoli creati per gli spettatori, app di traduzione create per i viaggiatori. Avevano solo bisogno di qualcosa fatto per loro.”

      Come funziona

      Il punto di svolta è stato lasciare il browser. Intercall funziona come software nativo sulla macchina dell'interprete, installato come Word o Zoom stesso piuttosto che aperto come un sito web. Scritto in C++, funziona direttamente con il sistema operativo e prende l'audio direttamente da qualsiasi chiamata sia aperta, sia essa Zoom, Microsoft Teams o Google Meet. Non ci sono estensioni del browser, bot per riunioni e condivisione dello schermo.

      Fa tre cose. Trascrive la conversazione mentre avviene, abbastanza velocemente da mantenere il testo a livello con il relatore invece di rimanere indietro. “Deve sembrare istantaneo,” dice Rajabov. “Nel momento in cui il testo rimane indietro rispetto al relatore, è inutile, e gli interpreti semplicemente lo chiudono.” Cattura le parti che sono più facili da perdere e più costose da sbagliare, i nomi propri e i termini specialistici, e consente agli interpreti di caricare fino a 600 dei loro prima di una sessione: il vocabolario di cardiologia prima di un appuntamento di cardiologia, i nomi dei casi prima di un'udienza. E in una chiamata multilingue, si sposta tra lingue e dialetti da solo, attraverso decine di essi. L'inglese del medico e il russo del paziente, catturati fianco a fianco, in una conversazione, come avvengono effettivamente le chiamate interpretate.

      Per la maggior parte degli interpreti, quella finestra unica sostituisce un patchwork di strumenti costruiti per altre persone: sottotitoli per riunioni, un blocco note, una scheda di traduzione tenuta aperta nel browser. La differenza si manifesta nel lavoro stesso. Meno richieste di ripetizione. Passaggi lunghi e densi trasmessi senza interrompere il flusso della conversazione. Molto meno del frenetico prendere appunti che esaurisce gli interpreti alla fine di un turno, quindi l'energia spesa per catturare e mantenere i dettagli torna all'interpretazione.

      Intercall è costruito per assistere, non per prendere il controllo. Non interpreta per l'utente. Porta alla luce ciò che altrimenti sfuggirebbe e lo restituisce, lasciando l'interprete al comando della parte che solo una persona può fare: il significato e il giudizio. Questa scelta ha messo Intercall precocemente in una categoria di uomo nel loop che gli analisti ora monitorano, intelligenza artificiale che supporta gli interpreti professionisti durante il lavoro dal vivo piuttosto che sostituirli. I nomi più grandi si sono mossi nella stessa direzione. Boostlingo ha aggiunto uno strumento di produttività AI nel 2024, KUDO ha portato assistenza nella sua console per interpreti nel 2025, e gli analisti di Slator e Nimdzi ora coprono la categoria.

      Riservatezza

      Gli interpreti sollevano quasi immediatamente l'obiezione ovvia: se è intelligenza artificiale, sta memorizzando il mio audio e addestrando sui colloqui privati dei miei clienti? La risposta dell'azienda è nel modo in cui è costruita la piattaforma, non in una politica sulla privacy. Secondo Intercall, audio, trascrizioni e traduzioni vivono solo in memoria e scompaiono quando la sessione termina; nulla viene scritto su un server e nulla viene utilizzato per addestrare i modelli. Qualunque cosa un interprete generi rimane sua. È crittografata e costruita per la riservatezza che il lavoro medico regolato da HIPAA e i tribunali richiedono, i contesti in cui una trascrizione trapelata è una violazione, non un'inconvenienza.

      Adozione e impatto

      Intercall è in funzione da più di un anno e mezzo. Più di 3.000 interpreti professionisti in 18 paesi lo hanno utilizzato, e migliaia di ore di interpretazione dal vivo ora passano attraverso la piattaforma ogni mese. Ciò che spicca è la portata. Il gruppo più numeroso di utenti si trova nella Repubblica Dominicana, con interpreti paganti anche negli Stati Uniti, in Polonia, in Perù, in Honduras, in Messico, in Canada e oltre, molti di loro lavorano attraverso fornitori di interpretazione tra cui Propio Language Services, iCall International e altri. Lo usano in incarichi dal vivo in ospedali, aule di tribunale e sale conferenze. La sua crescita è avvenuta principalmente attraverso la professione stessa: interpreti che lo raccomandano ai colleghi e lo dicono pubblicamente.

      L'impatto che descrivono si riduce a due parole: efficienza e precisione.

      Efficienza, perché lo strumento assorbe la parte del lavoro che esaurisce gli interpreti, mantenendo nomi, numeri e dettagli in memoria mentre continua ad ascoltare e parlare. Gli interpreti segnalano di lavorare più a lungo con molta meno fatica. Alcuni descrivono di terminare i turni con energia che prima spendevano per prendere appunti freneticamente. Alcuni

Altri articoli

L'avvocato che ha battuto Meta in un processo storico sulla dipendenza afferma che l'IA era la sua arma segreta L'avvocato che ha battuto Meta in un processo storico sulla dipendenza afferma che l'IA era la sua arma segreta L'avvocato di contenzioso Mark Lanier ha utilizzato l'IA per prepararsi e vincere un verdetto di 6 milioni di dollari contro Meta e Google, definendolo "un cambiamento totale nel gioco" per il contenzioso ad alto rischio. Gli ETF gestiti dall'IA di FINQ superano silenziosamente Wall Street all'inizio del 2026 Gli ETF gestiti dall'IA di FINQ superano silenziosamente Wall Street all'inizio del 2026 I due ETF gestiti da AI di FINQ, AIUP e AINT, hanno superato l'S&P 500 dal loro lancio su NYSE Arca nel febbraio 2026, con rendimenti del 15,30% e del 27,13% rispettivamente, rispetto al 10,07% del benchmark. Perché Apple ha costruito un sistema AI di terze parti per Siri e poi ha rifiutato di mostrarlo al WWDC La beta di iOS 27 di Apple contiene un framework Extensions per Claude, Gemini e ChatGPT all'interno di Siri, ma la funzione era assente dalla keynote del WWDC 2026. De Beers scommette sulla blockchain mentre i diamanti coltivati in laboratorio aumentano. De Beers scommette sulla blockchain mentre i diamanti coltivati in laboratorio aumentano. GIA acquisisce il 30% di Tracr, la piattaforma di provenienza blockchain di De Beers, mentre i prezzi dei diamanti naturali crollano e le pietre coltivate in laboratorio guadagnano quote di mercato. Le borse di criptovalute hanno promesso accesso all'IPO di SpaceX tramite azioni tokenizzate. Nulla di tutto ciò è arrivato. Le borse di criptovalute hanno promesso accesso all'IPO di SpaceX tramite azioni tokenizzate. Nulla di tutto ciò è arrivato. Binance, Bybit e Bitget hanno annullato le campagne di IPO tokenizzate di SpaceX dopo che xStocks non è riuscita a consegnare le azioni, lasciando oltre 1 miliardo di dollari in ordini non evasi. Wear OS 7 sembra pronto a sbarcare presto sugli orologi Pixel. Wear OS 7 sembra pronto a sbarcare presto sugli orologi Pixel. Pixel Watch 2, Pixel Watch 3 e Pixel Watch 4 potrebbero presto ricevere Wear OS 7, secondo le pagine di supporto Verizon aggiornate avvistate prima del rilascio.

Progettato per assistere, non per sostituire: all'interno dell'AI in tempo reale di Intercall per interpreti professionisti

Intercall mette la trascrizione e la traduzione in tempo reale sullo schermo in entrambe le lingue mentre gli interpreti lavorano, catturando i nomi, i numeri e i termini che sfuggono sotto il carico cognitivo. Oltre 3.000 interpreti in 18 paesi lo utilizzano.