Il Brain2Qwerty di Meta legge le frasi digitate dal cervello
Meta afferma di poter trasformare l'attività cerebrale in frasi digitate senza aprire il cranio. Il salto è reale. Anche il rovescio della medaglia: il sistema impara dalla digitazione, l'unica cosa che i suoi utenti previsti non possono fare.
Lunedì, Meta ha svelato la seconda versione di Brain2Qwerty, un sistema che legge i segnali cerebrali prodotti dalle persone mentre digitano e ricostruisce le parole. È non invasivo. Non ci sono interventi chirurgici né impianti. Un volontario indossa uno scanner di magnetoencefalografia (MEG), una macchina simile a un casco che raccoglie i minuscoli campi magnetici emessi dal cervello. Un pipeline di intelligenza artificiale fa il resto.
Il numero principale è un vero balzo. Brain2Qwerty v2 ha raggiunto una precisione media delle parole del 61%, salendo al 78% per il miglior partecipante, ha detto Meta. I precedenti sistemi non invasivi riuscivano solo a ottenere cifre a una sola cifra. La versione v1 dello scorso anno si è fermata intorno al 48%.
Per arrivarci, Meta ha addestrato il sistema su circa 22.000 frasi digitate da nove volontari, ciascuno indossando lo scanner per circa 10 ore. Meta ha condotto lo studio in un centro di ricerca a San Sebastián, in Spagna, ha riportato Gizmodo.
Chatbot per il cervello
Il trucco è la stessa tecnologia dietro ChatGPT. La pipeline prima trasforma il segnale disordinato dello scanner in caratteri. Un secondo modello li unisce in parole. Poi un grande modello linguistico, affinato sui dati cerebrali, utilizza il contesto per indovinare la frase che la persona intendeva, molto simile a un telefono che prevede la tua prossima parola.
Meta afferma che questa è la prima volta che un LLM ha decifrato l'attività cerebrale rumorosa in frasi complete. Ha persino messo a lavoro agenti di intelligenza artificiale per affinare la propria pipeline di decodifica, anche se gli ingegneri hanno preso le decisioni finali.
La scelta dello scanner è stata più importante del previsto. Meta ha testato sia il MEG che l'EEG, più economico e comune. Il MEG è stato di gran lunga migliore, con un tasso di errore dei caratteri del 29% contro il 65% per l'EEG.
Meta ha reso open source il codice e il dataset, rispecchiando una spinta più ampia a fare intelligenza artificiale per la scienza in modo aperto. Inquadra il progetto come un modo per aiutare i milioni che perdono la parola a causa di lesioni cerebrali o malattie.
Ancora bloccati in laboratorio
Poi arrivano le avvertenze, ed esse sono significative. Il sistema non è affatto un prodotto. Lo scanner MEG riempie una stanza, costa una fortuna e appartiene a un ospedale, non a una casa. Non può nemmeno funzionare in tempo reale. I modelli hanno bisogno di un'intera sessione di digitazione per completarsi prima di produrre qualcosa, quindi non c'è feedback dal vivo.
C'è un problema più profondo. Brain2Qwerty impara dai segnali cerebrali delle persone che digitano. I suoi utenti previsti, quelli bloccati da paralisi o malattia, non possono digitare affatto. Meta ammette quanto sopra. Le persone con mobilità limitata potrebbero beneficiarne, ma i completamente bloccati è improbabile che lo facciano. Ciò richiederebbe di ricostruire il compito attorno al movimento immaginato piuttosto che ai veri tasti premuti.
Il design attuale ha persino bisogno di sapere esattamente quando l'utente preme ciascun tasto, e Meta definisce il percorso verso una decodifica continua e senza attivazione "incerto".
I chirurghi sono ancora avanti
Per ora, l'approccio invasivo vince in termini di risultati. I sistemi impiantati raggiungono una precisione molto più alta, ha notato The Register, con recenti interventi chirurgici che raggiungono il 92% di precisione a livello di frase. Un'interfaccia chirurgica ha permesso a un uomo con SLA di lavorare a tempo pieno, decifrando il suo tentativo di parlare con una precisione quasi perfetta. Aziende da Neuralink ai suoi concorrenti stanno correndo per commercializzare quel tipo di impianto.
La proposta di Meta è che può colmare il divario senza il trapano, perché la precisione aumenta costantemente man mano che alimenta i modelli con più dati.
Questo potrebbe rivelarsi vero, e svolgere il lavoro in modo aperto dovrebbe aiutare altri a testarlo. Ma un lettore cerebrale che riempie una stanza, aspetta che tu finisca e dipende dalla tua capacità di digitare è lontano da una linea di salvataggio. Le ambizioni più ampie di Meta nell'IA tendono ad arrivare forti e presto. Questa è un vero progresso in laboratorio e un onesto promemoria di quanto lontano il laboratorio sia ancora dal reparto.
Altri articoli
Il Brain2Qwerty di Meta legge le frasi digitate dal cervello
La Brain2Qwerty v2 di Meta decodifica le frasi digitate da scansioni cerebrali con un'accuratezza del 61% senza impianto. Il problema: è delle dimensioni di una stanza, non in tempo reale e limitata al laboratorio.
