El Brain2Qwerty de Meta lee oraciones escritas desde el cerebro.
Meta dice que puede convertir la actividad cerebral en oraciones escritas sin abrir tu cráneo. El salto es real. También lo es la trampa: el sistema aprende de la escritura, la única cosa que sus usuarios previstos no pueden hacer.
El lunes, Meta presentó la segunda versión de Brain2Qwerty, un sistema que lee las señales cerebrales que las personas producen mientras escriben y reconstruye las palabras. Es no invasivo. No hay cirugía ni implante. Un voluntario lleva un escáner de magnetoencefalografía (MEG), una máquina en forma de casco que capta los pequeños campos magnéticos que emite el cerebro. Un pipeline de IA hace el resto.
El número destacado es un verdadero salto. Brain2Qwerty v2 alcanzó una precisión promedio de palabras del 61 por ciento, subiendo al 78 por ciento para el mejor participante, dijo Meta. Los sistemas no invasivos anteriores solo lograron cifras de un solo dígito. La versión v1 del año pasado alcanzó alrededor del 48 por ciento.
Para llegar allí, Meta entrenó el sistema con aproximadamente 22,000 oraciones que nueve voluntarios escribieron, cada uno usando el escáner durante unas 10 horas. Meta llevó a cabo el estudio en un centro de investigación en San Sebastián, España, informó Gizmodo.
Chatbots para el cerebro
El truco es la misma tecnología detrás de ChatGPT. El pipeline primero convierte la señal desordenada del escáner en caracteres. Un segundo modelo los une en palabras. Luego, un modelo de lenguaje grande, ajustado con los datos cerebrales, utiliza el contexto para adivinar la oración que la persona quería decir, muy parecido a como un teléfono predice tu próxima palabra.
Meta dice que esta es la primera vez que un LLM ha decodificado la actividad cerebral ruidosa en oraciones completas. Incluso puso a trabajar a agentes de IA refinando su propio pipeline de decodificación, aunque los ingenieros tomaron las decisiones finales.
La elección del escáner importó más de lo esperado. Meta probó tanto el MEG como el EEG, que es más barato y común. El MEG fue mucho mejor, con una tasa de error de caracteres del 29 por ciento frente al 65 por ciento del EEG.
Meta ha hecho público el código y el conjunto de datos, reflejando un impulso más amplio para hacer IA para la ciencia de manera abierta. Enmarca el proyecto como una forma de ayudar a los millones que pierden el habla debido a lesiones cerebrales o enfermedades.
Aún atrapados en el laboratorio
Luego vienen las advertencias, y son grandes. El sistema está lejos de ser un producto. El escáner MEG ocupa una habitación, cuesta una fortuna y pertenece a un hospital, no a un hogar. Tampoco puede funcionar en tiempo real. Los modelos necesitan una sesión completa de escritura para terminar antes de producir algo, por lo que no hay retroalimentación en vivo.
Hay un problema más profundo. Brain2Qwerty aprende de las señales cerebrales de las personas que escriben. Sus usuarios previstos, aquellos atrapados por parálisis o enfermedad, no pueden escribir en absoluto. Meta admite tanto. Las personas con movilidad limitada podrían beneficiarse, pero los completamente atrapados son poco probables de hacerlo. Eso requeriría reconstruir la tarea en torno al movimiento imaginado en lugar de pulsaciones reales.
El diseño actual incluso necesita saber exactamente cuándo el usuario presiona cada tecla, y Meta llama al camino hacia una decodificación continua y sin disparadores "incierto".
Los cirujanos aún están adelante
Por ahora, el enfoque invasivo gana en resultados. Los sistemas implantados alcanzan una precisión mucho más alta, señaló The Register, con trabajos quirúrgicos recientes alcanzando una precisión del 92 por ciento a nivel de oración. Una interfaz quirúrgica permitió a un hombre con ELA trabajar en un empleo a tiempo completo, decodificando su intento de habla con una precisión casi perfecta. Empresas desde Neuralink hasta sus rivales están compitiendo para comercializar ese tipo de implante.
La propuesta de Meta es que puede cerrar la brecha sin el taladro, porque la precisión aumenta constantemente a medida que alimenta a los modelos con más datos.
Eso puede resultar cierto, y hacer el trabajo de manera abierta debería ayudar a otros a probarlo. Pero un lector cerebral que ocupa una habitación, espera hasta que termines y depende de que puedas escribir está muy lejos de ser un salvavidas. Las ambiciones más amplias de IA de Meta tienden a llegar de manera ruidosa y temprana. Este es un verdadero avance en el laboratorio, y un recordatorio honesto de cuán lejos todavía está el laboratorio de la sala.
Otros artículos
El Brain2Qwerty de Meta lee oraciones escritas desde el cerebro.
El Brain2Qwerty v2 de Meta decodifica oraciones escritas a partir de escaneos cerebrales con un 61% de precisión sin implante. La trampa: es del tamaño de una habitación, no es en tiempo real y está limitado al laboratorio.
