La precisión de la IA de Meta para convertir pensamientos en texto alcanza el 61%, y el código abierto se publica simultáneamente.

Meta lanzó esta semana Brain2Qwerty v2, un sistema de interfaz cerebro-computadora no invasiva que registra la actividad neuronal mediante un casco de escáner MEG (magnetoencefalografía) y decodifica directamente texto objetivo usando un modelo de aprendizaje profundo de extremo a extremo, con una precisión promedio del 61% por palabra. Meta también publicó el código y el conjunto de datos como parte de su Digital Brain Project, y estableció un fondo de 5 millones de dólares.

Arquitectura técnica de Brain2Qwerty v2: escala de entrenamiento y método de decodificación de extremo a extremo

El sistema emplea un modelo de aprendizaje profundo de extremo a extremo que decodifica directamente desde la señal MEG cruda hasta el texto de salida, sin depender de pasos intermedios diseñados manualmente; un modelo de lenguaje grande corrige los errores inducidos por ruido en la etapa posterior según el contexto semántico.

Escala de datos de entrenamiento: aproximadamente 22.000 oraciones, 9 voluntarios, cada uno con alrededor de 10 horas de grabación. Meta afirma que la precisión seguirá mejorando a medida que aumente el volumen de datos de entrenamiento. Como referencia técnica, la versión v1 tenía una tasa de error de caracteres (CER) de aproximadamente el 32% en condiciones de MEG; al cambiar la misma tarea a EEG (electroencefalografía), esta tasa aumentaba a aproximadamente el 67%.

Ventajas técnicas del MEG y limitaciones del equipo actual

El MEG utiliza sensores superconductores para detectar los campos magnéticos extremadamente débiles generados por la actividad neuronal; su penetración es superior a la del EEG y la señal es relativamente más clara. Sin embargo, el casco MEG cuesta millones de dólares y requiere un entorno especial que aísle los campos magnéticos externos, por lo que durante mucho tiempo ha estado limitado a laboratorios de neurociencia, sin aplicaciones clínicas o de consumo.

Brain2Qwerty v2 alcanza un 61% de precisión bajo estas restricciones de equipo, acercándose al nivel que antes solo lograban las interfaces implantables (como Neuralink). Meta eligió la vía no invasiva porque el umbral quirúrgico de las interfaces implantables hace que la mayoría de los potenciales beneficiarios no las acepten.

Plan de código abierto de Meta: Digital Brain Project y fondo de 5 millones de dólares

Al publicar Brain2Qwerty v2, Meta también puso a disposición el código del sistema y el conjunto de datos de entrenamiento como parte del Digital Brain Project. Además, Meta estableció un fondo de 5 millones de dólares dedicado a apoyar la creación de conjuntos de datos de neurociencia abiertos.

Meta señala que uno de los cuellos de botella en la investigación de BCI no invasiva es la falta de conjuntos de datos neuronales públicos a gran escala; actualmente, las distintas instituciones de investigación recopilan datos básicos de forma repetida con una eficiencia muy baja. Este fondo tiene como objetivo impulsar a la comunidad a construir conjuntos de datos de referencia.

Preguntas frecuentes

¿Cuál es la diferencia técnica fundamental entre las interfaces cerebro-computadora no invasivas e implantables?

Las interfaces implantables (como Neuralink) colocan electrodos directamente en la corteza cerebral, ofreciendo señales limpias, baja latencia y alta precisión, pero requieren cirugía. El principal desafío de los métodos no invasivos es la relación señal-ruido: el cráneo y el cuero cabelludo atenúan severamente la señal, especialmente en EEG; el MEG tiene una penetración relativamente mejor, pero el costo del equipo y los requisitos ambientales limitan su adopción.

¿Qué significado técnico tiene el modelo «de extremo a extremo» de Brain2Qwerty v2?

El modelo de extremo a extremo decodifica directamente desde la señal MEG cruda hasta el texto de salida, sin necesidad de que los investigadores diseñen pasos intermedios manualmente (como identificar eventos cerebrales específicos y luego deducir letras paso a paso). Durante el desarrollo, Meta utilizó agentes de IA para explorar sistemáticamente el espacio de optimización del flujo de decodificación, y los ingenieros seleccionaron la configuración final de entrenamiento a partir de ello.

¿Cuándo podría este sistema entrar en el ámbito clínico o comercial?

Brain2Qwerty v2 se ha probado actualmente en condiciones de laboratorio con equipos MEG; se trata de un sistema en fase de investigación que aún no ha entrado en ensayos clínicos ni en procesos de comercialización. Meta afirma que la precisión aún tiene margen de mejora, pero hasta la fecha de este informe no se ha anunciado un cronograma para su uso clínico o comercial.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios