Neurólogos de la Universidad de Columbia en Nueva York han desarrollado un sistema que permite traducir el pensamiento en palabras inteligibles, consiguiendo por primera vez transponer señales cerebrales a las palabras.
Esta tecnología, basada en sintetizadores de voz y en la inteligencia artificial, reconstruye las palabras que escucha una persona con una claridad inigualable.
Según Nima Mesgarani y sus colegas, este avance marca un paso decisivo hacia la creación de interfaces cerebro-ordenador que permitirá expresarse a las personas cuya capacidad de hablar es limitada o inexistente, especialmente aquellas que viven con secuelas de ictus o con esclerosis lateral amiotrófica o ELA, una enfermedad del sistema nervioso que ataca a las células nerviosas (neuronas) y la médula espinal
Asimismo, según los investigadores, este desarrollo podría conducir a nuevas formas de comunicación entre los ordenadores y el cerebro humano.
«Nuestra voz nos ayuda a comunicarnos con nuestros amigos, nuestra familia y el mundo que nos rodea, por lo que perder su uso como resultado de una lesión o enfermedad es terrible», señala Nima Mesgarani en un comunicado. Y añade: “nuestro estudio representa una manera de restaurar este poder. Demostramos que con la tecnología adecuada, cualquier oyente puede descifrar y comprender los pensamientos de otra persona”.
Patrones cerebrales de las palabras
En las últimas décadas, el trabajo de los neurocientíficos ha demostrado que ciertos patrones particulares de actividad aparecen en el cerebro cuando una persona se expresa a sí misma con la palabra (o se imagina que lo hace). Otras señales particulares también aparecen en el cerebro cuando una persona escucha a otra.
Estas dos observaciones han llevado a los investigadores a registrar y descodificar estos patrones o código neural, con la finalidad de percibir los pensamientos que circulan por el cerebro y traducirlos a palabras.
Los esfuerzos anteriores de este equipo, pero también de otros grupos de investigación, se han centrado en modelos informáticos simples que analizan espectrogramas, que son representaciones visuales de frecuencias de sonido. Pero este enfoque no ha tenido éxito, ya que no ha podido reproducir sonidos inteligibles similares a los del habla.
Como resultado de este fracaso, el equipo de Nima Mesgarani abandonó el espectrograma y recurrió a un vocoder, un algoritmo informático que puede sintetizar el habla después de ser entrenado para escuchar conversaciones humanas.
Tecnología mejorada
El vocoder es un analizador y sintetizador de voz desarrollado en la década de 1930 como un codificador de voz para telecomunicaciones, que ha sido recuperado para esta tecnología.
Para esta investigación, los neurocientíficos enseñaron a vocoder a interpretar la actividad cerebral de una persona. Y lo consiguieron con el apoyo del Ashesh Dinesh Mehta, un experto en epilepsia que realiza regularmente cirugías cerebrales.
«Le pedimos a los pacientes epilépticos que escucharan las oraciones pronunciadas por diferentes personas, mientras medíamos sus patrones de actividad cerebral», explica Mesgarani. Estos patrones neurales fueron los que sirvieron para entrenar al vocoder.
Luego, los investigadores pidieron a estas mismas personas que escucharan los números audibles de 0 a 9 pronunciados por los oradores. Durante ese proceso, también grabaron las señales cerebrales y las transmitían al vocoder, que las emitía como voz sintetizada.
Este sonido producido por el vocoder en respuesta a las señales cerebrales de los números fue analizado y limpiado por redes neuronales, un tipo de inteligencia artificial que imita la estructura de las neuronas en el cerebro. El resultado fue la emisión de una voz robótica recitando una secuencia de números.
Fiabilidad del 75%
Para verificar la precisión, Mesgarani y su equipo pidieron a las personas que escucharan la grabación e informaran de lo que escucharon. Y descubrieron que las personas podían entender y repetir los sonidos en el 75% de las veces, lo que está más allá de cualquier intento anterior. «El sensible vocoder y las poderosas redes neuronales representaban los sonidos que los pacientes habían escuchado originalmente con sorprendente precisión», señala Mesgarani.
El objetivo final de esta tecnología es integrarla en un implante similar a los que usan algunos pacientes epilépticos, lo que traduciría directamente los pensamientos del usuario en palabras. Un individuo podría entonces pensar «necesito un vaso de agua» y el sistema transformaría las señales cerebrales generadas por este pensamiento en un discurso sintetizado.
No es la primera vez que los neurocientíficos consiguen romper los códigos usados por el cerebro para comunicarse e interpretar el entorno. Tal como informamos en otro artículo, neurocientíficos australianos consiguieron recientemente descifrar el código nervioso que permite al cerebro interpretar la información que recibe de los sentidos, abriendo la posibilidad a que una prótesis sienta lo mismo que un miembro amputado.
Referencia
Towards reconstructing intelligible speech from the human auditory cortex. Hassan Akbari et al. Scientific Reports, volume 9, Article number: 874 (2019). DOI:https://doi.org/10.1038/s41598-018-37359-z
Hacer un comentario