Tendencias21

La tecnología da voz a quienes no pueden hablar

La voz es una parte esencial de la identidad, pues por ella se pueden transmitir otros rasgos como la edad, la personalidad o el estilo de vida. Sin embargo, muchas personas sufren un trastorno del lenguaje que les impide comunicarse con su propia voz, sustituyéndola por otra robótica que reproduce lo que escriben. Desde hace unos años la empresa VocaliD ha creado un banco de voces y una tecnología patentada que permite combinarlas para crear un tono personalizado único, apto para su uso en cualquier dispositivo. Por Patricia Pérez.

La tecnología da voz a quienes no pueden hablar

Más de 10 millones de personas en el mundo sufren un trastorno del habla por problemas de las funciones motoras orales, ya sea a causa de una lesión cerebral, una enfermedad neurodegenerativa como la Esclerosis Lateral Amiotrófica (ELA) o una discapacidad intelectual. Estos trastornos varían desde simples substituciones de sonido hasta la inhabilidad de comprender o utilizar el lenguaje para el habla.

Muchos de ellos utilizan dispositivos que convierten lo que escriben en voz para comunicarse. Sin embargo, se trata de una voz robótica, como la popularizada por el célebre científico británico Stephen Hawking. Para él se ha convertido ya en una de sus señas de identidad, pero su uso puede resultar traumático para un niño. E igual que a nadie se le ocurre utilizar la misma pierna protésica para una niña que para un hombre adulto, con las voces debería pasar lo mismo.

En esa línea, se están explorando durante los últimos años diferentes vías para devolver la voz a estos pacientes, bien a través de la síntesis de voz o mediante la producción artificial de habla humana. Aunque la tecnología existe desde hace décadas, los esfuerzos se centran ahora en conseguir su personalización. Varias empresas y grupos de investigación están utilizando motores de síntesis de voz para crear voces a partir de muestras, principalmente desde frases grabadas.

Es el caso de la empresa escocesa CereProc, popular por haber creado un sintetizador de voz para el crítico de cine Roger Ebert varios años antes de su muerte en 2013, tomando como base palabras básicas pronunciadas por él mismo, extraídas de diversas grabaciones suyas en programas de radio y televisión.

Otro ejemplo es la norteamericana VocaliD, aunque su enfoque es diferente, pues permite personalizar las voces utilizando sólo una pequeña muestra de su beneficiario, incluso si no pueden hablar. Para ello recurre a la donación de voces, en algunos casos de familiares de los pacientes, aunque cualquier persona puede hacerlo altruistamente.

Búsqueda de coincidencias

Según explican en la web de la empresa, la creación de voces sintéticas pasa por la audición de un actor de voz, que se graba durante días o semanas en un estudio profesional. Después, un ejército de ingenieros y lingüistas pasan de tres a cuatro meses trabajando sobre las grabaciones para sintetizarla. El resultado es una voz cara, por lo que implica el proceso, y genérica.

Rupal Patel, fundadora y CEO de VocaliD, detectó que las personas con trastornos severos de comunicación conservan la capacidad de controlar aspectos de sus voces, como el tono y el volumen. Es lo que Patel llama «melodía del habla», fundamental para conferirle identidad.

Así, basta con tres segundos de sonido del paciente para que los algoritmos busquen coincidencias entre los donantes y las combine con su ADN vocal. El resultado es una voz digital personalizada que transmite una identidad vocal única. Se presenta como un archivo de sonido que se conecta a cualquier dispositivo de conversión de texto a voz, sin ninguna configuración adicional.

«Tengo dos hermanas, una de las cuales cecea y la otra tiene la voz nasal como yo antes de tener ELA», explica Jessie Levine, una de las primeras beneficiarias de esta herramienta, en un reportaje publicado en la revista online Phys.org. «Nunca se me ocurrió que podría adaptarlas a la mía y utilizarlas”, asegura.

Crowdsourcing

El sistema no sería posible sin el banco de voces, una acción de crowdsourcing que permite que cualquiera pueda compartir su voz con otros, o almacenarla para sí mismo, desde la comodidad de su propia casa. De esta forma se está construyendo una plataforma que reúne la diversidad y riqueza de la voz humana, con hablantes de diversas lenguas, razas y edades. Hasta el momento, más de 14.000 personas en todo el mundo han contribuido a aumentar la colección con más de seis millones de frases. El proceso implica unas seis horas y 3.500 frases leídas en voz alta.

La compañía entregó sus primeras siete voces a finales del año pasado y está trabajando en casi un centenar más. Sin embargo, la barrera todavía sigue siendo el precio, pues supera los 1.000 euros cada una. Uno de las primeras receptoras fue Delaney Supple, una chica de 17 años de Massachusetts que nació con parálisis cerebral.

Hasta ahora había estado utilizando un sintetizador que reproducía lo que escribía en la pantalla de su tableta, pero con una voz digital genérica, que como es de suponer no era de su agrado. La nueva le gusta mucho, tanto a ella como a su familia. «Me encanta escucharla», reconoce su madre, Erica Supple, quien confiesa que la primera vez que la oyó le recordó a la voz de su hermano cuando era más joven.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Un proyecto global trabaja para crear de forma colaborativa un cerebro robótico general 29 junio, 2024
    El auge de la inteligencia artificial generativa impulsa un proyecto global que trabaja para crear un cerebro robótico general, capaz de generar androides como los que hemos visto hasta ahora solo en la ciencia ficción. Pero es cuestión de tiempo que convivamos con ellos en perfecta armonía. Ya no es una utopía.
    Eduardo Martínez de la Fe
  • Las hormigas invasoras hacen autostop para encontrar un nuevo hogar 28 junio, 2024
    Se sabe que los insectos son especialistas en utilizar todo tipo de formas de transporte para atravesar amplias distancias, pero un nuevo estudio ha revelado que las hormigas también dominan el autostop: estos insectos sociales recogen a toda la familia, incluida su reina, y se suben al primer vehículo que encuentran para emprender un viaje […]
    Pablo Javier Piacente
  • Los recuerdos imborrables se adhieren a algunas neuronas 28 junio, 2024
    Los científicos han descubierto una explicación biológica para los recuerdos a largo plazo, esos que acompañan a una persona prácticamente durante toda la vida. Revelaron que una molécula, KIBRA, sirve como “pegamento” para otras moléculas, consolidando así la formación de la memoria al activar y mantener una etiqueta sináptica persistente, que queda adherida a un […]
    Pablo Javier Piacente
  • Descubren un boquete de seguridad que afecta a todos los dispositivos y conexiones a Internet 28 junio, 2024
    Una vulnerabilidad de seguridad, que afecta a todas las conexiones y dispositivos de Internet, puede eludir firewalls, VPN y otras herramientas de seguridad y permite espiar a cualquier persona, sin necesidad de código malicioso o acceso al dispositivo. No existe una manera fácil de solucionar este problema de seguridad.
    Redacción T21
  • Crean bebés digitales para mejorar la atención sanitaria 27 junio, 2024
    Un equipo de investigadores desarrolló modelos informáticos que simulan los procesos metabólicos únicos de cada bebé: los “gemelos digitales” pueden ayudar a comprender mejor las enfermedades metabólicas raras y otros desafíos que enfrentan los bebés humanos durante los primeros 6 meses de vida, que son críticos para su crecimiento posterior.
    Pablo Javier Piacente
  • La similitud de los vientos espaciales con los de la Tierra 27 junio, 2024
    Los científicos han descubierto corrientes en el espacio que reflejan de manera inquietante los vientos que giran cerca de la superficie de la Tierra, lo que sugiere fuerzas ocultas que los conectan. Este nuevo conocimiento podría proporcionarnos una mejor comprensión de los sistemas ambientales que circulan alrededor del globo y mejorar los pronósticos meteorológicos espaciales […]
    Pablo Javier Piacente
  • Los archivos geológicos anticipan nuestro futuro climático 27 junio, 2024
    Hace 56 millones de años, la erosión del suelo se cuadruplicó en el planeta debido a las fuertes lluvias y las inundaciones de los ríos provocadas por un calentamiento global muy similar al que conocemos hoy.
    Eduardo Martínez de la Fe
  • Ya es posible transmitir el tacto a través de Internet 26 junio, 2024
    Un nuevo estándar para la compresión y transmisión del sentido del tacto mediante Internet sienta las bases para la telecirugía, la teleconducción y nuevas experiencias de juego en línea, entre otras aplicaciones. El flamante estándar HCTI (Haptic Codecs for the Tactile Internet) es para el “tacto digital” lo que son JPEG, MP3 y MPEG para […]
    Pablo Javier Piacente
  • Las primeras muestras de la cara oculta de la Luna ya están en la Tierra 26 junio, 2024
    La cápsula de reingreso de la sonda Chang'e-6 de China, que transporta hasta dos kilogramos de materiales extraídos y perforados de la cuenca más antigua de la Luna ubicada en su lado oscuro, aterrizó este martes 25 de junio en la región de Mongolia Interior y fue rápidamente recuperada, según informó la Administración Nacional del […]
    Pablo Javier Piacente
  • La Tierra tendrá dos soles dentro de 1,3 millones de años y durante 60.000 años 26 junio, 2024
    Dentro de 1,3 millones de años, la Tierra tendrá una especie de segundo sol porque la estrella Gliese 710 se acercará a 1,1 años luz de la Tierra y la veríamos del mismo tamaño que Júpiter. Lo malo es que esa alteración cósmica puede provocar un episodio en nuestro planeta como el que acabó con […]
    Eduardo Martínez de la Fe