Tendencias21

La tecnología da voz a quienes no pueden hablar

La voz es una parte esencial de la identidad, pues por ella se pueden transmitir otros rasgos como la edad, la personalidad o el estilo de vida. Sin embargo, muchas personas sufren un trastorno del lenguaje que les impide comunicarse con su propia voz, sustituyéndola por otra robótica que reproduce lo que escriben. Desde hace unos años la empresa VocaliD ha creado un banco de voces y una tecnología patentada que permite combinarlas para crear un tono personalizado único, apto para su uso en cualquier dispositivo. Por Patricia Pérez.

La tecnología da voz a quienes no pueden hablar

Más de 10 millones de personas en el mundo sufren un trastorno del habla por problemas de las funciones motoras orales, ya sea a causa de una lesión cerebral, una enfermedad neurodegenerativa como la Esclerosis Lateral Amiotrófica (ELA) o una discapacidad intelectual. Estos trastornos varían desde simples substituciones de sonido hasta la inhabilidad de comprender o utilizar el lenguaje para el habla.

Muchos de ellos utilizan dispositivos que convierten lo que escriben en voz para comunicarse. Sin embargo, se trata de una voz robótica, como la popularizada por el célebre científico británico Stephen Hawking. Para él se ha convertido ya en una de sus señas de identidad, pero su uso puede resultar traumático para un niño. E igual que a nadie se le ocurre utilizar la misma pierna protésica para una niña que para un hombre adulto, con las voces debería pasar lo mismo.

En esa línea, se están explorando durante los últimos años diferentes vías para devolver la voz a estos pacientes, bien a través de la síntesis de voz o mediante la producción artificial de habla humana. Aunque la tecnología existe desde hace décadas, los esfuerzos se centran ahora en conseguir su personalización. Varias empresas y grupos de investigación están utilizando motores de síntesis de voz para crear voces a partir de muestras, principalmente desde frases grabadas.

Es el caso de la empresa escocesa CereProc, popular por haber creado un sintetizador de voz para el crítico de cine Roger Ebert varios años antes de su muerte en 2013, tomando como base palabras básicas pronunciadas por él mismo, extraídas de diversas grabaciones suyas en programas de radio y televisión.

Otro ejemplo es la norteamericana VocaliD, aunque su enfoque es diferente, pues permite personalizar las voces utilizando sólo una pequeña muestra de su beneficiario, incluso si no pueden hablar. Para ello recurre a la donación de voces, en algunos casos de familiares de los pacientes, aunque cualquier persona puede hacerlo altruistamente.

Búsqueda de coincidencias

Según explican en la web de la empresa, la creación de voces sintéticas pasa por la audición de un actor de voz, que se graba durante días o semanas en un estudio profesional. Después, un ejército de ingenieros y lingüistas pasan de tres a cuatro meses trabajando sobre las grabaciones para sintetizarla. El resultado es una voz cara, por lo que implica el proceso, y genérica.

Rupal Patel, fundadora y CEO de VocaliD, detectó que las personas con trastornos severos de comunicación conservan la capacidad de controlar aspectos de sus voces, como el tono y el volumen. Es lo que Patel llama «melodía del habla», fundamental para conferirle identidad.

Así, basta con tres segundos de sonido del paciente para que los algoritmos busquen coincidencias entre los donantes y las combine con su ADN vocal. El resultado es una voz digital personalizada que transmite una identidad vocal única. Se presenta como un archivo de sonido que se conecta a cualquier dispositivo de conversión de texto a voz, sin ninguna configuración adicional.

«Tengo dos hermanas, una de las cuales cecea y la otra tiene la voz nasal como yo antes de tener ELA», explica Jessie Levine, una de las primeras beneficiarias de esta herramienta, en un reportaje publicado en la revista online Phys.org. «Nunca se me ocurrió que podría adaptarlas a la mía y utilizarlas”, asegura.

Crowdsourcing

El sistema no sería posible sin el banco de voces, una acción de crowdsourcing que permite que cualquiera pueda compartir su voz con otros, o almacenarla para sí mismo, desde la comodidad de su propia casa. De esta forma se está construyendo una plataforma que reúne la diversidad y riqueza de la voz humana, con hablantes de diversas lenguas, razas y edades. Hasta el momento, más de 14.000 personas en todo el mundo han contribuido a aumentar la colección con más de seis millones de frases. El proceso implica unas seis horas y 3.500 frases leídas en voz alta.

La compañía entregó sus primeras siete voces a finales del año pasado y está trabajando en casi un centenar más. Sin embargo, la barrera todavía sigue siendo el precio, pues supera los 1.000 euros cada una. Uno de las primeras receptoras fue Delaney Supple, una chica de 17 años de Massachusetts que nació con parálisis cerebral.

Hasta ahora había estado utilizando un sintetizador que reproducía lo que escribía en la pantalla de su tableta, pero con una voz digital genérica, que como es de suponer no era de su agrado. La nueva le gusta mucho, tanto a ella como a su familia. «Me encanta escucharla», reconoce su madre, Erica Supple, quien confiesa que la primera vez que la oyó le recordó a la voz de su hermano cuando era más joven.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Descubren que la base del lenguaje humano se desarrolló hace 135.000 años 20 marzo, 2025
    Los humanos hablamos más de 7.000 idiomas en la actualidad, muy diferentes entre ellos: sin embargo, un nuevo estudio ha descubierto que todas estas variantes idiomáticas provienen de un solo árbol genealógico lingüístico, que surgió antes de que nuestra especie se dividiera en poblaciones distintas hace 135.000 años. Solo 35.000 años después, el lenguaje habría […]
    Pablo Javier Piacente / T21
  • Nace el primer periódico creado íntegramente por la Inteligencia Artificial 20 marzo, 2025
    Por primera vez en la historia, un periódico italiano ha publicado una edición especial en la que cada palabra, titular y cita han sido generados exclusivamente por IA. Así nace Il Foglio AI, un proyecto que promete revolucionar la forma en que concebimos las noticias.
    Redacción T21
  • Google habría impulsado una IA experimental involucrada en la muerte de un adolescente 20 marzo, 2025
    Plataformas respaldadas por gigantes tecnológicos como Google han introducido chatbots de IA interactivos dirigidos a niños y adolescentes, abriendo fuertes debates sobre su impacto en el desarrollo infantil. En concreto, la aplicación experimental Character.AI ha sido objeto de demandas legales por parte de distintas familias, que alegan que sus hijos fueron expuestos a contenidos perjudiciales […]
    Pablo Javier Piacente / T21
  • Sudáfrica y China logran una conexión cuántica satelital récord de casi 13.000 kilómetros 20 marzo, 2025
    Un equipo internacional de científicos ha establecido una conexión satelital cuántica histórica entre Sudáfrica y China, cubriendo una distancia récord de 12.900 kilómetros. Gracias al fenómeno del entrelazamiento cuántico, esta tecnología garantiza comunicaciones absolutamente seguras frente a cualquier intento de espionaje.
    Redacción T21
  • Los tribunales no reconocen derechos de autor a la Inteligencia Artificial 20 marzo, 2025
    Un tribunal de apelaciones en Estados Unidos ha puesto límites a la creatividad de las máquinas: las obras generadas exclusivamente por inteligencia artificial no pueden ser protegidas por derechos de autor. El fallo reafirma que la ley actual requiere la participación humana para garantizar la protección legal de una obra.
    Redacción T21
  • Desvelan la primera luz que encendió el Universo 20 marzo, 2025
    El Telescopio de Cosmología de Atacama (ACT) ha compilado el mapa más detallado que hemos visto hasta hoy del fondo cósmico de microondas, la tenue luz que impregna el Universo desde solo 380.000 años después del Big Bang y cuyos ecos pueden apreciarse en la actualidad. La imagen obtenida es lo más parecido a la […]
    Redacción T21
  • Microsoft e Inait revolucionan la Inteligencia Artificial con cerebros digitales casi humanos 20 marzo, 2025
    Microsoft ha unido fuerzas con la startup suiza Inait para desarrollar sistemas de IA inspirados en el cerebro humano. Esta colaboración busca crear modelos que no solo aprenden de datos, sino que también razonan como el cerebro humano.
    Redacción T21
  • Una prueba de consciencia corporal desafía las visiones tradicionales sobre la cognición animal 19 marzo, 2025
    Los gorilas pueden ser tan conscientes de sí mismos como los chimpancés, según ha comprobado una nueva investigación: luego de realizar una prueba de autoconsciencia corporal bajo parámetros diferentes a las tradicionales, los científicos verificaron que las capacidades cognitivas de estos simios se habían menospreciado hasta hoy.
    Pablo Javier Piacente / T21
  • China plantea la necesidad de etiquetar el contenido generado con IA 19 marzo, 2025
    En colaboración con varios ministerios gubernamentales, la Administración China de Control del Ciberespacio (CAC) ha anunciado que todo el contenido generado por IA en Internet tendrá que ser etiquetado como tal. Sería la forma a través de la cual el gigante asiático se acopla a la idea europea de establecer algún tipo de regulación sobre […]
    Pablo Javier Piacente / T21
  • Escándalo: Elon Musk implanta en la Casa Blanca su servicio de internet satelital Starlink 19 marzo, 2025
    Starlink ha instalado en la Casa Blanca un servicio de Internet satelital paralelo al sistema oficial de telecomunicaciones que suscita dudas sobre su legalidad, abre brechas de seguridad en las comunicaciones secretas y aventaja a las empresas de Elon Musk en el acceso a proyectos oficiales. Polémica.
    EDUARDO MARTÍNEZ DE LA FE/T21