Tendencias21

La tecnología da voz a quienes no pueden hablar

La voz es una parte esencial de la identidad, pues por ella se pueden transmitir otros rasgos como la edad, la personalidad o el estilo de vida. Sin embargo, muchas personas sufren un trastorno del lenguaje que les impide comunicarse con su propia voz, sustituyéndola por otra robótica que reproduce lo que escriben. Desde hace unos años la empresa VocaliD ha creado un banco de voces y una tecnología patentada que permite combinarlas para crear un tono personalizado único, apto para su uso en cualquier dispositivo. Por Patricia Pérez.

La tecnología da voz a quienes no pueden hablar

Más de 10 millones de personas en el mundo sufren un trastorno del habla por problemas de las funciones motoras orales, ya sea a causa de una lesión cerebral, una enfermedad neurodegenerativa como la Esclerosis Lateral Amiotrófica (ELA) o una discapacidad intelectual. Estos trastornos varían desde simples substituciones de sonido hasta la inhabilidad de comprender o utilizar el lenguaje para el habla.

Muchos de ellos utilizan dispositivos que convierten lo que escriben en voz para comunicarse. Sin embargo, se trata de una voz robótica, como la popularizada por el célebre científico británico Stephen Hawking. Para él se ha convertido ya en una de sus señas de identidad, pero su uso puede resultar traumático para un niño. E igual que a nadie se le ocurre utilizar la misma pierna protésica para una niña que para un hombre adulto, con las voces debería pasar lo mismo.

En esa línea, se están explorando durante los últimos años diferentes vías para devolver la voz a estos pacientes, bien a través de la síntesis de voz o mediante la producción artificial de habla humana. Aunque la tecnología existe desde hace décadas, los esfuerzos se centran ahora en conseguir su personalización. Varias empresas y grupos de investigación están utilizando motores de síntesis de voz para crear voces a partir de muestras, principalmente desde frases grabadas.

Es el caso de la empresa escocesa CereProc, popular por haber creado un sintetizador de voz para el crítico de cine Roger Ebert varios años antes de su muerte en 2013, tomando como base palabras básicas pronunciadas por él mismo, extraídas de diversas grabaciones suyas en programas de radio y televisión.

Otro ejemplo es la norteamericana VocaliD, aunque su enfoque es diferente, pues permite personalizar las voces utilizando sólo una pequeña muestra de su beneficiario, incluso si no pueden hablar. Para ello recurre a la donación de voces, en algunos casos de familiares de los pacientes, aunque cualquier persona puede hacerlo altruistamente.

Búsqueda de coincidencias

Según explican en la web de la empresa, la creación de voces sintéticas pasa por la audición de un actor de voz, que se graba durante días o semanas en un estudio profesional. Después, un ejército de ingenieros y lingüistas pasan de tres a cuatro meses trabajando sobre las grabaciones para sintetizarla. El resultado es una voz cara, por lo que implica el proceso, y genérica.

Rupal Patel, fundadora y CEO de VocaliD, detectó que las personas con trastornos severos de comunicación conservan la capacidad de controlar aspectos de sus voces, como el tono y el volumen. Es lo que Patel llama «melodía del habla», fundamental para conferirle identidad.

Así, basta con tres segundos de sonido del paciente para que los algoritmos busquen coincidencias entre los donantes y las combine con su ADN vocal. El resultado es una voz digital personalizada que transmite una identidad vocal única. Se presenta como un archivo de sonido que se conecta a cualquier dispositivo de conversión de texto a voz, sin ninguna configuración adicional.

«Tengo dos hermanas, una de las cuales cecea y la otra tiene la voz nasal como yo antes de tener ELA», explica Jessie Levine, una de las primeras beneficiarias de esta herramienta, en un reportaje publicado en la revista online Phys.org. «Nunca se me ocurrió que podría adaptarlas a la mía y utilizarlas”, asegura.

Crowdsourcing

El sistema no sería posible sin el banco de voces, una acción de crowdsourcing que permite que cualquiera pueda compartir su voz con otros, o almacenarla para sí mismo, desde la comodidad de su propia casa. De esta forma se está construyendo una plataforma que reúne la diversidad y riqueza de la voz humana, con hablantes de diversas lenguas, razas y edades. Hasta el momento, más de 14.000 personas en todo el mundo han contribuido a aumentar la colección con más de seis millones de frases. El proceso implica unas seis horas y 3.500 frases leídas en voz alta.

La compañía entregó sus primeras siete voces a finales del año pasado y está trabajando en casi un centenar más. Sin embargo, la barrera todavía sigue siendo el precio, pues supera los 1.000 euros cada una. Uno de las primeras receptoras fue Delaney Supple, una chica de 17 años de Massachusetts que nació con parálisis cerebral.

Hasta ahora había estado utilizando un sintetizador que reproducía lo que escribía en la pantalla de su tableta, pero con una voz digital genérica, que como es de suponer no era de su agrado. La nueva le gusta mucho, tanto a ella como a su familia. «Me encanta escucharla», reconoce su madre, Erica Supple, quien confiesa que la primera vez que la oyó le recordó a la voz de su hermano cuando era más joven.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • La costumbre de orinar en grupos provendría de los monos 22 enero, 2025
    Las personas generalmente van al baño en grupos: según una nueva investigación, los chimpancés hacen lo mismo, posiblemente para fortalecer los lazos sociales. Es posible que la tendencia en los seres humanos hacia la "micción contagiosa" sea una herencia evolutiva proveniente de otros primates.
    Redacción T21
  • Descubren antiguos sacrificios para hacer "renacer" al Sol después de una enorme erupción volcánica 21 enero, 2025
    Cientos de artefactos de piedra descubiertos en la isla danesa de Bornholm pueden haber sido ofrecidos a los dioses para evitar una crisis climática: se entregaron a modo de sacrificio hace casi 5.000 años, para lograr el "regreso" de un Sol oscurecido luego de una gigantesca erupción volcánica. Los investigadores creen que todo el hemisferio […]
    Pablo Javier Piacente / T21
  • El cambio climático está "atrapando" a algunas bacterias en un bucle temporal eterno 21 enero, 2025
    Especies de bacterias en un lago de Wisconsin están en una suerte de "bucle interminable" evolutivo: han crecido rápidamente y regresado abruptamente a su estado inicial, repitiendo una y otra vez ese ciclo, aparentemente en respuesta a estaciones y otros parámetros ambientales que cambiaron drásticamente como consecuencia del cambio climático.
    Pablo Javier Piacente / T21
  • Tendremos un futuro utópico y distópico a la vez. El futuro se adelanta una vez más. 21 enero, 2025
    La nueva edición de la exposición ArtFutura, que se desarrolla en el Palacio Neptuno de Madrid, transmite un mensaje claro: la Inteligencia Artificial Generativa no es una amenaza para el arte, sino una nueva herramienta que expande los límites de nuestra creatividad. Sin miedo.
    Alejandro Sacristán (enviado especial T21)
  • Una interfaz cerebro-ordenador permite a una persona con parálisis operar un helicóptero virtual 21 enero, 2025
    La interfaz cerebro-ordenador puede permitir a las personas con parálisis interactuar con otros, participar en trabajos remotos y disfrutar de actividades recreativas: un implante colocado quirúrgicamente en una persona con parálisis en las cuatro extremidades proporcionó un nivel de control sin precedentes sobre un cuadricóptero virtual, solo pensando en el movimiento de los dedos para […]
    Redacción T21
  • Una abeja robótica rompe los récords de polinización y hace acrobacias en el aire 20 enero, 2025
    Un insecto-robot que simula a una abeja y pesa menos de un gramo, aletea con la misma eficacia que los insectos en la naturaleza y fue diseñado para la polinización artificial: podría sentar las bases para una producción agrícola realizada totalmente es espacios interiores. El avance permitiría cultivar frutas y verduras dentro de un almacén […]
    Pablo Javier Piacente / T21
  • Nuevos hallazgos reafirman el origen genético de la depresión 20 enero, 2025
    Un nuevo estudio señala los "genes de la depresión" en todas las etnias: se trata de 239 factores de riesgo genéticos para la depresión que inciden en todas las principales poblaciones mundiales. Esto permitirá a los científicos predecir por primera vez el riesgo de depresión independientemente del origen étnico de cada persona.
    Pablo Javier Piacente / T21
  • Doctor Manuel Corpas: un viaje alucinante a través de la Genómica y la Bioinformática 20 enero, 2025
    El científico español Manuel Corpas ha sido pionero en compartir en Internet la base genética de su familia con la finalidad de descubrir hasta qué punto los genomas influyen en nuestras elecciones de vida. Ahora está construyendo una red internacional de investigación en torno a los genomas de diversidad latinoamericanos para descubrir cómo la migración […]
    Alejandro Sacristán/T21
  • Las megasequías son cada vez más frecuentes e intensas en todo el planeta 20 enero, 2025
    En los últimos 40 años se ha registrado un preocupante aumento en el número de sequías de larga extensión en diversas partes del planeta: los investigadores advierten que las megasequías tienen un fuerte impacto negativo sobre las economías regionales que dependen de la agricultura, la producción energética y la salud de los ecosistemas. La principal […]
    Redacción T21
  • Leonardo da Vinci podría haber comprendido la gravedad más de un siglo antes que Newton 18 enero, 2025
    Un grupo de investigadores estudió los cuadernos de Leonardo da Vinci y descubrió que la comprensión de la gravedad por parte del erudito renacentista estaba muy por delante de su tiempo: incluso realizó experimentos para demostrar que la gravedad es una forma de aceleración y modeló la constante gravitatoria con una precisión de alrededor del […]
    Pablo Javier Piacente