Tendencias21
Nuevos cálculos matemáticos devolverán la voz a mujeres y niños mudos

Nuevos cálculos matemáticos devolverán la voz a mujeres y niños mudos

La disfunción de las cuerdas vocales o DCV es un trastorno que impide hablar. Para sustituir la voz humana, existen ya dispositivos artificiales de voz, los sintetizadores de habla, que generan tonalidades de discurso a partir de la síntesis articulatoria (es decir, de la onda o línea de transmisión de los tractos vocal y nasal humanos). Pero estos dispositivos solo son capaces de emular las voces de hombres. Nuevos cálculos matemáticos desarrollados en la Academia Filandesa de Investigación en Ciencias Computacionales permitirán mejorarlos para que también puedan emitir voces similares a las de mujeres y niños, y generar así un habla más natural y personalizada. Por Yaiza Martínez.

Nuevos cálculos matemáticos devolverán la voz a mujeres y niños mudos

La ayuda para las personas que han perdido su voz por padecer una disfunción de las cuerdas vocales o DCV (trastorno que hace que las cuerdas vocales, en lugar de abrirse cuando inhalamos y espiramos, se cierren) está en camino.

Un grupo de investigadores de la Academia Filandesa de Investigación en Ciencias Computacionales (LASTU) está desarrollando un método que contribuirá a la fabricación de prótesis de voz con mejores características, informa la LATSU en un comunicado.

Gracias a este sistema, por ejemplo, las niñas que hayan perdido su voz contarán con un dispositivo de voz artificial mejorado, capaz de producir sonidos más adecuados a su edad, en lugar de la habitual voz de un hombre adulto que producen normalmente estos sistemas.

Matemáticas para una síntesis de voz personalizada

Los avances en la producción de voz artificial han sido posibles gracias a los resultados obtenidos en un proyecto de investigación dirigido por el profesor Samuli Siltanen de la LASTU, y se calcula que, solo en Finlandia, podrían beneficiar a cerca de 30.000 personas con problemas en las cuerdas vocales.

Uno de los problemas fundamentales del análisis de las señales de un discurso es determinar el grado de excitación de las cuerdas vocales a partir de sonidos registrados digitalmente, así como definir la forma del tracto vocal al hablar, esto es, las posiciones de la boca y de la garganta.

Esta medición, denominada estimación del pulso glotal basada en filtrado inverso, requiere de una forma altamente especializada de cálculo computacional.

Con las técnicas tradicionales, el filtrado inverso es solo posible para voces masculinas de tono bajo. Las voces de mujeres y niños son un caso más complicado por su elevada tonalidad, demasiado cercana en frecuencia a la resonancia más baja del tracto vocal.

Lo que ha conseguido desarrollar Siltanen es un método de cálculo nuevo, que consigue hacer el flitrado inverso del pulso glotal en estos casos, de forma más eficiente.

Descifrando la articulación oral

El filtrado inverso es necesario para el reconocimiento automático de los discursos, que es lo que permite desarrollar una síntesis de voz óptima.

Hasta ahora, la llamada síntesis articulatoria ha sido un método de interés puramente académico, puesto que pocos han sido los modelos suficientemente avanzados o computacionalmente eficientes como para imitar voces humanas no masculinas.

En estos sistemas, un ordenador transforma un texto en discurso sonoro. La antigua forma de hacerlo era registrar palabras independientes y producirlas en sonido, una tras otra, pero esta fórmula rara vez genera un discurso cuyo sonido resulte natural o ajustado a la voz de las mujeres o de los niños que no pueden hablar.

Esta dificultad se debe a la complejidad del proceso de producción del habla, en el que participan diversos elementos.

Según explica al respecto Sitanen: “La mayoría de los sonidos de un discurso son el resultado de un proceso específico. El aire que fluye entre los pliegues vocales hace que estos vibren. Esta vibración, si pudiéramos oírla, produciría un sonido extraño, como un zumbido. Sin embargo, a medida que se mueve por el tracto vocal, el zumbido se transforma en vocales conocidas”.

Otras aplicaciones

El canto sería un ejemplo perfecto de la interacción entre la respuesta de las cuerdas vocales y del tracto vocal: “Cuando cantamos la vocal “a” en diferentes tonos, nuestro tracto vocal permanece sin cambios, pero la frecuencia de la excitación de las cuerdas vocales sí cambia. Por otro lado, también podemos cantar diferentes vocales en el mismo tono, entonces es la forma del tracto lo que cambia, mientras que la excitación de las cuerdas vocales se mantiene estable”, apunta el investigador.

Gracias a los nuevos cálculos desarrollados, las síntesis del discurso podrán realizarse más eficientemente y de manera más ajustada, y los reproductores artificiales de voz serán capaces de emular el tono original de la voz de cada hablante.

Esta mejoría podría beneficiar, además de a las personas mudas por DCV, a la calidad de los discursos sintéticos empleados en telefonía móvil y en servicios telefónicos automáticos. Asimismo, serviría para incrementar los niveles de reconocimiento del discurso en entornos ruidosos, concluye el comunicado de la LASTU.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • La lluvia colabora con el océano para atrapar más carbono 30 octubre, 2024
    Hasta el momento, la lluvia ha sido ignorada en los cálculos de la capacidad del océano para absorber dióxido de carbono (CO2), pero una nueva estimación indica que las precipitaciones mejoran la capacidad del océano para atrapar las emisiones entre un 5 % y un 7 %, cumpliendo un papel vital en el ambiente. Este […]
    Pablo Javier Piacente
  • Los animales se vuelven menos sociables con el avance de la edad, al igual que los humanos 30 octubre, 2024
    Una serie de estudios científicos en torno al comportamiento de cientos de especies de animales revela que las variedades más sociables amplían su expectativa de vida y se reproducen por más tiempo. Además, los investigadores descubrieron que algunas especies, al igual que los seres humanos, tienden a reducir sus relaciones sociales a una edad avanzada: […]
    Pablo Javier Piacente
  • Los gorilas occidentales votan para tomar decisiones colectivas 30 octubre, 2024
    Un nuevo estudio desmonta la creencia de que, entre los grandes simios, es el macho dominante quien decide por todo el grupo. Entre los gorilas occidentales de la República Centroafricana, cada individuo tiene voz y voto, especialmente cuando se trata de cambiar de asentamiento.
    Redacción T21
  • Podemos comprender oraciones escritas en un parpadeo 29 octubre, 2024
    Nuestro cerebro puede entender oraciones escritas en lo que dura el parpadeo de un ojo, según revela un nuevo estudio. Los científicos descubrieron que el procesamiento del lenguaje escrito ocurre a velocidades significativamente más rápidas de las necesarias para hablar o comunicarse en voz alta.
    Pablo Javier Piacente
  • El beso humano habría comenzado como un ritual de acicalamiento de los simios 29 octubre, 2024
    El acto final del aseo de los simios implica labios sobresalientes y una ligera succión, para eliminar los desechos o parásitos, un comportamiento que persistió incluso cuando su función higiénica disminuyó. Un nuevo estudio sugiere que esta conducta refleja la forma, el contexto y la función de los besos humanos modernos.
    Pablo Javier Piacente
  • Thriller policial en la arqueología: el ADN confirma una leyenda nórdica de 800 años 29 octubre, 2024
    Un fascinante descubrimiento arqueológico en Noruega ha arrojado nueva luz sobre un misterioso episodio de la historia medieval del país. Revela que hace 800 años existió una deriva genética única que se puede observar entre los actuales habitantes del sur del país.
    Redacción T21
  • Descubren moléculas complejas de carbono en el espacio interestelar 28 octubre, 2024
    Un equipo de investigadores ha descubierto grandes moléculas que contienen carbono en una distante nube interestelar de gas y polvo: el hallazgo muestra que las moléculas orgánicas complejas, que incluyen carbono e hidrógeno, probablemente existieron en la nube de gas frío y oscuro que dio origen a nuestro Sistema Solar.
    Pablo Javier Piacente
  • El colapso de una corriente oceánica clave podría tener impactos catastróficos en todo el planeta 28 octubre, 2024
    Los científicos ya no consideran de baja probabilidad el colapso de la Circulación de Volteo Meridional del Atlántico (AMOC), que incluye a la Corriente del Golfo: se trata de una de las corrientes oceánicas más importantes para el equilibrio ambiental y climático global, y su debilitamiento provocaría eventos climáticos extremos, trayendo mucha más inestabilidad y […]
    Pablo Javier Piacente
  • Desafío a la consciencia: la cognición puede existir en organismos sin cerebro 28 octubre, 2024
    Una nueva investigación ha comprobado que los hongos muestran indicios de cognición y consciencia mínima, sin tener cerebro ni sistema nervioso para percibir el entorno ni tomar decisiones. Su comportamiento sigue patrones cognitivos para asegurar su supervivencia y crecimiento, todo un desafío a lo que sabemos sobre la consciencia.
    Eduardo Martínez de la Fe
  • Nuestra percepción del tiempo se modifica de acuerdo con lo que vemos 27 octubre, 2024
    Una nueva investigación revela que diferentes estímulos visuales pueden distorsionar significativamente la percepción humana del tiempo: ver escenas más destacadas y memorables puede crear la impresión de que el tiempo avanza más lentamente, en tanto que las imágenes desordenadas y caóticas comprimen la percepción del tiempo, haciendo que parezca acelerarse.
    Pablo Javier Piacente