Tendencias21
Nuevos cálculos matemáticos devolverán la voz a mujeres y niños mudos

Nuevos cálculos matemáticos devolverán la voz a mujeres y niños mudos

La disfunción de las cuerdas vocales o DCV es un trastorno que impide hablar. Para sustituir la voz humana, existen ya dispositivos artificiales de voz, los sintetizadores de habla, que generan tonalidades de discurso a partir de la síntesis articulatoria (es decir, de la onda o línea de transmisión de los tractos vocal y nasal humanos). Pero estos dispositivos solo son capaces de emular las voces de hombres. Nuevos cálculos matemáticos desarrollados en la Academia Filandesa de Investigación en Ciencias Computacionales permitirán mejorarlos para que también puedan emitir voces similares a las de mujeres y niños, y generar así un habla más natural y personalizada. Por Yaiza Martínez.

Nuevos cálculos matemáticos devolverán la voz a mujeres y niños mudos

La ayuda para las personas que han perdido su voz por padecer una disfunción de las cuerdas vocales o DCV (trastorno que hace que las cuerdas vocales, en lugar de abrirse cuando inhalamos y espiramos, se cierren) está en camino.

Un grupo de investigadores de la Academia Filandesa de Investigación en Ciencias Computacionales (LASTU) está desarrollando un método que contribuirá a la fabricación de prótesis de voz con mejores características, informa la LATSU en un comunicado.

Gracias a este sistema, por ejemplo, las niñas que hayan perdido su voz contarán con un dispositivo de voz artificial mejorado, capaz de producir sonidos más adecuados a su edad, en lugar de la habitual voz de un hombre adulto que producen normalmente estos sistemas.

Matemáticas para una síntesis de voz personalizada

Los avances en la producción de voz artificial han sido posibles gracias a los resultados obtenidos en un proyecto de investigación dirigido por el profesor Samuli Siltanen de la LASTU, y se calcula que, solo en Finlandia, podrían beneficiar a cerca de 30.000 personas con problemas en las cuerdas vocales.

Uno de los problemas fundamentales del análisis de las señales de un discurso es determinar el grado de excitación de las cuerdas vocales a partir de sonidos registrados digitalmente, así como definir la forma del tracto vocal al hablar, esto es, las posiciones de la boca y de la garganta.

Esta medición, denominada estimación del pulso glotal basada en filtrado inverso, requiere de una forma altamente especializada de cálculo computacional.

Con las técnicas tradicionales, el filtrado inverso es solo posible para voces masculinas de tono bajo. Las voces de mujeres y niños son un caso más complicado por su elevada tonalidad, demasiado cercana en frecuencia a la resonancia más baja del tracto vocal.

Lo que ha conseguido desarrollar Siltanen es un método de cálculo nuevo, que consigue hacer el flitrado inverso del pulso glotal en estos casos, de forma más eficiente.

Descifrando la articulación oral

El filtrado inverso es necesario para el reconocimiento automático de los discursos, que es lo que permite desarrollar una síntesis de voz óptima.

Hasta ahora, la llamada síntesis articulatoria ha sido un método de interés puramente académico, puesto que pocos han sido los modelos suficientemente avanzados o computacionalmente eficientes como para imitar voces humanas no masculinas.

En estos sistemas, un ordenador transforma un texto en discurso sonoro. La antigua forma de hacerlo era registrar palabras independientes y producirlas en sonido, una tras otra, pero esta fórmula rara vez genera un discurso cuyo sonido resulte natural o ajustado a la voz de las mujeres o de los niños que no pueden hablar.

Esta dificultad se debe a la complejidad del proceso de producción del habla, en el que participan diversos elementos.

Según explica al respecto Sitanen: “La mayoría de los sonidos de un discurso son el resultado de un proceso específico. El aire que fluye entre los pliegues vocales hace que estos vibren. Esta vibración, si pudiéramos oírla, produciría un sonido extraño, como un zumbido. Sin embargo, a medida que se mueve por el tracto vocal, el zumbido se transforma en vocales conocidas”.

Otras aplicaciones

El canto sería un ejemplo perfecto de la interacción entre la respuesta de las cuerdas vocales y del tracto vocal: “Cuando cantamos la vocal “a” en diferentes tonos, nuestro tracto vocal permanece sin cambios, pero la frecuencia de la excitación de las cuerdas vocales sí cambia. Por otro lado, también podemos cantar diferentes vocales en el mismo tono, entonces es la forma del tracto lo que cambia, mientras que la excitación de las cuerdas vocales se mantiene estable”, apunta el investigador.

Gracias a los nuevos cálculos desarrollados, las síntesis del discurso podrán realizarse más eficientemente y de manera más ajustada, y los reproductores artificiales de voz serán capaces de emular el tono original de la voz de cada hablante.

Esta mejoría podría beneficiar, además de a las personas mudas por DCV, a la calidad de los discursos sintéticos empleados en telefonía móvil y en servicios telefónicos automáticos. Asimismo, serviría para incrementar los niveles de reconocimiento del discurso en entornos ruidosos, concluye el comunicado de la LASTU.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Descubren que la base del lenguaje humano se desarrolló hace 135.000 años 20 marzo, 2025
    Los humanos hablamos más de 7.000 idiomas en la actualidad, muy diferentes entre ellos: sin embargo, un nuevo estudio ha descubierto que todas estas variantes idiomáticas provienen de un solo árbol genealógico lingüístico, que surgió antes de que nuestra especie se dividiera en poblaciones distintas hace 135.000 años. Solo 35.000 años después, el lenguaje habría […]
    Pablo Javier Piacente / T21
  • Nace el primer periódico creado íntegramente por la Inteligencia Artificial 20 marzo, 2025
    Por primera vez en la historia, un periódico italiano ha publicado una edición especial en la que cada palabra, titular y cita han sido generados exclusivamente por IA. Así nace Il Foglio AI, un proyecto que promete revolucionar la forma en que concebimos las noticias.
    Redacción T21
  • Google habría impulsado una IA experimental involucrada en la muerte de un adolescente 20 marzo, 2025
    Plataformas respaldadas por gigantes tecnológicos como Google han introducido chatbots de IA interactivos dirigidos a niños y adolescentes, abriendo fuertes debates sobre su impacto en el desarrollo infantil. En concreto, la aplicación experimental Character.AI ha sido objeto de demandas legales por parte de distintas familias, que alegan que sus hijos fueron expuestos a contenidos perjudiciales […]
    Pablo Javier Piacente / T21
  • Sudáfrica y China logran una conexión cuántica satelital récord de casi 13.000 kilómetros 20 marzo, 2025
    Un equipo internacional de científicos ha establecido una conexión satelital cuántica histórica entre Sudáfrica y China, cubriendo una distancia récord de 12.900 kilómetros. Gracias al fenómeno del entrelazamiento cuántico, esta tecnología garantiza comunicaciones absolutamente seguras frente a cualquier intento de espionaje.
    Redacción T21
  • Los tribunales no reconocen derechos de autor a la Inteligencia Artificial 20 marzo, 2025
    Un tribunal de apelaciones en Estados Unidos ha puesto límites a la creatividad de las máquinas: las obras generadas exclusivamente por inteligencia artificial no pueden ser protegidas por derechos de autor. El fallo reafirma que la ley actual requiere la participación humana para garantizar la protección legal de una obra.
    Redacción T21
  • Desvelan la primera luz que encendió el Universo 20 marzo, 2025
    El Telescopio de Cosmología de Atacama (ACT) ha compilado el mapa más detallado que hemos visto hasta hoy del fondo cósmico de microondas, la tenue luz que impregna el Universo desde solo 380.000 años después del Big Bang y cuyos ecos pueden apreciarse en la actualidad. La imagen obtenida es lo más parecido a la […]
    Redacción T21
  • Microsoft e Inait revolucionan la Inteligencia Artificial con cerebros digitales casi humanos 20 marzo, 2025
    Microsoft ha unido fuerzas con la startup suiza Inait para desarrollar sistemas de IA inspirados en el cerebro humano. Esta colaboración busca crear modelos que no solo aprenden de datos, sino que también razonan como el cerebro humano.
    Redacción T21
  • Una prueba de consciencia corporal desafía las visiones tradicionales sobre la cognición animal 19 marzo, 2025
    Los gorilas pueden ser tan conscientes de sí mismos como los chimpancés, según ha comprobado una nueva investigación: luego de realizar una prueba de autoconsciencia corporal bajo parámetros diferentes a las tradicionales, los científicos verificaron que las capacidades cognitivas de estos simios se habían menospreciado hasta hoy.
    Pablo Javier Piacente / T21
  • China plantea la necesidad de etiquetar el contenido generado con IA 19 marzo, 2025
    En colaboración con varios ministerios gubernamentales, la Administración China de Control del Ciberespacio (CAC) ha anunciado que todo el contenido generado por IA en Internet tendrá que ser etiquetado como tal. Sería la forma a través de la cual el gigante asiático se acopla a la idea europea de establecer algún tipo de regulación sobre […]
    Pablo Javier Piacente / T21
  • Escándalo: Elon Musk implanta en la Casa Blanca su servicio de internet satelital Starlink 19 marzo, 2025
    Starlink ha instalado en la Casa Blanca un servicio de Internet satelital paralelo al sistema oficial de telecomunicaciones que suscita dudas sobre su legalidad, abre brechas de seguridad en las comunicaciones secretas y aventaja a las empresas de Elon Musk en el acceso a proyectos oficiales. Polémica.
    EDUARDO MARTÍNEZ DE LA FE/T21