Tendencias21

Un software mejora los cantos desafinados sin restarles esencia

Un software creado en Singapur afina los cantos desafinados sin perder la esencia del canto original. Para ello, ajusta el ritmo del canto al de cantantes profesionales alargando y acortando los fonemas, y luego lo combina con música de fondo. Los softwares existentes ajustan la calidad, pero a costa de perder el timbre del cantante.

Un software mejora los cantos desafinados sin restarles esencia

I2R Speech2Singing es un software de síntesis de voz desarrollado por investigadores del Instituto A * STAR (Singapur) es el primero en ofrecer canto de alta calidad de forma automática, sin dejar de preservar el carácter original de su voz natural.

«A muchas personas les gusta cantar, pero carecen de las habilidades para hacerlo», dice en la nota de prensa del Instituto Minghui Dong, que dirigió la investigación. «Queremos utilizar nuestra tecnología para ayudar a la persona promedio a cantar bien.»

El canto consta de tres elementos clave: contenido, prosodia y timbre. El contenido se transmite utilizando palabras, la prosodia -o melodía en el caso del canto- se expresa a través del ritmo y el tono, pero el timbre es la cualidad distintiva que hace que un banjo suene diferente de la trompeta, y la voz de un cantante de otro. I2R Speech2Singing trabaja puliendo la melodía, al tiempo que conserva el contenido original y el timbre de un sonido.

Las tecnologías existentes que se centran en la corrección de la melodía intentan alinear los sonidos desafinados o bien a la nota más cercana en la escala musical o a la nota exacta de la partitura original.

El primero funciona bien para cantantes profesionales, que sólo pueden estar ligeramente fuera de tono, pero no puede arreglar drásticamente un canto totalmente fuera de tono o simplemente una lectura en voz alta. En este caso es mejor corregir las melodías discordantes, pero hacer caso omiso de muchos otros aspectos de la melodía como el vibrato y el estiramiento de las vocales.

Solución

En cambio, I2R Speech2Singing utiliza grabaciones de cantantes profesionales como plantillas con los que corregir la melodía de una voz cantando o convertir una voz que habla en un canto.

El software detecta la temporización de cada sonido fonético usando tecnología de reconocimiento de voz, y luego extiende y comprime la duración de la señal utilizando tecnología de conversión de voz para que coincida con el ritmo de un cantante profesional. Un sintetizador de voz combina luego la voz corregida con música de fondo para producir un hermoso solo.

El resultado produce mejor calidad de voz que los productos en el mercado. Dong y su equipo están trabajando para mejorar la accesibilidad del software y añadir una característica que permita a los usuarios afinar su canto como lo deseen.

Referencia bibliográfica:

Dong, M., Lee, S. W., Li, H., Chan, P., Peng, X., Ehnes, J. W. & Huang, D.: I2R Speech2Singing Perfects Everyone’s Singing. Interspeech (2014).

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Estados Unidos abre una nueva ontología militar con el lanzamiento del avión F-47 22 marzo, 2025
    El F-47 que desarrollará Boeing para el Pentágono redefine el concepto de superioridad aérea, fusionando avances en inteligencia artificial, sistemas furtivos de vanguardia y capacidades de combate colaborativo con drones autónomos.
    EDUARDO MARTÍNEZ DE LA FE/T21
  • Descubren por qué algunas personas no pueden imaginar prácticamente nada 22 marzo, 2025
    La capacidad de visualizar un lugar, objeto o situación a pedido varía significativamente entre individuos. Pero algunas personas no pueden evocar imágenes mentales en absoluto: este rasgo se conoce como afantasía, literalmente "un defecto de la imaginación". Ahora, un nuevo estudio revela que estas personas tienen la capacidad de asociar un concepto con su representación […]
    Pablo Javier Piacente
  • Las montañas esconden los mayores reservorios de energía limpia 21 marzo, 2025
    Una nueva investigación sugiere que podrían existir reservas masivas de gas de hidrógeno natural escondiéndose en las cadenas montañosas del planeta: estos recursos podrían darnos acceso a una enorme fuente de energía limpia, capaz de solucionar la crisis energética actual.
    Pablo Javier Piacente / T21
  • Un anillo con IA optimiza la comunicación de personas con problemas auditivos 21 marzo, 2025
    Investigadores de la Universidad de Cornell, en Estados Unidos, han desarrollado un innovador dispositivo llamado SpellRing: se trata de un anillo potenciado por Inteligencia Artificial (IA) que utiliza tecnología de microsonar para rastrear en tiempo real el deletreo manual en el Lenguaje de Señas Americano (ASL). Este avance podría transformar la forma en que las […]
    Pablo Javier Piacente / T21
  • Identifican la vía química que regula cómo tienen sexo los ratones 21 marzo, 2025
    Una aceitada maquinaria química marca el ritmo sexual de los ratones machos: la dopamina y la acetilcolina van cumpliendo diferentes papeles desde antes del coito y hasta la eyaculación. Los descubrimientos podrían habilitar nuevas instancias terapéuticas para trastornos sexuales en humanos, como por ejemplo la eyaculación precoz.
    Redacción T21
  • Un nuevo mapa revela el paisaje oculto bajo el hielo de la Antártida y la vulnerabilidad del continente helado 21 marzo, 2025
    Un nuevo mapa elaborado por científicos británicos revela por primera vez con precisión milimétrica las sorprendentes características del paisaje oculto bajo el hielo antártico y confirma el enorme riesgo climático que supone el deshielo acelerado en la región.
    Redacción T21
  • Descubren que la base del lenguaje humano se desarrolló hace 135.000 años 20 marzo, 2025
    Los humanos hablamos más de 7.000 idiomas en la actualidad, muy diferentes entre ellos: sin embargo, un nuevo estudio ha descubierto que todas estas variantes idiomáticas provienen de un solo árbol genealógico lingüístico, que surgió antes de que nuestra especie se dividiera en poblaciones distintas hace 135.000 años. Solo 35.000 años después, el lenguaje habría […]
    Pablo Javier Piacente / T21
  • Nace el primer periódico creado íntegramente por la Inteligencia Artificial 20 marzo, 2025
    Por primera vez en la historia, un periódico italiano ha publicado una edición especial en la que cada palabra, titular y cita han sido generados exclusivamente por IA. Así nace Il Foglio AI, un proyecto que promete revolucionar la forma en que concebimos las noticias.
    Redacción T21
  • Google habría impulsado una IA experimental involucrada en la muerte de un adolescente 20 marzo, 2025
    Plataformas respaldadas por gigantes tecnológicos como Google han introducido chatbots de IA interactivos dirigidos a niños y adolescentes, abriendo fuertes debates sobre su impacto en el desarrollo infantil. En concreto, la aplicación experimental Character.AI ha sido objeto de demandas legales por parte de distintas familias, que alegan que sus hijos fueron expuestos a contenidos perjudiciales […]
    Pablo Javier Piacente / T21
  • Desvelan la primera luz que encendió el Universo 20 marzo, 2025
    El Telescopio de Cosmología de Atacama (ACT) ha compilado el mapa más detallado que hemos visto hasta hoy del fondo cósmico de microondas, la tenue luz que impregna el Universo desde solo 380.000 años después del Big Bang y cuyos ecos pueden apreciarse en la actualidad. La imagen obtenida es lo más parecido a la […]
    Redacción T21