Tendencias21

Cualquier dispositivo podrá contar con Sirius, el primer asistente digital de código abierto

Un equipo de investigadores de la Universidad de Michigan, en Estados Unidos, ha dado un nuevo giro a los asistentes personales inteligentes, desarrollando un sistema que combina el reconocimiento de palabra e imagen. Bautizado como Sirius, recurre al código abierto y se ejecuta en la nube, por lo que también se plantea su utilidad en la investigación de la próxima generación de almacenamiento computacional. Por Patricia Pérez.

Cualquier dispositivo podrá contar con Sirius, el primer asistente digital de código abierto

Asistentes personales inteligentes como Siri, Google Now o Cortana están a punto de tener un nuevo competidor en el mercado, además gratuito y personalizable. Se trata de Sirius, desarrollado por un equipo de investigadores de Ingeniería de la Universidad de Michigan (UM), en Estados Unidos. Al igual que los sistemas de Apple, Google y Microsoft es capaz de seguir instrucciones y preguntas de voz, interpretarlas y responder utilizando la palabra, pero utilizando código abierto.

Según explica la UM en un comunicado, Sirius utiliza incluso la mayoría de los algoritmos de sus homólogos, pero no se trata una herramienta costosa o con bloqueos comerciales, lo que le permitirá adaptarse a cualquier tipo de dispositivo en la era de los wearables. «Ahora la tecnología principal está a nuestro alcance», explica Jason Mars, profesor de Ciencias de la Computación e Ingeniería y co-director de Clarity Lab, donde se desarrolló Sirius.

Así, en lugar de crear una aplicación que se ejecutara en Apple Watch, el reloj de la manzana, un desarrollador podría ingeniar su propio reloj. “Estamos muy contentos de ver todo lo que se puede construir y aprender con Sirius como punto de partida”, añade Mars.

El profesor lo describe como el Linux de los asistentes personales inteligentes. Linux es un sistema operativo –como OS X de Apple y Microsoft Windows- pero libre y gratuito. Aunque sea menos habitual en ordenadores domésticos, ha revolucionado la informática actual, convirtiéndose en el sistema preferido para ejecutar servidores, e incluso la base sobre la que se sustenta Android de Google, el sistema operativo más común de tabletas y teléfonos inteligentes.

Los investigadores presentaban su proyecto el pasado sábado en una conferencia sobre lenguajes de programación y sistemas operativos (ASPLOS) celebrada en Estambul, liberando el software inmediatamente después, por lo que ya se puede probar en su versión demo.

Voz e imagen

Junto al código abierto, la novedad de Sirius frente a los sistemas actuales es la capacidad de responder tanto a preguntas de voz como a reconocer imágenes, ejecutándose en la nube. Así, en su versión inicial, los usuarios pueden realizar consultas bien únicamente por voz, o combinando palabra e imagen. Por ejemplo, mostrando la foto de un restaurante, se le puede preguntar a qué hora cierra.

«Lo que hemos hecho con Sirius es llevarlo al límite de los asistentes personales inteligentes tradicionales», subraya Johann Hauswald, estudiante de doctorado de la UM en Clarity Lab. «No sólo se puede interactuar con la voz, sino también hacer preguntas sobre lo que estás viendo, una nueva forma de interacción con este tipo de dispositivos», añade.

La versión demo de Sirius es una Wikipedia hablante. Los investigadores cargaron una versión estática de la mayor enciclopedia libre virtual, de forma que los usuarios pueden hacer preguntas basadas en datos objetivos. Sin embargo, la base de conocimiento se puede modificar por cualquier tipo de información que investigadores o startups consideren útil.

De esta forma se podrían crear asistentes digitales especializados en campos tan dispares como la medicina, la cocina o la reparación de automóviles. De hecho, investigadores de la UM están ya trabajando con IBM para desarrollar una herramienta que podría ayudar en el asesoramiento académico.

Para desarrollar Sirius, los investigadores parten de varios proyectos ya verificados de código abierto, cuyas técnicas y algoritmos se asemejan a las de los sistemas comerciales. Por una parte, el reconocimiento de voz proviene de Sphinx, de la Universidad Carnegie Mellon, en EEUU; Kaldi, de Microsoft Research; y RASR, de la Universidad Técnica de Aquisgrán (oficialmente RWTH Aachen) en Alemania.

El sistema de preguntas y respuesta procede de OpenEphyra, el mismo que sentó las bases para que el superordenador Watson, de IBM, derrotara a concursantes reales en Jeopardy, el popular ‘trivial’ de la televisión estadounidense. Y por último, el reconocimiento de imagen proviene de SURF, algoritmo de visión por computador de Kooaba, startup suiza adquirida recientemente por Qualcomm.

Almacenamiento computacional

El potencial de este asistente puede llegar lejos. De hecho, Mars ve Sirius como una importante plataforma para la investigación en el desarrollo de la próxima generación de almacenamiento computacional. Y es que se trata de un banco de pruebas ideal puesto al servicio de los investigadores para estudiar cómo los centros de los datos que procesan consultas de voz deben evolucionar para enfrentarse a los nuevos retos.

Los wearables dependerán en gran medida de la entrada de voz e imagen, y para el año 2018 se calcula que el número de ventas de este tipo de dispositivos podría alcanzar hasta los 485 millones de unidades en todo el mundo.

Además, la mayor parte del trabajo de los asistentes de voz se ejecuta en la nube. Herramientas como Siri o Cortana pueden aceptar órdenes o preguntas desde el smartphone y traducirlas a texto. Pero es un software alojado en la nube el que interpreta el texto, busca las posibles respuestas, elige la mejor y la envía de vuelta al dispositivo móvil.

Este proceso, según los investigadores, puede requerir 100 veces más potencia que una simple búsqueda de texto. Así las cosas, calcularon que si la voz suplanta al texto para consultas web, la infraestructura del centro de datos tendría que crecer 165 veces. «Tenemos que pensar en nuevas formas de rediseñar nuestras plataformas en la nube para afrontar este tipo de carga de trabajo», advierte Mars.

«Hay quien se pregunta si la interacción por voz o imagen es sólo bombo publicitario o algo grande, y realmente creo que es la tendencia natural», subraya Lingjia Tang, también profesora en la UM y co-directora del Clarity Lab. «Creo que la forma de comunicarnos con los ordenadores cada vez se asemejará más a cómo nos comunicamos entre humanos», vaticina.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • La acidez cerebral podría estar relacionada con múltiples trastornos neurológicos 11 abril, 2024
    Un estudio en animales a gran escala vincula los cambios en el pH del cerebro con problemas cognitivos de amplio alcance, ligados a patologías como el autismo o el Alzheimer, entre otras. Los científicos creen que los problemas metabólicos en el cerebro podrían estar directamente relacionados con una variedad de trastornos neuropsiquiátricos y neurodegenerativos.
    Pablo Javier Piacente
  • Cultivan organoides cerebrales con conexiones neuronales similares a las de un cerebro real 11 abril, 2024
    Un equipo internacional de investigadores ha desarrollado una técnica para conectar tejidos cultivados en laboratorio que imitan al cerebro humano de una manera que se asemeja a los circuitos neuronales del cerebro real. El "sistema" de mini cerebros interconectados podría revolucionar nuestra comprensión de las funciones cerebrales.
    Pablo Javier Piacente
  • Los Estados se exponen a condenas judiciales por inacción climática 11 abril, 2024
    Suiza es el primer Estado condenado judicialmente por no resolver el desafío climático y violar los derechos humanos de las personas mayores. Hace un año, 16 niños y jóvenes obtuvieron una sentencia condenatoria contra el Estado de Montana por destruir con sus leyes el medioambiente. Cualquier Estado puede ser denunciado si no preserva el ambiente en […]
    Eduardo Martínez de la Fe
  • Detectan extraños pulsos de radio procedentes de un magnetar que desconciertan a los científicos 10 abril, 2024
    Los astrónomos han detectado señales de radio inusuales procedentes de XTE J1810-197, un radiomagnetar o estrella de neutrones ultramagnética situada a 8.100 años luz de distancia de la Tierra, en la constelación de Sagitario. Los resultados son inesperados y sin precedentes: a diferencia de las señales de radio que se han detectado en otros magnetares, […]
    Pablo Javier Piacente
  • La IA podría ser el límite para todas las civilizaciones avanzadas en el Universo 10 abril, 2024
    Un nuevo estudio sugiere que el desarrollo de la Inteligencia Artificial (IA) hacia una Superinteligencia Artificial (ASI) podría explicar por qué no hemos detectado aún otras civilizaciones avanzadas en el cosmos, a pesar de la alta probabilidad de su existencia: en vez de supernovas, plagas, guerras nucleares o eventos climáticos extremos que hayan sido un […]
    Pablo Javier Piacente
  • Higgs ha podido dejar abierta la puerta a la Nueva Física 10 abril, 2024
    La muerte de Peter Higgs, que pasará a la historia como el descubridor del bosón que explica cómo se forma la materia, deja un legado en la historia de la física que todavía puede aportar algo más trascendente: la prueba definitiva de una Nueva Física más allá del Modelo Estándar.
    Eduardo Martínez de la Fe
  • Descubren neuronas "zombis" en el cerebro, que serían claves en el proceso de aprendizaje 9 abril, 2024
    Las neuronas "zombis" son unidades vivas pero funcionalmente alteradas, que parecen "dormidas" en determinadas situaciones: los investigadores han revelado que cumplen un papel fundamental en el cerebelo, concretamente en aspectos relativos a la forma en la cual aprendemos.
    Pablo Javier Piacente
  • La Luna se invirtió por completo hace más de 4 mil millones de años 9 abril, 2024
    Hace unos 4.220 millones de años, poco después de que la Luna se formara a partir de un trozo de la Tierra que se desprendió durante una colisión violenta a principios de la historia del Sistema Solar, nuestro satélite se dio vuelta y comenzó así una etapa clave de su desarrollo. Así lo ha comprobado […]
    Pablo Javier Piacente
  • Arte rupestre de hace 2.000 años podría representar música psicodélica 9 abril, 2024
    Aunque la música psicodélica moderna no nació hasta la década de 1960, las influencias psicodélicas se pueden encontrar en el arte rupestre de hace miles de años. Grabados precolombinos en piedra, de 2.000 años de antigüedad, reflejan figuras humanas bailando en estado de trance chamánico.
    Redacción T21
  • Descubren antiguas partículas de polvo espacial provenientes de otro sistema estelar 8 abril, 2024
    Los astrónomos han descubierto una rara partícula de polvo atrapada en un antiguo meteorito extraterrestre, que fue formado por una estrella distinta a nuestro Sol. El polvo se habría originado luego de una supernova: las partículas son como "cápsulas del tiempo celestes" y proporcionan una instantánea de la vida de su estrella madre.
    Pablo Javier Piacente