Tendencias21
Un sistema automático convierte vídeos tediosos en películas interesantes

Un sistema automático convierte vídeos tediosos en películas interesantes

Cada vez existen más herramientas para grabar rutinas diarias, bien sea por interés propio, vigilancia u otros motivos. Sin embargo, esto da lugar a pesadas grabaciones de larga duración que, en la mayoría de los casos, no pueden ser revisadas en detalle. Investigadores de la Universidad de Texas en Austin, Estados Unidos, han desarrollado una técnica capaz de analizar estos vídeos y montar la mejor historia reducida, pero sin perder la coherencia ni información relevante. Por Patricia Pérez.

Un sistema automático convierte vídeos tediosos en películas interesantes

Algún día no muy lejano los ordenadores nos facilitarán automáticamente el videoresumen de un día de nuestra vida, las vacaciones familiares o las ocho horas de patrulla policial, según auguran científicos de la Universidad de Texas (UT) en Austin.

Los investigadores se adelantan así a lo que está por venir, sobre todo cuando se extienda el uso comercial de dispositivos como Looxcie, la primera videocámara con conexión móvil y manos libres, o las novedosas Google Glass, un paso más en la realidad aumentada.

“La cantidad de lo que nosotros llamamos vídeo ‘egocéntrico’, aquel que graba lo que sucede alrededor de la perspectiva de una persona, está a punto de explotar”, avanza Kristen Grauman, profesora asociada de Ciencias de la Computación, en un comunicado de la UT. Por ello, “vamos a necesitar mejores métodos para resumir y seleccionar de entre todos esos datos”, continúa.

La necesidad es cada vez más clara, pues aparecen nuevos dispositivos y escenarios que generan vídeos de gran volumen, por lo que resulta complicado revisarlos al detalle. Además, con los métodos actuales, existe el riesgo de perder información esencial al sintetizar la grabación.

Como alternativa, Grauman y su equipo han desarrollado una avanzada técnica que utiliza aprendizaje automático para analizar los vídeos grabados, de forma que puedan acortarlos mediante clips muy breves o una serie de imágenes fijas que sigan transmitiendo la esencia de la historia. El método, al que han bautizado como videoresumen “Story-driven”, se presentó este verano en la Conferencia IEEE sobre Visión Artificial y Reconocimiento de Patrones.

Este tipo de videoresumen ayudará a las autoridades militares a gestionar las imágenes de las cámaras de los soldados, a los investigadores a seleccionar información a través de vídeos grabados con teléfonos móviles en sucesos como el atentado en el maratón de Boston, o a los mayores que usan esta herramienta en su día a día para compensar pérdidas de memoria.

Un sistema automático convierte vídeos tediosos en películas interesantes

Esencia y coherencia

Diversos estudios demuestran la utilidad que supone para personas con pérdidas de memoria llevar una cámara en su vida diaria, la cual toma una instantánea una vez por minuto de todo aquello que le rodea.

El hecho de revisar esas imágenes al final del día puede ayudarles en su recuperación. Pero, “¿y si en lugar de imágenes seleccionadas por un minuto de diferencia, tuvieran un vídeo o resumen fotográfico cribado con las mejores historias? Tal vez eso les ayudaría aún más”. Ese es el planteamiento de Grauman y el objetivo que persigue con su método.

Para ponerlo en práctica se valieron de grabaciones de más de 12 horas de actividad diaria tomadas por 23 voluntarios que utilizaron cámaras Looxcie. Se trata de dispositivos que se ajustan cómodamente en la oreja como un dispositivo Bluetooth convencional y son capaces de grabar hasta cinco horas seguidas. Se conectan al smartphone para compartir los contenidos generados, y cuestan alrededor de 200 dólares.

El siguiente paso era determinar qué hace buena una historia visual. Los métodos tradicionales para resumir vídeos seleccionan bien una serie de fotogramas clave o aquellas tomas que mejor representan la entrada original. Para ello se basan en factores como la diversidad (fotogramas no redundantes), anomalías (sucesos inusuales), y el espacio temporal. Se tiene en cuenta el movimiento o el color, y se rastrean objetos de interés.

Todo ello consigue reducir el tiempo de visionado, pero para los investigadores se trata de una opción “demasiado limitante”, pues no se atiende al progreso de las acciones. Como resultado, se pueden omitir sucesos importantes -pero cortos en el tiempo-, mientras se mantienen los redundantes -aunque visualmente diversos- que no afectan a la narrativa general.

Por tanto, Grauman y su equipo tienen claro que más allá de mostrar personas, objetos o escenarios importantes, se debe transmitir cómo una cosa lleva a la siguiente. En definitiva, darle coherencia a la narración visual.

Buscar la influencia

Una vez claro el objetivo, el mecanismo consta de dos pasos. El primero implica el uso de técnicas de aprendizaje automático para enseñar al sistema de “puntuación” el significado de los objetos visualizados. Para ello se basan en factores egocéntricos, tales como la frecuencia con la que aparecen ciertos objetos en el centro de la imagen, que es un buen indicador de hacía dónde mira el portador de la cámara, o si los toca con sus manos. De esta forma se seleccionan los fotogramas más importantes.

El siguiente paso fue utilizar dichos fotogramas para buscar aquellos que influyen en los posteriores. Para ello adaptaron un método desarrollado por investigadores de la Universidad Carnegie Mellon, en Estados Unidos, que podía predecir cómo una noticia lleva a la otra, reuniendo una serie de artículos para la transición desde un punto de partida a un punto final conocido.

En el trabajo sobre texto, los investigadores prestaron especial atención a la frecuencia de uso de ciertas palabras y a las correlaciones a través de artículos para cuantificar su influencia. Para su adaptación al vídeo, Grauman y su equipo utilizaron objetos y fotogramas significativos para hacer lo mismo. Así fueron capaces de dar forma a una cadena de vídeos ensamblados eficientemente para rellenar la historia de principio a fin.

A continuación realizaron encuestas para comparar su método con los anteriores, y “entre el 75 y el 90 por ciento de las personas que evaluaron los resúmenes calificaron nuestro sistema como superior», asegura la profesora.

La misma considera que a medida que las técnicas para sumariar vídeos sigan mejorando, se convertirán en una valiosa herramienta no sólo para aquellos con necesidades muy especializadas, como los investigadores policiales y los que sufren pérdida de memoria, sino también para los usuarios habituales de Internet.

De hecho, mejorar la exploración de vídeo en la web es una de las aplicaciones que se augura al sistema. Grauman puso como ejemplo la posibilidad de visualizar 50 imágenes en una página web. “Es manejable, ya que se pueden desplazar hacia arriba o abajo y verlas todos de una sola pasada. Ahora imagínese tratando de ver 50 vídeos online; simplemente no es viable”, sentencia. Ahí radica su próximo reto.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • El cambio climático está modificando el cerebro de los animales 17 noviembre, 2024
    Las funciones principales del sistema nervioso, o sea la detección de sentidos, el procesamiento mental y la dirección del comportamiento, son críticas para el desarrollo armónico de la vida en la Tierra. Permiten a los animales navegar en sus entornos para facilitar su supervivencia y reproducción, además de hacer posible un equilibrio armónico entre las […]
    Pablo Javier Piacente
  • El misterio del ordenador más antiguo del mundo 16 noviembre, 2024
    En 1901, un grupo de investigadores descubrió en un naufragio un extraño y rudimentario ordenador, que luego se definió como el mecanismo de Antikythera, un artefacto fechado en el siglo II a.C. que se convirtió en el ordenador más antiguo del mundo y hasta apareció en uno de los films de la saga "Indiana Jones". […]
    Pablo Javier Piacente
  • Piedras de 12.000 años de antigüedad serían la evidencia más antigua del principio mecánico de la rueda 15 noviembre, 2024
    Aunque los arqueólogos ubican la invención formal de la rueda sobre la Edad del Bronce, un nuevo estudio sugiere que este avance podría haberse concretado miles de años antes: el análisis de un conjunto excepcional de más de cien guijarros perforados, descubietos en una aldea de Israel, muestra que estas piedras con 12.000 años de […]
    Pablo Javier Piacente
  • Restauran la visión humana mediante células madre 15 noviembre, 2024
    En un avance vital en el campo de la medicina regenerativa, un trasplante de células madre ha mejorado significativamente la visión de tres personas con daños severos en sus córneas. El ensayo clínico realizado en Japón es el primero en su tipo a nivel mundial, según destacan los investigadores.
    Pablo Javier Piacente
  • La cultura declara también la emergencia climática: así es el movimiento 15 noviembre, 2024
    La cultura mundial se suma al movimiento por la emergencia climática y en España acaba de lanzarse con un manifiesto entre la utopía y la distopía para desafiar las estructuras de poder que ignoran el consenso científico, fracasan en su misión de protegernos y perpetúan el ecocidio.
    Alejandro Sacristán (enviado especial)
  • Crean un arma de rayo de energía inspirada en la Estrella de la Muerte de la saga Star Wars 14 noviembre, 2024
    Científicos chinos afirman haber hecho realidad el arma de haz de energía convergente que utiliza la estación espacial Estrella de la Muerte en la saga Star Wars: el sistema dirige una serie de haces de alta potencia a un solo objetivo. En la práctica, el arma podría tener un impacto letal al permitir desplegar múltiples vehículos […]
    Pablo Javier Piacente
  • Una isla rusa desaparece por completo del mapa en el Ártico 14 noviembre, 2024
    Un grupo de escolares y estudiantes universitarios descubrió que una isla rusa en el Ártico ha desaparecido recientemente, después de comparar imágenes satelitales del área para un proyecto educativo. La Sociedad Geográfica Rusa confirmó la desaparición de la isla helada Mesyatseva, aparentemente como consecuencia de los efectos del calentamiento global y el cambio climático antropogénico.
    Pablo Javier Piacente
  • Descubren cómo nuestro cerebro predice el futuro 14 noviembre, 2024
    El cerebro hace mucho más que procesar información: aprende de experiencias pasadas y hace predicciones sobre el futuro inmediato. Así podemos vivir con seguridad las experiencias cotidianas.
    Redacción T21
  • Descubren una extraña criatura fantasmal desconocida en lo profundo del océano 13 noviembre, 2024
    Un grupo de investigadores ha revelado recientemente una variedad desconocida de nudibranquio, una extraña criatura marina que nada libremente en los mares a más de 2.200 metros de profundidad, iluminada por un brillo bioluminiscente y adornada con una capucha ondulante, que le confieren un aspecto fantasmal. Se trata del primer nudibranquio conocido de su tipo, […]
    Pablo Javier Piacente
  • Nuestros antepasados usaron herramientas hace más de 3 millones de años 13 noviembre, 2024
    Un nuevo estudio que ha analizado los huesos de las manos de australopitecos, simios y humanos revela que el uso de herramientas probablemente evolucionó antes del surgimiento del género Homo: nuestros antepasados homínidos habrían comenzado a dominarlas hace más de 3 millones de años, iniciando una práctica cultural y tecnológica que se creía propia de […]
    Pablo Javier Piacente