Tendencias21
Un 'Google' para los textos escritos a mano

Un 'Google' para los textos escritos a mano

Científicos suecos están trabajando en desarrollar un ‘Google para la escritura a mano’, es decir, un sistema para analizar y buscar en textos escritos a mano. Para ello, la idea es que parte del texto lo ‘traduzca’ un ser humano experto, y a partir de ahí sea el ordenador el que automatice el proceso, sabiendo cómo es la escritura del autor en cuestión. Por Carlos Gómez Abajo.

Un 'Google' para los textos escritos a mano Poder utilizar los ordenadores para analizar y buscar en textos escritos a mano revolucionaría la investigación de las humanidades. Y la tecnología para digitalizar los libros impresos y hacer búsquedas en ellos ya existe.

La biblioteca de la Universidad de Uppsala (Suecia) ha lanzado recientemente una plataforma digital, Alvin, donde las obras digitalizadas de las colecciones patrimonio cultural están siendo recogidas en una sola base de datos. Con unos pocos clics, será posible buscar a través de las colecciones, abriendo nuevas posibilidades para los investigadores y otras personas interesadas.

«Las obras se pueden buscar, por ejemplo a través de Google, lo que significa que usted puede revisar materiales históricos y encontrar nuevos ángulos», explica Per Cullhed, estratega de desarrollo en la biblioteca de la Universidad, en la información de ésta.

Cuando la biblioteca universitaria digitaliza libros de colecciones del patrimonio, utiliza un software que convierte las páginas a texto digital, conocido como Reconocimiento Óptico de Caracteres (OCR). El software interpreta la información impresa y la hace buscable. Con la escritura, se utiliza la tecnología HTR -reconocimiento de texto escrito a mano- en su lugar. Es el desarrollo de esta tecnología el que está creando una especie de carrera entre los investigadores de todo el mundo.

«Quieres ser el primero en encontrar un programa que funcione. Si alguien tuviera hoy un algoritmo para realizar búsquedas digitales a gran escala de cosas como la colección de manuscritos de la Biblioteca Vaticana, valdría una fortuna. Aunque el valor de mercado es enorme, también lo es la magnitud de la tarea», dice Anders Brun, director del proyecto en el Departamento de Tecnología de la Información.

En el proyecto de investigación interdisciplinar De la pluma a los bytes, Anders Brun y sus colegas están tratando de desarrollar un método que permita analizar y buscar en grandes cantidades de textos escritos a mano. El proyecto consiste en investigación básica, que a largo plazo debería resultar en software acabado.

«Lo llamamos habitualmente el Google de la escritura a mano: una manera de encontrar rápidamente lo que busca a pesar de que la cantidad de información es enorme «, dice.

El proyecto se inició en enero de 2013 y tendrá una duración de unos cinco años. La financiación se compone principalmente de una subvención del Consejo de Investigación sueco, por valor de 1,5 millones de euros.

Frederick Wahlberg, estudiante de doctorado en el Departamento de Tecnología de la Información, está trabajando actualmente en manuscritos medievales en sueco antiguo en colaboración con Mats Dahllöf, investigador en lingüística y filología, y Lars Mårtensson, profesor asociado en el Departamento de Idiomas escandinavos. Más adelante en el proyecto, buscarán en la más reciente colección Waller, que se encuentra en la biblioteca de la universidad.

«Los textos son muy difíciles de leer y es imprescindible colaborar entre varias disciplinas si queremos tener éxito», afirma Wahlberg. La clave

El núcleo del trabajo tiene que ver con la decodificación de texto, con encontrar un método a través del cual el equipo intenta interpretar la imagen digital del texto. Los investigadores están tratando de evitar la interpretación de texto porque un texto escrito a mano puede ser muy diferente dependiendo de quien sostuviera la pluma. En su lugar, quieren enseñar al ordenador a interpretar el material.

«Utilizando conocimiento experto, tratamos de dar al ordenador la respuesta correcta para una pequeña porción del material y luego automatizarlo», explica Wahlberg.

El conocimiento de los expertos sobre lo que es interesante y sobre cómo difieren unos escritores de otros les ayuda a avanzar en su trabajo.

«El ordenador nos puede ayudar, pero no puede resolver todos nuestros problemas. Todavía es necesario que haya un conocimiento experto para interpretar el material y hacer las correcciones», dice Anders Brun.

Sin embargo, para los investigadores en humanidades, la oportunidad de hacer manuscritos buscables a gran escala revolucionaría su trabajo y crearía todo tipo de nuevas posibilidades.

«Este tipo de software es un poco un Santo Grial para los investigadores que quieren abrir nuevos caminos digitales en áreas como la historia, los estudios religiosos y la lingüística. ¡Significaría tanto para la investigación!», resume Brun.

Productos

Los primeros productos de hardware que interpretaban la escritura a mano y la traducían a texto a máquina aparecieron en la década de 1980. Sustituían al teclado.

El sistema se empezó a usar de forma habitual en las PDAs, y más tarde en las tabletas. Algunos sistemas de Windows para PC incorporan sistemas de este tipo, más avanzados que los de su sistema para móviles.

Sin embargo, su uso no se ha extendido en los ordenadores de sobremesa ni en los portátiles, porque se considera que la introducción de texto mediante teclado es más rápida y fiable.

En cuanto al software, el primer programa apareció en 1962. En la década de 1990 aparecieron dos programas capaces de reconocer el texto escrito, que han seguido evolucionando desde entonces.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • La IA revela los misterios ocultos de los virus en los océanos y en los intestinos humanos 17 mayo, 2024
    Los virus son una fuerza misteriosa y poco comprendida: se sabe que pueden infectar, matar y manipular células humanas y bacterianas en casi todos los entornos, desde los océanos hasta nuestros intestinos. Sin embargo, aún no se tiene una idea completa de cómo los virus afectan el entorno que los rodea, en gran parte debido […]
    Pablo Javier Piacente
  • El Sol lanza su llamarada más poderosa en 7 años 17 mayo, 2024
    Una erupción solar medida en X8.7, la categoría más extrema para este tipo de fenómenos, acaba de surgir desde la misma región de manchas solares responsable de las llamaradas del fin de semana pasado, que provocaron impresionantes auroras y otras consecuencias en todo el planeta. Se trata de la llamarada solar más poderosa desde 2017, […]
    Pablo Javier Piacente
  • Un videojuego arroja luz sobre cómo vuelan los insectos 17 mayo, 2024
    Moscas de la fruta genéticamente modificadas han permitido a los científicos desentrañar la misteriosa mecánica de vuelo de los insectos. Gracias a la IA, cartografiaron cómo los músculos de la mosca Drosophila melanogaster manipulan la bisagra del ala para realizar maniobras de vuelo ágiles y aerodinámicas.
    Redacción T21
  • Descubren un exoplaneta similar a la Tierra orbitando una estrella que sobrevivirá al Sol 16 mayo, 2024
    Un planeta extrasolar rocoso del tamaño de la Tierra orbita de cerca a una estrella enana roja ultrafría, que se supone brillará durante 100.000 millones de años, mucho más tiempo que nuestro Sol, que se extinguirá en alrededor de 5.000 millones de años. A pesar de estas características y de su cercanía con la Tierra, […]
    Pablo Javier Piacente
  • El dióxido de carbono atmosférico crece a un ritmo sin precedentes en los últimos 50.000 años 16 mayo, 2024
    Un análisis químico detallado del hielo antártico antiguo permitió a los científicos comprobar que la tasa de incremento actual del dióxido de carbono (CO2) atmosférico es la mayor en los últimos 50.000 años: según los investigadores, este aumento y su comparación con ciclos anteriores indica claramente la intensidad del cambio climático que está comenzando a […]
    Pablo Javier Piacente
  • Un Parlamento Ciudadano Climático se abre paso en España 16 mayo, 2024
    Después de las Asambleas Ciudadanas celebradas en España entre 2022 y 2024, la Asamblea Cívica por el Clima y el Observatorio de Sostenibilidad han propuesto la creación de un Parlamento Ciudadano Climático, formado mediante sorteo representativo por expertos y actores sociales, para alcanzar un consenso social mayoritario sobre la emergencia climática que esté basado en […]
    Alejandro Sacristán
  • Los virus humanos más antiguos estarían ocultos en los huesos de los neandertales 15 mayo, 2024
    El análisis genético de esqueletos de neandertales de 50.000 años de antigüedad ha revelado restos de tres virus relacionados con patógenos humanos modernos: los investigadores creen que podrían recrearse.
    Pablo Javier Piacente
  • Ondas gigantes de materia oscura podrían estar alterando las órbitas de las estrellas 15 mayo, 2024
    Los científicos creen que las perturbaciones en los sistemas estelares binarios podrían ser la clave para detectar la sustancia más confusa del espacio: la materia oscura. Ondas de esta materia invisible serían capaces de modificar las órbitas de las estrellas, de acuerdo a un nuevo estudio.
    Pablo Javier Piacente
  • El envejecimiento también es cosa del azar 15 mayo, 2024
    ¿Cómo funciona el envejecimiento? Los científicos del Grupo de Excelencia para la Investigación del Envejecimiento CECAD han descubierto que el azar es más importante en el proceso de envejecimiento de lo que se pensaba anteriormente.
    Redacción T21
  • Revelan el misterio de las "manchas gigantes" en el Océano Pacífico 14 mayo, 2024
    Un grupo de manchas de agua extremadamente cálidas en el Océano Pacífico han tenido un efecto desastroso en los ecosistemas marinos desde 2010. Ahora, una nueva investigación sugiere que, paradójicamente, una de las causas de su formación habría sido la reducción en las emisiones de aerosoles en China, junto al calentamiento global.
    Pablo Javier Piacente