Tendencias21
Un 'Google' para los textos escritos a mano

Un 'Google' para los textos escritos a mano

Científicos suecos están trabajando en desarrollar un ‘Google para la escritura a mano’, es decir, un sistema para analizar y buscar en textos escritos a mano. Para ello, la idea es que parte del texto lo ‘traduzca’ un ser humano experto, y a partir de ahí sea el ordenador el que automatice el proceso, sabiendo cómo es la escritura del autor en cuestión. Por Carlos Gómez Abajo.

Un 'Google' para los textos escritos a mano Poder utilizar los ordenadores para analizar y buscar en textos escritos a mano revolucionaría la investigación de las humanidades. Y la tecnología para digitalizar los libros impresos y hacer búsquedas en ellos ya existe.

La biblioteca de la Universidad de Uppsala (Suecia) ha lanzado recientemente una plataforma digital, Alvin, donde las obras digitalizadas de las colecciones patrimonio cultural están siendo recogidas en una sola base de datos. Con unos pocos clics, será posible buscar a través de las colecciones, abriendo nuevas posibilidades para los investigadores y otras personas interesadas.

«Las obras se pueden buscar, por ejemplo a través de Google, lo que significa que usted puede revisar materiales históricos y encontrar nuevos ángulos», explica Per Cullhed, estratega de desarrollo en la biblioteca de la Universidad, en la información de ésta.

Cuando la biblioteca universitaria digitaliza libros de colecciones del patrimonio, utiliza un software que convierte las páginas a texto digital, conocido como Reconocimiento Óptico de Caracteres (OCR). El software interpreta la información impresa y la hace buscable. Con la escritura, se utiliza la tecnología HTR -reconocimiento de texto escrito a mano- en su lugar. Es el desarrollo de esta tecnología el que está creando una especie de carrera entre los investigadores de todo el mundo.

«Quieres ser el primero en encontrar un programa que funcione. Si alguien tuviera hoy un algoritmo para realizar búsquedas digitales a gran escala de cosas como la colección de manuscritos de la Biblioteca Vaticana, valdría una fortuna. Aunque el valor de mercado es enorme, también lo es la magnitud de la tarea», dice Anders Brun, director del proyecto en el Departamento de Tecnología de la Información.

En el proyecto de investigación interdisciplinar De la pluma a los bytes, Anders Brun y sus colegas están tratando de desarrollar un método que permita analizar y buscar en grandes cantidades de textos escritos a mano. El proyecto consiste en investigación básica, que a largo plazo debería resultar en software acabado.

«Lo llamamos habitualmente el Google de la escritura a mano: una manera de encontrar rápidamente lo que busca a pesar de que la cantidad de información es enorme «, dice.

El proyecto se inició en enero de 2013 y tendrá una duración de unos cinco años. La financiación se compone principalmente de una subvención del Consejo de Investigación sueco, por valor de 1,5 millones de euros.

Frederick Wahlberg, estudiante de doctorado en el Departamento de Tecnología de la Información, está trabajando actualmente en manuscritos medievales en sueco antiguo en colaboración con Mats Dahllöf, investigador en lingüística y filología, y Lars Mårtensson, profesor asociado en el Departamento de Idiomas escandinavos. Más adelante en el proyecto, buscarán en la más reciente colección Waller, que se encuentra en la biblioteca de la universidad.

«Los textos son muy difíciles de leer y es imprescindible colaborar entre varias disciplinas si queremos tener éxito», afirma Wahlberg. La clave

El núcleo del trabajo tiene que ver con la decodificación de texto, con encontrar un método a través del cual el equipo intenta interpretar la imagen digital del texto. Los investigadores están tratando de evitar la interpretación de texto porque un texto escrito a mano puede ser muy diferente dependiendo de quien sostuviera la pluma. En su lugar, quieren enseñar al ordenador a interpretar el material.

«Utilizando conocimiento experto, tratamos de dar al ordenador la respuesta correcta para una pequeña porción del material y luego automatizarlo», explica Wahlberg.

El conocimiento de los expertos sobre lo que es interesante y sobre cómo difieren unos escritores de otros les ayuda a avanzar en su trabajo.

«El ordenador nos puede ayudar, pero no puede resolver todos nuestros problemas. Todavía es necesario que haya un conocimiento experto para interpretar el material y hacer las correcciones», dice Anders Brun.

Sin embargo, para los investigadores en humanidades, la oportunidad de hacer manuscritos buscables a gran escala revolucionaría su trabajo y crearía todo tipo de nuevas posibilidades.

«Este tipo de software es un poco un Santo Grial para los investigadores que quieren abrir nuevos caminos digitales en áreas como la historia, los estudios religiosos y la lingüística. ¡Significaría tanto para la investigación!», resume Brun.

Productos

Los primeros productos de hardware que interpretaban la escritura a mano y la traducían a texto a máquina aparecieron en la década de 1980. Sustituían al teclado.

El sistema se empezó a usar de forma habitual en las PDAs, y más tarde en las tabletas. Algunos sistemas de Windows para PC incorporan sistemas de este tipo, más avanzados que los de su sistema para móviles.

Sin embargo, su uso no se ha extendido en los ordenadores de sobremesa ni en los portátiles, porque se considera que la introducción de texto mediante teclado es más rápida y fiable.

En cuanto al software, el primer programa apareció en 1962. En la década de 1990 aparecieron dos programas capaces de reconocer el texto escrito, que han seguido evolucionando desde entonces.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • La parte más "antigua" del cerebro controla cuánto comemos 7 febrero, 2025
    Las neuronas que se encuentran en la región más antigua del cerebro de los vertebrados, el tronco encefálico, podrían controlar cuándo dejamos de comer, según sugiere un nuevo estudio. El hallazgo podría propiciar nuevos enfoques terapéuticos para la obesidad, una patología que afecta a un porcentaje cada vez mayor de la población mundial.
    Redacción T21
  • La estructura más grande del universo desafía nuestra comprensión del cosmos 7 febrero, 2025
    Los astrónomos han descubierto la estructura más grande del cosmos, llamada Quipu en honor a un sistema de medición inca. Contiene la asombrosa cantidad de 200 cuatrillones de masas solares y una longitud de 1.300 millones de años luz. Es una ventana insólita para descifrar cómo se tejió la red cósmica que da forma al […]
    Redacción T21
  • Los monos comprenden cuándo no entendemos algo y nos lo hacen saber 6 febrero, 2025
    Los científicos han conseguido obtener la evidencia más clara hasta la fecha en torno a que los simios pueden comprender cuándo cometemos un error o una omisión en una tarea e indicarnos nuestra falla con claridad. Es un gran avance en la comprensión de los mecanismos intuitivos y cooperativos en primates no humanos. 
    Pablo Javier Piacente / T21
  • Es posible que un enorme asteroide impacte contra la Tierra el 24 de septiembre de 2182 6 febrero, 2025
    El asteroide Bennu, de unos 500 metros de diámetro, tiene una probabilidad estimada de 1 entre 2.700 de colisionar con la Tierra en septiembre de 2182. Los científicos crearon un modelo que muestra el impacto global en el clima y el ambiente del choque contra la Tierra de una roca espacial con las caracterìsticas de […]
    Pablo Javier Piacente / T21
  • Maratón de ideas para aplicar la Inteligencia Artificial a colectivos vulnerables 6 febrero, 2025
    España ha puesto en marcha un hackathon internacional para aplicar la Inteligencia Artificial a la solución de problemas de colectivos vulnerables. Organizado por OdiseIA, está abierto a la participación de empresas y profesionales capaces de aportar ideas que marquen una diferencia.
    Idoia Salazar/Fundadora y presidenta de OdiseIA
  • Un 30% del planeta se está volviendo extremadamente peligroso para los mayores de 60 años 6 febrero, 2025
    Las personas mayores de 60 años estarían en riesgo en aproximadamente un tercio de la masa continental del planeta, que registra temperaturas extremas como consecuencia del cambio climático y el calentamiento global. El peligro podría incrementarse si no se alcanzan los objetivos de reducción en la emisión de gases de efecto invernadero y no logra […]
    Redacción T21
  • Confirmado: las mujeres hablan más que los hombres 5 febrero, 2025
    Las mujeres son realmente más comunicativas que los hombres, pero solo durante un período determinado de la vida: durante la mediana edad, hablan 3.000 palabras más al día. En general, sin embargo, los hombres y las mujeres hablan aproximadamente la misma cantidad de palabras por día: alrededor de 16.000.
    Pablo Javier Piacente / T21
  • Descubren cómo una Tierra "gemela" podría detectarnos 5 febrero, 2025
    Un estudio analiza cómo la Tierra podría ser detectada desde otro planeta similar habitado por una civilización inteligente: concluye que las señales de radio, como las emisiones de radar planetario del antiguo Observatorio de Arecibo, son las tecnofirmas más detectables de la Tierra, potencialmente visibles hasta 12.000 años luz de distancia de nuestro planeta.
    Pablo Javier Piacente / T21
  • Los niños usaban piercings hace 30.000 años en Europa 5 febrero, 2025
    Los europeos de la Edad de Hielo, de tan solo 10 años de edad, llevaban piercings en las mejillas hace 30.000 años: un análisis de esqueletos paleolíticos de Europa Central sugiere que los dientes de las personas estaban desgastados y apiñados debido a las perforaciones en las mejillas.
    Redacción T21
  • Las ciudades se llenan de ratas por el cambio climático 4 febrero, 2025
    Un equipo de científicos analizó 16 ciudades de todo el mundo y descubrió un intenso vínculo entre el creciente número de ratas y tres aspectos cruciales del entorno urbano: la densidad de población humana, la urbanización y el incremento de las temperaturas como consecuencia del cambio climático de raíz antropogénica. En 11 de las 16 […]
    Pablo Javier Piacente / T21