Tendencias21
Un 'Google' para los textos escritos a mano

Un 'Google' para los textos escritos a mano

Científicos suecos están trabajando en desarrollar un ‘Google para la escritura a mano’, es decir, un sistema para analizar y buscar en textos escritos a mano. Para ello, la idea es que parte del texto lo ‘traduzca’ un ser humano experto, y a partir de ahí sea el ordenador el que automatice el proceso, sabiendo cómo es la escritura del autor en cuestión. Por Carlos Gómez Abajo.

Un 'Google' para los textos escritos a mano Poder utilizar los ordenadores para analizar y buscar en textos escritos a mano revolucionaría la investigación de las humanidades. Y la tecnología para digitalizar los libros impresos y hacer búsquedas en ellos ya existe.

La biblioteca de la Universidad de Uppsala (Suecia) ha lanzado recientemente una plataforma digital, Alvin, donde las obras digitalizadas de las colecciones patrimonio cultural están siendo recogidas en una sola base de datos. Con unos pocos clics, será posible buscar a través de las colecciones, abriendo nuevas posibilidades para los investigadores y otras personas interesadas.

«Las obras se pueden buscar, por ejemplo a través de Google, lo que significa que usted puede revisar materiales históricos y encontrar nuevos ángulos», explica Per Cullhed, estratega de desarrollo en la biblioteca de la Universidad, en la información de ésta.

Cuando la biblioteca universitaria digitaliza libros de colecciones del patrimonio, utiliza un software que convierte las páginas a texto digital, conocido como Reconocimiento Óptico de Caracteres (OCR). El software interpreta la información impresa y la hace buscable. Con la escritura, se utiliza la tecnología HTR -reconocimiento de texto escrito a mano- en su lugar. Es el desarrollo de esta tecnología el que está creando una especie de carrera entre los investigadores de todo el mundo.

«Quieres ser el primero en encontrar un programa que funcione. Si alguien tuviera hoy un algoritmo para realizar búsquedas digitales a gran escala de cosas como la colección de manuscritos de la Biblioteca Vaticana, valdría una fortuna. Aunque el valor de mercado es enorme, también lo es la magnitud de la tarea», dice Anders Brun, director del proyecto en el Departamento de Tecnología de la Información.

En el proyecto de investigación interdisciplinar De la pluma a los bytes, Anders Brun y sus colegas están tratando de desarrollar un método que permita analizar y buscar en grandes cantidades de textos escritos a mano. El proyecto consiste en investigación básica, que a largo plazo debería resultar en software acabado.

«Lo llamamos habitualmente el Google de la escritura a mano: una manera de encontrar rápidamente lo que busca a pesar de que la cantidad de información es enorme «, dice.

El proyecto se inició en enero de 2013 y tendrá una duración de unos cinco años. La financiación se compone principalmente de una subvención del Consejo de Investigación sueco, por valor de 1,5 millones de euros.

Frederick Wahlberg, estudiante de doctorado en el Departamento de Tecnología de la Información, está trabajando actualmente en manuscritos medievales en sueco antiguo en colaboración con Mats Dahllöf, investigador en lingüística y filología, y Lars Mårtensson, profesor asociado en el Departamento de Idiomas escandinavos. Más adelante en el proyecto, buscarán en la más reciente colección Waller, que se encuentra en la biblioteca de la universidad.

«Los textos son muy difíciles de leer y es imprescindible colaborar entre varias disciplinas si queremos tener éxito», afirma Wahlberg. La clave

El núcleo del trabajo tiene que ver con la decodificación de texto, con encontrar un método a través del cual el equipo intenta interpretar la imagen digital del texto. Los investigadores están tratando de evitar la interpretación de texto porque un texto escrito a mano puede ser muy diferente dependiendo de quien sostuviera la pluma. En su lugar, quieren enseñar al ordenador a interpretar el material.

«Utilizando conocimiento experto, tratamos de dar al ordenador la respuesta correcta para una pequeña porción del material y luego automatizarlo», explica Wahlberg.

El conocimiento de los expertos sobre lo que es interesante y sobre cómo difieren unos escritores de otros les ayuda a avanzar en su trabajo.

«El ordenador nos puede ayudar, pero no puede resolver todos nuestros problemas. Todavía es necesario que haya un conocimiento experto para interpretar el material y hacer las correcciones», dice Anders Brun.

Sin embargo, para los investigadores en humanidades, la oportunidad de hacer manuscritos buscables a gran escala revolucionaría su trabajo y crearía todo tipo de nuevas posibilidades.

«Este tipo de software es un poco un Santo Grial para los investigadores que quieren abrir nuevos caminos digitales en áreas como la historia, los estudios religiosos y la lingüística. ¡Significaría tanto para la investigación!», resume Brun.

Productos

Los primeros productos de hardware que interpretaban la escritura a mano y la traducían a texto a máquina aparecieron en la década de 1980. Sustituían al teclado.

El sistema se empezó a usar de forma habitual en las PDAs, y más tarde en las tabletas. Algunos sistemas de Windows para PC incorporan sistemas de este tipo, más avanzados que los de su sistema para móviles.

Sin embargo, su uso no se ha extendido en los ordenadores de sobremesa ni en los portátiles, porque se considera que la introducción de texto mediante teclado es más rápida y fiable.

En cuanto al software, el primer programa apareció en 1962. En la década de 1990 aparecieron dos programas capaces de reconocer el texto escrito, que han seguido evolucionando desde entonces.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Sudáfrica y China logran una conexión cuántica satelital récord de casi 13.000 kilómetros 20 marzo, 2025
    Un equipo internacional de científicos ha establecido una conexión satelital cuántica histórica entre Sudáfrica y China, cubriendo una distancia récord de 12.900 kilómetros. Gracias al fenómeno del entrelazamiento cuántico, esta tecnología garantiza comunicaciones absolutamente seguras frente a cualquier intento de espionaje.
    Redacción T21
  • Los tribunales no reconocen derechos de autor a la Inteligencia Artificial 20 marzo, 2025
    Un tribunal de apelaciones en Estados Unidos ha puesto límites a la creatividad de las máquinas: las obras generadas exclusivamente por inteligencia artificial no pueden ser protegidas por derechos de autor. El fallo reafirma que la ley actual requiere la participación humana para garantizar la protección legal de una obra.
    Redacción T21
  • Desvelan la primera luz que encendió el Universo 20 marzo, 2025
    El Telescopio de Cosmología de Atacama (ACT) ha compilado el mapa más detallado que hemos visto hasta hoy del fondo cósmico de microondas, la tenue luz que impregna el Universo desde solo 380.000 años después del Big Bang y cuyos ecos pueden apreciarse en la actualidad. La imagen obtenida es lo más parecido a la […]
    Redacción T21
  • Microsoft e Inait revolucionan la Inteligencia Artificial con cerebros digitales casi humanos 20 marzo, 2025
    Microsoft ha unido fuerzas con la startup suiza Inait para desarrollar sistemas de IA inspirados en el cerebro humano. Esta colaboración busca crear modelos que no solo aprenden de datos, sino que también razonan como el cerebro humano.
    Redacción T21
  • Una prueba de consciencia corporal desafía las visiones tradicionales sobre la cognición animal 19 marzo, 2025
    Los gorilas pueden ser tan conscientes de sí mismos como los chimpancés, según ha comprobado una nueva investigación: luego de realizar una prueba de autoconsciencia corporal bajo parámetros diferentes a las tradicionales, los científicos verificaron que las capacidades cognitivas de estos simios se habían menospreciado hasta hoy.
    Pablo Javier Piacente / T21
  • China plantea la necesidad de etiquetar el contenido generado con IA 19 marzo, 2025
    En colaboración con varios ministerios gubernamentales, la Administración China de Control del Ciberespacio (CAC) ha anunciado que todo el contenido generado por IA en Internet tendrá que ser etiquetado como tal. Sería la forma a través de la cual el gigante asiático se acopla a la idea europea de establecer algún tipo de regulación sobre […]
    Pablo Javier Piacente / T21
  • Escándalo: Elon Musk regala a la Casa Blanca acceso a su servicio de internet satelital Starlink 19 marzo, 2025
    Starlink ha instalado en la Casa Blanca un servicio de Internet satelital paralelo al sistema oficial de telecomunicaciones que suscita dudas sobre su legalidad, abre brechas de seguridad en las comunicaciones secretas y aventaja a las empresas de Elon Musk en el acceso a proyectos oficiales. Polémica.
    EDUARDO MARTÍNEZ DE LA FE/T21
  • Los recortes en salud de Trump podrían derivar en 1.400 bebés contagiados con SIDA cada día 19 marzo, 2025
    Los datos de una encuesta internacional sugieren que más de un tercio de las organizaciones que dependían de los fondos de Estados Unidos para combatir el virus de la inmunodeficiencia humana (VIH) ya habían cerrado en febrero: el recorte podría producir que alrededor de 1.400 bebés al día se contagien de SIDA en los sitios […]
    Redacción T21
  • Oxígeno oscuro: un enigmático proceso desafía la fotosíntesis en las profundidades del océano 19 marzo, 2025
    Los científicos han descubierto un proceso biológico completamente nuevo en las profundidades del océano. Conocido como 'producción de oxígeno oscuro', permite a ciertas bacterias generar oxígeno sin necesidad de luz ni aire, desafiando los principios establecidos sobre la fotosíntesis.
    Redacción T21
  • Desvelan qué hace única a la consciencia humana 18 marzo, 2025
    Se ha descubierto por primera vez que las neuronas individuales representan los conceptos que aprendemos, independientemente del contexto. Esto permite a los humanos, a diferencia de otros animales, establecer relaciones más elevadas y abstractas.
    Pablo Javier Piacente / T21