Wednesday, January 26, 2005

Científicos de Xerox resuelven el problema del escaneado de libros

(19/01/2005 11:53): Científicos de Xerox resuelven el misterio de copiar los bordes centrales de páginas de libros sin dañar la encuadernación.

SANTIAGO: Si ha digitalizado páginas de un libro, estará familiarizado con el problema, palabras oscuras y distorsionadas al centro, donde la página está unida al empaste del libro. Para corregir el problema, la mayoría usa el método de la “fuerza bruta”, presionando el libro para aplanarlo lo más posible contra la superficie de cristal del escáner y de esa manera obtener copias entendibles

Los investigadores de Xerox Corporation (NYSE: XRX) creen que hay una mejor forma de resolver el problema. Han propuesto una solución simple y elegante: una fórmula matemática que pueda ser incorporada en el software de los modelos comunes de scanner para eliminar el problema. Ello podría no solo proteger el lomo de los libros sino que, además, producir copias que sean fáciles de leer.

La investigación fue presentada por Beilei Xu, una científica de la compañía del laboratorio de Webster, N.Y., durante la 5ta Conferencia Internacional de Ciencia de la Imagen y Copia Física en Xi´an, China.

Según Xu y Robert P. Loce, otro investigador de Xerox que trabajó en el proyecto, cuando la página de algún libro no es uniforme, el contacto con la superficie del scanner produce dos problemas. La variedad de la iluminación provoca que algunas partes de la copia resulten más oscuras que otras; y, por otra parte, la variación en la distancia con la superficie del escáner provoca que las letras o los objetos más alejados de la superficie aparezcan como arrugados.

Ha habido algunos intentos especializados y bastante costosos para corregir este problema. Por ejemplo, en una ocasión Xerox vendió una copiadora con un borde angulado y una cubierta articulada de manera que la gente pudiera copiar páginas sin romper los libros cuando intentaba abrirlos completamente. Otra solución consistió en scanners especializados en libros, con sensores de peso para que el libro quedara abierto con las páginas hacia arriba, y la digitalización tuviera lugar por encima de él.

Sin embargo, en lugar de rediseñar la máquina o acomodar los libros, Xu y Loce decidieron incorporar esa capacidad dentro del software. Los scanners capturan imágenes mediante la luz brillante que cae dentro de la imagen; esa luz es reflejada fuera de la imagen, luego es medida por sensores, los cuales “leen” la luminosidad u oscuridad de la imagen, pixel por pixel.

“Normalmente la luz solo entrega información del reflejo del documento original”, dijo Xu. “En nuestra aplicación, usamos la luz medida para además determinar la distancia del libro con la superficie de cristal del scanner por cada pixel en la página”.

Debido a que las partes de la página que están más lejos de la superficie del scanner aparecen más oscuras, ellos pueden determinar la variación en la distancia y matemáticamente compensarla, eliminando de la imagen la parte más oscura. Sin embargo, la imagen tendrá todavía palabras distorsionadas en el centro. El segundo paso en el proceso es aplicar un factor de desarrugado, basado también en cuan lejos está la página de la superficie del scanner, para compensar la distorsión geométrica de la imagen.

Los procesos patentados son capaces de permitir que los libros sean digitalizados en forma entendible, con resultados de alta calidad en casi cualquier scanner convencional de bajo precio, según señala Loce. El software está diseñado para trabajar con la metodología que es comúnmente usada en los scanners y copiadoras del mercado de consumidores finales, un área donde Xerox habitualmente no compite. Sin embargo, la tecnología está disponible para licencia, y la teoría que hay detrás podría ser adaptada en el futuro para los scanners de alta velocidad usados en los productos Xerox.