Cómo digitalizar imágenes y documentos

Cómo digitalizar imágenes y documentos antiguos

Saber cómo digitalizar imágenes y documentos es esencial para garantizar su existencia a largo plazo. El formato físico está sujeto a condiciones medioambientales, roturas involuntarias, pérdidas, entre muchos otros problemas. Tener una copia digital puede garantizar otra forma de mantener el activo seguro. No que se trate de un formato sin problemas de por sí, pero nos garantiza lo que llamamos Diversificación tecnológica. Tener varias copias en lugares independientes hace estadísticamente imposible perderlo por accidente.

Con motivos de sencillez y por su similitud, las imágenes y documentos se van a digitalizar de la misma forma, con un paso más para los documentos.

Obtendremos una imagen digital en formato PNG, JPG… y un documento en un formato .PDF o .DOC dónde podemos copiar el texto.

Con un equipamiento simple y de casa o adquiriendo un escáner estándar especializado, es posible hoy en día obtener magníficas digitalizaciones.

Elijamos el equipo de trabajo

En este punto debemos decidir: usar un escáner o una cámara digital.

El escáner es una buena opción para la obtención de documentos e imágenes con menor rango dinámico. Es decir con menos tipos de color, luces, sombras… como un texto o imagen en blanco y negro. Un escáner también evitará interferencias de la luz ambiental mejor, a no ser que el fotógrafo use la luz con precisión y experiencia.

El escáner puede ser más lento que una cámara y no siempre podemos o debemos colocar determinados documentos dentro del escáner. Por ejemplo hojas quebradizas, abultadas, con relieve o incluso con anillas.

La fotografía digital vía cámara es ideal para imágenes de muchos detalles, colores, gradientes e incluso desperfectos. En los documentos no es tan habitual por ser predominantemente blancos y negros. La cámara también se puede mover mucho más que un escáner (a otro lugar o incluso país). Un escáner requiere de espacio, cableados y normalmente un PC.

Aún así existen escáneres más costosos y con mayor capacidad o movilidad, pero se van de nuestro presupuesto probablemente.

Una vez decidido, y sopesado lo positivo y negativo de cada uno, debemos adquirir el equipo. Quizás tengamos un escáner de una impresora o un smartphone con buena cámara: pero todo depende de nuestras exigencias de calidad final.

Comienza la digitalización

En el caso de los escáneres, para digitalizar imágenes, documentos, fotografías, planos… escogeremos siempre la opción de mayor calidad. Eso implica color y resolución lo más alta posible. Idealmente 600 dpi o 1200 dpi para óptimos resultados. Estos números son el equivalente a píxeles físicos, así que cuanto más mejor. En el caso de la cámara, la calidad es más alta.

La luz es el elemento más importante para construir una escena para fotografiar. Intentaremos tener una luz regular, fiable y difusa.
Podemos fabricarnos una zona especial, con una plataforma de escaneado y cuatro focos fijados con una orientación de 45º sobre el documento. El flash en imágenes o documentos que puedan brillar es un problema debe no ser activado.

Fijar la cámara a un trípode es fundamental también para agilizar el proceso y evitar que haya imágenes movidas. Una vez todo en posición es hora de hacer las fotos o escaneos.

Recuerda de que la cámara o escáner estén capturando en perspectiva la superficie. Eso significa que la cámara no puede estar torcida/inclinada debe capturar todo recto. Una buena forma de observarlo es mirar las equinas y forma completa del foto o imagen. Si no es un cuadrado sino que está rotado o es como un rombo, no lo hemos realizado perpendicular a la hoja y debemos corregirlo.

El Post Procesamiento Digital

Una vez realizado el escaneado o fotografiado, debemos almacenar las imágenes originales y trabajar en su procesado por separado. Un escaneo en formato .PDF .PNG . JPG o .TIFF son ideales para trabajar.

Prácticamente cualquier escaneo o fotografía requiere una corrección de color. En el caso de los documentos en blanco y negro es simple, solo necesitamos dos colores, y así reducimos el ruido. Una correcta corrección de color es fundamental para procesar el texto he incluso vectorizar una imagen.

Este primer procesado no solo hace que lo veamos mejor, sino que facilita a programas entender la imagen y usar herramientas mejor.

Por ejemplo quitar el fondo, vectorizar, o escanear el texto. Además cómo mejor este el archivo original y final, mejor de cara a futuro. Se están desarrollando herramientas y quizás otras hipotéticas futuras que podrán hacer más cosas con los recursos, cuanta más calidad tengan mejor lo hará.

Por ejemplo, nosotros actualmente con IA (Inteligencia Artificial) somos capaces de digitalizar imágenes y documentos y subir su resolución. Esto se conoce como AI Upscaling.

Cómo hacer el texto seleccionable

El problema es que tenemos una imagen “plana” que se puede ver, pero no seleccionar el texto. Si por ejemplo queremos buscar una palabra (con herramientas como CTRL + F o CTRL + B) no podemos.

Por suerte este problema es muy común y se ha trabajado desde hace años en software. Desde escaneo de facturas, planos o textos: todo requiere extraer texto y el método usado es el OCR.

Digamos que es la capacidad de un ordenador de reconocer visualmente un carácter y traducirlo en una letra de un documento. Pues esto puede hacerse de manera gratuita buscando “OCR” en Google o muchos programas de pago. Vigilar con quién compartir los documentos si son confidenciales, pero no es muy complicado encontrar un buen servicio. Incluso existe un truco con Google drive de abrir una imagen en Docs y te la escanéa.