Cajón de retales: OCR o reconocimiento de textos

El OCR (Optical character recognition) es un software de reconocimiento de texto que saca de una imagen el texto que contiene y lo transforma en cadenas de caracteres para guardarlos en un formato que se pueda utilizar en programas de edición de texto.

Lo único que debemos hacer es añadir el archivo de pdf o imagen de la que queramos reconocer el texto y seleccionar el formato de salida en el que queremos el nuevo archivo.
Hay diversas webs en las que podemos seguir el proceso explicado:

En ocronline elegimos el idioma y el formato de salida del archivo en las pestañas superiores al cuadro blanco. Con el botón browse buscaremos el archivo en nuestro ordenador y con upload se llevará a cabo el reconocimiento.
La única pega es que sólo convierte archivos de imagen y está limitado a 100 archivos por día, pero creo esto es más que suficiente.

Con onlineocr.net podemos reconocer archivos en formato pdf y si además estamos registrados el límite de caracteres no se limita sólo a los 4MB. Cuando damos a reconocer conseguimos que nos salga el texto del archivo en pantalla. Para poder descargar este archivo nuevo en el formato elegido debemos estar registrados. Además con el registro conseguiremos otros formatos de salida distintos a los que nos ofrecen. Aunque siempre podemos utilizar la opción de copiar y pegar texto al word y listo.

Por último señalar que está tan a la orden del día usar esta tecnología de reconocimiento de texto en imagenes y pdf que google se une a esta moda y nos facilita Google Codes Samples desde la que podremos subir las imágenes y convertirlas a formato de salida de google docs. Para ello previamente debemos identificarnos en nuestra cuenta de google y darle permiso para acceder al "programa". A continuación lo que veremos es una pantalla como la de abajo.

Esperemos que no se quede en una muestra y que google la añada de forma permanente a google docs.

Como conclusión me gustaría añadir que es una tecnología de la que aún no se ha aprovechado todo su potencial y que aún tiene algunos errores.
¡Que aproveche!

Fuente: http://www.configurarequipos.com/doc439.html

Cajón de retales

domingo, 10 de octubre de 2010

OCR o reconocimiento de textos

0 comentarios:

Publicar un comentario

Entradas más populares

Vídeo Redes Sociales

Etiquetas

Blog Archive

Datos personales

Visitas