El OCR (Optical character recognition) es un software de reconocimiento de texto que saca de una imagen el texto que contiene y lo transforma en cadenas de caracteres para guardarlos en un formato que se pueda utilizar en programas de edición de texto. Lo único que debemos hacer es añadir el archivo de pdf o imagen de la que queramos reconocer el texto y seleccionar el formato de salida en el que queremos el nuevo archivo.
Hay diversas webs en las que podemos seguir el proceso explicado:
En ocronline elegimos el idioma y el formato de salida del archivo en las pestañas superiores al cuadro blanco. Con el botón browse buscaremos el archivo en nuestro ordenador y con upload se llevará a cabo el reconocimiento.La única pega es que sólo convierte archivos de imagen y está limitado a 100 archivos por día, pero creo esto es más que suficiente.
Por último señalar que está tan a la orden del día usar esta tecnología de reconocimiento de texto en imagenes y pdf que google se une a esta moda y nos facilita Google Codes Samples desde la que podremos subir las imágenes y convertirlas a formato de salida de google docs. Para ello previamente debemos identificarnos en nuestra cuenta de google y darle permiso para acceder al "programa". A continuación lo que veremos es una pantalla como la de abajo.
Esperemos que no se quede en una muestra y que google la añada de forma permanente a google docs.
Como conclusión me gustaría añadir que es una tecnología de la que aún no se ha aprovechado todo su potencial y que aún tiene algunos errores.
¡Que aproveche!
Fuente: http://www.configurarequipos.com/doc439.html






0 comentarios:
Publicar un comentario