Programas de OCR para convertir hojas de papel y PDF en texto editable

OCR es la abreviatura que significa “Reconocimiento óptico de caracteres” (reconocimiento óptico de caracteres) èd es una tecnología de software, “inteligente” que sirve para convertir las imágenes y los PDF que contienen texto escrito en documentos editables con programas normales de procesamiento de textos como Microsoft Word.
Sin entrar en detalles técnicos, el software de OCR permite por lo tanto tomar un papel escrito y convertirlo en un documentocuyas palabras pueden ser cambiadas. En general, hay se refiere al uso del escánery el reconocimiento de los textos escritos en un papel para que las palabras puedan ser cambiadas. Para encontrar campos de aplicación típicos de la vida cotidiana podemos pensar en cuando se quiere utilizar el texto escrito en un libro o en un periódico para ponerlo en un documento de Word o en una tesis, para editarlo y hacerlo propio o incluso para reescribir un fax recibido.

En este artículo vemos algunos programas y sitios web, gratuitos, útiles para modificar faxes, imágenes de escáner y pdf en un archivo de texto normal.
Últimamente la tecnología de OCR ha hecho grandes avances y los resultados son sorprendentes.

LEE TAMBIÉN: Reconocer y extraer el texto de la imagen en Android con aplicaciones OCR

1) Transcribir el texto en fotos con Google Keep es la forma más fácil, incluso si no funciona con PDFs.

2) Con Microsoft Onenote Para Windows 10 se puede utilizar la función de OCR de las hojas escaneadas para hacer que los documentos en papel sean editables. El programa es fácil de usar y gratuito y se discute en otro artículo.

3) También con Google Docs puedes extraer el texto de un pdf o una imagen que es otra solución muy práctica y conveniente.

4) OpenOCR Cognitivo (Cuneiforme) es un programa de código abierto que permite hacer reconocimiento óptico de caracteres (OCR) y por lo tanto transformar el pdf y las imágenes en documentos de texto editables con Word u otros programas. El cuneiforme soporta 23 idiomas, entre ellos también italiano y tiene algoritmos especiales para reconocer el texto de las impresoras, faxes y fotocopias. Reconoce automáticamente los bloques de texto, tablas e imágenes sin dificultad y conserva perfectamente la disposición de la página.

5) SimpleOCR es un programa simple y básico capaz de hacer textos editables escritos en papel y escaneados en el ordenador, con reconocimiento óptico de caracteres. Con SimpleOCR puedes convertir cualquier documento en papel en texto electrónico editable para su uso con Word.

6) Pantalla fácil OCR es un programa gratuito para Windows 10 y Windows 7 que permite extraer y capturar texto de cualquier imagen o captura de pantalla. La herramienta OCR (Reconocimiento Óptico de Caracteres) de Easy Screen es capaz de capturar y convertir capturas de pantalla en texto. Puede extraer el texto de una imagen, video, sitio web, documentos. Potenciado por el OCR de Google, que garantiza una alta precisión de reconocimiento, este programa gratuito soporta más de 100 idiomas.

7) Boxoft Free OCR Converter es otro gran programa gratuito que permite extraer texto de todo tipo de imágenes (incluyendo hojas de papel escaneadas), en múltiples idiomas incluyendo inglés, francés, alemán, italiano, holandés, español, portugués y más. Además de las imágenes, también puede escanear copias en papel de documentos y convertirlas en texto editable.

7) OnlineOCR.net es un sitio web donde sólo tienes que subir la imagen escaneada o el pdf para obtener el archivo editable y editable con Word.

8) NewOCR Actualmente sólo ofrece la extracción de texto de archivos de imágenes y fotos, pero admite algunas otras características que muchos sitios de OCR en línea no ofrecen, como el establecimiento de múltiples idiomas de reconocimiento, lo que también es útil para obtener una traducción correcta del texto. Si la imagen está inclinada, también puede rotarla dinámicamente.

9) OCR.space es definitivamente una de las opciones más robustas que hemos encontrado, una de las mejores herramientas de OCR que también soporta el formato de archivo WEBP además de PNG, JPG y PDF. Además, no necesitas subir un archivo, puedes usar la URL de una imagen Online. Otras funciones son la rotación automática, el escaneo de recibos, el reconocimiento de la mesa y el cambio de tamaño automático. El texto extraído también puede ser guardado en un PDF o como un archivo JSON.

10) Lector final en línea es un sitio web para convertir una imagen en un archivo de texto o un archivo pdf en un archivo de Word, siempre editable. Esta última función, la conversión de archivos de .pdf a .doc también se puede hacer con otro software específico para editar archivos pdf. Cuando hablamos de una imagen convertida en un archivo de texto, en este caso, nos referimos a una página escaneada y guardada a través del programa de gestión de un escáner normal, en un archivo jpeg, gif, bmp o tiff. Para utilizar el sitio debe registrarse y se reconoce la conversión de archivos escritos en cualquier idioma, incluyendo el italiano.

11) OCR TO Word es un simple y poderoso programa capaz de extraer texto de un PDF o un documento escaneado. El texto extraído puede ser editado en Word.

12) (a9t9) Software gratuito de OCR es una aplicación gratuita para Windows 10 que permite hacer que el texto dentro de las imágenes sea editable.

13) gImageReader es un programa de código abierto basado en el proyecto Tesseract que fue desarrollado por los laboratorios HP hace varios años, mientras que hoy en día pertenece a Google. Esta poderosa aplicación permite extraer texto de imágenes, PDF, XPS, BMP, ICO, y muchos otros archivos de imágenes. Puede especificar diferentes porciones de texto para extraer y guardarlas directamente en un archivo de texto editable.

14) Capture2Text es un programa que puede copiar el texto de las imágenes con facilidad y con una interfaz muy fácil de usar.

El rendimiento de estos programas depende en gran medida de la calidad de la imagen que se quiere reconocer y de la sensibilidad del escáner utilizado.
Pasamos de reproducciones idénticas de textos a casos en los que no se reconoce ni una sola palabra.

LEE TAMBIÉN: Copiar y pegar texto en fotos, imágenes y vídeos en Internet con Chrome