TesseractOCR

Autores: Rui Fontes y Ângelo Abrantes
Versión actual: 2024.11.02 estable
Compatibilidad con NVDA: de 2019.3 en adelante
Descargar
Ver código fuente en GitHub

Este complemento usa el motor libre y de código abierto Tesseract OCR para realizar reconocimiento óptico de caracteres en un archivo de imagen, pdf, jpg, tif o de otro tipo, sin que sea necesario abrirlo. También puede escanear y reconocer un documento en papel mediante un escáner compatible con WIA. En las preferencias de NVDA, se añade la categoría TesseractOCR, donde se puede indicar el idioma usado durante el reconocimiento y los tipos de documentos a reconocer.

Atajos

Los atajos por defecto son:

Windows+control+r: reconoce el documento seleccionado.
Windows+control+shift+r: escanea y reconoce un documento desde el escáner.

A continuación, espera a que se abra el fichero ocr.txt con el texto reconocido. Si quieres conservar el texto reconocido, ¡no olvides guardar el documento con otro nombre y en otro lugar, ya que todos los archivos de la carpeta temporal se eliminan al comienzo del siguiente proceso OCR!
Estas órdenes pueden modificarse desde el diálogo Gestos de entrada, en la categoría «TesseractOCR».

Actualización automática

Este complemento incluye una función de actualización automática. La comprobación de una nueva versión se realizará cada vez que se cargue NVDA. Si la quieres, ve a NVDA, Preferencias, Opciones, y marca la casilla en la categoría del complemento.

Problemas conocidos

Esta versión sólo funciona en Windows de 64 bits.
Al elegir la opción «diversos» en el cuadro combinado «Tipo de documentos», el texto reconocido puede aparecer con muchas líneas en blanco. Este es un problema conocido de Tesseract y, sin consumir un montón de tiempo de procesamiento, todavía no he encontrado una solución. ¡Pero aún no me he rendido!

Idiomas soportados

Los idiomas soportados en esta versión son: africano, amárico, árabe, búlgaro, burmés, catalán / valenciano, chino simplificado, chino tradicional, croata, checo, danés, alemán, holandés, inglés, finés, francés, gallego, georgiano, griego, hebreo, hindi, húngaro, islandés, indonesio, irlandés, italiano, japonés, canarés, Kirghiz, coreano, letón, lituano, macedonio, nepalí, noruego, panyabí, persa, polaco, portugués, rumano / moldavo, ruso, serbio (latino), eslovaco, esloveno, español, sueco, tamil, tailandés, turco, ucraniano, urdu y vietnamita.

Tipos de imagen soportados

Este complemento soporta los siguientes tipos de archivos: pdf, jpg, tif, png, bmp, pnm, pbm, pgm, jp2, gif, jfif, jpeg, tiff, spix y webp.

Relacionado

Autor: José Manuel Delicado Alcolea

Ingeniero de software y máster en Ingeniería Informática por la Universidad Rey Juan Carlos. Me encanta todo lo relacionado con la informática, la accesibilidad y las nuevas tecnologías. Trabajo como consultor de accesibilidad. Lee todas las entradas de José Manuel Delicado Alcolea

Ubicación dentro del sitio

Atajos

Actualización automática

Problemas conocidos

Idiomas soportados

Tipos de imagen soportados

Me gusta esto:

Relacionado

Autor: José Manuel Delicado Alcolea

Deja un comentarioCancelar respuesta

Atajos

Actualización automática

Problemas conocidos

Idiomas soportados

Tipos de imagen soportados

Comparte esta página

Me gusta esto:

Relacionado

Autor: José Manuel Delicado Alcolea

Deja un comentarioCancelar respuesta