Este complemento para NVDA proporciona reconocimiento OCR en línea y fuera de línea. El reconocimiento fuera de línea se ha desarrollado basado en el componente PaddleOCR_json.
Este complemento proporciona actualmente el motor PaddleOCR_json para el reconocimiento fuera de línea y las versiones general y precisa del motor de reconocimiento de Baidu. El motor PaddleOCR_json se instalará automáticamente al instalar el complemento. En el futuro se añadirá soporte para más motores de reconocimiento en línea y fuera de línea.
Además, este complemento proporciona descripción de imágenes, que puede identificar el contenido de las mismas.

Ventajas del complemento

  • La velocidad de reconocimiento es rápida, y el reconocimiento fuera de línea tarda unos 100 ms. La situación descrita puede variar en función de la configuración de rendimiento del ordenador.
  • Potente precisión de reconocimiento fuera de línea, comparable al reconocimiento en línea.
  • Las coordenadas del texto resultante reconocido son precisas, y la respuesta del resultado del click también.

Atajos de teclado

  • Reconocer texto del objeto en el navegador de objetos: NVDA+alt+o
  • Reconocimiento OCR del portapapeles: NVDA+alt+shift+o
  • Cambiar motor de reconocimiento OCR: NVDA+alt+9
  • Descripción de imagen: NVDA+alt+p
  • Descripción de imagen del portapapeles: NVDA+alt+shift+p

Todos estos atajos de teclado se pueden modificar en la categoría «Xinyi OCR» del diálogo Gestos de entrada de NVDA.

Contacto de soporte

Cualquier comentario o sugerencia es bienvenido:

  • En el repositorio del proyecto en GitHub.
  • Por correo: [email protected]
  • QQ: 354522977
  • WeChat: huaiyinfeilong

Registro de cambios

Versión 3.0.1

  • Nueva función de detección de pantalla oscura en la descripción de imágenes: se mostrará un aviso si se intentan describir imágenes con la cortina de pantalla activada.

Versión 3.0

  • Se añade función de reconocimiento del contenido de imágenes, que puede identificar y describir las imágenes examinadas y las que están en el portapapeles.

Versión 2.0.2

  • Se corrige un problema por el que el OCR en línea podía no estar disponible en equipos donde el OCR fuera de línea tampoco funcionaba.

Versión 2.0.1

  • Se corrige un problema de estabilidad en entornos de red con proxy.

Versión 2.0

  • Se añade el motor de reconocimiento OCR en línea de Baidu. Soporta reconocimiento general y preciso. Se puede usar una clave compartida o una clave privada propia. Si usas tu propia clave privada, deberás configurarla en las opciones.
  • Se añade la capacidad de detectar la cortina de pantalla. Se mostrará un aviso si se intenta usar el OCR con la cortina de pantalla activada.
  • Ya no se detecta si el sistema es de 64 bits durante la instalación. Tras la instalación, si el sistema no es de 64 bits, no se puede usar el OCR fuera de línea.

Versión 1.3

  • Se corrige un problema que impedía la instalación en versiones de NVDA inferiores a la 2023.1.

Versión 1.2

  • Se añade detección del entorno durante la instalación. Se mostrará un aviso en sistemas que no sean de 64 bits indicando que la instalación no se puede completar.
  • Se corrige un problema por el que PaddleOCR_json.exe continuaba en ejecución si NVDA se cerraba anormalmente.
  • Se corrige un problema por el que aumenta el uso de memoria tras varios reconocimientos OCR.
  • Se corrige un problema por el que NVDA quedaba en suspensión durante el reconocimiento.

Versión 1.1

  • Se añade la capacidad de reconocer desde el portapapeles con el atajo NVDA+alt+shift+o.

Autor: José Manuel Delicado Alcolea

Ingeniero de software y máster en Ingeniería Informática por la Universidad Rey Juan Carlos. Me encanta todo lo relacionado con la informática, la accesibilidad y las nuevas tecnologías. Consultor de accesibilidad por cuenta propia desde el año 2015.

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.