El propósito de este complemento es facilitar las tareas de depuración en NVDA. Se añadirán nuevas funciones basadas en las sugerencias de los usuarios. Todos los correos o incidencias de GitHub con comentarios e ideas de funciones nuevas son bienvenidos.

Atajos de teclado

  • NVDA+shift+f1: inserta una línea de marca en el registro de NVDA.

Explicación y uso

Cuando pulses el atajo de teclado, el complemento insertará una línea como la siguiente en el registro de NVDA (en el nivel Info): -- Marca 1 -- También anunciará: «¡Marca 1 grabada!» Si pulsas el atajo de teclado de nuevo, obtendrás: -- Marca 2 -- y se verbalizará «¡Marca 2 grabada!». Digamos por ejemplo que quieres realizar una serie de tareas que generan errores extensos en el registro de NVDA. Vas a publicar las partes relevantes de tu registro en una lista de correo o en el sistema de incidencias de NVDA en GitHub. Sin embargo, no quieres navegar por el registro entero para buscar el contenido relevante. Por tanto usas este complemento para insertar la marca 1, justo antes de hacer eso que causa el primer error. Si sabes que algo más generará más errores o de diferente tipo, insertas otra marca para separar el error anterior del nuevo, de tal forma que puedas decir «esto es lo que estaba haciendo en la marca 3, cuando ocurrieron algunos errores». Otro ejemplo: mientras usas una aplicación, algo ocurre y provoca un error (tal vez oyes el sonido de error de Windows). Quieres regresar y buscar ese error más tarde, pero no quieres dejar de trabajar y guardas el registro justo ahora. Así que usas este complemento otra vez para insertar una marca en tu registro. En esta ocasión la marca aparecerá después de los errores en tu registro, en vez de antes. Pero no importa, las marcas te ayudarán a separar las secciones importantes de tu registro. Las líneas de marca mostradas más arriba se pueden buscar fácilmente con el comando Buscar de un editor de texto como el bloc de notas o Notepad++. Además, por defecto hay una línea en blanco que se inserta antes de cada marca. Se pueden poner también líneas en blanco después de la marca. Las líneas en blanco pueden ser útiles si usas el visualizador del registro de NVDA u otro editor de texto y deseas usar las flechas para subir y bajar rápidamente por el registro y encontrar una marca concreta. Es fácil interceptar las palabras «En blanco» cuando se verbaliza un fragmento de texto según te mueves rápidamente por el registro. Si te mueves muy rápido, podrías necesitar más de una línea en blanco. Puedes ajustarlas en las opciones. Nota: el contador de marcas sobrevivirá a la recarga de plugins (NVDA+ctrl+f3), pero se restablecerá a 1 si reinicias NVDA.

Configuración:

En la sección de Opciones de las preferencias de NVDA, encontrarás una categoría «Ayudante de depuración». En el diálogo de opciones puedes cambiar el número de líneas en blanco insertadas antes y después de cada línea de marca. Por defecto hay una línea antes y 0 después, aunque puedes elegir entre 0 y 10 líneas para ambos. Bajo la categoría Herramientas del panel Gestos de entrada de NVDA, puedes cambiar NVDA+shift+f1 por la combinación de teclas que elijas.

Registro de cambios

  • Versión 1.0.2 (28-08-2019)
    • Traducciones y limpieza de código.
  • Versión 1.0.1 (26-08-2019)
    • Versión con correcciones menores para corregir un probable problema de instalación en ciertas versiones de Windows.
  • Versión 1.0 (22-08-2019)
    • Versión inicial. Incluye las siguientes características:
      • Capacidad de generar líneas de marca numeradas en el registro (a nivel Info).
      • Capacidad de agregar de 0 a 10 líneas en blanco antes y después de cada línea de marca.
      • Configuración mediante el sistema del diálogo de opciones de NVDA.

Este complemento permite que el usuario elija qué ajustes deberían aparecer en el anillo del sintetizador.

Características

Este complemento proporciona las siguientes características:

  • Una categoría de configuración en el diálogo de opciones de NVDA para
    elegir qué ajustes se incluyen en el anillo de ajustes del sintetizador.
  • la capacidad de guardar ajustes específicos por perfil.
  • sustituye los ajustes por defecto del sintetizador que se muestran en el
    anillo de ajustes del sintetizador.

Requisitos

Necesitas tener NVDA 2019.2 o posterior.

Instalación

Instálalo como cualquier otro complemento de NVDA.

Modo de uso

Para indicar qué ajustes se incluyen o excluyen, ve a las opciones de NVDA y
selecciona la categoría «Synth ring settings selector». En dicha categoría
podrás configurar los ajustes soportados por este complemento. Ajustes
incluidos por defecto:

  • idioma.
  • voz.
  • variante.
  • velocidad.
  • alzado brusco.
  • volumen.
  • tono.
  • entonación.

Nota: este diálogo sólo muestra los ajustes soportados por el sintetizador
en uso. Los ajustes no presentes aquí no se modifican en la configuración
del complemento.

Este complemento permite al usuario configurar NVDA para que pite con
algunos eventos de teclado.

Características

Este complemento proporciona las siguientes características que puedes usar
para adaptar el comportamiento de teclado de NVDA:

  • Pitar para mayúsculas cuando el bloqueo mayúsculas está activado: si esta
    característica está habilitada, NVDA pitará cuando escribas una letra
    mayúscula y el bloqueo mayúsculas esté activo. ¡No cometas más errores de
    mayúsculas!
  • Pitar para caracteres escritos cuando la tecla shift esté presionada: con
    esta característica NVDA pitará si escribes un carácter con la tecla shift
    presionada.
  • Pitar cuando cambia el estado de las teclas interruptores: con esta
    característica, NVDA producirá un tono alto cuando el interructor se
    activa, y uno bajo si se desactiva. Ten en cuenta que Windows dispone de
    una función de pitidos para teclas de alternancia incorporada en el centro
    de accesibilidad. Esta característica nativa funciona bien si no usas el
    ajuste de la disposición de teclado portátil.
  • Anunciar el cambio de estado de las teclas interruptores: Solo para cuando
    «Pitar cuando cambia el estado de las teclas» está habilitado. Puedes
    habilitar o deshabilitar el anunciado de las teclas interruptores cuando
    estas cambian su estado.
  • Pitar para caracteres específicos: en las opciones avanzadas, puedes
    configurar NVDA para que emita un pitido con los caracteres que desees.
  • Desactivar los pitidos en los campos de contraseña: esta función está
    activada por defecto para evitar riesgos de seguridad. Desactívala si
    quieres oír pitidos en los campos de contraseña.

Requisitos

Necesitarás NVDA 2018.2 o posterior.

Instalación

Instala este complemento como cualquier otro.

Uso

Para activar o desactivar características, ve a las configuraciones de NVDA y selecciona la categoría beep keyboard. En esa categoría podrás habilitar o deshabilitar cualquier característica soportada por este complemento.

  • «Pitar para mayúsculas cuando el bloqueo mayúsculas está activado» está
    habilitado por defecto.

Si necesitas ajustes adicionales, abre el cuadro de diálogo de opciones
avanzadas, que contiene las siguientes opciones:

  • Ignorar caracteres escritos con la tecla shift presionada: todos los
    caracteres escritos aquí serán ignorados al emitir el pitido cuando la
    tecla shift sea presionada. Se permiten secuencias de escape, EJ. «\t»
    para tab, «\r» para la tecla enter.
  • Pitar siempre para los siguientes caracteres: ingresa aquí todos los
    caracteres escritos para los que quieras que NVDA emita un pitido. Se
    permiten secuencias de escape, EJ. «\t» para tab, «\r» para la tecla
    enter.
  • Seleccionar un tono para su configuración: puedes configurar parámetros
    para todos los tonos. Selecciona uno aquí, y ajusta los parámetros en los
    siguientes cuadros de texto. Al cambiar de opción, NVDA emitirá el pitido
    del tono seleccionado con los parámetros configurados en ese momento.
  • Tono: tono para el tono seleccionado actualmente.
  • Duración: duración para el tono seleccionado actualmente.
  • Volumen: volumen para el tono seleccionado actualmente.
  • Probar el tono: este botón te permite reproducir un tono de prueba con los
    parámetros establecidos actualmente.
  • Presiona el botón Aceptar para guardar las configuraciones o cancelar para
    descartarlas.
Developer Toolkit (DTK) es un complemento para NVDA que asiste a los desarrolladores ciegos o con baja visión a la hora de crear interfaces de usuario visualmente atractivas o contenido web de forma autónoma. Esto se consigue activando DTK, navegando por la interfaz de usuario o el contenido web, y pulsando gestos para obtener información sobre el aspecto, la posición y el tamaño del control con el foco. Para activar o desactivar DTK, pulsa alt+windows+k en tu teclado. Para seguir usando el ordenador con normalidad, desactiva DTK antes de continuar con tus tareas.

Gestos

Los siguientes gestos se encuentran disponibles cuando DTK está activado.
  • Alt+windows+k – Activa o desactiva las funciones de DTK.
  • Flecha izquierda – Moverse al elemento hermano anterior.
  • Flecha derecha – Moverse al siguiente elemento hermano.
  • Flecha arriba – Moverse al elemento padre.
  • Flecha abajo – Moverse al primer elemento hijo.
  • Ctrl+inicio – Moverse al elemento padre de más alto nivel.
  • A – En el contenido web, verbaliza los atributos HTML. Pulsa dos veces rápidamente para copiarlos al portapapeles.
  • B – Verbalizar la posición del borde inferior del objeto. Pulsa dos veces rápidamente para copiarla al portapapeles.
  • C – Verbalizar la cantidad de hijos que contiene el objeto. Pulsa dos veces rápidamente para copiarla al portapapeles.
  • Ctrl+d – Activar o desactivar mensajes detallados.
  • F – En el contenido web, verbaliza la información de fuente y formato del objeto. Pulsa dos veces rápidamente para copiarla al portapapeles.
  • H – Verbalizar la altura del objeto. Pulsa dos veces rápidamente para copiarla al portapapeles.
  • L – Verbalizar la posición del borde izquierdo del objeto. Pulsa dos veces rápidamente para copiarla al portapapeles.
  • R – Verbalizar la posición del borde derecho del objeto. Pulsa dos veces rápidamente para copiarla al portapapeles.
  • S – Verbalizar la cantidad de hermanos relativos al objeto. Pulsa dos veces rápidamente para copiarla al portapapeles.
  • T – Verbalizar la posición del borde superior del objeto. Pulsa dos veces rápidamente para copiarla al portapapeles.
  • V – Verbalizar la versión de Developer Toolkit. Pulsa dos veces rápidamente para copiarla al portapapeles.
  • W – Verbalizar la anchura del objeto. Pulsa dos veces rápidamente para copiarla al portapapeles.

Notas

  • DTK ayuda a los desarrolladores a crear interfaces de usuario. Este complemento no es una herramienta de análisis para interfaces de usuario de terceros.
  • Al usar Chrome, no todos los elementos web aparecerán en el árbol de accesibilidad. Para forzar que un elemento aparezca en el árbol de accesibilidad, dale un atributo title.
  • Al usar Firefox, podrían aparecer elementos fantasma en el árbol de accesibilidad. Por ejemplo, un marco de texto puede aparecer como un contenedor de bloques de texto. Estos elementos fantasma forman parte de la implementación del árbol de accesibilidad de Mozilla.
  • Edge no se ha probado completamente. Por lo tanto, cualquier cosa que anuncie el complemento debería tratarse con cuidado.
  • En el contenido web, todo a excepción de un bloque de texto es un contenedor. Por ejemplo, un párrafo (etiqueta p) puede contener varios elementos dentro.
  • las etiquetas div son anunciadas como secciones en HTML5.
  • Para evitar que los nombres de los elementos web aparezcan como «None», da siempre a los elementos un atributo title.
  • La información de fuente sólo se encuentra disponible en el contenido web. Esto debería corregirse en una futura versión.
  • El complemento no enseña al usuario conceptos adecuados de diseño de contenido web o interfaces de usuario.

Problemas conocidos

  • Los usuarios no son notificados automáticamente del estado de activación o desactivación de las funciones de DTK al cambiar de ventana.
  • Los márgenes de un control sólo están disponibles en el contenido web, y dependen del navegador.
  • Los atributos de borde y relleno no están disponibles. Este es un problema de larga duración.
  • No hay forma de restringir DTK a un tipo de contenido concreto o ventana de aplicación.
  • La información de fuente que se obtiene al pulsar la f está desordenada, pero esto se corregirá en próximas versiones.

Historial de versiones

2019.1.2

  • DTK ahora anuncia valores de posición y tamaño si estos son 0.
  • La navegación ahora respeta el ajuste de mensajes detallados.
  • El anuncio de información de tamaño y posición ahora es más conciso.
  • Mejoras de estabilidad.

2019.1.1

  • DTK ya no intentará cargarse varias veces a sí mismo al anunciar el número de versión.
  • Las funciones de DTK vendrán desactivadas al instalar. Anteriormente, las funciones de DTK se activaban al instalar. Esto es distinto a activar o desactivar el complemento desde las herramientas de NVDA > ventana Gestionar complementos.
  • Los mensajes presentados al usuario ahora pueden contener caracteres no ASCII.
  • Al pulsar gestos como a, b, c, f, h, l, r, s, t, v y w ya no se interrumpe la voz de NVDA si se copia información al portapapeles.

2019.1

  • Corregido un problema de compatibilidad por el que DTK declaraba una versión mínima de NVDA que todavía no había sido publicada.

2019.0 (versión estable inicial)

  • Compilación inicial con navegación básica.

Este complemento pretende añadir motores de reconocimiento de imágenes en
línea a NVDA. Hay dos tipos de motores, OCR y descriptor de imágenes. El OCR
extrae texto de las imágenes. El descriptor de imágenes describe lo que se
muestra visualmente en la imagen y lo muestra como texto (descripción
general, puntos de referencia de color y demás). Es necesaria una conexión a
Internet para utilizar este complemento, ya que la descripción de imágenes
es proporcionada por servicios en línea. Estos servicios se conocen como
motores en este complemento.

Configuración de motor

Puedes elegir motores de reconocimiento y configurarlos en detalle en la
categoría Online image describer del diálogo de opciones de NVDA.

El autor de este complemento ha registrado cuentas con cuota de API gratuita
y ha configurado un servidor proxy en www.nvdacn.com para permitir que este
complemento sea más fácil de probar al principio. La cuota de pruebas está
limitada y puede ser cancelada por el proveedor de la API en cualquier
momento. Se recomienda encarecidamente que registres tu propia clave
siguiendo la guía de cada motor.

Los siguientes ajustes se aplican a todos los motores.

  • Copiar resultado al portapapeles después del reconocimiento: si se activa,
    el texto del resultado del reconocimiento se copiará al portapapeles tras
    el reconocimiento.
  • Usar mensaje explorable para el texto del resultado: si se activa, el
    texto del resultado del reconocimiento se mostrará en una ventana
    emergente en lugar de enviarse por mensajes de voz y braille.
  • Intercambiar el efecto de gestos repetidos con los que no están repetidos:
    por defecto, sólo se muestra un documento virtual con el resultado si
    pulsas el gesto correspondiente dos veces. Si haces esto frecuentemente
    puedes activar esta opción, de tal forma que sólo pulses una vez para
    abrir el visor de resultados.
  • Activar registro más detallado con propósitos de depuración: algunos
    registros son esenciales para depurar, pero afectan al rendimiento y
    consumen mucho espacio. Activa esta opción sólo si el autor del
    complemento o un desarrollador de NVDA te lo pide.
  • Tipo de proxy: indica el tipo de proxy que estás usando. Si no sabes qué
    es un proxy, no modifiques esta opción.
  • Dirección del proxy: URL completa del proxy. Si no sabes qué es un proxy
    no cambies esta opción. Si eliges usar un proxy, este se verificará antes
    de guardar. Tras la verificación, un mensaje te indicará el resultado.

Los siguientes ajustes significan lo mismo en todos los motores, por lo que
se describen aquí para ahorrar espacio:

  • Tipo de acceso a la API: controla cómo accedes a las distintas APIs de los
    servicios. Si eliges «Usar cuota pública», estarás usando la cuota
    gratuita de una cuenta registrada proporcionada por el autor del
    complemento. Si eliges «Usar tu propia clave de API», este complemento
    usará la cuota de tu propia cuenta.
  • ID de aplicación, clave de API o clave secreta de API: si quieres usar la
    cuota de tu propia cuenta será necesario que dispongas de los tokens de
    acceso correspondientes. Algunos motores sólo necesitan una clave de
    API. Algunos motores necesitan dos tokens. Estos sólo son válidos si
    eliges «Usar tu propia clave de API» en tipo de acceso a la API.

Ten en cuenta que la calidad y la precisión de los resultados dependen de
muchos factores:

  • Modelos y técnicas empleados por el proveedor del motor
  • Calidad de la imagen subida
  • Navegador de objetos oculto tras algo
  • Resolución de pantalla

Descripción de imágenes en línea

Órdenes de teclado

NVDA+alt+p reconoce el objeto bajo el navegador de objetos y lee el
resultado. Si se pulsa dos veces, abre un documento virtual con el
resultado.

Ctrl+shift+NVDA+p reconoce la imagen desde el portapapeles. Después lee el
resultado. Si se pulsa dos veces abre un documento virtual con el
resultado. Se aceptan dos tipos de contenido:

El primero es una imagen real(CF_DIB), que puedes poner en el portapapeles
tomando una captura de pantalla con la tecla Imprimir pantalla o copiándola
desde el navegador.

El segundo es un archivo copiado desde el explorador de archivos.(CF_HDROP)

Si no es una imagen, el complemento dirá «No hay imagen en el
portapapeles». Si sólo hay texto en el portapapeles, el complemento
intentará usarlo como una ruta local hacia un archivo. Si el texto no es una
ruta, el complemento dirá «El texto del portapapeles no es una ruta
válida». Si el archivo correspondiente no es una imagen, el complemento dirá
«El archivo especificado en el portapapeles no es una imagen».

Hay tres motores disponibles.

Motor de aprendizaje automático de Oliver Edholm

Se trata de un motor gratuito que describe imágenes. Si hay texto en ella le
aplicará un OCR. Hay dos ajustes para este motor.

  • Tipos de acceso: el autor de este complemento ha instalado un proxy en
    www.nvdacn.com para los usuarios que no pueden acceder a los servicios de
    Google. Si quieres usar este proxy, elige la opción «usar el proxy de
    www.nvdacn.com» el la configuración de tipos de acceso. Si quieres usar tu
    propia clave en los siguientes dos motores, sigue la guía que se encuentra
    en la sección del OCR de Microsoft Azure.
  • Idioma del resultado: por defecto, inglés. Si configuras un idioma
    distinto al inglés, la descripción podría presentar problemas de
    traducción, ya que se genera automáticamente a partir del servicio de
    traducción inteligente.

Seguridad:

  • Las imágenes se envían a un script alojado en Google Cloud Platform para
    su análisis. Después del análisis las imágenes se eliminan del servidor y
    nunca se las vuelve a ver por allí.

Analizador de imágenes de Microsoft Azure

Este motor extrae un rico conjunto de características visuales basadas en el
contenido de la imagen. Este motor está sólo en inglés. Si quieres que la
descripción se muestre en otros idiomas, puedes usar el descriptor de
imágenes de Microsoft Azure

Entre las características visuales se incluyen:

  • Adulto – detecta si la imagen es de naturaleza pornográfica (representa la
    desnudez o un acto sexual). También se detecta el contenido sexualmente
    sugerente.
  • Marcas – detecta diversas marcas dentro de la imagen, incluyendo su
    ubicación aproximada. El argumento de marcas sólo está disponible en
    inglés.
  • Categorías – clasifica el contenido de la imagen según una taxonomía
    definida en la documentación.
  • Color – determina el color más llamativo, el color predominante y si la
    imagen está en blanco y negro.
  • Descripción – describe el contenido de la imagen con una frase completa en
    los idiomas soportados.
  • Caras – detecta si hay caras presentes. Si las hay, identifica sus
    coordenadas, género y edad.
  • Tipo de imagen – detecta si la imagen es prediseñada o se ha dibujado a
    mano.
  • Objetos – detecta diversos objetos dentro de la imagen, incluyendo su
    ubicación aproximada. El argumento de objetos sólo está disponible en
    inglés.
  • Etiquetas – etiqueta la imagen con una lista detallada de palabras
    relacionadas con su contenido.

Algunas características también proporcionan detalles adicionales:

  • Famosos – identifica personas famosas si se detectan en la imagen.
  • Puntos de referencia – identifica puntos de referencia si se detectan en
    la imagen.

Descriptor de imágenes de Microsoft Azure

Este motor genera descripciones de imágenes en un lenguaje natural con
frases completas. La descripción se basa en una colección de etiquetas de
contenido, también devueltas por la operación. Se puede generar más de una
descripción para cada imagen. Las descripciones se ordenan según su
puntuación de confianza. Hay dos ajustes para este motor.

  • Idioma: el idioma que usará el servicio para devolver una descripción de
    la imagen. Por defecto, inglés.
  • Número máximo de candidatos: cantidad máxima de descripciones candidatas
    que se devuelven. Por defecto 1.

OCR en línea

Los motores en línea se apoyan en el uso y presencia de los siguientes
servicios.

https://www.nvdacn.com

https://ocr.space/ocrapi

https://azure.microsoft.com/en-us/services/cognitive-services/

http://ai.qq.com

http://ai.baidu.com

http://ai.sogou.com/

Órdenes de teclado

NVDA+alt+r reconoce el objeto actual del navegador de objetos con un motor
OCR en línea y lee el resultado. Si se pulsa dos veces, abre un documento
virtual con el resultado.

Ctrl+shift+NVDA+r reconoce la imagen del portapapeles con un motor OCR en
línea y después lee el resultado. Si se pulsa dos veces, abre un documento
virtual con el resultado. Acepta dos tipos de contenido:

El primero es una imagen real(CF_DIB), que puedes poner en el portapapeles
tomando una captura de pantalla con la tecla Imprimir pantalla o copiándola
desde el navegador.

El segundo es un archivo copiado del explorador.(CF_HDROP) Si no es una
imagen, el complemento dirá «No hay imagen en el portapapeles». Si sólo hay
texto en el portapapeles, el complemento intentará utilizarlo como ruta a un
archivo local. Si no es una ruta, el complemento dirá «El texto del
portapapeles no es una ruta válida». Si el archivo correspondiente no es una
imagen, el complemento dirá «El archivo especificado en el portapapeles no
es una imagen».

Existe también un gesto para cancelar el reconocimiento actual. Este gesto
puede ser útil si piensas que has esperado demasiado tiempo y quieres
cancelar. Además hay veces en las que no te gustaría que el mensaje de
reconocimiento te molestara porque quieres revisar los mensajes que han
llegado después de iniciar el reconocimiento. Este gesto se encuentra sin
asignar.

Motores

Hay cinco motores disponibles.

OCR space

Este servicio consta de una API de pago con cuota gratuita proporcionada por
https://ocr.space

Soporta 24 idiomas, incluyendo:

  • Árabe
  • Búlgaro
  • Chino (simplificado)
  • Chino (tradicional)
  • Croata
  • Checo
  • Danés
  • Holandés
  • Inglés
  • Finés
  • Francés
  • Alemán
  • Griego
  • Húngaro
  • Coreano
  • Italiano
  • Japonés
  • Polaco
  • Portugués
  • Ruso
  • Esloveno
  • Español
  • Sueco
  • Turco

Estos son los ajustes de este motor:

  • Idioma: idioma de reconocimiento del texto. Por defecto inglés.
  • Detectar orientación de la imagen: si se activa, la API gira
    automáticamente la imagen correctamente.
  • Escalar imagen para mejorar la calidad: si se activa, la API escala la
    imagen internamente. Esto puede mejorar el resultado del OCR de forma
    significativa, especialmente para documentos PDF escaneados con baja
    resolución.
  • Optimizar para reconocimiento de tablas: si se activa, la lógica del OCR
    se asegura de que el texto del resultado interpretado siempre se devuelva
    línea a línea. Esta opción se recomienda para hacer OCR en tablas,
    recibos, facturas, y todos los tipos de documentos entrantes que tengan
    estructura de tabla.

Si quieres usar tu propia clave, también deberás especificar tu clave de
API.

Puedes obtener tu propia clave de API gratuita registrándote en OCR
space

Aquí hay una guía simple.

Busca el enlace «Register for free API key». Pulsa en él y llegarás a un
formulario que tendrás que rellenar.

El formulario te pide que introduzcas los siguientes datos:

  • Dirección de correo electrónico
  • Nombre
  • Apellidos
  • ¿Cómo tienes pensado usar la API del OCR?

Después de rellenarlo y enviarlo, podrías tener que resolver un
captcha. Después recibirás un correo de confirmación. Busca el enlace «Yes,
subscribe me to this list.» en ese correo. Accede a ese enlace y recibirás
la clave de API pronto.

Microsoft Azure OCR

Este motor utiliza la API del OCR de los Servicios Cognitivos de Visión
Artificial de Microsoft Azure.

Soporta 24 idiomas, incluyendo:

  • Chino simplificado
  • Chino tradicional
  • Checo
  • Danés
  • Holandés
  • Inglés
  • Finés
  • Francés
  • Alemán
  • Griego
  • Húngaro
  • Italiano
  • Japonés
  • Coreano
  • Noruego
  • Polaco
  • Portugués
  • Ruso
  • Español
  • Sueco
  • Turco
  • Árabe
  • Rumano
  • Serbio cirílico
  • Serbio latino
  • Eslovaco

Estos son los ajustes de este motor:

  • Idioma: idioma de reconocimiento del texto. Por defecto detectar
    automáticamente.
  • Detectar orientación de la imagen: si se activa, la API gira
    automáticamente la imagen correctamente.

Si quieres usar tu propia clave, deberías obtener una clave de suscripción
para utilizar la API de Visión Artificial de Microsoft desde el siguiente
enlace:

Paso 1: crea una cuenta.

https://azure.microsoft.com/en-ua/try/cognitive-services/

Ten en cuenta que debes crear una clave para la API de visión artificial. Es
el primer botón «Obtener clave de API» que encuentras con la navegación de
una sola letra. Actualmente Microsoft ofrece la opción de crear una clave de
prueba que funciona durante 7 días. También puedes crear una cuenta gratuita
de Azure para tener más pruebas. Al registrarse será obligatorio aportar los
datos de una tarjeta de crédito. Si ya tienes una cuenta con suscripción,
puedes saltarte este paso.

Paso 2: despliega los servicios cognitivos

Ahora tienes una cuenta de Azure.

Primero, inicia sesión en el portal de Azure

Espera hasta que oigas el mensaje «El portal está listo, has iniciado sesión
en el portal de Azure».

Busca el enlace llamado «Todos los recursos» después del botón «Todos los
servicios» y actívalo.

Espera hasta que oigas el mensaje «La hoja Todos los recursos está
lista». El foco se encontrará en un cuadro de edición. Pulsa shift+tab hasta
que llegues a un elemento de menú llamado Agregar y actívalo.

Espera hasta que oigas el mensaje «Buscar en marketplace», escribe cognitive
services y pulsa flecha abajo.

Espera hasta que oigas el mensaje Lista de opciones Cognitive services 1 de
5, y a continuación pulsa intro.

Espera hasta que oigas el mensaje La hoja Cognitive Services está
lista. Pulsa tab o la letra b para buscar un botón llamado Crear y actívalo.

Espera hasta que oigas el mensaje La hoja Crear está lista. El foco se
encontrará en un cuadro de edición. Escribe un nombre para este recurso. Ten
en cuenta que el nombre del recurso sólo puede incluir caracteres
alfanuméricos, ‘_,-‘, y no puede terminar con los dos últimos. Por ejemplo,
podría llamarse nvdaocr.

Pulsa tab para ir al cuadro combinado de suscripción. Normalmente puedes
dejarlo como está.

Pulsa tabulador para ir al cuadro combinado de región. Elige una que se
encuentre cerca de tu ubicación actual. Recuerda esta región, ya que tendrás
que especificarla en la configuración del motor.

Pulsa tabulador para ir al cuadro combinado de capa. Normalmente una capa
gratuita como f0 es adecuada. Si no es suficiente para ti, puedes elegir
otra capa después de leer todos los detalles del precio en el enlace «Ver
detalles completos del precio».

Tabula hasta que llegues a un cuadro de edición llamado Crear nuevo grupo de
recursos. Deberías crear uno si no tienes ninguno. Busca el botón Crear
Nuevo. Después busca el botón Crear y actívalo para crear el recurso.

Espera hasta que oigas el mensaje «Despliegue completado_».

Después busca el botón «Ir al recurso». A veces es necesario subir y activar
el botón Notificaciones para encontrar este botón.

Espera hasta que oigas el mensaje La hoja Primeros pasos está lista.

Busca el enlace llamado Claves y actívalo.

Espera hasta que oigas el mensaje La hoja Gestionar claves está lista.

Busca un cuadro de edición llamado Clave 1 o Clave 2. El contenido de ese
cuadro de edición es la clave de API que se necesita para la configuración
del motor. Pulsa ctrl+c para copiarla al portapapeles. Después ya podrás
rellenar estos dos ajustes en el motor, indispensables si utilizas tu propia
clave de API.

  • Región de recursos de Azure: la región que elegiste al desplegar los
    servicios cognitivos en el portal de Azure.
  • Clave de API: la clave que obtienes al desplegar con éxito los servicios
    cognitivos en el portal de Azure, se recomienda la clave 2.

Baidu OCR

Este también ofrece una API de pago con cuota gratuita proporcionada por
Baidu. El OCR de Baidu soporta 10 idiomas, incluyendo:

  • Una mezcla entre chino e inglés
  • Inglés
  • Portugués
  • Francés
  • Alemán
  • Italiano
  • Español
  • Ruso
  • Japonés
  • Coreano

Este motor también puede obtener la posición de cada carácter

Aquí están sus ajustes:

  • Obtener posición de cada carácter: permite operar de forma más precisa en
    algunas aplicaciones inaccesibles. Al activar esta opción el
    reconocimiento se volverá algo más lento.
  • Usar API precisa: si se habilita usará otro punto de conexión. Esta
    conexión precisa dura más tiempo, pero tiene mejor calidad y (si usas tu
    propia clave de API) el precio es más alto.

Tiene cuatro conexiones con límites de cuota separados.

  • OCR básico sin información sobre la ubicación del texto: actualmente 50000
    veces al día.
  • OCR básico con información sobre la ubicación del texto: actualmente 500
    veces al día.
  • OCR preciso sin información sobre la ubicación del texto: actualmente 500
    veces al día.
  • OCR preciso con información sobre la ubicación del texto: actualmente 50
    veces al día.

Si pulsas el gesto que sólo lee el resultado, estarás utilizando la conexión
que no da información sobre la posición del texto.

Si pulsas el gesto que muestra el visor de resultados, usarás la conexión
que muestra información sobre la ubicación del texto.

Aunque proporciona una cuota gratuita bastante generosa, su sitio web sólo
está en chino y no es muy accesible.

Sougou OCR y Tencent AI OCR

Estas dos APIs pueden usarse de forma gratuita con límite de frecuencia. Si
quieres sobrepasar el límite, puedes registrar tu propia clave de API. Las
webs de estas dos APIs también se encuentran sólo en chino y tampoco son muy
accesibles.

No hay información sobre los idiomas soportados en la documentación de esta
API. Según las pruebas realizadas, se soportan el chino, el inglés y una
mezcla de ambos. No hay configuración adicional para esta API.

Registro de cambios

0.17

  • Se han corregido los siguientes problemas:
    • Se salta directamente al panel cuando se cambia a Descriptor de
      imágenes en línea en el diálogo de opciones
    • Errata de descripción en el analizador de Azure

0.16

  • Se ha añadido un gesto para cancelar el reconocimiento
  • Se han corregido los siguientes problemas:
    • No se anunciaban los cambios de estado en la lista de casillas de
      verificación
    • Se intercambia el efecto del gesto repetido que no funcionaba en
      Online Image Describer

0.15

  • Se ha añadido una opción para mostrar una ventana que contiene el mensaje
    en vez de usar mensajes de voz y braille para el texto de los resultados
  • Las casillas de verificación con las características visuales del
    analizador de imágenes de Microsoft Azure ahora están en una lista.
  • Se han corregido los siguientes problemas:
    • No se podía cargar un archivo de imagen JPG desde el portapapeles
    • El objeto del documento con el resultado no se mostraba después del
      reconocimiento.
    • La posición en los objetos del documento de resultados no era fiable
      si la imagen se redimensionaba internamente.
    • El resultado del analizador de imágenes de Microsoft Azure se mostraba
      en una línea, complicando la navegación.

0.14

  • Corregidos algunos fallos:
    • No podías usar tu propia clave de API en los motores de Microsoft
      Azure
    • No se podía obtener el texto del resultado si había una pantalla
      braille

0.13

  • Ahora el complemento funciona al recargar los plugins sin reiniciar
    (NVDA+ctrl+f3)

0.12

  • Corregido el mensaje en modo exploración del descriptor de imágenes de
    Microsoft Azure
  • El tono del color ahora se representa con la descripción de colores de
    NVDA.
  • Se ha mejorado el formato de resultado del analizador de imágenes de
    Microsoft Azure
  • Se ha mejorado la documentación a partir de los comentarios de la revisión
  • Corregida inconsistencia de gestos.
  • Ctrl+shift+NVDA para el portapapeles y NVDA+alt para el navegador de
    objetos
  • Se ha corregido un error de información ausente de imagen mientras se
    reconocía.

0.11

  • Se ha añadido la capacidad de describir imágenes
  • Se ha cambiado la descripción corta del complemento a Online Image
    Describer

0.10

  • Corregido un error al utilizar la clave propia de API del usuario en la
    API de Sougou.
  • Corregido un problema de panel desconocido añadiendo los ajustes a
    supportedSettings

0.9

  • Corregido un problema que provocaba que no hubiera efecto alguno al
    realizar una doble pulsación.
  • Se ha revisado la documentación para reflejar los cambios más recientes en
    el código.
  • Se ha clarificado qué tipo de imágenes del portapapeles se soportan y cómo
    copiarlas para reconocerlas.
  • Solucionado el problema que impedía abrir el visor de resultados cuando se
    hacía el reconocimiento desde el portapapeles.
  • Se ha añadido soporte para reconocer una imagen desde una ruta de archivo
    copiada al portapapeles.

0.8

  • Se ha añadido un aviso más amigable si el resultado del reconocimiento
    está vacío.
  • Resuelto otro problema que provocaba un mal funcionamiento si la ruta a
    los archivos de configuración contiene caracteres no ASCII

0.6

  • Se han añadido opciones de proxy para aquellos usuarios que accedan a
    Internet a través de un proxy específico.
  • Se han añadido varias opciones generales.
  • Se ha corregido un error de decodificación Unicode causado por el envío de
    una URL Unicode a urllib3.

0.5

  • Se ha corregido un error Unicode que ocurría si el motor del OCR subía el
    archivo de imagen directamente en vez de codificarlo en Base64.
  • Modificado el gesto para reconocer el portapapeles a ctrl+NVDA+shift+r, ya
    que NVDA+shift+r se usa en Word y Excel para definir cabeceras de fila en
    tablas, o para eliminar las definiciones si se pulsan dos veces.

0.4

  • Se ha corregido un error de instalación que ocurría cuando la ruta a la
    configuración contenía caracteres no ASCII
  • Se ha cambiado el gesto para evitar una colisión con Golden Cursor.
  • Se ha cambiado el motor por defecto a Microsoft Azure, ya que es capaz de
    detectar automáticamente el idioma del texto.

0.3

  • Se ha añadido documentación detallada sobre cómo obtener la clave de API
    del OCR de Microsoft Azure
  • Se ha corregido un problema con las nuevas instalaciones.
  • Eliminado el OCR automático, ya que esta función es problemática y puede
    resultar confusa con los motores en línea. AutoOCR se liberará como un
    complemento separado cuando sea suficientemente estable.
Este complemento permite presentar en un mensaje información del carácter como su nombre Unicode, número, categoría, etc.

Órdenes

  • 2 del teclado numérico (todas las disposiciones de teclado) o NVDA+. (disposición portátil): si se pulsa 4 veces, muestra información del carácter bajo el cursor de revisión situado en el objeto actual del navegador de objetos.

Notas

  • Este complemento también proporciona un script para mostrar directamente información sobre el carácter bajo el cursor de revisión. Este script no tiene un gesto asignado por defecto. Si no te sientes cómodo con el gesto de cuatro pulsaciones, puedes asignar un gesto desde el diálogo Gestos de entrada de NVDA (categoría «Revisión de texto»).
  • La información proporcionada está en inglés, ya que forma parte de la norma Unicode. Si existiera una traducción local de este complemento, la información continuaría proporcionándose en inglés.
  • El nombre CLDR (Unicode Common Locale Data Repository) sólo se soporta en NVDA 2019.1 y versiones posteriores.

Registro de cambios

Versión 1.1

  • Actualizaciones para soportar versiones más nuevas de NVDA (compatible con Python 2 y 3)
  • Las liberaciones se realizan ahora con Appveyor

Versión 1.0

  • Versión inicial.
Este complemento te proporciona descripciones de imágenes utilizando métodos de aprendizaje automático. Notas:
  • El atajo para obtener una descripción de imagen para el navegador de objetos actual es NVDA+Control+I.
  • Si configuras otro idioma distinto al inglés, las descripciones podrían tener errores de traducción ya que se generan automáticamente.
  • El idioma de las descripciones que se generan está vinculado al idioma de NVDA configurado. En otras palabras, si tienes configurado el sueco, obtendrás descripciones en sueco, a menos que cambies el idioma en las opciones de Image describer.
  • Puedes cambiar el atajo en el menú Gestos de entrada, bajo la categoría Image describer.
Seguridad:
  • Las imágenes se envían a un script alojado en la plataforma Google Cloud para su análisis. Después del análisis la imagen se elimina del servidor y no se volverá a ver más.
Para desarrolladores:
  • Si quieres experimentar con el complemento, ejecuta primero el script deps.py.

Este complemento proporciona potentes órdenes que se pueden emplear en el modo exploración de NVDA. Por ejemplo, con BrowserNav puedes encontrar párrafos alineados verticalmente; es decir, párrafos con el mismo desplazamiento horizontal. Se puede usar para leer árboles jerárquicos de comentarios o tablas HTML mal formadas. También te permite navegar por párrafos con el mismo tamaño de fuente o estilo. BrowserNav también proporciona nuevas órdenes de navegación de una sola letra: p para ir al siguiente párrafo e Y para ir a la pestaña siguiente.

Uso en navegadores

BrowserNav puede utilizarse para navegar por desplazamiento horizontal desde el borde izquierdo de la pantalla, por tamaño o por estilo de la fuente.

  • Al navegar por desplazamiento horizontal, puedes encontrar fácilmente párrafos alineados verticalmente en la página. Concretamente, puedes pulsar NVDA+alt+flechas arriba y abajo para saltar al párrafo anterior o siguiente con la misma alineación, respectivamente. Por ejemplo, esto puede ser útil al explorar árboles jerárquicos de comentarios (como los de reddit.com) para saltar por los comentarios de primer nivel y evitar aquellos con niveles más altos.
  • Al navegar por tamaño de fuente, puedes encontrar fácilmente párrafos escritos con el mismo tamaño de fuente, un tamaño mayor o menor.
  • También puedes navegar por tamaño de fuente aplicando restricción de estilo.

BrowserNav funciona en cualquier navegador soportado por NVDA.
Atajos de teclado:

  • NVDA+alt+flechas arriba y abajo: salta al párrafo anterior o siguiente con el mismo desplazamiento horizontal o tamaño de fuente.
  • NVDA+alt+flecha izquierda: salta al párrafo anterior con menos desplazamiento o mayor tamaño de fuente.
  • NVDA+alt+flecha derecha: salta al siguiente párrafo con más desplazamiento o menor tamaño de fuente.
  • NVDA+o: cambia el rotor entre desplazamiento horizontal, tamaño de fuente o tamaño de fuente con restricción de estilo.
  • P y shift+p: salta al siguiente párrafo o al anterior.
  • Y o shift+y: salta a la pestaña siguiente o anterior.

Código fuente

El código fuente está disponible en http://github.com/mltony/nvda-indent-nav.

Este complemento está diseñado para practicar las órdenes de NVDA como si se tratara de un juego, tanto para la disposición de teclado de escritorio como la portátil. Todos los datos de las órdenes se extraen del archivo keyCommands.html de la carpeta de documentación de tu idioma en NVDA. Este complemento no tiene por defecto ningún gesto o atajo. Tienes que asignar un gesto específico para él mediante: menú NVDA > Preferencias > Gestos de entrada > Práctica de órdenes de NVDA.

Modo de uso

  • Eliges el modo de distribución de teclado con el que quieres practicar, y comienzas a jugar
  • Se mostrarán una orden o pregunta y su descripción. Debes pulsar las teclas adecuadas o responder
  • Si has elegido la respuesta correcta, ganarás un punto
  • Si la respuesta fue incorrecta, la puntuación no cambiará y continuarás sin perder nada
  • En cualquier momento, si quieres salir, se te preguntará si quieres guardar las preguntas restantes para la siguiente ronda
  • Si más adelante eliges una distribución con preguntas guardadas, se te preguntará si quieres continuar con las preguntas restantes de la ronda anterior
  • Si respondes bien todas las preguntas, aproximadamente 88 en cada distribución, se te declarará ganador.
Este complemento mejora el uso de Microsoft Outlook verbalizando algunas órdenes y añadiendo órdenes extra.

Órdenes

  • De alt+1 a alt+9, alt+0, alt+_ y alt+=: verbaliza los campos de cabecera del 1 al 12 en un mensaje, elemento del calendario o ventana de tarea. Si se pulsa dos veces, mueve el foco a ese campo si es posible. Si se pulsa tres veces, copia sus contenidos al portapapeles.
  • NVDA+shift+I (distribución de escritorio) / NVDA+control+shift+I (distribución portátil): verbaliza la barra de información en un mensaje, elemento del calendario o ventana de tarea. Si se pulsa dos veces, mueve el foco hasta allí. Si se pulsa tres veces, copia su contenido al portapapeles.
  • NVDA+shift+A (distribución de escritorio) / NVDA+control+shift+A (distribución portátil): indica el número y los nombres de los adjuntos en una ventana de mensaje. Si se pulsa dos veces, mueve el foco hasta allí.
  • NVDA+shift+M (distribución de escritorio) / NVDA+control+shift+M (distribución portátil): mueve el foco al cuerpo del mensaje
  • Ctrl+alt+flechas izquierda y derecha: en la lista de resultados de búsqueda de la libreta de direcciones, navega entre los campos de la línea seleccionada actualmente
  • Ctrl+q: en la lista de mensajes, marca el mensaje o grupo de mensajes seleccionado como leído
  • Ctrl+u: en la lista de mensajes, marca el mensaje o grupo de mensajes seleccionado como no leído

Notas

Todos los gestos pueden cambiarse en el diálogo Gestos de entrada de NVDA. Puedes querer modificarlos en las siguientes situaciones:
  • Los gestos por defecto para marcar como leído o como no leído son los que vienen en la versión en inglés de Microsoft Outlook. Si son diferentes de los que vienen en tu versión local, deberás cambiarlos según corresponda.
  • Los gestos por defecto para leer cabeceras se corresponden con la tecla Alt combinada con la fila superior del teclado alfanumérico. Puede ser necesario reasignar los gestos para leer las cabeceras 11 y 12 si no encajan con tu distribución de teclado.

Registro de cambios

Versión 1.3

  • Arreglada la lectura de encabezados de mensajes en compilaciones más nuevas de Office 365.
  • Actualizaciones para soportar versiones más nuevas de NVDA (compatible con Python 2 y 3)
  • Traducciones añadidas
  • Las liberaciones se realizan ahora con Appveyor

Versión 1.2

  • Arreglada la lectura de encabezados al reenviar reuniones.
  • Traducciones añadidas

Versión 1.1

  • Traducciones añadidas

Versión 1.0

  • Versión inicial.