Este complemento para NVDA permite saltarte ciertas frases durante un breve periodo de tiempo. Seguramente te preguntarás si necesitas una cosa así. La respuesta es simple. Lo quería, y lo hice. No estoy seguro de si la gente lo encontrará útil o no, pero ¿por qué no hacerlo público?
Se asumen casos como los siguientes:

  • Evitar el extenso prefijo común al principio de una línea de consola durante un trabajo con comandos.
  • Silenciar el molesto mensaje «add line comments» al revisar código en GitHub.
  • Saltarse el nombre de una persona en Slack o Discord cuando envía montones de mensajes seguidos.

Puede haber otras situaciones en las que el complemento sirva.

Modo de uso

Evitar frases

Este complemento extiende la función de marcadores de inicio y fin de NVDA.
Primero, mueve el cursor de revisión al comienzo de la frase a evitar. Luego, pulsa NVDA+f9 para marcar la posición de inicio.
Después, muévete al final de la frase que quieres evitar y pulsa NVDA+f11. Esto causará que cualquier frase que coincida con la selección se evite automáticamente de ahora en adelante.
La posición de selección no se limpia inmediatamente después de elegir la frase a evitar. Por tanto, también puedes pulsar la ya conocida orden NVDA+f10 para copiar el texto al portapapeles.
El complemento puede memorizar una cantidad ilimitada de frases a evitar.

Eliminar frases evitadas

Las frases evitadas se eliminan al hacer una de las siguientes acciones:

  • Pulsar NVDA+f11 teniendo seleccionada exactamente la misma frase que se evitó. NVDA leerá la frase seleccionada como siempre.
  • Pulsar NVDA+shift+f11. Al ejecutar esta orden se borran los ajustes y se lee todo con normalidad.
  • Reiniciar NVDA. Los ajustes no se guardan, así que todas las frases se purgan al reiniciar.

Precaución

La salida braille no se ve afectada en modo alguno. Por otro lado, puedes querer abreviar también la pantalla braille, pero no lo hice porque el procesamiento del enrutamiento del cursor (tocar teclas del cursor) se volvería mucho más complicado.
Como es habitual, se inyecta en processSpeech, ya usado por complementos que modifican el texto que se verbalizará.
Existe la posibilidad de que este complemento haga conflicto con otros que operen de forma similar. Por ahora no puedo hacer nada con esto, ya que el orden de los hooks es incontrolable.

Un complemento simple que convierte números decimales en fracciones. Por ejemplo, 0,5 se convertirá en 1/2.
El autor creó este complemento para facilitar la conversión de decimales devueltos por la calculadora de Windows en fracciones, ya que la propia calculadora no permite hacerlo. Nos invita a contactar con él para cualquier fallo o sugerencia, y a copiar, modificar y distribuir el complemento si es necesario.

Atajos de teclado

  • Alt+NVDA+s: convierte en fracción el número decimal seleccionado.
  • Alt+NVDA+a: convierte en fracción el número decimal que hay en el portapapeles.
  • Si se pulsan dos veces rápidamente estos atajos, el resultado se copiará al portapapeles.
  • Todos los atajos se pueden personalizar desde el diálogo «Gestos de entrada».

Este complemento para NVDA es un lector de archivos de textos sin interfaz.

¿Cómo funciona?

Al abrir un archivo, el complemento copia el contenido en memoria y cierra el archivo, permitiendo la lectura mediante atajos de teclado. El contenido se envía al lector, por lo que se puede leer sin que se muestre nada en pantalla.

Atajos:

Nota: todos los atajos se pueden personalizar en la categoría Txt reader del diálogo gestos de entrada.

  • NVDA+alt+f: Muestra el diálogo para abrir un archivo.
  • NVDA+alt+flecha abajo: Navega a la siguiente línea.
  • NVDA+alt+flecha arriba: Navega a la línea anterior.
  • NVDA+alt+espacio: Lee la línea actual.
  • NVDA+alt+inicio o fin: Ir al principio o fin del texto.
  • NVDA+alt+t: Lee el título del archivo.
  • NVDA+alt+c: Copia la línea actual al portapapeles.
  • NVDA+alt+l: Si se abrió previamente un archivo, vacía el contenido en memoria.

Registro de cambios

0.3

  • Se solucionó un error que permitía la ejecución del complemento en el modo seguro.
  • El complemento ya se puede traducir.

0.2

  • Los atajos de teclado ahora están agrupados en la categoría Txt reader de los gestos de entrada.
  • Se agregó un atajo para vaciar el contenido en memoria.

0.1

  • Versión inicial.

Este complemento mejora la compatibilidad con Google Docs. Este complemento funciona en modo exploración haciendo que las órdenes de navegación rápida y la navegación con el cursor funcionen adecuadamente. Por ejemplo, si usas Google Docs sin este complemento, la h te llevará al siguiente encabezado, pero sólo entre aquellos visibles en pantalla. Este complemento corrige ese comportamiento y hace que la h te lleve por todos los encabezados del documento.

Instalación

Para que este complemento funcione correctamente, se deben activar el soporte para lectores de pantalla y el soporte braille. Para ello:

  • Abre un documento de Google.
  • Pulsa control+alt+z hasta que escuches «Se ha habilitado la compatibilidad con lectores de pantalla».
  • Pulsa control+alt+h hasta que oigas «Soporte braille habilitado».
  • Pulsa NVDA+barra espaciadora para entrar en modo exploración si te encontrabas en modo foco.

Requisitos

Navegadores compatibles:

  • Google Chrome
  • Mozilla Firefox

Por ahora, es necesario que se instale la distribución de teclado en inglés de Estados Unidos para que funcione el complemento. Hace falta porque el complemento resuelve los atajos de Google Docs en inglés de Estados Unidos. Fallará si no encuentra esta distribución. Se agradecen solicitudes de cambio para corregir este comportamiento.

Órdenes soportadas

Órdenes globales:

  • NVDA+alt+g: conmutar accesibilidad de Google Docs (permite desactivar temporalmente las funciones de este complemento).

Órdenes de navegación rápida (se omite su parte correspondiente con shift para abreviar):

  • H: siguiente encabezado.
  • 1 a 6: siguiente encabezado del nivel 1 al 6.
  • K: siguiente enlace.
  • L: siguiente lista.
  • I: siguiente elemento de lista.
  • G: siguiente gráfico.
  • T: siguiente tabla.

Órdenes de navegación:

  • Flechas
  • Control+flechas
  • Inicio y fin
  • Control+inicio, control+fin, retroceso página y avance página

Problemas conocidos

  • El complemento necesita que la distribución de teclado en inglés de Estados Unidos esté instalada.
  • Este complemento convierte órdenes de NVDA en gestos de Google Docs. Por tanto, no se puede ajustar su comportamiento. Por ejemplo, al pulsar h repetidamente se regresa al principio del documento. Esto es un inconveniente para los usuarios de NVDA, pero es el comportamiento por defecto en Google Docs y no se puede cambiar.
  • Las órdenes de selección, como shift+flechas, no se soportan todavía. Cambia al modo foco para seleccionar contenido.

Este complemento usa el software Scanvox para leer documentos en papel. Fue creado con la ayuda del desarrollador del software, y no necesita procedimientos de instalación adicionales.

Requisitos previos

Para usar este complemento, necesitas un escáner USB conectado a tu ordenador compatible con TWAIN o WIA. Casi todos los escáneres son compatibles con uno o ambos protocolos.

Cómo funciona

Para usar el complemento, ve al menú Herramientas de NVDA, y selecciona Scanvox. En este diálogo, puedes iniciar un escaneo pulsando el botón Scan. El escaneo tarda unos segundos en comenzar, y cuando termina, el texto escaneado se lee automáticamente en voz alta. Pulsa este botón hasta haber escaneado todas las páginas. Cuando acabes, puedes guardar el archivo resultante, o abrirlo en el bloc de notas usando los botones correspondientes. Si quieres eliminar las páginas escaneadas y escanear un nuevo documento, puedes pulsar el botón para cancelar todas las páginas escaneadas. Al salir de Scanvox, todas las páginas escaneadas se eliminan.

Atajos de teclado

Se puede ejecutar este complemento desde cualquier parte pulsando NVDA+alt+s. Este gesto se puede personalizar en el diálogo Gestos de entrada.

Registro de cambios

Versión 2024.01.10

  • Se añade un botón «What’s new» para consultar las novedades de la versión actual.
  • Se añade la lectura automática de la página tras escanearla.
  • Se añade un separador de página en los archivos resultantes para facilitar la detección del cambio de página. Por defecto, son 20 asteriscos.

Versión 2024.01.03

  • Se actualiza la ayuda en francés.

Versión 2023.12.29

  • Primera versión.

Funciones de manejo de fragmentos de texto para NVDA.

Características

Huecos de memoria para fragmentos

Este complemento incluye 10 huecos de memoria para fragmentos que puedes usar para copiar y pegar texto entre aplicaciones.

¿Cómo funciona?

  • Instala el complemento.
  • Selecciona algo de texto.
  • Pulsa NVDA+control+teclas numéricas para copiar el texto seleccionado a un hueco de memoria. Si hay datos en el hueco de memoria seleccionado, serán sustituidos por el texto copiado.
  • Pulsa NVDA+control+shift+teclas numéricas una vez para oír el contenido del hueco seleccionado.
  • Pulsa NVDA+control+shift+teclas numéricas dos veces para pegar el contenido de ese hueco de memoria en la aplicación en ejecución.

Colaboración y traducciones

Si quieres colaborar con el desarrollo o traducir este complemento, consulta el archivo contributing.md que hay en la carpeta de documentación en inglés, dentro del repositorio de código fuente.

Este complemento para NVDA ayuda a que se te vea mejor en videollamadas dando instrucciones sobre cómo situarte ante la cámara. Utiliza reconocimiento facial y procesamiento de imágenes para detectar si estás de lado o vertical, así como determinar si la iluminación es suficiente.

Instalación

Este complemento contiene dependencias binarias que requieren los componentes redistribuíbles de Visual C++ para 32 bits, que puedes descargar directamente de Microsoft.

Modo de uso

Después de instalar el complemento, pulsa NVDA+shift+w y sigue las instrucciones. Cuando oigas el mensaje «Your face is well positioned», significará que tu cara está bien situada. En ese momento, puedes pulsar la tecla escape para salir del complemento y liberar la cámara.

Este complemento está diseñado para integrar perfectamente las posibilidades de la API de Open AI en tu flujo de trabajo. Ya sea que quieras redactar un texto completo, traducir pasajes con precisión, resumir documentos de forma concisa o incluso describir e interpretar contenido visual, este complemento hace todo eso con facilidad.

Requisitos previos de uso

Para utilizar la funcionalidad completa del complemento Open AI para NVDA, hace falta una clave de API de Open AI. Sigue estos pasos para configurarla:

  1. Consigue una clave de API registrando una cuenta de Open AI en https://platform.openai.com/api-keys.
  2. Con la clave de API lista, tienes dos opciones para configurarla:
    • Mediante el diálogo de opciones de NVDA:
      • Accede al menú NVDA y navega al submenú «Preferencias».
      • Abre el diálogo «Opciones» y selecciona la categoría «Open AI».
      • Introduce la clave API en el campo correspondiente y pulsa «Aceptar».
    • Usando variables de entorno:
      • Pulsa windows+pausa para abrir las propiedades del sistema.
      • Pulsa en «Configuración avanzada del sistema» y luego en «Variables de entorno».
      • Crea una nueva variable bajo «Variables de usuario»:
        • Pulsa en «Nueva».
        • Introduce OPENAI_API_KEY como nombre de variable y pega tu clave de API en el valor.
      • Pulsa «Aceptar» para guardar los cambios.

¡Ya tienes todo lo necesario para explorar las funciones del complemento de Open AI para NVDA!

Cómo usar el complemento

Acceso a las características principales

Las funciones del complemento están alojadas en un diálogo central que se puede abrir con el atajo NVDA+g. Este diálogo proporciona acceso a la mayoría de funciones del complemento, permitiéndote:

  • Entablar una conversación con el modelo de IA.
  • Obtener descripciones de imágenes desde archivos de imagen.
  • Transcribir contenido hablado desde archivos de audio o desde el micrófono.
  • Usar síntesis de voz para vocalizar el texto escrito.

Órdenes en el diálogo principal

Hay algunas órdenes disponibles en el diálogo principal para distintos elementos.

  • Cuando el campo de escritura tiene el foco:
    • Ctrl+intro: enviar el texto introducido.
    • Ctrl+flecha arriba: recuperar y situar la orden más reciente introducida en el campo actual para revisarla o reutilizarla.
  • Cuando el campo del historial tiene el foco:
    • Alt+flecha derecha: copiar el texto del usuario a la entrada.
    • Alt+flecha izquierda: copiar la respuesta del asistente al sistema.
    • Ctrl+c: copiar el texto del usuario o la respuesta del sistema, dependiendo de la posición del cursor.
    • Ctrl+shift+flecha arriba: moverse al bloque de texto del usuario o del asistente que haya encima del actual.
    • Ctrl+shift+flecha abajo: moverse al bloque de texto del usuario o del asistente que haya debajo del actual.

Órdenes globales

Se pueden usar estas órdenes para disparar acciones desde cualquier parte del sistema. Es posible reasignarlas desde el diálogo Gestos de entrada de NVDA, en la categoría Open AI.

  • NVDA+e: toma una captura de pantalla y la describe.
  • NVDA+o: describe el objeto donde se encuentra el navegador de objetos.

Dependencias incluidas

El complemento viene empaquetado con las siguientes dependencias esenciales:

  • OpenAI: la biblioteca de Python oficial para la API de Open AI.
  • MSS: un módulo multiplataforma ultrarrápido que toma varias capturas de pantalla en Python puro usando ctypes.
  • sounddevice: reproduce y graba sonido con Python.

Este complemento hace posible obtener descripciones detalladas de imágenes y otro contenido visual inaccesible.
Aprovechando las capacidades multimodales del modelo de lenguaje GPT-4, pretendemos entregar las mejores descripciones de contenido de su clase. Para más información sobre el modelo subyacente, consulta GPT-4V.

Características

  • Describe el objeto que tiene el foco, el navegador de objetos o la pantalla entera.
  • Describe cualquier imagen que se haya copiado al portapapeles, ya sea una imagen incrustada en un correo o una ruta en el explorador de archivos.
  • Soporta una amplia variedad de formatos, incluyendo PNG (.png), JPEG (.jpeg y .jpg), WEBP (.webp) y gifs no animados (.gif).
  • Almacena opcionalmente respuestas en caché para preservar la cuota de la API.
  • Para usuarios avanzados, se pueden personalizar el aviso y el recuento de tokens para adaptar la información a tus necesidades.

Caso de uso

Había algunas motivaciones principales detrás de este proyecto.
NVDA es capaz de realizar reconocimiento óptico de caracteres (OCR) desde el primer momento, lo cual cambia las reglas del juego. Si estás intentando sacar texto de una imagen o un documento PDF, esto es lo que estás buscando.
Sin embargo, el OCR sólo puede analizar datos que puedan ser texto. Se queda corto al considerar el contexto, los objetos y las relaciones transmitidas en esas imágenes. E Internet está lleno de ellos. Logotipos, retratos, memes, iconos, cuadros, diagramas, gráficos de barras/líneas… Lo que sea. Están en todas partes y, por lo general, no en un formato que los usuarios de lectores de pantalla puedan interpretar. Hasta hace poco, ha habido una dependencia inquebrantable de que los autores de contenido proporcionen descripciones de texto alternativas. Si bien esto sigue siendo una obligación, es difícil cambiar el hecho de que un alto estándar de calidad resulta ser la excepción, no la regla.
Ahora, las posibilidades son casi infinitas. Podrías:

  • Visualizar el escritorio o una ventana específica para comprender la ubicación de los iconos al formar a alguien
  • Obtener información detallada sobre el estado de juegos, máquinas virtuales, etc. cuando el sonido es insuficiente o no está disponible
  • Averiguar lo que se muestra en un gráfico
  • Desmitificar las capturas de pantalla
  • Asegurarte de que tu rostro mira claramente a la cámara antes de grabar vídeos o participar en reuniones en línea

Primeros pasos

Descarga e instala el complemento. Después, sigue estos pasos para obtener una clave de API de OpenAI:

  1. Visita https://platform.openai.com/account/api-keys
  2. Si aún no tienes una cuenta, crea una. Si la tienes, inicia sesión.
  3. En la página de claves API, haz clic en crear una nueva clave secreta. Cópiala en el portapapeles.
  4. Carga al menos un dólar en la cuenta.
  5. En el cuadro de diálogo de opciones de NVDA, desplázate hacia abajo hasta la categoría AI Content Describer, luego ve al campo Clave API y pega la clave generada.

Al momento de escribir este documento, OpenAI regala crédito a nuevas cuentas de desarrollador que puede usarse durante tres meses, después de los cuales caduca.
Después de este período, tendrás que cargar dinero. El uso típico nunca debería exceder los $5,00 por mes. Como punto de referencia, la versión original de este complemento se desarrolló por poco menos de un dólar. Siempre es posible iniciar sesión en la cuenta de OpenAI y hacer clic en «usage» para ver el estado de la cuota.

Modo de uso

Hay tres atajos de teclado asignados por defecto:

  • NVDA+shift+i: despliega un menú que permite describir el objeto bajo el foco, bajo el navegador de objetos o la pantalla entera mediante IA.
  • NVDA+shift+u: describe los contenidos del objeto bajo el navegador de objetos usando IA.
  • NVDA+shift+y: describe la imagen (o ruta a un archivo de imagen) que hay en el portapapeles usando IA.

Hay dos gestos sin asignar:

  • Describir los contenidos del objeto bajo el foco usando IA.
  • Tomar una captura de pantalla y describirla usando IA.

No dudes en personalizarlos a tu gusto en cualquier momento desde el diálogo Gestos de entrada.

Colaboraciones

¡Todas son bienvenidas! ¿Has encontrado un fallo? Abre una incidencia.
¿Tienes una sugerencia para una nueva función? Abre una incidencia también y hablemos sobre su implementación. Se revisarán las solicitudes de cambio que no tengan una incidencia asignada, pero probablemente nos llevarán más tiempo a todos, especialmente si decido que la corrección o la nueva característica debe funcionar de un modo distinto.
Las traducciones se reciben con los brazos abiertos.
Si no tienes GitHub o prefieres no usarlo, puedes mandar un correo a [email protected].
¡Gracias por tu apoyo!

Nota: este complemento dispone de funciones de traducción automática que envían todo el contenido leído por NVDA a un servidor remoto cuando están activadas. Consulta la política de privacidad de Baidu, y desactiva la traducción automática si vas a trabajar con información sensible.
Este complemento para NVDA proporciona traducción con Baidu.

Atajos de teclado

  • Traduce lo que has oído: NVDA+w
  • Traduce lo que has oído en dirección inversa: NVDA+shift+w
  • Alternar entre modos de traducción automática (desactivada, normal e inversa): NVDA+f8
  • Traducir contenido del portapapeles: NVDA+control+w
  • Traducir en dirección inversa el contenido del portapapeles: NVDA+control+shift+w

Contacto de soporte

Cualquier comentario o sugerencia es bienvenido:

  • En el repositorio del proyecto en GitHub.
  • Por correo: [email protected]
  • QQ: 354522977
  • WeChat: huaiyinfeilong

Registro de cambios

Versión 1.5

Versión 1.4

  • Se mejora la documentación de ayuda y se corrigen errores en la traducción al inglés.
  • Se optimiza el aviso de alternancia de traducción automática, que es más claro y conciso ahora.

Versión 1.3

Se añaden funciones de traducción y traducción inversa del contenido del portapapeles.

  • Traducción: se traduce el contenido del portapapeles del idioma de origen al idioma de destino. Si está activada la opción «Identificar automáticamente idioma de origen», se reconocerá el idioma de origen automáticamente.
  • Traducción inversa del portapapeles: traduce los contenidos del portapapeles del idioma de destino al idioma de origen.

Versión 1.2

Se añade la traducción automática, que dispone de tres modos: desactivada, normal e inversa.
Tras activar la traducción automática, todo el contenido leído por NVDA se traducirá automáticamente. Cada uno de los tres modos funciona como se describe a continuación:

  • Traducción automática: traduce automáticamente el contenido leído por NVDA del idioma de origen al idioma de destino. Si la opción «Identificar automáticamente el idioma de origen» está activada, se reconocerá automáticamente el idioma de origen.
  • Traducción automática inversa: traduce automáticamente el contenido leído por NVDA del idioma de destino al idioma de origen.
  • Desactivar traducción automática: no se usa la traducción automática.

Nota: tras activar la traducción automática, todo el contenido leído por NVDA se enviará al servidor de traducción, y la velocidad de respuesta de NVDA se reducirá en diversos grados en función de los resultados de traducción y tu velocidad de conexión.

Versión 1.1

Se añade una función de traducción inversa, que puede traducir del idioma de destino al idioma de origen.