- Autor: André-Abush Clause
- Versión actual: 24.06.29 en desarrollo
- Compatibilidad con NVDA: de 2023.1 en adelante
- Descargar versión en desarrollo
- Ver código fuente en GitHub
Este complemento está diseñado para integrar perfectamente las posibilidades de la API de Open AI en tu flujo de trabajo. Ya sea que quieras redactar un texto completo, traducir pasajes con precisión, resumir documentos de forma concisa o incluso describir e interpretar contenido visual, este complemento hace todo eso con facilidad.
Requisitos previos de uso
Para utilizar la funcionalidad completa del complemento Open AI para NVDA, hace falta una clave de API de Open AI. Sigue estos pasos para configurarla:
- Consigue una clave de API registrando una cuenta de Open AI en https://platform.openai.com/api-keys.
- Con la clave de API lista, tienes dos opciones para configurarla:
- Mediante el diálogo de opciones de NVDA:
- Accede al menú NVDA y navega al submenú «Preferencias».
- Abre el diálogo «Opciones» y selecciona la categoría «Open AI».
- Introduce la clave API en el campo correspondiente y pulsa «Aceptar».
- Usando variables de entorno:
- Pulsa windows+pausa para abrir las propiedades del sistema.
- Pulsa en «Configuración avanzada del sistema» y luego en «Variables de entorno».
- Crea una nueva variable bajo «Variables de usuario»:
- Pulsa en «Nueva».
- Introduce OPENAI_API_KEY como nombre de variable y pega tu clave de API en el valor.
- Pulsa «Aceptar» para guardar los cambios.
- Mediante el diálogo de opciones de NVDA:
¡Ya tienes todo lo necesario para explorar las funciones del complemento de Open AI para NVDA!
Cómo usar el complemento
Acceso a las características principales
Las funciones del complemento están alojadas en un diálogo central que se puede abrir con el atajo NVDA+g. Este diálogo proporciona acceso a la mayoría de funciones del complemento, permitiéndote:
- Entablar una conversación con el modelo de IA.
- Obtener descripciones de imágenes desde archivos de imagen.
- Transcribir contenido hablado desde archivos de audio o desde el micrófono.
- Usar síntesis de voz para vocalizar el texto escrito.
Órdenes en el diálogo principal
Hay algunas órdenes disponibles en el diálogo principal para distintos elementos.
- Cuando el campo de escritura tiene el foco:
- Ctrl+intro: enviar el texto introducido.
- Ctrl+flecha arriba: recuperar y situar la orden más reciente introducida en el campo actual para revisarla o reutilizarla.
- Cuando el campo del historial tiene el foco:
- Alt+flecha derecha: copiar el texto del usuario a la entrada.
- Alt+flecha izquierda: copiar la respuesta del asistente al sistema.
- Ctrl+c: copiar el texto del usuario o la respuesta del sistema, dependiendo de la posición del cursor.
- Ctrl+shift+flecha arriba: moverse al bloque de texto del usuario o del asistente que haya encima del actual.
- Ctrl+shift+flecha abajo: moverse al bloque de texto del usuario o del asistente que haya debajo del actual.
Órdenes globales
Se pueden usar estas órdenes para disparar acciones desde cualquier parte del sistema. Es posible reasignarlas desde el diálogo Gestos de entrada de NVDA, en la categoría Open AI.
- NVDA+e: toma una captura de pantalla y la describe.
- NVDA+o: describe el objeto donde se encuentra el navegador de objetos.
Dependencias incluidas
El complemento viene empaquetado con las siguientes dependencias esenciales:
- OpenAI: la biblioteca de Python oficial para la API de Open AI.
- MSS: un módulo multiplataforma ultrarrápido que toma varias capturas de pantalla en Python puro usando ctypes.
- sounddevice: reproduce y graba sonido con Python.
@[email protected] @[email protected] Interesante, voy a ver qué tal funciona Whisper.