- Autor: Michael Curran, de NV Access
- Versión actual: 2022.1
- Compatibilidad con NVDA: de 2019.3 en adelante
- Descargar complemento
- Descargar conjunto de imágenes de ejemplo
- Código fuente en GitHub
Nota: esta traducción se ha simplificado eliminando información redundante, y por tanto no es totalmente fiel a la documentación original.
Experimento para hacer accesibles las imágenes a personas ciegas.
Introducción
Audio Screen es un complemento para NVDA que permite que una persona ciega desplace el dedo por una pantalla táctil compatible con Windows 8 o posterior, y oiga la parte de una imagen que haya bajo el mismo. Si no hay una pantalla táctil disponible, se puede usar el ratón, aunque es menos preciso para el usuario, ya que los movimientos del ratón son relativos.
Aquí hay una demostración de AudioScreen hecha por Michael Curran (en inglés) [archivo mp3, 17 mb], donde se muestran los diferentes modos, y se utiliza el complemento para explorar un mapa de Australia, un arcoiris, la tierra desde el espacio, una caricatura de una casa, y una puesta de sol.
Como Audio Screen necesita NVDA para funcionar, el usuario recibe información por voz, como el nombre del control o el texto que hay directamente bajo su dedo.
Se puede ver Audio Screen como una alternativa experimental para que las personas ciegas perciban imágenes básicas, como diagramas o mapas, cuando no hay una alternativa táctil disponible.
Audio Screen tiene dos modos de salida: «Tono estéreo gris» para investigar las líneas y contornos en imágenes (útil en diagramas y mapas), y «Color MSB» para investigar la variación de color en imágenes (útil en fotografías).
El modo de tono estéreo gris
En este modo, Audio Screen representa la imagen bajo tu dedo o el ratón como múltiples pitidos que varían en tono, volumen y posición estéreo. La idea está basada en el sistema de mapeado de imagen a voz creado por Peter Meijor (www.seeingwithsound.com). Audio Screen se esfuerza en proporcionar aproximadamente la misma información que tu dedo te daría al tocar diagramas en relieve. Puedes percibir cuándo se mueve tu dedo o el ratón sobre una línea, tanto horizontal como verticalmente. Por ejemplo, si tu dedo cruza una línea horizontal mientras baja por la pantalla, puedes oír la línea bajo tu dedo. Si tu dedo cruza una línea vertical mientras te mueves por la pantalla de izquierda a derecha, escucharás moverse la línea de derecha a izquierda bajo tu dedo. Si dejas quieto tu dedo o el ratón en la misma posición durante más de medio segundo, Audio Screen comenzará a barrer el audio de izquierda a derecha, aislando columnas de píxeles únicas, proporcionando muchos más detalles extremos de la imagen para ayudar a detectar patrones y demás.
En NVDA 2016.1 o posterior, si pones más de un dedo en la pantalla a la vez, Audio Screen barrerá la imagen bordeada por tus dedos. Por ejemplo, si se pone un dedo en la esquina superior izquierda de una gran imagen y otro dedo abajo a la derecha, Audio Screen barrerá la imagen entera.
Además de recibir retroalimentación mediante entrada táctil o movimiento del ratón, puedes pedirle a Audio Screen que haga un barrido por una imagen completa o control, mediante su orden de reproducir el navegador de objetos. Esto realizará varios barridos sobre el objeto actual del navegador de objetos.
El modo de color msb
En este modo, Audio Screen transmitirá el color (específicamente matiz, saturación y brillo) de la imagen bajo tu dedo.
El matiz (posición en el espectro de colores) se representa con un pitido en un tono particular. Actualmente, el tono más bajo va asociado al azul, y va subiendo por el verde, amarillo, naranja, rojo (el tono más alto). Ya que un espectro es de hecho un círculo, al ir del rojo pasando por los púrpuras al azul, el tono más alto (rojo) se desvanece y el más bajo (azul) reaparece.
La saturación (intensidad del color) está representada por ruido marrón (ruido aleatorio bajo). Cuando el color tiene su máxima intensidad (saturación completa) no hay ruido aleatorio y se oye completamente el tono del espectro. Según se reduce la saturación a gris (sin saturación) el tono del espectro se hace más silencioso y el ruido aleatorio se vuelve más alto, eventualmente quedándose solo cuando no hay saturación.
El brillo se representa con el volumen general de todo el sonido.
Algunos ejemplos:
- Negro: silencio
- Blanco: sonido aleatorio alto
- Azul intenso: un tono muy bajo
- Amarillo intenso: un tono medianamente elevado
- Rojo claro: un tono muy alto con algo de ruido aleatorio
- Verde oscuro: un tono medianamente bajo
- Gris oscuro: ruido aleatorio silencioso
Requisitos del sistema
- Una copia instalada de NVDA 2015.4 o posterior (NVDA 2016.1 o posterior para barrido con varios dedos).
- Sistema operativo Windows 8 o posterior.
- Una pantalla táctil compatible con Windows 8 o 10, o en su defecto un ratón.
- Se debe desactivar la retroalimentación visual para toques en Windows. Busca cambiar los ajustes de entrada táctil en la pantalla de inicio, y desmarca en ese diálogo Mostrar retroalimentación visual al tocar la pantalla.
Modo de uso
Mientras NVDA esté en ejecución con este complemento instalado, abre una imagen interesante en pantalla completa (por ejemplo, usa Internet Explorer para mostrar uno de los archivos svg de ejemplo, maximizándolo y poniéndolo posteriormente en pantalla completa con f11).
Audio Screen está apagado por defecto, por lo que tienes que encenderlo cambiando a uno de sus modos. Esto se hace pulsando NVDA+ctrl+a, y alterna entre tono estéreo gris, color MSB y apagado.
Ahora, mueve tu dedo o el ratón por la pantalla y empieza a escuchar la imagen bajo él.
Como NVDA puede verbalizar los controles y el texto bajo tu dedo, ver un diagrama o mapa en svg es fantástico, ya que Internet Explorer permite que NVDA verbalice el título o descripción de cualquier forma por la que tu dedo se desplace, asumiendo que se han definido adecuadamente títulos y descripciones usando las etiquetas title y desc de svg apropiadamente.
Atajos
- NVDA+ctrl+a: cambiar modo de audio entre desactivado, tono estéreo gris o color MSB
- NVDA+alt+a: reproducir objeto bajo el navegador de objetos
- NVDA+shift+a: mostrar diálogo de ajustes, también accesible desde la opción Audio screen en el menú Preferencias de NVDA
Ajustes
- Audio Screen Mode: indica qué modo se usará por defecto al arrancar de los tres disponibles. Por defecto está en desactivado.
- Ajustes del modo de tono en estéreo gris:
- Reverse brightness (brillo invertido): esta opción permite revertir el brillo de la imagen, de tal forma que las partes oscuras harán más ruido y las brillantes estarán en silencio. Útil cuando los objetos en primer plano son más oscuros que el fondo.
- Number of columns in stereo field: indica la anchura de la imagen en píxeles. Al moverte, indica el tamaño de la imagen capturada. Al reproducir el objeto bajo el navegador de objetos, aunque la imagen se captura entera, se reduce para encajar en esta anchura.
- Number of rows (frequencies): cómo debería ser de alta la imagen en píxeles. Cada fila de píxeles se representa mediante una frecuencia. Las frecuencias se propagan de forma logarítmica. Al moverte con el dedo, este ajuste especifica la altura de la imagen. Al reproducir el objeto del navegador de objetos, la reduce para que encaje en esta altura.
- Lowest frequency in HZ: la frecuencia más baja (en hz) usada para representar la fila inferior de la imagen.
- Highest frequency in HZ: la frecuencia más alta (en hz) usada para representar la fila superior de la imagen.
- Initial stereo sweep delay in seconds (tiempo de espera para el barrido inicial en segundos): cuánto debería esperar Audio Screen para comenzar el barrido después de mover el dedo o el ratón.
- Duration of stereo audio sweep in seconds (duración en segundos del barrido estéreo): cuánto debe tardar cada barrido.
- Number of stereo sweeps (número de barridos estéreo): el número de veces que se reproduce el barrido después de moverte o reproducir el objeto actual.
- Width (in pixels) of the rectangle at the point under your finger / the mouse: indica la anchura en píxeles del área de captura al reproducir un único punto.
- Height (in pixels) of the rectangle at the point under your finger / the mouse: indica en píxeles la altura del área de captura al reproducir un único punto.
- Ajustes del modo de color MSB:
- Horizontal length of capture area in pixels: la anchura en píxeles del área capturada bajo tu dedo o ratón donde deseas detectar el color. El color se hace calculando la media de todos los puntos del área. Los valores más pequeños darán colores más precisos, aunque pueden causar que percibas más detalles de los que se ven visualmente.
- Vertical length of capture area in pixels: altura en píxeles del área capturada. Se debe tener en cuenta lo mismo que se ha explicado en el ajuste anterior.
- Lowest frequency (blue) in HZ: la frecuencia (en hz) que representa al azul. La frecuencia sube por azul marino, verde, amarillo, naranja, hasta el rojo. Como el espectro vuelve del rojo al azul a través del púrpura, las tonalidades púrpuras se representan mediante las frecuencias baja y alta a diferentes volúmenes. Por ejemplo, un púrpura azulado tendrá mucha baja frecuencia y un poco de la alta.
- highest frequency (red) in HZ: la frecuencia (en hz) que representa el rojo. Recomendable leer el ajuste anterior para entender sus peculiaridades, que también se aplican aquí.
Contexto histórico
Durante bastante tiempo, Michael Curran quiso una forma de acceder como persona ciega a mapas y diagramas básicos sin tener que producirlos en relieve.
Aunque los formatos táctiles son ciertamente útiles cuando están disponibles, tienen ciertas desventajas como:
- Tardan tiempo en producirse.
- Se necesitan materiales especiales.
- A veces se necesita una máquina especial.
- Se gasta papel y se perjudica al medioambiente.
- Es difícil transportar las láminas.
- Las etiquetas son muy limitadas por culpa de las restricciones de espacio.
Hace unos años, Mick descubrió un componente software muy interesante llamado The vOICe, de www.seeingwithsound.com. Este software podía tomar imágenes o vídeos de una webcam, y reproducirlos como audio para una persona ciega, haciendo uso del tono, el volumen y la panoramización estéreo. Aunque el software The vOICe es más pasivo en el sentido de que analiza de izquierda a derecha a través de una imagen completa, Mick vio muchas posibilidades de emplear el concepto de imagen a sonido de una forma más activa, con la ayuda de una pantalla táctil.
Existen otros métodos para transmitir una imagen en una pantalla táctil mediante sonidos, pero ninguno de ellos usa el concepto expuesto en vOICe.
Al transmitir información de un sentido a otro, Mick cree que es muy importante no perder información en el proceso. Si se puede proporcionar aproximadamente la misma resolución o mejor en el segundo sentido, el cerebro lo tendrá más fácil a la hora de descodificar la información. Un mapeado como el de vOICe se queda extremadamente cerca de conseguirlo.
Mapear colores con sonidos
Aunque el acceso a diagramas básicos como mapas y otros dibujos basados en líneas tienen muchas aplicaciones prácticas para las personas ciegas, también hay un argumento que da una importancia subjetiva al acceso a las imágenes de color tales como en el arte o la belleza del mundo. Por ejemplo la variación de colores en el arcoiris, o una foto de la Tierra vista desde el espacio. Estas cosas difícilmente se describen con palabras.