PDF de programación - Desarrollo de herramientas de accesibilidad al ordenador y a internet basadas en la voz

Imágen de pdf Desarrollo de herramientas de accesibilidad al ordenador y a internet basadas en la voz

Desarrollo de herramientas de accesibilidad al ordenador y a internet basadas en la vozgráfica de visualizaciones

Publicado el 14 de Junio del 2018
467 visualizaciones desde el 14 de Junio del 2018
681,7 KB
12 paginas
Creado hace 14a (28/04/2010)
DESARROLLO DE

HERRAMIENTAS DE
ACCESIBILIDAD AL
ORDENADOR Y A

INTERNET BASADAS EN

LA VOZ

Convocatoria XIII Premios de Accesibilidad

Universal 2010



Oscar Saz, William Ricardo Rodríguez, José Enrique García, Antonio Escartín, Eduardo Lleida,
Laura Abarca, Sara Mejuto, Verónica Bermúdez, Marta Peña, Elena Lafuente, José Féliz Muñoz



DESARROLLO DE HERRAMIENTAS DE ACCESIBILIDAD AL

ORDENADOR Y A INTERNET BASADAS EN LA VOZ

¹Oscar Saz, W.-Ricardo Rodríguez, J.-Enrique García, Antonio Escartín & Eduardo Lleida

ViVoLab, GTC, I3A, Universidad de Zaragoza

²Laura Abarca, Sara Mejuto, Verónica Bermúdez & Marta Peña

ASPACE-Huesca y CADIS-Huesca

³Elena Lafuente & José Félix Muñoz

Laboratorio Aragonés de Usabilidad, Walqa



RESUMEN

El acceso a las nuevas Tecnologías de la Información y Comunicaciones (TICs)
supone una barrera que limita enormemente las posibilidades de desarrollo personal
de personas con diversidad funcional. Mientras para la mayoría de la sociedad,
obtener y mejorar el conocimiento del mundo a través del ordenador e Internet es
algo habitual, para las personas con discapacidad supone un trabajo costoso debido a
sus limitaciones. La necesidad de empoderar al usuario y proporcionar a estas
personas acceso a los nuevos elementos de comunicación es un esfuerzo básico a la
hora de pensar en la integración total de este colectivo (Abascal, 2008).

El trabajo que aquí se presenta desgrana una doble vertiente de trabajos para
mejorar este acceso a las nuevas tecnologías. La primera de ellas está orientada a
proporcionar un modo alternativo de control a personas con una gran discapacidad
física de los periféricos del ordenador (ratón y/o teclado) mediante entradas orales. La
segunda describe una serie de herramientas para que los creadores de contenidos en
Internet aprovechen las potencialidades de la síntesis y el reconocimiento de voz para
proporcionar un acceso mejorado a personas con diferentes limitaciones: invidentes
por un lado y personas con discapacidad física por otro.

Todo el núcleo del trabajo de desarrollo se ha llevado a cabo por parte de
grupo de investigación en tecnologías del habla y el lenguaje ViVoLab, del Grupo de
Tecnologías de las Comunicaciones (GTC) del Instituto de Investigación en Ingeniería
de Aragón (I3A) de la Universidad de Zaragoza. Este grupo cuenta con experiencia en el
trabajo para mejorar la calidad de vida de personas con discapacidad mediante el
logopedia en “Comunica”1 (Saz et al., 2009a), desarrollado en
software para
colaboración con el Colegio Público de Educación Especial “Alborada” y otras
instituciones.

Para los trabajos aquí presentados se ha contado con la necesaria colaboración
en el conocimiento de las necesidades de usuarios con discapacidad de ASPACE-
Huesca y la Coordinadora de Asociaciones de Discapacidad de Huesca (CADIS-Huesca);


1 http://www.vocaliza.es

y en el ámbito de la usabilidad y accesibilidad en la web del Laboratorio Aragonés de
Usabilidad en el Parque Tecnológico Walqa. El enfoque multidisciplinar de todo el
trabajo realizado es uno de los componentes básicos del mismo.

PARTE I. ACCESIBILIDAD AL ORDENADOR

I.1.

INTRODUCCIÓN

La mayor dificultad que presenta una persona con una grave dificultad motriz,
como por ejemplo alguien con parálisis cerebral, es la imposibilidad de manejar de
forma eficiente elementos básicos en la interacción con el ordenador como el ratón o
el teclado. Otras posibilidades de interacción deben ser, pues, estudiadas, adaptando
la forma en que el usuario se relaciona con la máquina de acuerdo a sus limitaciones
existentes. Los campos más novedosos tecnológicamente en los que se trabaja
actualmente integran elementos como el seguimiento del iris, el reconocimiento de
voz (Hawle et al., 2003), o los interfaces cerebrales (Iturriate et al., 2009), entre otros.

I.2.

EMULADOR DE PULSACIÓN BASADO EN VOZ

Los sistemas emuladores de teclado y ratón basados en barrido son, a día de
hoy, uno de los elementos más usados por aquellos que trabajan con personas con
diversidad funcional como la parálisis cerebral. El programa de barrido presenta de
forma sucesiva al usuario las diferentes posibilidades (teclas en el teclado o direcciones
de movimiento del ratón), y el usuario debe accionar un pulsador para activar la
opción marcada en ese instante. El uso de pulsadores mecánicos accionados no sólo
con la mano o brazo, sino con la cabeza o la pierna, es la situación más habitual en
estos casos; aunque en muchas situaciones puede producir una sensación de
incomodad o cansancio al usuario debido a la necesidad de forzar la postura o repetir
de forma continuada un mismo movimiento. La sustitución de estos pulsadores
mecánicos por otros elementos de interacción basados en un interfaz más natural para
la persona podría ser una solución para algunos de estos usuarios, simplificando y
agilizando su trabajo con el ordenador.

De esta forma, el proyecto de colaboración “Sistemas De Interacción Oral Sobre
Dispositivos Portables” entre CADIS-Huesca y la Universidad de Zaragoza vía ViVoLab
(GTC/I3A) y auspiciado por la Diputación Provincial de Huesca (DPH), el Instituto
Aragonés de Servicios Sociales (IASS) y la Caja de Ahorros de la Inmaculada (CAI)
pretendía encontrar una solución a esta situación. El desarrollo del trabajo se llevó a
cabo con la colaboración del personal del centro de día de ASPACE en Huesca. Dicho
centro realiza actividades con usuarios con diferentes grados de parálisis cerebral,
fomentando su capacitación y su autonomía personal. Entre las actividades existentes,
se realizan aulas de informática, donde los usuarios practican diferentes tareas con el
ordenador según sus posibilidades; desde acceder a Internet a escribir en un
procesador de textos pequeñas historias o tarjetas de felicitación.

Después de evaluar las posibilidades que los interfaces orales podrían ofrecer a
personas con parálisis cerebral severa como es el caso de ASPACE-Huesca se decidió
que, dada la fuerte disartria que dificulta el habla de estas personas, se debía evitar el
uso de sistemas basados en reconocimiento del habla, cuyas prestaciones decaen en
presencia de fuertes trastornos del habla, buscando recoger emisiones más simples
emitidas por los usuarios. Así pues, se empezó a plantear la forma de sustituir los
pulsadores mecánicos existentes por pulsación por voz. Un grupo de usuarios fueron
seleccionados por el personal de ASPACE-Huesca como sujetos de prueba durante el
desarrollo de
la ayuda técnica, presentando cada uno de ellos diferentes
características en su capacidad cognitiva y movilidad.



Figura 1: Esquema de pulsación emulada por voz

El esquema de funcionamiento del software desarrollado al final del proyecto
se basa en el esquema de bloques de la Figura 1. A través del micrófono, el usuario
realiza una emisión oral en el momento en que quiera activar la pulsación. El sistema
de captura de audio lleva incorporado un sistema de reducción de ruido para eliminar
el ruido presente en el audio capturado. Posteriormente se estima la energía de dicha
emisión, con el ruido ya suprimido, y cuando dicha emisión responde a la forma de un
pulso cuadrado de una determinada duración, se lanza el evento de pulsación en el
ordenador.

Figura 2: Interfaz visual de “VozClick”



El interfaz de usuario del software “VozClick” se puede ver en la Figura 2. Está
pensado para ser configurado por la persona que trabaje con el usuario, y una vez
iniciado permite a dicho usuario emular la pulsación con su habla. La ventana de
aplicación contiene todos los elementos requeridos para su funcionamiento, como la
intensidad mínima que tiene que alcanzar la emisión del usuario para activar la

pulsación, así como la duración de la emisión de voz que el usuario tiene que realizar
para que el sistema se active. Otros elementos secundarios de configuración de la
aplicación proporcionan las siguientes funcionalidades: Distinguir emisiones sonoras
(articulaciones vocálicas) de sordas (soplidos); activar o no la supresión del ruido según
el entorno en que se trabaje, minimizar la ventana en la bandeja de Windows o
habilitar/deshabilitar las pulsaciones consecutivas en un corto espacio de tiempo, para
permitir la emulación de la característica de “doble clic”.

I.3.

EMULADOR DE RATÓN BASADO EN LA PRODUCCIÓN DE VOCALES

Tras

la finalización del proyecto que dio

lugar a “VozClick” se siguió
manteniendo abierta la línea de trabajo con CADIS-Huesca y ASPACE-Huesca. En este
sentido, se estudió la posibilidad de eliminar completamente el uso de sistemas de
barrido de ratón en el ordenador a través de interfaces orales. Como se ha comentado
anteriormente, el uso de reconocimiento del habla no es suficientemente robusto en
presencia de usuarios con disartria muy profunda, por lo que se desestimó el
reconocimiento de palabras completas como “arriba”, “abajo”, “izquierda” o
“derecha”. Aunque se sigue investigando en este aspecto, todavía no es posible el
desarrollo de herramientas reales que apliquen este conocimiento.

Según la experiencia de otros grupos de investigación de reconocido prestigio
(Bilmes et al., 2006)(Harada et al., 2008) se observó que el control de la prod
  • Links de descarga
http://lwp-l.com/pdf11860

Comentarios de: Desarrollo de herramientas de accesibilidad al ordenador y a internet basadas en la voz (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios...
CerrarCerrar
CerrarCerrar
Cerrar

Tienes que ser un usuario registrado para poder insertar imágenes, archivos y/o videos.

Puedes registrarte o validarte desde aquí.

Codigo
Negrita
Subrayado
Tachado
Cursiva
Insertar enlace
Imagen externa
Emoticon
Tabular
Centrar
Titulo
Linea
Disminuir
Aumentar
Vista preliminar
sonreir
dientes
lengua
guiño
enfadado
confundido
llorar
avergonzado
sorprendido
triste
sol
estrella
jarra
camara
taza de cafe
email
beso
bombilla
amor
mal
bien
Es necesario revisar y aceptar las políticas de privacidad