Los investigadores de Intel enseñan a los ordenadores a leer en los labios para mejorar el software de reconocimiento de voz

Los potentes algoritmos de reconocimiento de voz actuales funcionan bien cuando se elimina el ruido de fondo o se utiliza un casco bien sintonizado, pero su exactitud se degrada rápidamente cuando las aplicaciones tienen que enfrentarse a entornos naturalmente ruidosos, tales como los lugares públicos. Combinado con algoritmos de detección de cara de la librería de visión informática OpenCV de Intel, el software Audio Visual Speech Recognition (AVSR) permite a los ordenadores detectar la cara de un orador y seguir los movimientos de su boca. La sincronización de datos de vídeo con la identificación del habla permite un reconocimiento de voz mucho más exacto, mejorando así una amplia variedad de aplicaciones de voz en entornos ruidosos. El software AVSR forma parte de la librería de visión informática OpenCV de Intel, una caja de herramientas de más de 500 funciones de tratamiento de la imagen que ayuda a los investigadores a desarrollar aplicaciones de visión informática.

“Intel quiere desarrollar tecnologías que permitan a los ordenadores interactuar de forma natural con el mundo, de la misma manera que lo hacen los humanos. El reconocimiento humano raramente se basa en un solo tipo de información. Tomamos decisiones combinando información procedente de varias fuentes,” dijo Justin Rattner, Intel Senior Fellow, Enterprise Platform Group y Director de los Microprocessor Research Labs de Intel. “Seguro que la adición de código de Reconocimiento de Voz Audio/Vídeo a la librería OpenCV de Intel fomentará la investigación y desarrollo en reconocimiento de voz asistido por la visión.”

Acelerando la Investigación de Nuevos Usos

Los microprocesadores más rápidos, la reducción del precio de las cámaras y diez veces más ancho de banda para la captura de vídeo de tecnologías tales como USB2 están permitiendo ejecutar en PCs corrientes algoritmos de visión informática en tiempo real. OpenCV está diseñado para incrementar la innovación en este campo al proporcionar código fuente para una amplia gama de funciones de visión y tratamiento de la imagen informáticos. Desde su lanzamiento en el año 2000, OpenCV ha registrado más de 500.000 descargas de código y ha atraído a más de 5.000 miembros registrados a su grupo de usuarios.

22/05/2003 - Visualizaciones: 2995

Microsoft compra al grupo SCO la licencia de Unix

HP gana un contrato de 107 millones de euros para implantar el proyecto de e-Learning más grande de la historia

Comentarios (0)

No hay comentarios

Los investigadores de Intel enseñan a los ordenadores a leer en los labios para mejorar el software de reconocimiento de voz

Comentarios (0)

Comenta esta noticia