ImpactU - Detalle del Producto

Sistema audiovisual para reconocimiento de comandos

Acceso Abierto

Idioma: Español

Publicado: 01/08/2011

APC (est): No disponible

Abstract:

Se presenta el desarrollo de un sistema automático de reconocimiento audiovisual del habla enfocado en el reconocimiento de comandos.La representación del audio se realizó mediante los coeficientes cepstrales de Mel y las primeras dos derivadas temporales.Para la caracterización del vídeo se hizo seguimiento automático de características visuales de alto nivel a través de toda la secuencia.Para la inicialización automática del algoritmo se emplearon transformaciones de color y contornos activos con información de flujo del vector gradiente ("GVF snakes") sobre la región labial, mientras que para el seguimiento se usaron medidas de similitud entre vecindarios y restricciones morfológicas definidas en el estándar MPEG-4.Inicialmente, se presenta el diseño del sistema de reconocimiento automático del habla, empleando únicamente información de audio (ASR), mediante Modelos Ocultos de Markov (HMMs) y un enfoque de palabra aislada; posteriormente, se muestra el diseño de los sistemas empleando únicamente características de vídeo (VSR), y empleando características de audio y vídeo combinadas (AVSR).Al final se comparan los resultados de los tres sistemas para una base de datos propia en español y francés, y se muestra la influencia del ruido acústico, mostrando que el sistema de AVSR es más robusto que ASR y VSR.

Tópico:

Speech and Audio Processing

Citaciones:

Citaciones por año:

Altmétricas:

Información de la Fuente:

FuenteIngeniare. Revista chilena de ingeniería	Cuartil año de publicaciónNo disponible	Volumen19
Issue2	Páginas278 - 291	pISSN0718-3291
ISSNNo disponible	Perfil OpenAlexhttps://openalex.org/S4210222220

Enlaces e Identificadores:

Scholar citations URL	https://scholar.google.com/scholar?cites=1085247324635952564&as_sdt=2005&sciodt=0,5&hl=en	Scholar URL	https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=info%3AtHVeHrGSDw8J%3Ascholar.google.com&btnG=	Open_access URL	http://www.scielo.cl/pdf/ingeniare/v19n2/art12.pdf
Doi URL	https://doi.org/10.4067/s0718-33052011000200012	Openalex URL	https://openalex.org/W2020110914	Pdf URL	https://scielo.conicyt.cl/scielo.php?pid=S0718-33052011000200012&script=sci_arttext&tlng=e

Artículo de revista