ImpactU Versión 3.11.2 Última actualización: Interfaz de Usuario: 16/10/2025 Base de Datos: 29/08/2025 Hecho en Colombia
Importancia de las frecuencias de resonancia del tracto vocal en la estimación de posiciones articulatorias - IMPORTANCE OF THE RESONANCE FREQUENCIES OF THE VOCAL TRACT IN ESTIMATING ARTICULATORY POSITIONS
La inversion articulatoria, cuyo objetivo es estimar la posicion de los organos articuladores a partir de la informacion contenida en la senal de voz, ofrece una variedad de potenciales aplicaciones en el campo de la voz; sin embargo, este es un problema aun por resolver. En este sentido, buscar representaciones con la capacidad de incrementar el desempeno de los sistemas de inversion articulatoria es una tarea importante. El presente trabajo analiza la relevancia de los formantes como entrada para los sistemas de inversion articulatoria. Para ello se implementa un analisis analitico y estadistico. En el caso analitico se utiliza un sintetizador articulario, el cual simula la ecuacion de tubos concatenados que modelan el tracto vocal. Para el analisis estadistico se estudian datos reales provenientes de un articulografo electromagnetico para los cuales se estima la asociacion entre las caracteristicas acusticas y los movimientos de los organos articuladores. A modo de medida de asociacion estadistica se utiliza la medida de informacion. Los resultados entregados por el analisis son corroborados en un sistema de inversion articulatoria basado en redes neuronales. Se observa una mejora en el valor de error cuadratico medio del 2,2% y para el caso de la medida de desempeno de la correlacion, una mejora del 2,8%. Abstract — Acoustic-to-Articulatory inversion, which seeks to estimate an articulator position using the acoustic information in the speech signal, offers several potential applications in the field of speech processing. In this context, it is important to use acoustic parameters with the ability to increase the performance of acoustic-to-articulatory inversion systems. This paper analyzes the importance of formants as inputs to such inversion systems from an analytical and a statistical perspective. The former is based on an articulatory synthesizer that simulates the voice signal from the vocal tract. The statistical analysis is based on real data provided by an electromagnetic articulograph, for which we estimate the statistical association between acoustic features and articulator movement. As a measure of statistical association, the information measure is utilized. The results are tested on a neuralnetwork-based Acoustic-to-Articulatory inversion system. The use of formants as inputs led to an improvement of 2.2% and 2.8% in the root-mean-square error and correlation values, respectively.