Seminarios
  • Seminario día 18 de Julio de 2011


Título: Detección de patologías vocales mediante análisis acústico y técnicas de dinámica no lineal
Impartido por: Juan Rafael Orozco


Presentación en PDF
logo pdf

Juan Rafael Orozco actualmente se encuentra realizando una estancia en el IDeTIC, pertenece al Grupo de Electrónica de Potencia, Automatización y Robótica (GEPAR) y el Grupo de Investigación en Telecomunicaciones Aplicadas (GITA) de la Universidad de Antioquia, Medellín (Colombia)

Juan Rafael is working on projects that are funded by ARTICA research center (http://www.articacdt.com/) and "Comité para el Desarrollo de la Investigación" (CODI) at Universidad de Antioquia (www.udea.edu.co) in Medellín (Colombia)

Resumen:

La hipernasalidad es la patología vocal más frecuente en personas con Labio y/o Paladar Hendido (LPH), y 1 de cada 1000 niños en el mundo nacen con esta malformación, por tanto resulta relevante desarrollar sistemas que permitan medir el progreso en el tratamiento con base en medidas objetivas, independientes de la experiencia del foniatra. Los pacientes con LPH producen movimientos articulatorios compensatorios en el tracto vocal, generando ruido en algunas fonaciones.

Para confirmar esta afirmación se implementaron medidas de perturbación, coeficientes MFCC y medidas de ruido sobre 266 registros de las cinco vocales del español, 110 sanos y 156 hipernasales. Se encontró que algunos coeficientes MFCC son importantes para la detección de hipernasalidad, adicionalmente, el desempeño aumentó por lo menos 20% al considerar las medidas de ruido.

Posteriormente, se abordó el mismo problema usando cuatro características de dinámica no lineal (DNL), el máximo exponente de Lyapunov (λ_1), el exponente de Hurst (H), la dimensión de correlación (D_c) y la complejidad de Lempel-Ziv (LZC). Utilizando una máquina de soporte vectorial de margen suave, se logró un acierto de 93%. Reproduciendo las pruebas para el conjunto de características acústicas, los resultados de acierto fueron de 93.7% indicando que las medidas de DNL poseen una capacidad de discriminación similar a las acústicas. Durante la estancia en el IDETiC, se ha estado trabajando en la detección automática de otras patologías vocales en voz continua. En la caracterización se inlcuyeron las características de DNL mencionadas antes, para luego computar la media, la desviación típica, la asimetría y la curtosis de cada métrica; sin embargo, sólo con la asimetría de H, la curtosis de H y el promedio de LZC, se lograron aciertos de hasta el 90%. Cuando sólo se computa la asimetría de H, el acierto es de 81%.