Cómo distinguir vocales con Python

Aceptada

Se trata de un trabajo que realicé en marco de una optativa de la carrera de física, que consistió en analizar archivos de audio para reconocer vocales del castellano. Se presentarán brevemente algunos conceptos de análisis de señales y de fisiología de la voz humana, y se explayará en la elaboración de un algoritmo de clasificación KNN desde cero en Python.


Tipo: Charla estandard, 25 minutos

Nivel: Medio

Disertantes: Carla Soprano

Biografiá del Disertante: Licenciada en Física de la UNLP. Ayudante en materias introductorias de física experimental en la Facultad de Ciencias Exactas de la UNLP.

Horario: 13:30 - 14:00 - 09/09/2023

Sala: Salón de Actos FRLP

Etiquetas/Tags: transformada rápida de fourier (fft) codificación predictiva lineal (lpc) k-primeros vecinos (knn) vocoder

Descripción completa

La voz humana puede caracterizarse a partir de las frecuencias que nuestro tracto vocal amplifica, que se denominan formantes. Por ejemplo, las formantes más graves se asocian con las vocales, mientras que las más agudas nos ayudan a distinguir quién es la persona que nos habla. En el espacio de las primeras dos formantes, F1 y F2, podemos mapear zonas que se relacionan con distintas vocales, y que se van a ver muy diferentes según el idioma que se considera. En el caso del castellano, hay 5 zonas asociadas a las vocales a, e, i, o y u respectivamente. Con un algoritmo KNN, o "k-primeros vecinos", podemos identificar estas zonas a partir de una muestra de hablantes suficientemente grande.