Cómo distinguir vocales con Python
Aceptada
Se trata de un trabajo que realicé en marco de una optativa de la carrera de física, que consistió en analizar archivos de audio para reconocer vocales del castellano. Se presentarán brevemente algunos conceptos de análisis de señales y de fisiología de la voz humana, y se explayará en la elaboración de un algoritmo de clasificación KNN desde cero en Python.
Tipo: Charla estandard, 25 minutos
Nivel: Medio
Disertantes: Carla Soprano
Biografiá del Disertante: Licenciada en Física de la UNLP. Ayudante en materias introductorias de física experimental en la Facultad de Ciencias Exactas de la UNLP.
Horario: 13:30 - 14:00 - 09/09/2023
Sala: Salón de Actos FRLP
Etiquetas/Tags: transformada rápida de fourier (fft) codificación predictiva lineal (lpc) k-primeros vecinos (knn) vocoder

Descripción completa
La voz humana puede caracterizarse a partir de las frecuencias que nuestro tracto vocal amplifica, que se denominan formantes. Por ejemplo, las formantes más graves se asocian con las vocales, mientras que las más agudas nos ayudan a distinguir quién es la persona que nos habla. En el espacio de las primeras dos formantes, F1 y F2, podemos mapear zonas que se relacionan con distintas vocales, y que se van a ver muy diferentes según el idioma que se considera. En el caso del castellano, hay 5 zonas asociadas a las vocales a, e, i, o y u respectivamente. Con un algoritmo KNN, o "k-primeros vecinos", podemos identificar estas zonas a partir de una muestra de hablantes suficientemente grande.