Matlab - recorrer señal de audio en busca de una palabra especifica

Pos: 149

Val: 10

recorrer señal de audio en busca de una palabra especifica

Publicado por daniel (4 intervenciones) el 28/11/2019 03:57:39

que codigo implementar para que al introducir un audio, el programa creado busque una palabra en especial y diga en que tiempo exactamente se encuentra cada palabra.

Valora esta pregunta

Me gusta: Está pregunta es útil y esta clara

No me gusta: Está pregunta no esta clara o no es útil

Responder

Pos: 2

Val: 3.309

recorrer señal de audio en busca de una palabra especifica

Publicado por JESUS DAVID ARIZA ROYETH (1818 intervenciones) el 28/11/2019 12:39:40

hola lo que debes hacer aquí es una extracción de características del audio , pero antes separar palabras como este enlace que te dejo:
https://la.mathworks.com/matlabcentral/answers/340214-separate-words-in-audio-file, en la extracción de características puedes utilizar cualquier algoritmo de aprendizaje automático como KNN , SVM, etc

Valora esta respuesta

Me gusta: Está respuesta es útil y esta clara

No me gusta: Está respuesta no esta clara o no es útil

Comentar

Pos: 149

Val: 10

recorrer señal de audio en busca de una palabra especifica

Publicado por daniel (4 intervenciones) el 28/11/2019 14:46:39

muchas gracias por responder.
Pero quedé mas perdido, soy nuevo con esto de programación en matlab .
estaría mejor si fuera mas detallado.
Gracias.

Valora esta respuesta

Comentar

Pos: 2

Val: 3.309

recorrer señal de audio en busca de una palabra especifica

Publicado por JESUS DAVID ARIZA ROYETH (1818 intervenciones) el 28/11/2019 15:51:50

en este caso no se trata de Matlab, se trata de entender primero que nada ¿Qué es una señal de audio digital?, ahí notarás que no es más que un vector de números muestreados a cierta frecuencia, esto será en cualquier lenguaje que estés usando , si visitas la documentación oficial del lenguaje en este caso de Matlab encontrarás los ejemplos necesarios, ahora bien también debes introducirte necesariamente al mundo matemático, específicamente entendiendo la relación de los números imaginarios con el seno y el coseno y, euler , la llamada Fórmula de Euler, con esto deberías pasar a entender cómo funcionan las transformadas matemáticas, como por ejemplo la más popular para el caso de audios, la transformada de Fourier, también requieres técnicas estadísticas como la extracción de características principales, esto te ayudara a extraer características importantes de los audios, faltaría la comparación aquí puedes aplicar machine learning , redes neuronales artificiales ...

En resumen :

Extraer las características de esas palabras especiales y guardarlas

Extraer las características del Nuevo audio

Comparar mediante Redes Neuronales Artificiales, Knn, SVM, etc las características extraídas con las características guardadas

Aquí en este Link oficial hacemos posible los procesamientos https://la.mathworks.com/help/audio/examples/Speech-Command-Recognition-Using-Deep-Learning.html
y existen muchos recursos para cada una de las etapas que te mencioné pero debes comprender los pasos, por lo menos, de forma general

ese link que te envié es muy útil y ahí muchos otros en esa página que te servirán pero debes tomarte el tiempo de entenderlos para que puedas adaptarlo a tus necesidades

Valora esta respuesta

Comentar

mostrar el espectro del sonido captado por el micrófono en tiempo real

Ayuda con proyecto de procesamiento de señales de audio en Matlab