Matlab - Dudas con PCA EN MATLAB

   
Vista:

Dudas con PCA EN MATLAB

Publicado por Julian Orozco (2 intervenciones) el 15/08/2017 01:48:16
Hola soy estudiante de Doctorado mi Nombre es Julián Orozco
Quería comentaros que estoy trabajando mi proyecto en clasificación para el aprendizaje automático pero antes de esto estoy aplicanando el Análisis de lo componentes principales y me surgen dudas, ya que en casi todos los casos que he buscado en internet me dice que los primeros componentes son los más importantes pero cuando desprecio los últimos componentes mi sistema de clasificación se vuelve un poco ineficiente entonces tengo preguntas como :

¿pueden ser los últimos componentes importantes para mi clasificación?
¿Si hay variables que las veo muy correlacionadas por qué razon reducir la dimensionalidad de mis datos me está afectando gravemente?
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder
Imágen de perfil de JESUS DAVID ARIZA ROYETH

Dudas con PCA EN MATLAB

Hola creo que tienes un error de Conceptos porque el Análisis de los componentes principales es una técnica que permite realizar una transformación lineal de tus datos , ahora Cómo lo hace?

el análisis de los componentes principales se vale de los eigenvalores y eigenvectores de la matriz de covarianza y cuando hablamos de covarianza estamos hablando de qué tanto se correlacionan dos variables entonces el análisis de los componentes principales te va a agrupar en varias dimensiones tus variables de acuerdo como estén correlacionadas y lo va a ser con un orden tal que el primer componente contenga la mayor información posible y el último la menor cantidad de Información pero lo normal es que en tu primer componente el coeficiente más alto sea negativo o positivo probablemente corresponderá a la variable con la mayor desviación estándar que tengas, pero no necesariamente las variables con mayor desviación estándar son las que te logran diferenciar tus clases en la clasificación, puedes tener una variable con una desviación estándar baja pero que en esas variables las clases estén separadas muy bien , por lo tanto así esta variable aparezca con fuerza en los últimos componentes , puede tener la mejor opción para diferenciar tus datos


para clarificar imagina una cantidad de puntos rojos y azules distribuidos en un eje con una desviación super alta pero mezclados y ahora imagínate una cantidad de puntos muy agrupados con poca desviación estándar baja , pero los puntos rojos están en un lado izquierdo y los azules en un lado derecho , entonces a pesar que la última variable tiene menor desviación es más óptima para clasificar , así que prueba con los componentes que mejor te ayuden a clasificar no necesariamente deben ser los primeros y esa es la razón por la que tus últimos componentes pueden ser importantes, esa pequeña desviación que guardan es la más determinante a la hora de diferenciar clases en tu clasificación


un saludo
https://www.facebook.com/royethmatlab/
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
1
Comentar

Dudas con PCA EN MATLAB

Publicado por Julian Orozco (2 intervenciones) el 15/08/2017 17:43:17
creo que ya entiendo un poco que la desviación estándar no necesariamente tiene que ver con la clasificación; aunque ahora debo profundizar mas en como se relaciona la desviación estándar con el análisis PCA pero he visto lo que me has dicho y realmente concuerda cuando lo miro por desviación estándar, pero me gustaría saber si hay alguna manera de hacer algún análisis que tenga en cuenta la clasificación y no solo la desviación estándar
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar
Imágen de perfil de JESUS DAVID ARIZA ROYETH

Dudas con PCA EN MATLAB

si deseas hacer un Análisis multivariante que tenga en cuenta la variable a clasificar te recomiendo el Análisis Discriminante ya que en este si podrás hacer lo que deseas

te dejo el link de Mathworks : https://www.mathworks.com/help/stats/discriminant-analysis.html
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar
Revisar política de publicidad