PDF de programación - Geometría euclidiana en estadística: métodos en ejes principales

Imágen de pdf Geometría euclidiana en estadística: métodos en ejes principales

Geometría euclidiana en estadística: métodos en ejes principalesgráfica de visualizaciones

Actualizado el 21 de Marzo del 2018 (Publicado el 7 de Diciembre del 2017)
448 visualizaciones desde el 7 de Diciembre del 2017
244,2 KB
18 paginas
Creado hace 11a (21/08/2009)
Geometr´ıa euclidiana en estad´ıstica: m´etodos en ejes

principales

Campo El´ıas Pardo

Universidad Nacional de Colombia - Bogot´a

Departamento de Estad´ıstica.
e-mail: c[email protected] *

21 de agosto de 2009

´Indice

1. Introducci´on

2. Representaciones geom´etricas de una matriz

2.1. Ejemplo “caf´e” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.2. Nube de individuos (filas) NI

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.2.1. Centro de gravedad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.2.2. Centrado de la nube de individuos . . . . . . . . . . . . . . . . . . . . . . .

2.2.3. Reducci´on de la nube de puntos (cambio de escala).

. . . . . . . . . . . . .

2.2.4.

Inercia de la nube de individuos NI .

. . . . . . . . . . . . . . . . . . . . . .

2.2.5. B´usqueda de nuevos ejes: cambio de base

. . . . . . . . . . . . . . . . . . .

2.3. La nube de variables (columnas) NK . . . . . . . . . . . . . . . . . . . . . . . . . .

2.3.1. Significado del centro de gravedad y del centrado . . . . . . . . . . . . . . .

2.3.2. Significado del reducido e imagen geom´etrica de las variables estandarizadas

2.3.3. Significado del ´angulo entre dos flechas variables

. . . . . . . . . . . . . . .

2.4. B´usqueda de los ejes nuevos en RI

. . . . . . . . . . . . . . . . . . . . . . . . . . .

2.4.1. C´ırculo de correlaciones y ayudas para la interpretaci´on. . . . . . . . . . . .

3. An´alisis en componentes principales generalizado o ponderado ACP (X, M, D)

3.1. Nube de filas en RK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3.2. Nube de columnas en RI y dualidad . . . . . . . . . . . . . . . . . . . . . . . . . .

2

3

3

4

5

5

5

6

7

10

10

11

11

11

11

13

13

14

*Conferencia para la V Jornada de Matem´aticas Estad´ıstica y Did´actica. Universidad Pedag´ogica y Tecnol´ogica

de Colombia. Sede Duitama. Paipa, mayo 30 de 2008.

1

Geometr´ıa euclidiana en estad´ıstica: m´etodos en ejes principales

Campo El´ıas Pardo

3.3. Ayudas para la interpretaci´on de las gr´aficas.

. . . . . . . . . . . . . . . . . . . . .

3.3.1. Calidad de la representaci´on.

. . . . . . . . . . . . . . . . . . . . . . . . . .

3.3.2. Contribuci´on absoluta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3.4. Elementos suplementarios o ilustrativos

. . . . . . . . . . . . . . . . . . . . . . . .

3.5. F´ormulas del ACP(X, M, D)

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4. El an´alisis de correspondencias simples (ACS) como un ACP(X,M,D)

4.1. Equivalencia distribucional.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4.2. Representaci´on simult´anea.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5. Un programa para ejecutar los m´etodos en ejesprincipales

2

14

14

15

15

15

16

16

16

17

1.

Introducci´on

La “escuela francesa de an´alisis de datos” utiliza la geometr´ıa euclidiana multidimensional
para formalizar los m´etodos exploratorios multivariados b´asicos”. Estos m´etodos se utilizan para
encontrar significado a la informaci´on contenida en tablas de datos grandes, por medio de su rep-
resentaci´on gr´afica en espacios multidimensionales. Estas “gr´aficas” son abstractas pero permiten
encontrar significado a la gran cantidad de cifras de una tabla mediante sus proyecciones sobre
rectas y planos (Lebart, Morineau & Piron 1995).

En estas notas se muestra la l´ogica geom´etrica, apoyada con el algebra lineal, com´un a los
m´etodos en ejes principales. La simbolog´ıa que se adopta es la usual en muchos textos y es la
siguiente: las letras may´usculas en negrilla hacen referencia a matrices (A), la min´usculas en negrilla
a vectores (a), las letras may´usculas y min´usculas en it´alica a variables (escalares) (A, a). En el
caso de conjuntos se utiliza la misma letra may´uscula para indicar al conjunto y a su cardinalidad.

Como herramienta de c´alculo se utiliza el lenguaje estad´ıstico R (R Development Core Team
2008), junto con el paquete ade4: an´alisis de datos ecol´ogicos y ambientales (environnementales)
con procedimientos exploratorios euclidianos (Chessel, Dufour & Thioulouse 2004).

Obtenci´on e instalaci´on de R. Para que este documento tenga m´as vida se incluyen instruc-
ciones en R para realizar los c´alculos matriciales y obtener las gr´aficas. El s´ımbolo −→ indica hacer
clic en la palabra siguiente que debe aparecer en el men´u que se presenta. Obviamente las versiones
de R y los paquetes de este documento corresponden a la fecha de su edici´on y se podr´an encontrar
otras cuando se est´e leyendo. Este documento da un camino posible en cada caso y supone que el
lector utiliza el sistema operativo Windows, el buscador Google, y que dispone de una conexi´on a
Internet de banda ancha.

Abra Google

Clic en Mirror y escoja uno.

Clic en Windows −→ base −→ R-2.7.0-win32.exe
Guarde el archivo en un directorio, por ejemplo R −→ Ejecutar.
Responda a las preguntas del instalador (aceptando las sugerencias).

Geometr´ıa euclidiana en estad´ıstica: m´etodos en ejes principales

Campo El´ıas Pardo

3

Instalaci´on de paquetes. Si el equipo est´a en una red que requiere autenticaci´on de proxy se
debe hacer lo siguiente:

Ubicar el el cursor en el acceso directo R 2.7.0 −→ Bot´on derecho del rat´on −→ Propiedades.
Agregar en destino el nombre del proxy y http_proxy_user=ask. Por ejemplo en la red de
la Universidad Nacional - Bogot´a

http_proxy=http://proxy.unal.edu.co:8080/http_proxy_user=ask

Si R se arranca desde el men´u de inicio se debe hacer el mismo procedimiento.

Para este documento se requiere instalar en R los paquetes ade4, ade4TkGUI y scatterplot3d,

para instalarlos proceda as´ı:

Arranque R.

Clic en Paquetes (en la barra de men´u situada en la parte superior) −→ Instalar paquetes,
aparece lista de Mirrors.
En las redes que requieren autenticaci´on escriba el nombre del usuario −→ la tecla TAB ((cid:28))
contrase˜na −→ OK (R lo pide la primera vez en cada sesi´on cuando se desea instalar paquetes
desde la Web).

Seleccione un Mirror −→ OK, aparece lista de paquetes.
Selecciones los paquetes (con la tecla Control oprimida cuando se quieren varios) ade4,
ade4TkGUI y scatterplot3d −→ OK.

Ahora la consola de R espera comandos y los primeros usos, en la lectura de este texto, son
los de calculadora graficadora y calculadora matricial. R diferencia may´usculas y min´usculas, <-
indica asignaci´on (tambi´en se puede utilizar =) y el s´ımbolo # se utiliza como comentario (el texto
que aparece despu´es de # se presenta pero R no lo interpreta).

2. Representaciones geom´etricas de una matriz

Para facilitar la visualizaci´on de los conceptos geom´etricos se utiliza un ejemplo peque˜no,

aunque los m´etodos en ejes principales son ´utiles en tablas de datos grandes.

2.1. Ejemplo “caf´e”

En Duarte, Suarez, Moreno & Ortiz (1996) se presenta un experimento, donde se preparan
tasas de caf´e para detectar la influencia de la contaminaci´on del grano con ma´ız y cebada. El
experimento considera tres factores: agregado (sin, ma´ız, cebada), porcentaje del agregado (20 %
y 40 %) y grado de tostaci´on (clara, 8 minutos y oscura, 10 minutos). Entonces el experimento
consta de 10 tratamientos y sobre las tasas de caf´e de cada uno se miden propiedades qu´ımicas,
f´ısicas y sensoriales. En este ejemplo se utilizan solamente las variables f´ısicas: color, DA: densidad
aparente, EA: extracto acuoso (contenido de s´olidos solubles). Los valores obtenidos para los 10
tratamientos se muestran en la tabla 1.

Geometr´ıa euclidiana en estad´ıstica: m´etodos en ejes principales

Campo El´ıas Pardo

4

Lectura de la tabla 1 en R

Cree del directorio Cafe.

Copie la tabla en el bloc de notes.

Ed´ıtela si es necesario y gu´ardela en directorio Cafe como cafe.txt.

Arranque R.

Cambie al directorio Cafe: Clic en Archivo (en la barra de men´u) −→ Cambiar dir
Ubique el directorio −→ Aceptar.
Y <- read.table(’cafe.txt’,header=TRUE,row.names=1);Y

Y <- Y[-1]; Y # quitar la columna Cafes

Tabla 1: Caracter´ısticas f´ısicas de los caf´es

Caf´es
ExcelsoClaro
Claro40Maiz
Claro40Cebad
Claro20Maiz
Claro20Cebad
ExcelsoOscur
Oscuro40Maiz
Oscuro40Ceba
Oscuro20Maiz
Oscuro20Ceba

Etiqueta Color DA EA
25.0
41.0
40.0
33.0
32.0
28.0
43.0
42.0
36.0
35.0

385.1
481.3
422.6
444.3
368.7
346.6
422.6
403.0
368.7
368.7

298.0
361.0
321.0
335.0
314.0
186.0
278.0
238.0
226.0
210.0

CE

CM40
CC40
CM20
CC20
OE

OM40
OC40
OM20
OC20

La matriz de datos del ejemplo se identifica con Y. Las 10 filas (I = 10) se representan como
puntos en R3 (K = 3), imagen que se denomina nube de filas (figura 1). Las columnas de Y
representan a las variables, cada una se puede ver como un vector en R10. Esta geometr´ıa es
abstracta pero tiene las mismas propiedades de la geometr´ıa en el plano (R2) y el espacio (R3). Los
3 vectores (color, DA y EA) constituyen la nube de columnas. En este ejemplo las filas representas
“individuos” y las columnas variables continuas, entonces los vectores fila representados en RK
constituyen la nube de individuos y los vectores columna en RI la nube de variables.

2.2. Nube de individuos (filas) NI

En la nube de los I individuos en RK los ejes son las variables y las coordenadas de cada
punto-individuo son los valores de las variables que asume (fila de Y). En la figura 1 se muestra
en 3D la nube de los 10 individuos del ejemplo caf´e.

Construcci´on de la gr´afica de la figura 1 en R. Para lo concerniente al ejemplo Cafe se
supone que el lector tiene R abierto y que ha cambiando el directorio a la carpeta Cafe.

library(scatterplot3d) # carga el paquete
Y3D <- scatterplot3d(Y,main="Y") # grafica
cord2d<-Y3D$xyz.convert(Y)
text(cord2d,labels=rownames(Y), cex=0.8,col="blue",pos=4) # poner etiquetas

# convertir cordenadas 3D a 2D

Geometr´ıa euclidiana en estad´ıstica: m´etodos en ejes principales

Campo El´ıas Pardo

5

2.2.1. Centro de gravedad

Sobre la nube de individuos se definen el c
  • Links de descarga
http://lwp-l.com/pdf7785

Comentarios de: Geometría euclidiana en estadística: métodos en ejes principales (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios...
CerrarCerrar
CerrarCerrar
Cerrar

Tienes que ser un usuario registrado para poder insertar imágenes, archivos y/o videos.

Puedes registrarte o validarte desde aquí.

Codigo
Negrita
Subrayado
Tachado
Cursiva
Insertar enlace
Imagen externa
Emoticon
Tabular
Centrar
Titulo
Linea
Disminuir
Aumentar
Vista preliminar
sonreir
dientes
lengua
guiño
enfadado
confundido
llorar
avergonzado
sorprendido
triste
sol
estrella
jarra
camara
taza de cafe
email
beso
bombilla
amor
mal
bien
Es necesario revisar y aceptar las políticas de privacidad