Gr´aficos Estad´ısticos con R
Juan Carlos Correa y Nelfi Gonz´alez
Posgrado en Estad´ıstica
Universidad Nacional-Sede Medell´ın
e-mail:
[email protected]
2002
´Indice General
1 Generalidades
1.1
6
6
Introducci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
1.1.1 Cu´ando presentar los datos ?
. . . . . . . . . . . . . .
8
1.1.2 Equipo y software para gr´aficos . . . . . . . . . . . . .
9
1.2 Percepci´on gr´afica . . . . . . . . . . . . . . . . . . . . . . . . .
1.3 Prop´osito de un gr´afico . . . . . . . . . . . . . . . . . . . . . .
9
1.4 Elementos de un Gr´afico . . . . . . . . . . . . . . . . . . . . . 11
1.5 Recomendaciones Generales para Elaborar un Gr´afico . . . . . 11
1.6 Gr´aficos distorsionados . . . . . . . . . . . . . . . . . . . . . . 14
1.7 Pecados comunes en gr´aficos t´ecnicos . . . . . . . . . . . . . . 14
2 Gr´aficos Estad´ısticos Univariables en R
15
2.1 Elementos graficadores en R . . . . . . . . . . . . . . . . . . . 15
2.1.1 Funciones para Especificar Devices
. . . . . . . . . . . 15
2.1.2 Algunos Par´ametros para Graficar en R . . . . . . . . 15
2.1.3 Gr´aficos Unidimensionales . . . . . . . . . . . . . . . . 16
. . . . . . . . . . . . . . . . 16
2.1.4 Gr´aficos Bidimensionales
2.1.5 Gr´aficos Tridimensionales
. . . . . . . . . . . . . . . . 17
. . . . . . . . 17
2.1.6 M´ultiple Gr´aficos por P´agina (Ejemplo)
2.2 Gr´aficos Univariables . . . . . . . . . . . . . . . . . . . . . . . 17
´Arboles de Tallo y Hoja . . . . . . . . . . . . . . . . . 17
2.2.1
2.2.2 Boxplot o Caja de Tukey . . . . . . . . . . . . . . . . . 18
2.2.3 Histogramas . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.4 Gr´aficos de Puntos . . . . . . . . . . . . . . . . . . . . 41
2.2.5 Gr´aficos Circulares (Pie Charts) . . . . . . . . . . . . . 44
2.2.6 Gr´afico de barras . . . . . . . . . . . . . . . . . . . . . 51
2.3 Gr´aficos especiales en R . . . . . . . . . . . . . . . . . . . . . 59
2.3.1 Gr´afico de coordenadas polares “Polar plot” . . . . . . 59
2
2.3.2 Carta o Gr´afico de Eventos
. . . . . . . . . . . . . . . 66
2.3.3 Pir´amide Poblacional . . . . . . . . . . . . . . . . . . . 68
3 Gr´aficos Multivariables en R
78
3.1 Gr´aficos de Dispersi´on . . . . . . . . . . . . . . . . . . . . . . 78
3.2 Matrices de Dispersi´on . . . . . . . . . . . . . . . . . . . . . . 79
3.3 Gr´aficos de independencia . . . . . . . . . . . . . . . . . . . . 92
3.4 Otros gr´aficos . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
3.4.1 Curvas de Andrews . . . . . . . . . . . . . . . . . . . . 99
3.4.2 Gr´afico de Estrellas (stars plots) . . . . . . . . . . . . . 102
4 Gr´aficos para Modelos Estad´ısticos en R
110
4.1 Regresi´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
4.1.1 Gr´aficos en Regresi´on Lineal Simple . . . . . . . . . . . 110
4.2 Algunos Ajustes de Curvas por Regresi´on no Param´etrica . . . 114
4.2.1 Ajuste Spline . . . . . . . . . . . . . . . . . . . . . . . 114
4.2.2 Regresi´on Kernel
. . . . . . . . . . . . . . . . . . . . . 122
4.2.3 LOESS . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
4.3 An´alisis de Componentes Principales
. . . . . . . . . . . . . . 132
4.4 An´alis de Agrupamientos (Clusters) . . . . . . . . . . . . . . . 153
4.4.1 Funciones clusplot, clusplot.default y clusplot.partition
154
4.4.2 Funci´on hclust . . . . . . . . . . . . . . . . . . . . . . 161
4.4.3 Funci´on rect.hclust . . . . . . . . . . . . . . . . . . 169
4.5 Series de tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . 172
4.5.1 Funci´on plot.ts . . . . . . . . . . . . . . . . . . . . . 174
4.5.2 Funciones acf, pacf, ccf . . . . . . . . . . . . . . . 176
4.5.3 Funci´on lag.plot . . . . . . . . . . . . . . . . . . . . 191
4.5.4 Funci´on stl . . . . . . . . . . . . . . . . . . . . . . . . 192
5 Gr´aficos Condicionales
200
5.1 Gr´aficas Trellis
. . . . . . . . . . . . . . . . . . . . . . . . . . 200
5.2 Gr´afico de Perfil . . . . . . . . . . . . . . . . . . . . . . . . . . 208
6 Otros Gr´aficos
212
6.1 Gr´afico de una serie . . . . . . . . . . . . . . . . . . . . . . . . 212
6.2 Gr´aficos de control univariados para el centramiento . . . . . . 213
6.3 Cartas de control multivariado . . . . . . . . . . . . . . . . . . 216
3
6.4 Graficando una elipse . . . . . . . . . . . . . . . . . . . . . . . 219
6.5 Graficando elipses de confianza del (1 − α)100% para un con-
junto de n observaciones de una distribuci´on normal bivariada 224
6.6 Opciones especiales . . . . . . . . . . . . . . . . . . . . . . . . 230
. . . . . . . . . . . . . . . . 230
6.6.1 Guardar y llamar gr´aficos
6.6.2
funci´on layout (especificaci´on de arreglos gr´aficos com-
plejos) . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
6.6.3
Superposici´on de curvas a un histograma . . . . . . . . 245
6.6.4 Efectos de sombreado en gr´aficos tridimensionales . . . 247
7 Ap´endices
250
7.1 Par´ametros gr´aficos (funci´on par) . . . . . . . . . . . . . . . . 250
7.2 Especificaci´on de color (funci´on hsv)
. . . . . . . . . . . . . . 259
7.3 Funci´on curve . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
7.4 Funci´on points . . . . . . . . . . . . . . . . . . . . . . . . . . 264
7.5 Funci´on lines . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
7.6 Funci´on abline . . . . . . . . . . . . . . . . . . . . . . . . . . 273
7.7 Funci´on contour . . . . . . . . . . . . . . . . . . . . . . . . . 277
7.8 Funci´on persp . . . . . . . . . . . . . . . . . . . . . . . . . . . 284
7.9 Funci´on mtext . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
7.10 Funci´on text . . . . . . . . . . . . . . . . . . . . . . . . . . . 294
4
Prefacio
La presentaci´on de datos estad´ısticos por medio de gr´aficos es considerada
una tarea importante en el proceso de comunicaci´on de los datos. Esto no lo
desconocen los investigadores a muy diferentes niveles. Usualmente cuando
alguien recibe en sus manos un documento con gr´aficos, la primer mirada se
dirige a ´estos. A pesar de la reconocida importancia este proceso no siempre
se realiza de la mejor manera.
Estas notas presentan gran variedad de gr´aficos de uso corriente en la
disciplina estad´ıstica y que han probado ser efectivos en la representaci´on
de datos. Muchos ejemplos aqu´ı presentados est´an basados en los aportes
de diferentes usuarios que han publicado sus rutinas en la lista r-help del
CRAN, a los cuales queremos hacer un merecido reconocimiento.
Esperamos que el lector aprecie el poder de una buena gr´afica, tanto como
los que trabajamos en el ´area estad´ıstica y que la lectura de este documento
le ayude a utilizar R en su elaboraci´on.
5
Cap´ıtulo 1
Generalidades
“Un gr´afico puede valer m´as que mil palabras,
pero puede tomar muchas palabras para hacerlo”
John Tukey
1.1
Introducci´on
La presentaci´on de datos mediante gr´aficos es algo que se realiza a diario
y en forma casi natural por personas de las m´as diferentes profesiones. La
revista americana LIFE ten´ıa como consigna “Una foto vale m´as que mil
palabras”. La capacidad de visualizaci´on del hombre hace que esto sea casi
cierto. En comparaci´on con otras formas de presentaci´on de los datos, los
gr´aficos nos permiten, de una mirada, comprender el comportamiento de los
datos, a´un de datos muy complejos, por lo tanto ahorran tiempo al analista
de informaci´on. Los gr´aficos estad´ısticos nos permiten usar nuestra habilidad
para visualmente procesar informaci´on de un gr´afico. Esto nos permite hacer
juicios respecto a la variabilidad, escala, patrones y tendencias de los datos.
Wainer (1990) dice:
“En m´as de 200 a˜nos desde el desarrollo inicial de las t´ecnicas
gr´aficas, hemos adquirido alg´un conocimiento en sus usos, nacida
de la experiencia.”
Es desafortunado el poco ´enfasis que la mayor´ıa de textos en estad´ıstica
ponen en la parte gr´afica. Unos pocos (Moore, 1979; Campbell, 1990) hacen
´enfasis en los errores de interpretaci´on en la presentaci´on de gr´aficos en los
6
medios de comunicaci´on, pero la gran mayor´ıa, en especial los que se utilizan
como texto de clase, s´olo presentan algunos gr´aficos m´as como un material
extra que como una herramienta fundamental en el trabajo aplicado.
William Playfair es considerado el pionero de la estad´ıstica gr´afica (Costigan-
Eaves y Macdonald-Ross, 1990). Su trabajo en gr´aficas lo realiz´o durante
m´as de 36 a˜nos. El actu´o basado en los siguientes principios que ´el mismo
estableci´o:
1. El m´etodo gr´afico es una forma de simplificar lo tedioso y lo complejo.
2. Los hombres ocupados necesitan alguna clase de ayuda visual.
3. Un gr´afico es m´as accesible que una tabla.
4. El m´etodo gr´afico es concordante con los ojos.
5. El m´etodo gr´afico ayuda al cerebro, ya que permite entender y memo-
rizar mejor.
Wainer (1990) se˜nala que entre la gente es muy com´un pensar que si un
gr´afico es bueno, ´este deber´a ser totalmente comprensible sin ninguna ayuda
adicional. Este pensamiento es limitante. Los gr´aficos “buenos” los divide
en dos categor´ıas:
1. Un gr´afico fuertemente bueno muestra todo lo que queremos conocer
s´olo con mirarlo.
2. Un gr´afico d´ebilmente bueno nos muestra lo que necesitamos conocer
observ´andolo, una vez sepamos como mirarlo.
Una buena descripci´on puede transformar un gr´afico d´ebilmente bueno
en uno fuertemente bueno. Debemos siempre buscar esta transformaci´on
cuando sea posible. Una buena descripci´on informa al lector y obliga al que
produce el gr´afico a pensar porqu´e y c´omo est´a presentando el gr´afico.
Una ventaja de los gr´aficos es que pueden mostrarnos cosas que de otra
forma hubiese sido muy dif´ıcil o imposible. Esta es una de las razones por
las cuales casi todo an´alisis estad´ıstico comienza con gr´aficos.
7
1.1.1 Cu´ando presentar los datos ?
No es extra˜no ver reportes en los cuales se incluyan gr´aficos donde s´olo se
presentan dos n´umeros, por ejemplo, porcentaje de hombres vs. porcentaje
de mujeres, esto a veces en un gr´afico de torta (pie). Si el conjunto de datos
es menor de 20, est
Comentarios de: Gráficos Estadísticos con R (0)
No hay comentarios