Actualizado el 21 de Marzo del 2018 (Publicado el 15 de Febrero del 2018)
1.642 visualizaciones desde el 15 de Febrero del 2018
16,5 MB
147 paginas
Creado hace 9a (20/08/2014)
An´alisis exploratorio y
visualizaci´on de datos
con R
Francisco Charte Ojeda
Copyright © 2014 Fancisco Charte Ojeda
Fotografia de portada Copyright © 2012 F. David Charte Luque
Este libro es un proyecto en curso. La presente versi´on fue gene-
rada el 20 de agosto de 2014. Para obtener la ´ultima versi´on
dirigirse a fcharte.com
Licensed under the Creative Commons Attribution-NonCommercial 3.0 Unported
License (the “License”). You may not use this file except in compliance with the
License. You may obtain a copy of the License at http://creativecommons.org/
licenses/by-nc/3.0. Unless required by applicable law or agreed to in writing,
software distributed under the License is distributed on an “as is” basis, without
warranties or conditions of any kind, either express or implied. See the License
for the specific language governing permissions and limitations under the License.
Primera edici´on, Agosto 2014
Contenidos
1
1.1
1.1.1
1.2
1.2.1
1.2.2
1.2.3
1.3
1.3.1
1.3.2
1.4
1.4.1
1.4.2
1.4.3
1.4.4
2
2.1
2.1.1
2.1.2
2.1.3
2.1.4
2.2
2.2.1
2.2.2
2.2.3
2.2.4
Herramientas de trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
7
R
Instalaci´on de R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Herramientas integradas en R
8
La consola de R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Una interfaz gr´afica b´asica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
R como lenguaje de script
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
RStudio
13
Instalaci´on de RStudio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Introducci´on al IDE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Tareas habituales
15
Acceso a la ayuda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Establecer la ruta de trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Guardar y recuperar el espacio de trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Cargar e instalar paquetes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Tipos de datos (I) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
23
Tipos de datos simples
Clase y tipo de un dato . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Almacenamiento de valores en variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Comprobar el tipo de una variable antes de usarla . . . . . . . . . . . . . . . . . . . . . . . 25
Objetos en el espacio de trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
27
Vectores
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Creaci´on de vectores
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Acceso a los elementos de un vector
Generaci´on de vectores aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Operar sobre vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.3 Matrices
2.3.1
2.3.2
2.3.3
32
Creaci´on de una matriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Acceso a los elementos de una matriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
Columnas y filas con nombre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4
Factors
36
3
3.1
3.1.1
3.1.2
3.1.3
3.1.4
3.1.5
3.2
3.2.1
3.2.2
3.2.3
4
4.1
4.1.1
4.1.2
4.2
4.2.1
4.2.2
4.3
4.3.1
4.3.2
4.4
4.4.1
4.4.2
4.4.3
5
5.1
5.2
5.3
5.4
6
6.1
6.1.1
Tipos de datos (II) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
39
Data frames
Creaci´on de un data frame . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
Acceder al contenido de un data frame
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Agregar filas y columnas a un data frame . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Nombres de filas y columnas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Data frames y la escalabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
49
Listas
Creaci´on de una lista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Acceso a los elementos de una lista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
Asignaci´on de nombres a los elementos
Carga de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
57
Datos en formato CSV
Lectura de archivos CSV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
Exportaci´on de datos a CSV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
61
Importar datos desde Excel
XLConnect . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
xlsx . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
65
Importar datos en formato ARFF
foreign . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
RWeka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
67
Importar datos de otras fuentes
Compartir datos mediante el portapapeles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
Obtener datos a partir de una URL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
Datasets integrados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
Tratamiento de datos ausentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
Problem´atica
Detectar existencia de valores ausentes
Eliminar datos ausentes
Operar en presencia de datos ausentes
71
72
73
74
An´alisis exploratorio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
75
Informaci´on general
Exploraci´on del contenido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
6.2
6.2.1
6.2.2
6.2.3
6.3
6.3.1
6.3.2
6.3.3
6.4
6.4.1
78
Estad´ıstica descriptiva
Funciones b´asicas
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
Aplicaci´on a estructuras complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
La funci´on describe() . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
84
Agrupamiento de datos
Tablas de contigencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
Discretizaci´on de valores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
Agrupamiento y selecci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
89
Ordenaci´on de datos
Generaci´on de rankings . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
6.5
Particionamiento de los datos
92
7
7.1
7.1.1
7.1.2
7.1.3
7.1.4
7.1.5
7.2
7.2.1
7.2.2
7.2.3
7.2.4
7.3
7.3.1
7.3.2
7.4
7.4.1
8
8.1
8.1.1
8.1.2
8.1.3
8.1.4
8.1.5
8.2
8.2.1
8.2.2
8.2.3
8.2.4
Gr´aficos con R (I) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
95
Gr´aficos b´asicos
Gr´aficas de puntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
Gr´aficas de cajas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
Gr´aficas de l´ıneas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
Gr´aficas de barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
Gr´aficas de sectores (circular) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
108
Histogramas
Histograma b´asico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
Personalizaci´on de divisiones y colores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
Curva de densidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Histogramas de objetos complejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
113
C´omo agrupar varios gr´aficos
Gr´aficas cruzadas por atributos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
Composiciones de m´ultiples gr´aficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
118
C´omo guardar los graficos
Animaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
Gr´aficos con R (II) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
123
Introducci´on a ggplot2
Nubes de puntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
Gr´aficas de l´ıneas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
A˜nadir curva de regresi´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
Curva de densidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
Composici´on de m´ultiples gr´aficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
126
Otras posibilidades gr´aficas
Dibujo de funciones y polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
c
Comentarios de: Análisis exploratorio y visualización de datos con R (0)
No hay comentarios