Curso básico de R
Francesc Carmona
[email protected]
15 de febrero de 2007
El objetivo principal de este curso es proporcionar los elementos básicos para
empezar a trabajar con el lenguaje de programación R en el ámbito de la
Estadística.
Índice
1.
Introducción
7
1.1. R y S . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.2. Obtención y instalación de R . . . . . . . . . . . . . . . . 10
1.3. Paquetes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4. Documentación . . . . . . . . . . . . . . . . . . . . . . . . 12
1.5. Ayudas sobre R . . . . . . . . . . . . . . . . . . . . . . . . 16
2. Empezamos
17
Inicio de una sesión en R . . . . . . . . . . . . . . . . . . 17
2.1.
2.2. Una primera sesión . . . . . . . . . . . . . . . . . . . . . . 18
2.3. R como calculadora . . . . . . . . . . . . . . . . . . . . . . 19
2.4. Ayuda dentro del programa . . . . . . . . . . . . . . . . . 20
2.5.
Instalación de paquetes adicionales . . . . . . . . . . . . . 21
2.6. Usar R desde un editor . . . . . . . . . . . . . . . . . . . . 22
2.7. Un ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3. Objetos en R
24
3.1. ¿Qué objetos? . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.2. Tipos de objetos . . . . . . . . . . . . . . . . . . . . . . . 25
3.3. Atributos de los objetos . . . . . . . . . . . . . . . . . . . 28
3.4. Nombres para los objetos
. . . . . . . . . . . . . . . . . . 30
3.5. Operaciones aritméticas . . . . . . . . . . . . . . . . . . . 31
3.6. Operadores lógicos . . . . . . . . . . . . . . . . . . . . . . 33
3.7. Discretizar datos
. . . . . . . . . . . . . . . . . . . . . . . 35
. . . . . . . . . . . . . . . . . 36
3.8. Operaciones con conjuntos
4. Vectores
37
. . . . . . . . . . . . . . . . . . 37
4.1. Generación de secuencias
4.2. Generación de secuencias aleatorias
. . . . . . . . . . . . 39
4.3. Selección de elementos de un vector . . . . . . . . . . . . 40
4.4. Valores perdidos . . . . . . . . . . . . . . . . . . . . . . . . 41
4.5. Ordenación de vectores
. . . . . . . . . . . . . . . . . . . 43
4.6. Vectores de caracteres . . . . . . . . . . . . . . . . . . . . 44
4.7. Factores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
5. Arrays y matrices
47
5.1. Definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.2. Operaciones con matrices . . . . . . . . . . . . . . . . . . 51
5.3. Combinación de arrays . . . . . . . . . . . . . . . . . . . . 54
6. Data.frames
55
6.1. Definición . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
6.2. La familia apply . . . . . . . . . . . . . . . . . . . . . . . . 58
6.3. Tablas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6.4. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
7. Muchos objetos
63
7.1. Listas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
7.2. Los objetos que tenemos . . . . . . . . . . . . . . . . . . . 64
7.3. En resumen . . . . . . . . . . . . . . . . . . . . . . . . . . 68
8. Datos
70
8.1. Lectura de datos . . . . . . . . . . . . . . . . . . . . . . . 70
8.2. Guardar y leer datos . . . . . . . . . . . . . . . . . . . . . 71
. . . . . . . . . . . . . . . . . . . 72
8.3.
Importar datos de Excel
8.4. Exportar datos
. . . . . . . . . . . . . . . . . . . . . . . . 74
9. Gráficos
Identificación interactiva de datos
75
9.1.
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . 75
9.2. El comando plot . . . . . . . . . . . . . . . . . . . . . . . 76
9.3.
. . . . . . . . . . . . . 80
9.4. Múltiples gráficos por ventana . . . . . . . . . . . . . . . . 81
9.5. Datos multivariantes . . . . . . . . . . . . . . . . . . . . . 82
9.6. Boxplots . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
9.7. Un poco de ruido . . . . . . . . . . . . . . . . . . . . . . . 84
9.8. Dibujar rectas . . . . . . . . . . . . . . . . . . . . . . . . . 85
9.9. Más gráficos . . . . . . . . . . . . . . . . . . . . . . . . . . 86
9.10. Guardar los gráficos
. . . . . . . . . . . . . . . . . . . . . 87
10. Funciones
88
10.1. Definición de funciones . . . . . . . . . . . . . . . . . . . . 88
10.2. Argumentos . . . . . . . . . . . . . . . . . . . . . . . . . . 89
10.3. Scope . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
10.4. Control de ejecución . . . . . . . . . . . . . . . . . . . . . 92
10.5. Cuando algo va mal
. . . . . . . . . . . . . . . . . . . . . 95
10.6. Ejecución no interactiva . . . . . . . . . . . . . . . . . . . 97
Este curso está basado muy especialmente en el documento
Introducción al uso y programación del sistema estadístico R
de Ramón Díaz-Uriarte de la Unidad de Bioinformática del CNIO.
1.
Introducción
1.1. R y S
1.
Introducción
1.1. R y S
R, también conocido como ”GNU S”, es un entorno y un lenguaje para
el cálculo estadístico y la generación de gráficos. R implementa un
dialecto del premiado lenguaje S, desarrollado en los Laboratorios Bell
por John Chambers et al.
1.
Introducción
1.1. R y S
R, también conocido como ”GNU S”, es un entorno y un lenguaje para
el cálculo estadístico y la generación de gráficos. R implementa un
dialecto del premiado lenguaje S, desarrollado en los Laboratorios Bell
por John Chambers et al.
Para los no iniciados diremos que R provee un acceso relativamente
sencillo a una amplia variedad de técnicas estadísticas y gráficas.
1.
Introducción
1.1. R y S
R, también conocido como ”GNU S”, es un entorno y un lenguaje para
el cálculo estadístico y la generación de gráficos. R implementa un
dialecto del premiado lenguaje S, desarrollado en los Laboratorios Bell
por John Chambers et al.
Para los no iniciados diremos que R provee un acceso relativamente
sencillo a una amplia variedad de técnicas estadísticas y gráficas.
Para los usuarios avanzados se ofrece un lenguaje de programación
completo con el que añadir nuevas técnicas mediante la definición de
funciones.
1.
Introducción
1.1. R y S
R, también conocido como ”GNU S”, es un entorno y un lenguaje para
el cálculo estadístico y la generación de gráficos. R implementa un
dialecto del premiado lenguaje S, desarrollado en los Laboratorios Bell
por John Chambers et al.
Para los no iniciados diremos que R provee un acceso relativamente
sencillo a una amplia variedad de técnicas estadísticas y gráficas.
Para los usuarios avanzados se ofrece un lenguaje de programación
completo con el que añadir nuevas técnicas mediante la definición de
funciones.
”S ha modificado para siempre la forma en la que las personas
analizan, visualizan y manipulan los datos”(Association of Computer
Machinery Software System Award 1998 a John Chambers).
Actualmente, S y R son los dos lenguajes más utilizados en
investigación en estadística.
Actualmente, S y R son los dos lenguajes más utilizados en
investigación en estadística.
Los grandes atractivos de R/S son:
Actualmente, S y R son los dos lenguajes más utilizados en
investigación en estadística.
Los grandes atractivos de R/S son:
La capacidad de combinar, sin fisuras, análisis
”preempaquetados”(ej., una regresión logística) con análisis
ad-hoc, específicos para una situación: capacidad de manipular y
modificar datos y funciones.
Actualmente, S y R son los dos lenguajes más utilizados en
investigación en estadística.
Los grandes atractivos de R/S son:
La capacidad de combinar, sin fisuras, análisis
”preempaquetados”(ej., una regresión logística) con análisis
ad-hoc, específicos para una situación: capacidad de manipular y
modificar datos y funciones.
Los gráficos de alta calidad: visualización de datos y producción
de gráficos para papers.
Actualmente, S y R son los dos lenguajes más utilizados en
investigación en estadística.
Los grandes atractivos de R/S son:
La capacidad de combinar, sin fisuras, análisis
”preempaquetados”(ej., una regresión logística) con análisis
ad-hoc, específicos para una situación: capacidad de manipular y
modificar datos y funciones.
Los gráficos de alta calidad: visualización de datos y producción
de gráficos para papers.
La comunidad de R es muy dinámica, con gran crecimiento del
número de paquetes, e integrada por estadísticos de gran
renombre (ej., J. Chambers, L. Terney, B. Ripley, D. Bates, etc.).
Actualmente, S y R son los dos lenguajes más utilizados en
investigación en estadística.
Los grandes atractivos de R/S son:
La capacidad de combinar, sin fisuras, análisis
”preempaquetados”(ej., una regresión logística) con análisis
ad-hoc, específicos para una situación: capacidad de manipular y
modificar datos y funciones.
Los gráficos de alta calidad: visualización de datos y producción
de gráficos para papers.
La comunidad de R es muy dinámica, con gran crecimiento del
número de paquetes, e integrada por estadísticos de gran
renombre (ej., J. Chambers, L. Terney, B. Ripley, D. Bates, etc.).
Hay extensiones específicas a nuevas áreas como bioinformática,
geoestadística y modelos gráficos.
Actualmente, S y R son los dos lenguajes más utilizados en
investigación en estadística.
Los grandes atractivos de R/S son:
La capacidad de combinar, sin fisuras, análisis
”preempaquetados”(ej., una regresión logística) con análisis
ad-hoc, específicos para una situación: capacidad de manipular y
modificar datos y funciones.
Los gráficos de alta calidad: visualización de datos y producción
de gráficos para papers.
La comunidad de R es muy dinámica, con gran crecimiento del
número de paquetes, e integrada por estadísticos de gran
renombre (ej., J. Chambers, L. Terney, B. Ripley, D. Bates, etc.).
Hay extensiones específicas a nuevas áreas como bioinformática,
geoestadística y modelos gráficos.
Es un lenguaje orientado a objetos.
Actualmente, S y R son los dos lenguajes más utilizados en
investigación en estadística.
Los grandes atractivos de R/S son:
La capacidad de combinar, sin fisuras, an
Comentarios de: Curso básico de R (0)
No hay comentarios