Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 1 de 48
Regresar
Full Screen
Cerrar
Abandonar
Uso del programa estadístico R
“Una introducción para principiantes”
José Antonio Palazón Ferrando
[email protected]
Francisco Alonso Sarría
[email protected]
INUAMA
Universidad de Murcia.
Murcia, 16 de julio, 2002
R: Una introducción para principiantes.
A modo de introducción: La palabra y el icono.
Conceptos elementales de R: operaciones, objetos y funciones.
Entrada de datos y exportación de resultados.
Funciones de usuario: R al máximo rendimiento.
Documentación e información adicional.
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 2 de 48
Regresar
Full Screen
Cerrar
Abandonar
Notaciones, lenguajes y sintaxis
¡Sumemos todos los datos!
Para xi =dato i–ésimo; suma =
nX
i=1
xi
x<-c(3.4, 4.6, ..., 9.1, 2.8)
suma<-sum(x)
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 3 de 48
Regresar
Full Screen
Cerrar
Abandonar
¿Qué objetivos tenemos?
Conocer la sintaxis básica de R.
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 4 de 48
Regresar
Full Screen
Cerrar
Abandonar
Aprender a trabajar con R de forma eficiente: individual y colec-
tivamente.
Analizar las ventajas del uso de R.
Aprender las técnicas de automatización de tareas con R.
Aprender a utilizar R para seguir aprendiendo.
Análisis de datos: una perspectiva personal
Objetivos: Docencia e Investigación.
Programas: BMDP, SPAD, Cornell Ecology Programs, Statgraphics,
Systat, Statistix, MVEP, etc.
Lenguajes y ficheros: BASIC (8000, gw, true), FORTRAN, Pascal, awk,
etc.
Otras herramientas: hojas de cálculo, bases de datos, SIG, etc.
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 5 de 48
Regresar
Full Screen
Cerrar
Abandonar
Primeros pasos: representación gráfica de datos
> plot(1:10, 10:1, pch=1:10, cex=1:10, col=1:10)
> hc <- hclust(eurodist)
> plot(hc,hang=-1)
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 6 de 48
Regresar
Full Screen
Cerrar
Abandonar
Concretando: ¿qué es R?
R es un entorno integrado para trabajar con el lenguaje S, que pro-
porciona:
Un conjunto coherente y extensivo de instrumentos para el
análisis y el tratamiento estadístico de datos.
Un lenguaje para expresar modelos estadísticos y un instrumen-
to para manejar modelos lineales y no lineales.
Un conjunto de utilidades gráficas para el análisis de datos y la
visualización en cualquier estación gráfica o impresora
Un eficiente lenguaje de programación orientada a objetos, que
crece fácilmente merced a la comunidad de usuarios.
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 7 de 48
Regresar
Full Screen
Cerrar
Abandonar
¿Qué puedo hacer con R?
En la distribución base se incluyen herramientas para:
Descripción, tabulación y representación gráfica de datos.
Inferencia estadística. Regresión y análisis de la varianza. Mode-
los lineales generalizados.
Técnicas multivariantes: ordenación y clasificación.
Series temporales. Análisis de supervivencia.
Calculo matricial. Resolución de sistemas de ecuaciones lineales.
Cálculo numérico. Interpolación.
Pueden encontrarse bibliotecas para:
Krigeado, interpolación espacial, estadística bayesiana, técnicas
de bootstrap, análisis discriminante, . . .
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 8 de 48
Regresar
Full Screen
Cerrar
Abandonar
Una sesión de trabajo
R puede utilizarse para distintas plataformas:
Linux, Mac, WinX, ...: hay algunas diferencias.
Para iniciar R basta con seleccionarlo en el menú de trabajo:
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 9 de 48
Regresar
Full Screen
Cerrar
Abandonar
Para terminar una sesión de R, adecuadamente, debe utilizarse
la función q(), que obliga a determinar si: queremos abandonar
los datos y el histórico de ordenes, lo deseamos grabar o cance-
lamos el abandono.
Primeros pasos
Es muy importante tener en cuenta los siguiente aspectos para com-
prender el funcionamiento de R:
R dialoga utilizando expresiones (que se escriben después del
prompt).
>3
el prompt es el signo “mayor que”, la expresión 3
[1] 3 el valor entre corchetes indica que el siguiente es
el primer valor que se produce tras evaluar la ex-
presión, ¡3 es obviamente el resultado!
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 10 de 48
Regresar
Full Screen
Cerrar
Abandonar
Primeros pasos (II)
R realiza una evaluación sistemática de una expresión, algunas
son verdaderamente complejas, y devuelve el resultado o efectúa
las operaciones indicadas en la expresión.
>3*2+1
>sqrt(3*3)
El asterisco indica producto ¿podemos
prever el resultado?
“sqrt” es la abreviatura de square root:
¿cabe imaginar el resultado?
>plot(3)
El primer gráfico: ¿qué significa?
>a <- 3
Hemos asignado el valor 3 al objeto a
¿cómo podemos comprobarlo?
>a <- 3 + 2
¿qué tenemos ahora en a?
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 11 de 48
Regresar
Full Screen
Cerrar
Abandonar
Primeros pasos (y III)
Resulta esencial saber que resultado es razonablemente espera-
ble de la evaluación de una expresión.
R detecta los errores de sintaxis.
>3 2+1 Error: el signo del producto no puede omitirse
¿cómo responde el sistema?
>3*2+
Error: la expresión está incompleta ¿qué sucede?
R no detecta los errores conceptuales: hace lo que pedimos y no
lo que deseamos.
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 12 de 48
Regresar
Full Screen
Cerrar
Abandonar
Una sesión de trabajo sencilla.
>x <- rnorm(25)
>a <- rnorm(25)
>y <- x + a/10
creamos un vector de 25 elementos con valores aleatorios normales
creamos otro vector de 25 elementos
suma ponderada de los vectores anteriores, elemento a elemento
>rm(a)
elimina el vector a
estadísticos de x
estadísticos de y
>summary(x)
>summary(y)
>mlyx <- lm(yvx) análisis de regresión para x, independiente, y dependiente
>plot (x,y)
representación de los puntos analizados
>abline(mlyx)
>summary(mlyx)
>plot(mlyx)
representación de la recta obtenida
presentación de los resultados del análisis
representación de los distintos elementos resultantes del análisis
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 13 de 48
Regresar
Full Screen
Cerrar
Abandonar
Ayuda en R
help(), ?: Proporciona ayuda sobre una palabra clave
>help(mean)
>? mean
>? "+"
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 14 de 48
Regresar
Full Screen
Cerrar
Abandonar
help.start(): Inicia consulta de la ayuda desde un navegador.
help.search(): Relaciona los objetos que contienen la cadena
dada.
>help.search("plot")
apropos(): Muestra la relación de objetos disponibles con una
cadena dada.
>help.search("plot")
Más ayuda en R
example(): Muestra los resultados propuestos en el ejemplo de
la ayuda.
>example(persp)
demo(): Muestra “demos” disponibles o la presenta.
>demo(graphics)
library(): Muestra la relación de bibliotecas de funciones dis-
ponibles.
data(): Muestra la relación de datos de ejemplo disponibles.
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 15 de 48
Regresar
Full Screen
Cerrar
Abandonar
La sintaxis de S
La sintaxis de S, y por extensión de R, se basa en expresiones, están
compuesta, opcionalmente por:
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 16 de 48
Regresar
Full Screen
Cerrar
Abandonar
Valores: numéricos, lógicos, o cadenas de caracteres
Variables: Representan a los objetos que se asignaron.
Asignación: asigna el valor de una expresión a una variable.
Operadores: que relacionan elementos de la expresión.
Funciones: Efectúan una acción.
Valores
En R podemos utilizar valores, o tipos:
Lógicos:
Enteros:
TRUE, FALSE, T, F
-10, 1, 1000, ...
Precisión doble: -10.1, 6.02310e24, ..., -Inf, Inf, NaN
Complejos:
1+3i, 1+0i, 9i, ...
Carácter:
"Hola", "Enero", "sin(x)", "pino", ...
Perdidos:
Na
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 17 de 48
Regresar
Full Screen
Cerrar
Abandonar
Variables
Los datos ser representan por una variable asociada a un nom-
bre. El nombre de una variable debe empezar por una letra, no
se admite el signo: “ ”, y es sensible a mayúsculas.
Tipos de variables: dependen del contenido, número, valores
lógicos, . . . , estructuras complejas.
h<-hist(x)
str(h)
List of 7 $ breaks : num [1:4] -6e-07 2e+00 4e+00 6e+00
$ counts : int [1:3] 2 2 2
$ intensities: num [1:3] 0.167 0.167 0.167
$ density : num [1:3] 0.167 0.167 0.167
$ mids : num [1:3] 1 3 5
$ xname : chr "x"
$ equidist : logi TRUE
-- attr(*, ¸class")= chr "histogram"
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 18 de 48
Regresar
Full Screen
Cerrar
Abandonar
Asignación
El resultado de una expresión puede ser almacedando en una va-
riable mediante una asignación.
La asignación puede realizarse utilizando los operadores “<-”,
“->
”, y “ ” (este último en desuso):
>x <- c(4,6,7,8,5,6)
>mean(x) ->mx
Puede realizarse una doble asignación, o asignar sobre la mar-
cha:
>c(4,6,7,8,5,6) ->x ->y
>2*(a<-3+3)
Puede asignarse sobre una variable utilizada en la expresión:
>i <- i+1
>x <- x/2
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 19 de 48
Regresar
Full Screen
Cerrar
Abandonar
Operadores
+,−,∗, /
suma, resta, producto, cociente
% %, %/ %,ˆ módulo, cociente entero, potencia
==, ! =, !
igual, distinto, no
>, >=, <, <= mayor que, mayor o igual que, menor
que, menor o igual que
|,||, &, &&
o, o, y, y
:
% ∗ %
generar una serie
producto de dos matrices
Página www
Página de Abertura
Contenido
JJ
J
II
I
Página 20 de 48
Regresar
Full Screen
Cerrar
Abandonar
Jerarquía en los operadores
Los operadores toman el operando de la izqui
Comentarios de: Uso del programa estadístico R - Una introducción para principiantes (0)
No hay comentarios