PDF de programación - Introducción al uso y programación del sistema estadístico R

Imágen de pdf Introducción al uso y programación del sistema estadístico R

Introducción al uso y programación del sistema estadístico Rgráfica de visualizaciones

Actualizado el 8 de Mayo del 2021 (Publicado el 15 de Enero del 2017)
1.999 visualizaciones desde el 15 de Enero del 2017
2,0 MB
40 paginas
Creado hace 21a (01/01/2003)
Handouts

Tríptico R
A quick introduction to ESS

Introducción al uso y programación del

sistema estadístico R

Ram ón Díaz-Uriarte

[email protected]

http://bioinfo.cnio.es/˜rdiaz

Unidad de Bioinform ática

Centro Nacional de Investigaciones Oncol ógicas (CNIO)

Copyright c 2003 Ram ón Díaz-Uriarte

Uso y programación de R – p. 1/157

Uso y programación de R – p. 2/157

Programa

Introducción a R

Uso de R con XEmacs + ESS

Objetos en R

Importación/Exportación de datos

Gráficos en R

Programación en R

Ejemplos prácticos

"Horario"

1a mañana:

Introducción a R
Uso de R con XEmacs + ESS
Objetos en R

1a tarde:

Objetos en R
Gráficos en R

2a mañana:

Programación en R
Ejemplos prácticos

2a tarde:

Ejemplos prácticos

Uso y programación de R – p. 3/157

Uso y programación de R – p. 4/157

Introducción

Qué son R y S

Obtención e instalación de R

Uso de R con ESS y XEmacs

Dos ejemplos con tests de la t y
correlación

Qué son R y S

" R, also known as “GNU S”, is a language and environment for
statistical computing and graphics. R implements a dialect of
the award-winning language S, developed at Bell Laboratories
by John Chambers et al. For newcomers it provides easy
access to a wide variety of statistical and graphical techniques.
Advanced users are offered a full-featured programming
language with which to add functionality by defining new
functions." (Del folleto que teneis en las manos).
" [S] has forever altered the way how people analyze, visualize
and manipulate data" (Association of Computer Machinery
Software System Award 1998 a John Chambers).
Probablemente, S y R son los dos lenguajes más usados en
investigación en estadística. Otras virtudes en el folletillo.

Qué son R y S (II)

¿Cuánto cuesta R? R es "GNU S"

Uso y programación de R – p. 5/157

Uso y programación de R – p. 6/157

En pocas palabras, los grandes atractivos de R/S son:

La capacidad de combinar, sin fisuras, análisis
"preempaquetados" (ej., una regresión logística) con
análisis ad-hoc, específicos para una situación: capacidad
de manipular y modificar datos y funciones.
Los gráficos de alta calidad (revelaciones de la visualización
de datos y producción de gráficas para papers).

La comunidad de R es muy dinámica (ej., crecimiento en
número de paquetes), integrada por estadísticos de gran
renombre (ej., J. Chambers, L. Terney, B. Ripley, D. Bates, etc).
Extensiones específicas a áreas nuevas (bioinformática,
geoestadística, modelos gráficos).
Un lenguaje orientado a objetos.
Muy parecido a Matlab y Octave, y con sintaxis que recuerda a
C/C++.

Uso y programación de R – p. 7/157

R es la implementación GNU de S.
FIlosofía y objetivos del proyecto GNU: www.gnu.org.
Desarrollar un sistema completo y "libre" (donde "free is free
as in freedom, not free as in beer").
Algunos "GNUs famosos": Emacs, gcc, GNU/Linux, etc.
R se distribuye con licencia GNU GPL o General Public
License (ver http://www.gnu.org/licenses/gpl.html.)
La GPL no pone ninguna restricción al uso de R. Restringe su
distribución (ha de ser GPL).
R se obtiene por 0 euros en http://cran.r-project.org

Uso y programación de R – p. 8/157

Obtención e instalación de R

Paquetes adicionales

Depende del sistema operativo, pero todo se puede encontrar en
http://cran.r-project.org/bin.

R consta de un "sistema base" y de paquetes adicionales que
extienden la funcionalidad. Distintos "tipos" de paquetes:

Windows: bajar ("download") el ejecutable desde
http://cran.r-project.org/bin/windows/base. (por
ejemplo,
http://cran.r-project.org/bin/windows/base/rw1070.exe).
Ejecutar el fichero. Instalará el sistema base y los paquetes
recomendados.
GNU/Linux: dos opciones:

Obtener el R-x.y.z.tar.gz y compilar desde las fuentes, y
también bajar los paquetes adicionales e instalar. (Buena
forma de comprobar que el sistema tiene development
tools).
Obtener binarios (ej., *.deb para Debian, *.rpm para
RedHat, SuSE, Mandrake).

Los que forman parte del sistema base (ej. ctest).
Los que no son parte del sistema base, pero son
"recommended" (ej., survival, nlme). En GNU/Linux y
Windows ya (desde 1.6.0?) forman parte de la distribución
estándard.
Otros paquetes; ej., car, gregmisc, los paquetes de
Bioconductor (como multtest, etc). Estos necesitamos
seleccionarlos e instalarlos individualmente. Más adelante
veremos como.

Documentación sobre R (I)

Documentación sobre R (II)

Uso y programación de R – p. 9/157

Uso y programación de R – p. 10/157

Los "manuales" de R, incluidos en todas las instalaciones. Son:

Documentación general:

An introduction to R. De lectura requerida.
Writing R extensions.
R data import/export.
The R language definition.
R installation and administration.

A guide for the unwilling S user, de P. Burns. En
http://cran.r-project.org/doc/contrib/Burns-unwilling_S.pdf
o http://www.burns-stat.com/pages/tutorials.html. ¡Sólo 8
páginas!
R para principiantes, de E. Paradis. En
http://cran.r-project.org/other-docs.html o
http://cran.r-project.org/doc/contrib/rdebuts_es.pdf.
FAQ.
S Programming, de W. Venables y B. Ripley. (Ver también
http://www.stats.ox.ac.uk/pub/MASS3/Sprog.)

Uso y programación de R – p. 11/157

Uso y programación de R – p. 12/157

Documentación general:

Estadística:

Documentación sobre R (III)

S poetry de P. Burns. En
http://www.burns-stat.com/pages/spoetry.html.
Otros documentos en la página de J. Fox
(http://cran.r-project.org/doc/contrib/Fox-Companion/appendix.html),
ej. sobre Frames, etc).
El site de Paul Johnson
(http://lark.cc.ukans.edu/~pauljohn/R/statsRus.html).
Los libros azul , marrón y verde de Chambers et al.

Introductory statistics with R de P. Dalgaard.
An R and S-PLUS companion to applied regression, de J. Fox.
Modern applied statistics with S, 4th ed. de W. Venables y
B. Ripley. (Ver también
http://www.stats.ox.ac.uk/pub/MASS4.)
Practical regression and ANOVA using R de J. Faraway , en
http://cran.r-project.org/other-docs.html o
http://www.stat.lsa.umich.edu/~faraway/book/.
Otros documentos en
http://cran.r-project.org/other-docs.html.
S-PLUS 6.0 for Unix. Guide to statistics. Vol. I & II. En
http://www.insightful.com/support/documentation.asp?DID=3.

Documentación sobre R (IV)

Obteniendo ayuda sobre R

Uso y programación de R – p. 13/157

Uso y programación de R – p. 14/157

Mixed-effects models in S and S-PLUS, de J. Pinheiro y
D. Bates.
Regression modelling strategies, de F. Harrell.
Site con documentación sobre análisis para datos categóricos
(site para libro de A. Agresti Categorical data analysis.).
http://www.stat.ufl.edu/~aa/cda/cda.html.
Modeling survival data: extending the Cox model, de
T. M. Therenau y P. M. Grambsch.
Documentos misceláneos en página de J. Fox.
(http://cran.r-project.org/doc/contrib/Fox-Companion/appendix.html.)

Ayuda incluida con el programa (veremos más adelante).
FAQ.
Site de Paul Johnson
http://lark.cc.ukans.edu/~pauljohn/R/statsRus.html.
R-help. Peeero:
Las email lists son "searchable". Ver
http://cran.r-project.org/search.html; y
http://finzi.psych.upenn.edu/search.html permite
hacer las búsquedas no sólo sobre las listas de email sino
también sobre la documentación (incluyendo paquetes).

Uso y programación de R – p. 15/157

Uso y programación de R – p. 16/157

Antes de hacer preguntas comprobar si ya han sido
contestadas.
Las listas de ayuda son voluntarias: nadie puede exigir
soluciones. (¿Cuánto habeis pagado por R?)
Pausarse antes de gritar "bug": véase FAQ, sección 9. Pero si
hay un bug, por favor reportese.

Instalación de paquetes adicionales

Depende del sistema operativo

Windows:

Desde la "GUI" o desde la interfaz de XEmacs.
Desde R, con "install.packages()", como en GNU/Linux (ver
siguiente).

GNU/Linux:

"R CMD INSTALL paquete-x.y.z.tar.gz". Permite instalar
aunque uno no sea root (especificando el directorio).
Más cómodo, desde R, "install.packages()",
"update.packages()", etc. También permiten instalar no
siendo root (especificar lib.loc).

Inicio de una sesión de R

Una primera sesión

Uso y programación de R – p. 17/157

Uso y programación de R – p. 18/157

GNU/Linux:

Teclear "R" en una shell.
Iniciar R desde (X)Emacs (M-X R).

Windows:

Hacer click dos veces en el icono. Se abrirá "Rgui".
Desde una "ventana del sistema" ejecutar "Rterm";
parecido a "R" en Unix o Linux.
Iniciar R desde de XEmacs.

Se puede "customizar" como se inicia una sesión de R (ej.,
que paquetes se cargan, mensajes, etc). Ver sección 10.8 en
An introduction to R.

> rnorm(5) # 5 numeros aleatorios de una distribucion normal (mean= 0, sd = 1)
> ## Hemos dicho que "#" indica el comienzo de un comentario?
>
> ## Los números se producen, y se muestran (print).
>
> x <- rnorm(5) # asignamos esos números a un objeto (un vector) llamado x.
> summary(x) ## mostrar un "summary" de x (un summary "inteligente").
>
> ## o también:
> w <- summary(x)
> w
> print(w) # teclear w y print(y) producen el mismo resultado.
>
> ## summary(x) TAMBIEN es un objeto. (virtually) "everything is an object".

Uso y programación de R – p. 19/157

Uso y programación de R – p. 20/157

Ayuda incluida con el programa

Usando R con (X)Emacs

?rnorm

help.start()

?help.search

help.search("normal")

?apropos

apropos("normal")

?demo

demo(graphics); demo(persp); demo(lm.glm)

¿Por qué usar R con XEmacs?

Uso de scripts, mantenimiento de código ordenado y
comentado. "Buena práctica estadística". (ver también
loadhistory, savehistory).
Colorea sintaxis, completa paréntesis, etc.
Una interfaz común para R en distintos sistemas operativos.
Una interfaz común para otros paquetes estadísticos (ej., SAS,
XLispStat, Arc, etc) y numéricos (ej., Octave).
Pero aunque (X)Emacs es MUCHO más que un editor...

(X)Emacs con ESS no es "familiar" para los usuarios de
Windows (pero no tanto con las modificaciones de J. Fox).
Problemas no resueltos en interacción R, XEmacs,
Windows.

Uso y programación de R – p. 21/157

Uso y programación de R – p. 22/157

Alternativa principal en Windows es WinEdt
(http://www.winedt.com
  • Links de descarga
http://lwp-l.com/pdf1914

Comentarios de: Introducción al uso y programación del sistema estadístico R (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios...
CerrarCerrar
CerrarCerrar
Cerrar

Tienes que ser un usuario registrado para poder insertar imágenes, archivos y/o videos.

Puedes registrarte o validarte desde aquí.

Codigo
Negrita
Subrayado
Tachado
Cursiva
Insertar enlace
Imagen externa
Emoticon
Tabular
Centrar
Titulo
Linea
Disminuir
Aumentar
Vista preliminar
sonreir
dientes
lengua
guiño
enfadado
confundido
llorar
avergonzado
sorprendido
triste
sol
estrella
jarra
camara
taza de cafe
email
beso
bombilla
amor
mal
bien
Es necesario revisar y aceptar las políticas de privacidad