PDF de programación - Introduccin al lenguaje R

Imágen de pdf Introduccin al lenguaje R

Introduccin al lenguaje Rgráfica de visualizaciones

Publicado el 26 de Marzo del 2020
69 visualizaciones desde el 26 de Marzo del 2020
176,8 KB
14 paginas
Creado hace 14a (30/03/2006)
Emmanuel Paradis 2003. R para Principiantes

http://cran.r-project.org/doc/contrib/rdebuts_es.pdf


Tom Short 2004. R Reference Card


http://cran.r-project.org/doc/contrib/Short-refcard.pdf

Análisis Exploratorio y Confirmatorio de Datos de Experimentos de Microarrays TP 1
Dpto. de Matemática - Instituto de Cálculo 1er. Cuatr. 2006 Dra. Diana M. Kelmansky


Trabajo Práctico 1: Introducción al lenguaje R



A partir de la sección 1.2 esta guía debe leerse ejecutando simultáneamente en R
todos los comandos indicados.

W. J. Owen 2006. The R Guide

http://cran.r-project.org/doc/contrib/Owen-TheRGuide.pdf

1



1.1 Un poco de historia

R es un conjunto de programas integrados para manejo de datos, simulaciones, cálculos y
realización de gráficos. Es además un lenguaje de programación orientado a objetos.
R es una implementación libre, independiente, open-source del lenguaje de programación
S que actualmente es un producto comercial llamado S-PLUS y es distribuido por
Insightful Corporation. El lenguaje S, que fue desarrollado a mediados de los años 70 en
Bell Labs (de AT&T y actualmente Lucent Technologies). Originalmente un programa para
el sistema operativo Unix, R ahora puede obenerse también en versiones para Windows y
Macintosh y Linux. A pesar de que hay diferencias menores entre R y S-PLUS (la
mayoría en la interfase gráfica), son esencialmente idénticos.
El proyecto R fue iniciado por Robert Gentleman y Ross Ihaka (de donde se deriva “R”)
del Statistics Department, University of Auckland, en 1995.
Acualmente R es mantenido por un grupo internacional de desarrolladores voluntarios:
Core development team.

La página web del proyecto R es http://www.r-project.org. Este es el sitio principal
sobre información de R: documentación, FAQs (FAQ son las iniciales de Frequently
Asked Questions, o sea preguntas más frecuentes).

Para bajar el sofware directamente se puede visitar el Comprehensive R Archive Network
(CRAN): http://cran.us.r-project.org/


La versión actual de R es 2.2.1.

Para analizar los datos de microarreglos utilizaremos el software R y programas
específicos desarrollados por BioConductor. Este también está integrado por

2

Análisis Exploratorio y Confirmatorio de Datos de Experimentos de Microarrays TP 1
Dpto. de Matemática - Instituto de Cálculo 1er. Cuatr. 2006 Dra. Diana M. Kelmansky

desarrolladores voluntarios de software para el análisis y comprensión de datos de
genómica, especialmente microarreglos, y se inició a mediados de 2001
( http://www.bioconductor.org/whatisit )

1.2 Iniciando y cerrando R

La forma más fácil de usar R es en forma interactiva mediante la línea de comandos. Una
vez instalado hay que hacer un doble click en el ícono de R (en Unix/Linux, se escribe R
desde el símbolo de comandos (command prompt)). Cuando R se inicia, aparece la
ventana del programa “Gui” (graphical user interface) con un mensaje de apertura

R : Copyright 2005, The R Foundation for Statistical Computing
Version 2.2.1 (2005-12-20 r36812)
ISBN 3-900051-07-0

R is free software and comes with ABSOLUTELY NO WARRANTY.
You are welcome to redistribute it under certain conditions.
Type 'license()' or 'licence()' for distribution details.

R is a collaborative project with many contributors.
Type 'contributors()' for more information and
'citation()' on how to cite R or R packages in publications.

Type 'demo()' for some demos, 'help()' for on-line help, or
'help.start()' for an HTML browser interface to help.
Type 'q()' to quit R.

Debajo del mensaje de apertura en la Consola de R se encuentra el “prompt” que es el
símbolo > (“mayor”).


>


La mayoría de las expresiones en R se escriben directamente a continuación del “prompt”
en la Consola de R.

Si se escribe e intenta ejecutar un comando que se ha escrito en forma incompleta, el
programa presenta un “+” que es el prompt de continuación.

Comencemos agregando a R los paquetes específicos de microarreglos de la página de
BioConductor: http://www.bioconductor.org/download/.

La forma más sencilla de instalar los paquetes es utilizando el script de instalación
biocLite.R (en la próxima sección veremos que es un script, aquí simplemente lo
utilizamos). Así es como se usa

En el prompt de se escribe

> source("http://www.bioconductor.org/biocLite.R")
> biocLite()

Análisis Exploratorio y Confirmatorio de Datos de Experimentos de Microarrays TP 1
Dpto. de Matemática - Instituto de Cálculo 1er. Cuatr. 2006 Dra. Diana M. Kelmansky



Ya tenemos instalados los programas.


3

variables:

funciones

• numéricas (integer, double, complex)
• de caracteres
• lógicas



Para salir de R, se escribe q() o se utiliza la opción Exit que se encuentra abajo en el
menú File.

1.3 Tipos de objetos en R

Los objetos primitivos o atómicos de R son:



Presentaremos primero ejemplos de los distintos tipos de variables y veremos más adelante
cómo se pueden construir objetos más complejos como vectores, matrices y listas.
Presentaremos funciones incorporadas en el R y finalmente veremos cómo como escribir
las propias funciones.


1.3.1 Variables


> a <- 49 # <- operador de asignación
# no se pueden poner espacios entre el “menor” y el “menos”
# se asigna el valor 49 a la variable a

Análisis Exploratorio y Confirmatorio de Datos de Experimentos de Microarrays TP 1
Dpto. de Matemática - Instituto de Cálculo 1er. Cuatr. 2006 Dra. Diana M. Kelmansky


4



> a <- 49 # variable numérica
> class(a)
[1] "numeric"
> a
[1] 49
> sqrt(a)
[1] 7



> a <- "El perro se comió mi informe"
> a
[1] "El perro se comió mi informe"
> class(a) # variable caracter
[1] "character"

> b <- sub("perro","gato",a) # sustituye una cadena de caracteres
> b
[1] "El gato se comió mi informe"



En el siguiente ejemplo, se asigna a la variable a el resultado (verdadero o falso) de una
comparación.


> a <- (1+1==3) # operador de comparación " == "
> class(a)
[1] "logical"
> a
[1] FALSE


1.3.2 Vectores

Un vector es una colección ordenada de datos del mismo tipo. Utilizamos la función c() y
el operador : , para generar vectores. Volveremos a ver el operador : más adelante.


> aaa <- c (TRUE, FALSE) # función c()
> aaa
[1] TRUE FALSE
> class(aaa)
[1] "logical"


> bbb <- c(2.1,3.8) # vector numérico
> bbb
[1] 2.1 3.8
> class(bbb)
[1] "numeric"

> ccc <- c("a","b","c") # vector de caracteres
> ccc
[1] "a" "b" "c"
> class (ccc)
[1] "character"


Ejemplo: La intensidad estimada de 15488 spots de un microarray es un vector de 15488
números.


• Un número es un caso particular de un vector, que consiste de un solo elemento.


Generación de vectores. La función c() y el operador de asignación

Un comando útil en R para entrar una cantidad pequeña de datos es la función c(). Esta
función combina, concatena elementos del mismo tipo. Por ejemplo, supongamos que los
valores siguientes representan ocho tiradas de un dado equilibrado:


2 5 1 6 5 5 4 1


Para ingresar estos valores en una sesión de R, asignándolos al objeto queridostodos
escribimos


y si escribimos


> queridostodos <- c(2,5,1,6,5,5,4,1)

y oprimimos enter, aparecerá lo siguiente

> queridostodos


[1] 2 5 1 6 5 5 4 1
>



Observaciones:


Análisis Exploratorio y Confirmatorio de Datos de Experimentos de Microarrays TP 1
Dpto. de Matemática - Instituto de Cálculo 1er. Cuatr. 2006 Dra. Diana M. Kelmansky



> ddd <- 1:3 # vector de enteros
> ddd
[1] 1 2 3
> class(ddd)
[1] "integer"

5





Hemos asignado valores a una variable llamada queridostodos. R
distingue mayúsculas y minúsculas de manera que podría haber otra variable
distinta llamada QueridosTodos. El nombre de una variable, tiene que
comenzar con una letra y puede contener la mayoría de las combinaciones de
letras, números y puntos. No puede nombrarse con números únicamente.
El operador de asignación “<-”; está compuesto de un < (“menor”) y un –
(“menos” o “guión”) escritos juntos. Se lee como “toma”, la variable
queridostodos toma el valor c(2,5,1,6,5,5,4,1). Alternativamente, a
partir de la versión 1.4.0 de R también puede utilizarse “=”como el operador
de asignación.

Análisis Exploratorio y Confirmatorio de Datos de Experimentos de Microarrays TP 1
Dpto. de Matemática - Instituto de Cálculo 1er. Cuatr. 2006 Dra. Diana M. Kelmansky


6





El valor de queridostodos no aparece en pantalla automáticamente. Sí lo
hace cuando se escribe el nombre en la línea de comandos, como vimos más
arriba.
El valor de queridostodos está precedido con un [1]. Esto indica que el
valor es un vector.

• Al concatenar valores numéricos con caracteres, éstos deben estar entre



comillas y el vector resultante es un vector de caracteres.
> nuevovector <- c(1,2,3, Pedro, Juan)
Error: object "Pedro" not found
> nuevovector <- c(1,2,3, "Pedro", "Juan")
> nuevovector
[1] "1" "2" "3" "Pedro" "Juan"
> class(nuevovector)
[1] "character"



1.3.3 Matrices

Consideraremos la función matrix()para entender el uso de funciones en R.
Del help obtenemos:


Matrices
Description:
'matrix' creates a matrix from the given set of values.
Usage:
matrix(data = NA, nrow = 1, ncol = 1, byrow = FALSE)
Arguments:
data: the data vector
nrow: the desired number of rows
ncol: the desired number of columns
byrow: logical. If `FALSE' the matrix is filled by columns,
otherwise the matrix is filled by rows.
...


Vemos que esta función toma vectores y los transforma en objetos con estructura de
matriz. Son 4 los argumentos de esta función. Especif
  • Links de descarga
http://lwp-l.com/pdf17442

Comentarios de: Introduccin al lenguaje R (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios
Es necesario revisar y aceptar las políticas de privacidad