Paquetes para el tratamiento de datos
provenientes de encuestas aleatorizadas
Beatriz Cobo Rodríguez
María del Mar Rueda García
Beatriz
Cobo
Rodríguez
María del
Mar Rueda
García
Introducción
Paquetes R
Paquete
RRTCS
Modelos
cualitativos
Modelos
cuantitativos
Paquete RRreg
Paquete rr
Paquete list
Paquete
endorse
Bibliografía
[email protected],
[email protected]
Departamento de Estadística e Investigación Operativa
Universidad de Granada
Salamanca, 6 de Noviembre de 2015
Índice
1 Introducción
2 Paquetes R
Paquete RRTCS
Modelos cualitativos
Modelos cuantitativos
Paquete RRreg
Paquete rr
Paquete list
Paquete endorse
3 Bibliografía
Beatriz
Cobo
Rodríguez
María del
Mar Rueda
García
Introducción
Paquetes R
Paquete
RRTCS
Modelos
cualitativos
Modelos
cuantitativos
Paquete RRreg
Paquete rr
Paquete list
Paquete
endorse
Bibliografía
Introducción
Beatriz
Cobo
Rodríguez
María del
Mar Rueda
García
Introducción
Paquetes R
Paquete
RRTCS
Modelos
cualitativos
Modelos
cuantitativos
Paquete RRreg
Paquete rr
Paquete list
Paquete
endorse
Bibliografía
Estudios de encuestas por muestreo
Aspectos sensibles o confidenciales
↓ Ínteres
↓ Problema
↓
Deseabilidad social: {Tendencia de las personas encuestadas a
responder en función de lo que es aceptable socialmente}
Rehúsan
participar encuesta
Respuestas
falsas
Respuestas
condicionadas
Alteran la precisión y confiabilidad de los estimadores
↓
Introducción
Beatriz
Cobo
Rodríguez
María del
Mar Rueda
García
Introducción
Paquetes R
Paquete
RRTCS
Modelos
cualitativos
Modelos
cuantitativos
Paquete RRreg
Paquete rr
Paquete list
Paquete
endorse
Bibliografía
Técnica de Respuestas Aleatorizadas (Warner, 1965)
Solución
↓
↓
Protección
del
anonimato
Reducir
el riesgo de evasión o
no respuesta
¿Usted consume drogas?
¿Usted no consume drogas?
Introducción
Ventajas:
Aumenta la probabilidad de contestar la verdad respecto a
una pregunta directa.
Mayor índice de respuesta.
Desventajas:
Aumento en la complejidad de la pregunta.
Dificultad en entender el método de aleatorización.
Requiere de muestras de tamaños grandes.
Beatriz
Cobo
Rodríguez
María del
Mar Rueda
García
Introducción
Paquetes R
Paquete
RRTCS
Modelos
cualitativos
Modelos
cuantitativos
Paquete RRreg
Paquete rr
Paquete list
Paquete
endorse
Bibliografía
Introducción
Beatriz
Cobo
Rodríguez
María del
Mar Rueda
García
Introducción
Paquetes R
Paquete
RRTCS
Modelos
cualitativos
Modelos
cuantitativos
Paquete RRreg
Paquete rr
Paquete list
Paquete
endorse
Bibliografía
Métodos de respuesta aleatorizada
Muestreo aleatorio simple
Diseños muestrales complejos: estratos, conglomerados...
↓ propuestos
Encuestas
↓ se realizan
↓ requieren
⇓
↓
Un tratamiento diferenciado derivado de la no independencia de
las unidades muestrales.
CRAN contiene algunos paquetes de R (survey, sampling, laeken
or TeachingSampling) que incluyen los métodos usados en
estimación en muestreo.
No pueden usarse directamente cuando la muestra es obtenida
mediante respuesta aleatorizada.
Paquetes R
Muy recientemente algunos autores han desarrollado paquetes de
R para la estimación con respuesta aleatorizada o procedimientos
similares.
Estos paquetes son:
Paquete RRTCS
Paquete RRreg
Paquete rr
Paquete list
Paquete endorse
Beatriz
Cobo
Rodríguez
María del
Mar Rueda
García
Introducción
Paquetes R
Paquete
RRTCS
Modelos
cualitativos
Modelos
cuantitativos
Paquete RRreg
Paquete rr
Paquete list
Paquete
endorse
Bibliografía
Paquete RRTCS
Descripción
El paquete RRTCS: Randomized Response Techniques for
Complex Surveys (Cobo, Rueda y Arcos, 2015)
Realiza estimaciones puntuales y por intervalos para totales,
medias y proporciones con datos obtenidos de encuesta de
respuesta aleatoria.
Trabaja con una amplia gama de diseños de muestreo
incluyendo muestreo aleatorio simple con y sin
reemplazamiento (SRSWR, SRSWOR), muestreo
estratificado, muestreo por conglomerados, muestreo con
probabilidades desiguales y combinaciones de ellos.
Beatriz
Cobo
Rodríguez
María del
Mar Rueda
García
Introducción
Paquetes R
Paquete
RRTCS
Modelos
cualitativos
Modelos
cuantitativos
Paquete RRreg
Paquete rr
Paquete list
Paquete
endorse
Bibliografía
Paquete RRTCS
Descripción
Se compone de veinte funciones principales, cada una de ellas
implementando uno de los procedimientos de RR para
encuestas complejas.
Tiene una función adicional llamada ResamplingVariance que
proporciona estimaciones de la varianza de los estimadores de
respuesta aleatoria utilizando algunos métodos de remuestreo.
Incluye 20 conjuntos de datos que contienen observaciones de
de diferentes encuestas realizadas en poblaciones reales y
simuladas utilizando diferentes técnicas de respuesta
aleatoria.
Beatriz
Cobo
Rodríguez
María del
Mar Rueda
García
Introducción
Paquetes R
Paquete
RRTCS
Modelos
cualitativos
Modelos
cuantitativos
Paquete RRreg
Paquete rr
Paquete list
Paquete
endorse
Bibliografía
Paquete RRTCS
Ejemplo
Nuestro objetivo es estimar la prevalencia de estudiantes que
consumen drogas.
Para ello:
extraemos una muestra mediante un mecanismo de muestreo
aplicamos las distintas técnicas cualitativas de respuesta
aleatoria disponibles en el paquete RRTCS
Beatriz
Cobo
Rodríguez
María del
Mar Rueda
García
Introducción
Paquetes R
Paquete
RRTCS
Modelos
cualitativos
Modelos
cuantitativos
Paquete RRreg
Paquete rr
Paquete list
Paquete
endorse
Bibliografía
Paquete RRTCS
Warner
El mecanismo de respuesta aleatoria de Warner funciona del
siguiente modo:
A una persona de la muestra etiquetada i se le ofrece una
caja con un número considerable de cartas idénticas
con una proporción p(0 < p < 1; p 6= 0.5) de ellas marcadas
¿Consumes drogas? y el resto marcadas ¿No consumes
drogas?.
Se le pide a la persona que extraiga aleatoriamente una de
ellas, observe la marca de la carta y de una respuesta
si la carta está marcada “¿Consumes drogas?”
1
y de verdad “Consumes drogas”, o
si la carta está marcada “¿No consumes drogas?”
y de verdad “No consumes drogas”
0
si la marca de la carta no coincide con tu característica real
zi =
Beatriz
Cobo
Rodríguez
María del
Mar Rueda
García
Introducción
Paquetes R
Paquete
RRTCS
Modelos
cualitativos
Modelos
cuantitativos
Paquete RRreg
Paquete rr
Paquete list
Paquete
endorse
Bibliografía
Paquete RRTCS
Warner
La respuesta aleatoria es dada por
ri = zi − (1 − p)
2p − 1
donde
z es la variable observada
y p es la proporción de cartas marcadas con la caraterística
sensible
Y la varianza estimada esbVR(ri) = ri(ri − 1)
Beatriz
Cobo
Rodríguez
María del
Mar Rueda
García
Introducción
Paquetes R
Paquete
RRTCS
Modelos
cualitativos
Modelos
cuantitativos
Paquete RRreg
Paquete rr
Paquete list
Paquete
endorse
Bibliografía
Paquete RRTCS
Beatriz
Cobo
Rodríguez
María del
Mar Rueda
García
Introducción
Paquetes R
Paquete
RRTCS
Modelos
cualitativos
Modelos
cuantitativos
Paquete RRreg
Paquete rr
Paquete list
Paquete
endorse
Bibliografía
Warner
Un estimador insesgado para la población total de la
característica sensible es
ri
πi
bYR =X
i∈s
donde
πi es la probabilidad de inclusión de primer orden
(probabilidad de que el elemento i esté en la muestra).
Paquete RRTCS
Beatriz
Cobo
Rodríguez
María del
Mar Rueda
García
Introducción
Paquetes R
Paquete
RRTCS
Modelos
cualitativos
Modelos
cuantitativos
Paquete RRreg
Paquete rr
Paquete list
Paquete
endorse
Bibliografía
Warner
La varianza de este estimador viene dada por
VR(ri)
πi
+ VHT(r)
V (bYR) =X
i∈U
donde
VR(ri) es la varianza de ri bajo el mecanismo de
aleatorización y
VHT(r) es la varianza del diseño del estimador de Horvitz
Thompson del valor ri.
Paquete RRTCS
Beatriz
Cobo
Rodríguez
María del
Mar Rueda
García
Introducción
Paquetes R
Paquete
RRTCS
Modelos
cualitativos
Modelos
cuantitativos
Paquete RRreg
Paquete rr
Paquete list
Paquete
endorse
Bibliografía
Warner
Esta varianza es estimada por
bV (bYR) =X
bVR(ri)
dondebVR(ri) varía con el mecanismo RR y
i∈s
la estimación de la varianza del diseño bV (r), se obtiene
utilizando el método de Deville (Deville, 1993).
+ bV (r)
πi
Beatriz
Cobo
Rodríguez
María del
Mar Rueda
García
Introducción
Paquetes R
Paquete
RRTCS
Modelos
cualitativos
Modelos
cuantitativos
Paquete RRreg
Paquete rr
Paquete list
Paquete
endorse
Bibliografía
Paquete RRTCS
Función Warner
Calcula la estimación de la respuesta aleatoria, su varianza y su
intervalo de confianza a través del modelo de Warner. La función
también puede devolver la variable trasformada.
Warner(z,p,pi,type=c("total","mean"),cl,N=NULL,pij=NULL)
z: vector de la variable observada; su tamaño es igual a n (el
tamaño de la muestra)
p: proporción de cartas marcadas con la característica sensible
pi: vector de probabilidades de inclusión de primer orden
type: el tipo de estimador: “total” o “mean”
cl: nivel de confianza
N: tamaño de la población. Por defecto es NULL
pij: matriz de probabilidades de inclusión de segundo orden.
Por defecto es NULL
Beatriz
Cobo
Rodríguez
María del
Mar Rueda
García
Introducción
Paquetes R
Paquete
RRTCS
Modelos
cualitativos
Modelos
cuantitativos
Paquete RRreg
Paquete rr
Paquete list
Paquete
endorse
Bibliografía
Ejemplo variables cualitativas. Warner
Nuestro objetivo es estimar la prevalencia sobre el abuso de
alcohol
De una población de 802 estudiantes extraemos una muestra,
mediante muestreo aleatorio simple sin reemplazamiento, de
tamaño 125.
La técnica de respuesta aleatoria utilizada es el modelo de
Warner (Warner, 1965) con parámetro p = 0.7
La pregunta sensible es: ¿Durante el último mes, has bebido
más de 5 cervezas/vinos seguidos?
Ejemplo variables cualitativas. Warner
Almacenamos en un data frame
ID: el identificador del estudiante
z: la respuesta a la pregunta sensible
Pi: probabilidades de inclusión de primer orden
Beatriz
Cobo
Comentarios de: Paquetes para el tratamiento de datos provenientes de encuestas aleatorizadas (0)
No hay comentarios