PDF de programación - DATA WAREHOUSE Y DATA MINING APLICADOS AL ESTUDIO DEL RENDIMIENTO ACADÉMICO Y DE PERFILES DE ALUMNOS

Imágen de pdf DATA WAREHOUSE Y DATA MINING APLICADOS AL ESTUDIO DEL RENDIMIENTO ACADÉMICO Y DE PERFILES DE ALUMNOS

DATA WAREHOUSE Y DATA MINING APLICADOS AL ESTUDIO DEL RENDIMIENTO ACADÉMICO Y DE PERFILES DE ALUMNOSgráfica de visualizaciones

Publicado el 10 de Mayo del 2017
815 visualizaciones desde el 10 de Mayo del 2017
955,5 KB
5 paginas
Creado hace 14a (01/04/2010)
DATA WAREHOUSE Y DATA MINING APLICADOS AL ESTUDIO
DEL RENDIMIENTO ACADÉMICO Y DE PERFILES DE ALUMNOS



D. L. LA RED MARTINEZ, J. C. ACOSTA, L. A. CUTRO, V. E. URIBE, A. R. RAMBO

Departamento de Informática / FACENA / Universidad Nacional del Nordeste



CONTEXTO

Se investiga el rendimiento académico de alumnos
de Sistemas Operativos de
la Licenciatura en
Sistemas de Información (LSI) y alumnos rezagados
de la Licenciatura en Sistemas (LS), plan anterior,
de la FACENA de la UNNE, a los efectos de obtener
perfiles de los mismos que pudieran establecer a
priori altas probabilidades de éxito o fracaso en la
Asignatura, con el propósito de
instrumentar
medidas de apoyo especiales a los alumnos con
perfil de alto riesgo de fracaso.



de

bajo

porcentaje


RESUMEN
El desigual aprovechamiento de las TICs observado
en los alumnos de Sistemas Operativos de la LSI de
la FACENA de la UNNE, como así también el
relativamente
alumnos
promocionados y regularizados al finalizar el
cursado de la Asignatura (éxito académico), han
motivado la aplicación de técnicas de Almacenes de
Datos (DataWarehouses: DW) y de Minería de
Datos (Data Mining: DM) basadas en clustering,
entre otras, para la búsqueda de perfiles de los
alumnos de la Asignatura mencionada, según su
rendimiento académico, situación demográfica y
socio económica, con el propósito de determinar a
priori situaciones potenciales de éxito o de fracaso
académico, lo cual permitiría encarar las medidas
tendientes a minimizar los fracasos. El presente
trabajo
tiene por objetivo brindar una breve
descripción de aspectos relacionados con el almacén
de datos construido y algunos procesos de minería
de datos desarrollados sobre el mismo.

Palabras clave: Base de Datos, Almacén de Datos,
Minería
Cluster
Demográfico.


de Datos,

Clustering,

1. INTRODUCCION

Una En el contexto de la SIC (Joyanes Aguilar,
1997), (Bolaños Calvo, 2001), (Taquini, 2001),
(Peiró, 2001) y a los efectos de la determinación de
los perfiles característicos de los alumnos de SO de
la FACENA de la UNNE, se ha construido un DW
con información personal, académica, demográfica y
socio económica de los alumnos y de su núcleo
familiar, el cual se ha comenzado a explorar con
técnicas de DM, presentándose en este trabajo
algunos
(aún
preliminares y parciales).

resultados

obtenidos

los

de

(Inmon, 1992),

Un DW es una colección de datos orientado a temas,
integrado, no volátil, de tiempo variante, que se usa
para el soporte del proceso de toma de decisiones
gerenciales. Es también un conjunto de datos
integrados orientados a una materia, que varían con
el tiempo, y que no son transitorios, los cuales
soportan el proceso de toma de decisiones de una
administración
(Inmon, 1996),
(Simon, 1997), (Trujillo, Palomar & Gómez, 2000).
La DM es la etapa de descubrimiento en el proceso
de KDD (Knowledge Discovery from Databases), es
el paso consistente en el uso de algoritmos concretos
que generan una enumeración de patrones a partir de
los datos preprocesados (Fayyad, Grinstein &
Wierse, 2001), (Fayyad, Piatetskiy-Shapiro, Smith,
& Ramasasmy, 1996), (Han & Kamber, 2001),
(Hand, Mannila & Smyth, 2000).
Es
también un mecanismo de explotación,
consistente en la búsqueda de información valiosa en
grandes volúmenes de datos. Está muy ligada a los
DW ya que los mismos proporcionan la información
histórica con la cual los algoritmos de minería
obtienen la información necesaria para la toma de
decisiones (Gutiérrez, 2001), (IBM Software Group,
2003).
La DM es un conjunto de técnica de análisis de
datos que permiten extraer patrones, tendencias y
regularidades para describir y comprender mejor los
datos y extraer patrones y tendencias para predecir
comportamientos futuros (Simon, 1997), (Berson &
Smith, 1997),
(Frawley, Piatetsky-Shapiro &
Matheus, 1992), (White, 2001).
En la figura 1 se muestra la arquitectura de un DW.


Figura 1: Arquitectura de un Data Warehouse.



El presente estudio se realizó sobre datos obtenidos
mediante encuestas realizadas al alumnado de SO,
considerando además los resultados de las distintas
instancias de evaluación previstas durante el cursado
de dicha asignatura. Se utilizó un entorno integrado
de gestión de bases de datos y data warehouse (DB2
versión 9.5), obtenido de la empresa IBM mediante
los Acuerdos firmados entre dicha empresa y la

UNNE; dicho entorno permite la extracción de
conocimiento en bases de datos y DW mediante
técnicas de DM como ser clustering (o agrupamiento
de datos) que consiste en la partición de un conjunto
de individuos en subconjuntos lo más homogéneos
posible, el objetivo es maximizar la similitud de los
individuos del cluster y maximizar la diferencia
entre clusters. El cluster demográfico es un
algoritmo desarrollado por IBM e implementado en
el IM, componente del DWE, entorno antes
mencionado, que resuelve automáticamente
los
problemas de definición de métricas de distancia /
similitud, proporcionando criterios para definir una
segmentación óptima
(Grabmeier, & Rudolph,
1998), (Baragoin, Chan, Gottschalk, Meyer, Pereira
& Verhees, 2002),
(Ballard, Rollins, Ramos,
Perkins, Hale, Dorneich, Cas Milner & Chodagam,
2007), Ballard, Beaton, Chiou, Chodagam, Lowry,
Perkins, Phillips & Rollins, 2006).
Los pasos realizados durante el presente trabajo han
sido los siguientes: a) recolección de los datos; b)
tratamiento y depuración de los datos; c) preparación
de la base de datos y del DW correspondiente sobre
la plataforma de trabajo seleccionada; d) selección
de la técnica de minería de datos para la realización
del estudio (predominantemente clustering); e)
generación de diferentes gráficos para el estudio de
los resultados; f) estudio de los resultados obtenidos;
g) obtención de las conclusiones.
En esta etapa se trabajó con una porción (Data Mart:
DM) del DW, cuya estructura se muestra en la figura
2.

Se utilizó la siguiente equivalencia de nombres y
significados de variables:

 SIT_LABORAL_ALUM: Situación laboral



del alumno.
IMP_EST_ALUM: Importancia dada al
estudio por el alumno.

 RAZON_EST_ALUM: Razón para estudiar



según el alumno.
IMP_TICS_ALUM: Importancia dada a las
TICs por el alumno.

 NOTA_PP_ALUM: Nota primer parcial.
 NOTA_RPP_ALUM: Nota recuperatorio

primer parcial.

 NOTA_SP_ALUM: Nota segundo parcial.
 NOTA_RSP_ALUM: Nota recuperatorio

segundo parcial.

 NOTA_EXT_ALUM: Nota recuperatorio

extraordinario.

 SIT_FIN_ALUM: Situación

final del

alumno luego del cursado.

Seguidamente se muestran algunos de los resultados
obtenidos:

 Minería de Clasificación según Carrera:

figuras 3, 4.



Figura 3: Licenciatura en Sistemas de Información.



Figura 4: Licenciatura en Sistemas.



 Minería de Clasificación según Situación

Final del Alumno: figuras 5, 6.

la aprobación de

Se considera Libre al alumno que no ha
cumplimentado
trabajos
prácticos y de laboratorio, Regular a quien ha
cumplimentado dichas exigencias pero con un
promedio inferior a 7 en la escala 0-10, finalmente
se considera Promoción a quien ha cumplimentado
las exigencias con un promedio igual o superior a 7.

los


Figura 2: Estructura del DM utilizado, parte del DW.



2. LINEAS DE INVESTIGACION y

DESARROLLO

El objetivo principal de este trabajo es encontrar
perfiles de alumnos por medio de la aplicación de
técnicas de DM a un DW con datos académicos,
socio económico y demográfico correspondientes a
alumnos de SO de la Licenciatura en Sistemas de
Información (LSI) de la FACENA de la UNNE.


3. RESULTADOS OBTENIDOS/ESPERADOS

Se obtuvieron diferentes clasificaciones mediante la
utilización
técnicas de
clustering, según diferentes criterios de agrupación
de los datos.

(preferentemente) de





Figura 5: Situación final del alumno.



Figura 6: Situación final del alumno - calidad del

modelo.



 Minería de Clasificación según Importancia

Dada al Estudio: figuras 7, 8.

Figura 7: Importancia dada al estudio - 1.

Figura 8: Importancia dada al estudio: calidad del

modelo.



 Minería de Clustering Demográfico según
Situación Final del Alumno como variable
principal: figuras 9, 10, 11.

Figura 9: Situación final del alumno: Libre.

Figura 10: Situación final del alumno: Regular.

Figura 11: Situación final del alumno: Promoción.



 Minería de Clustering de Kohonen según
Situación Final del Alumno como variable
principal: figuras 12, 13, 14.

Figura 12: Situación final del alumno: Libre.



Se ha podido comprobar las grandes ventajas de la
utilización de tecnologías y software de última
generación que soportan sistemas multiplataforma.
Se hace notar que los resultados logrados son sólo la
etapa preliminar de los diversos estudios que se tiene
previsto realizar, incorporando las demás variables
del DW.
Se tiene previsto desarrollar las siguientes líneas
futuras de acción:

 Avanzar en

la

investigación con

la
utilización de minería de datos como ser
redes neuronales, redes bayesianas, arboles
de decisión, etc., aplicadas al almacén de
datos utilizado hasta ahora generalmente
con las técnicas de clustering.

 Aplicar las técnicas de
  • Links de descarga
http://lwp-l.com/pdf3497

Comentarios de: DATA WAREHOUSE Y DATA MINING APLICADOS AL ESTUDIO DEL RENDIMIENTO ACADÉMICO Y DE PERFILES DE ALUMNOS (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios...
CerrarCerrar
CerrarCerrar
Cerrar

Tienes que ser un usuario registrado para poder insertar imágenes, archivos y/o videos.

Puedes registrarte o validarte desde aquí.

Codigo
Negrita
Subrayado
Tachado
Cursiva
Insertar enlace
Imagen externa
Emoticon
Tabular
Centrar
Titulo
Linea
Disminuir
Aumentar
Vista preliminar
sonreir
dientes
lengua
guiño
enfadado
confundido
llorar
avergonzado
sorprendido
triste
sol
estrella
jarra
camara
taza de cafe
email
beso
bombilla
amor
mal
bien
Es necesario revisar y aceptar las políticas de privacidad