PDF de programación - APLICACIÓN DE TÉCNICAS DE MINERÍA DE DATOS EN LA CONSTRUCCIÓN Y VALIDACIÓN DE MODELOS PREDICTIVOS Y ASOCIATIVOS A PARTIR DE ESPECIFICACIONES DE REQUISITOS DE SOFTWARE

Imágen de pdf APLICACIÓN DE TÉCNICAS DE MINERÍA DE DATOS EN LA CONSTRUCCIÓN Y VALIDACIÓN DE MODELOS PREDICTIVOS Y ASOCIATIVOS A PARTIR DE ESPECIFICACIONES DE REQUISITOS DE SOFTWARE

APLICACIÓN DE TÉCNICAS DE MINERÍA DE DATOS EN LA CONSTRUCCIÓN Y VALIDACIÓN DE MODELOS PREDICTIVOS Y ASOCIATIVOS A PARTIR DE ESPECIFICACIONES DE REQUISITOS DE SOFTWAREgráfica de visualizaciones

Publicado el 9 de Febrero del 2017
901 visualizaciones desde el 9 de Febrero del 2017
343,8 KB
14 paginas
Creado hace 22a (03/12/2001)
APLICACIÓN DE TÉCNICAS DE MINERÍA DE DATOS EN LA

CONSTRUCCIÓN Y VALIDACIÓN DE MODELOS PREDICTIVOS Y
ASOCIATIVOS A PARTIR DE ESPECIFICACIONES DE REQUISITOS

DE SOFTWARE

María N. Moreno García∗, Luis A. Miguel Quintales, Francisco J. García Peñalvo y M.

José Polo Martín

Universidad de Salamanca. Departamento de Informática y Automática
Teléfono: 34-923-294653, Fax: 34-923-294514, *e-mail: [email protected]


5HVXPHQ: La medición del software está adquiriendo una gran importancia debido a que cada
vez se hace más patente la necesidad de obtener datos objetivos que permitan evaluar,
predecir y mejorar la calidad del software así como el tiempo y coste de desarrollo del mismo.
El valor de las mediciones aumenta cuando se realiza sobre modelos construidos en las
primeras fases del proyecto ya que los resultados obtenidos permiten tenerlo bajo control en
todo momento y corregir a tiempo posibles desviaciones. La proliferación actual de métricas y
el gran volumen de datos que se maneja ha puesto de manifiesto que las técnicas clásicas de
análisis de datos son insuficientes para lograr los objetivos perseguidos. En este trabajo se
presenta la forma en que pueden aplicarse las nuevas técnicas de minería de datos en la
construcción y validación de modelos de ingeniería del software, cambiando el análisis
tradicional de datos GLULJLGRDODYHULILFDFLyQ por un enfoque de análisis de datos GLULJLGRDO
GHVFXEULPLHQWRGHOFRQRFLPLHQWR.


1. Introducción

Las primeras etapas del desarrollo de software son cruciales en la consecución de productos
de calidad dentro de los límites de tiempo y coste establecidos para un proyecto. Los errores
introducidos en las primeras etapas del desarrollo del software o durante su evolución son
causa frecuente de dificultades en el mantenimiento, baja reutilización y comportamiento
defectuoso de los programas. Igualmente, las malas estimaciones realizadas al comienzo del
proyecto tienen consecuencias desastrosas en cuanto a costes y plazos de entrega. Estas son
las principales causas por las que la medición del software en el ámbito de la especificación
de requisitos (ERS) está adquiriendo cada vez mayor importancia, debido a la necesidad de
obtener datos objetivos que contribuyan a mejorar la calidad desde las primeras etapas del
proyecto.

Los estudios relacionados con la medición en el nivel de la especificación de requisitos se
han centrado fundamentalmente en el desarrollo de métricas para determinar el tamaño y la
funcionalidad del software. Entre las de mayor difusión se encuentran las métricas de puntos
de función [Albrecht, 1979], métricas Bang [DeMarco, 1982] o los puntos objeto [Boehm et
al., 1995]. La medición de atributos de calidad de las especificaciones de requisitos del
software (ERS) ha sido también objeto de algunos trabajos que van desde la medición de
especificaciones formales [Samson et al., 1990] hasta la aplicación de métricas para evaluar la
calidad de especificaciones expresadas informalmente en lenguaje natural (métricas de
facilidad de comprensión del texto contenido en los documentos [Lehner, 1993] o métricas de
estructura y organización en documentos convencionales [Arthur y Stevens, 1989] y con
hipertexto [French et al., 1997] [Roth et al., 1994]), pasando por técnicas encaminadas a

determinar el cumplimiento de los estándares, directrices, especificaciones y procedimientos,
que requieren información procedente de revisiones técnicas, inspecciones :DONWKURXJK, o
auditorías [Davis et al., 1993] [Brykczynski, 1999] [Farbey, 1990]. La creciente adopción de
la tecnología de orientación a objetos en el desarrollo de software ha dado lugar a la aparición
de nuevas métricas específicas para este tipo de sistemas [Chidamber y Kemerer, 1994],
[Lorenz y Kidd 1994], [Churcher y Shepperd, 1995] [Binder, 1994]. Recientemente se han
propuesto métricas para la evaluación de la calidad a partir de modelos producidos en etapas
iniciales del ciclo de vida, como son las métricas de calidad y complejidad en modelos OMT
[Genero et al., 1999], métricas de calidad de los diagramas de clases en UML [Genero et al.,
1999, 2000] o las técnicas de medición de modelos conceptuales basados en eventos [Poels,
2000].
La proliferación actual de métricas y la necesidad de medir diferentes aspectos del software
está contribuyendo a crear confusión sobre las relaciones entre tales medidas, así como sobre
su forma y ámbito de aplicación. Este hecho ha abierto una nueva vía en la investigación
orientada hacia la propuesta de modelos, arquitecturas y marcos de referencia (“framewors”)
que permitan la organización de las medidas y la clasificación de las entidades de software
susceptibles de medir [Poels, 1998] [Briand et al., 1999] [Moreno et al. 2001]. La
construcción de modelos sobre diferentes aspectos del software requiere la recolección de
numerosos datos procedentes de observaciones empíricas. Los avances tecnológicos actuales
posibilitan la rápida obtención de grandes cantidades de datos de fuentes muy diversas, así
como el almacenamiento eficiente de los mismos. Dichos datos encierran información muy
valiosa que puede tratarse mediante los métodos tradicionales de análisis de datos, sin
embargo estos métodos no son capaces de encontrar toda la información útil latente en la gran
masa de datos que se maneja. En ese contexto, las técnicas de minería de datos surgen como
las mejores herramientas para realizar exploraciones más profundas y extraer información
nueva, útil y no trivial que se encuentra oculta en grandes volúmenes de datos.
En este trabajo se muestra la aplicación práctica de técnicas de minería de datos en la
construcción y validación de modelos de ingeniería del software que relacionan diferentes
atributos de la ERS con el objeto de predecir características del software producido tales
como calidad, funcionalidad, tamaño, complejidad, etc. Los resultados obtenidos serán
indicativos tanto de la calidad como de la utilidad de los modelos de requisitos realizados.

7pFQLFDVGHPLQHUtDGHGDWRV

La minería de datos ha dado lugar a una paulatina sustitución del análisis de datos GLULJLGRD
OD YHULILFDFLyQ por un enfoque de análisis de datos GLULJLGR DO GHVFXEULPLHQWR GHO
FRQRFLPLHQWR. La principal diferencia entre ambos se encuentra en que en el último se
descubre información sin necesidad de formular previamente una hipótesis. La aplicación
automatizada de algoritmos de minería de datos permite detectar fácilmente patrones en los
datos, razón por la cual esta técnica es mucho más eficiente que el análisis dirigido a la
verificación cuando se intenta explorar datos procedentes de repositorios de gran tamaño y
complejidad elevada. Dichas técnicas emergentes se encuentran en continua evolución como
resultado de la colaboración entre campos de investigación tales como bases de datos,
reconocimiento de patrones,
sistemas expertos, estadística,
visualización, recuperación de información, y computación de altas prestaciones.

Los algoritmos de minería de datos se clasifican en dos grandes categorías: supervisados o
predictivos y no supervisados o de descubrimiento del conocimiento [Weiss y Indurkhya,
1998].

inteligencia artificial,

Los algoritmos VXSHUYLVDGRVRSUHGLFWLYRV predicen el valor de un atributo (HWLTXHWD) de un
conjunto de datos, conocidos otros atributos (DWULEXWRVGHVFULSWLYRV). A partir de datos cuya
etiqueta se conoce se induce una relación entre dicha etiqueta y otra serie de atributos. Esas
relaciones sirven para realizar la predicción en datos cuya etiqueta es desconocida. Esta forma
de trabajar se conoce como DSUHQGL]DMH VXSHUYLVDGR y se desarrolla en dos fases:
Entrenamiento (construcción de un modelo usando un subconjunto de datos con etiqueta
conocida) y prueba (prueba del modelo sobre el resto de los datos).
Cuando una aplicación no es lo suficientemente madura no tiene el potencial necesario para
una solución predictiva, en ese caso hay que recurrir a los métodos QR VXSHUYLVDGRV R GH
GHVFXEULPLHQWRGHOFRQRFLPLHQWR que descubren patrones y tendencias en los datos actuales
(no utilizan datos históricos). El descubrimiento de esa información sirve para llevar a cabo
acciones y obtener un beneficio (científico o de negocio) de ellas. En la tabla siguiente se
muestran algunas de las técnicas de minería de ambas categorías.


6XSHUYLVDGRV
Árboles de decisión
Inducción neuronal
Regresión
Series temporales


1RVXSHUYLVDGRV
Detección de desviaciones
Segmentación
Agrupamiento ("clustering")
Reglas de asociación
Patrones secuenciales



7DEODClasificación de las técnicas de minería de datos


La aplicación de los algoritmos de minería de datos requiere la realización de una serie de
actividades previas encaminadas a preparar los datos de entrada debido a que, en muchas
ocasiones dichos datos proceden de fuentes heterogéneas, no tienen el formato adecuado o
contienen ruido. Por otra parte, es necesario interpretar y evaluar los resultados obtenidos. El
proceso completo consta de las siguientes etapas [Cabena et al., 1998]:



1. 'HWHUPLQDFLyQGHREMHWLYRV
2. 3UHSDUDFLyQGHGDWRV

- Selección: Identificación de las fuentes de información externas e internas y

selección del subconjunto de datos necesario.

- Preprocesamiento: estudio de la calidad de los datos y determinación de las

operaciones de
  • Links de descarga
http://lwp-l.com/pdf2366

Comentarios de: APLICACIÓN DE TÉCNICAS DE MINERÍA DE DATOS EN LA CONSTRUCCIÓN Y VALIDACIÓN DE MODELOS PREDICTIVOS Y ASOCIATIVOS A PARTIR DE ESPECIFICACIONES DE REQUISITOS DE SOFTWARE (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios...
CerrarCerrar
CerrarCerrar
Cerrar

Tienes que ser un usuario registrado para poder insertar imágenes, archivos y/o videos.

Puedes registrarte o validarte desde aquí.

Codigo
Negrita
Subrayado
Tachado
Cursiva
Insertar enlace
Imagen externa
Emoticon
Tabular
Centrar
Titulo
Linea
Disminuir
Aumentar
Vista preliminar
sonreir
dientes
lengua
guiño
enfadado
confundido
llorar
avergonzado
sorprendido
triste
sol
estrella
jarra
camara
taza de cafe
email
beso
bombilla
amor
mal
bien
Es necesario revisar y aceptar las políticas de privacidad