Métodos de investigación no convencionales
basados en la inteligencia artificial
Pontificia Universidad Católica de Chile
Santiago de Chile, octubre de 2013
MÉTODOS DE INVESTIGACIÓN
NO CONVENCIONALES
BASADOS EN LA INTELIGENCIA ARTIFICIAL
MINERÍA DE DATOS
Prof. Víctor Yepes Piqueras, Ph.D.
[email protected]
Universitat Politècnica de València (España)
1
Métodos de investigación no convencionales
basados en la inteligencia artificial
Pontificia Universidad Católica de Chile
Santiago de Chile, octubre de 2013
MINERÍA DE DATOS
La revolución digital ha permitido que la captura
de datos sea fácil, y su almacenamiento tenga un
costo muy reducido.
Enormes cantidades de datos son recogidas y
almacenadas en bases de datos en la vida diaria.
Resultado: Para analizar estas enormes
cantidades de datos, las herramientas
tradicionales de gestión de datos y las
herramientas estadísticas no son adecuadas.
MINERÍA DE DATOS
Los datos por sí solos no producen beneficio
directo. Su verdadero valor consiste en poder
extraer información útil para la toma de
decisiones.
Tradicionalmente se analizaban datos con la
ayuda de técnicas estadísticas (resumiendo y
generando informes) o validando modelos
sugeridos manualmente por los expertos.
Prof. Víctor Yepes Piqueras, Ph.D.
[email protected]
Universitat Politècnica de València (España)
2
Métodos de investigación no convencionales
basados en la inteligencia artificial
Pontificia Universidad Católica de Chile
Santiago de Chile, octubre de 2013
MINERÍA DE DATOS
Datos: hechos o medidas que describen
características de objetos, eventos o
personas, es la materia prima de la que se
obtendrá la información.
Información: Datos analizados y
presentados en forma adecuada, de
interés para un observador en un momento
determinado.
Conocimiento: información procesada
para emitir juicios que llevan a
conclusiones.
Meta Conocimiento: Reglas que permiten
obtener conocimiento.
MINERÍA DE DATOS
Prof. Víctor Yepes Piqueras, Ph.D.
[email protected]
Universitat Politècnica de València (España)
3
Métodos de investigación no convencionales
basados en la inteligencia artificial
Pontificia Universidad Católica de Chile
Santiago de Chile, octubre de 2013
MINERÍA DE DATOS
Minería de datos es un proceso no trivial
de exploración y análisis de grandes
cantidades de datos con el objeto de
encontrar patrones y reglas significativas
(conocimiento)
Normalmente, estos patrones no se pueden
detectar mediante la exploración tradicional de los
datos porque las relaciones son demasiado
complejas o porque hay demasiado datos.
MINERÍA DE DATOS
Prof. Víctor Yepes Piqueras, Ph.D.
[email protected]
Universitat Politècnica de València (España)
4
Métodos de investigación no convencionales
basados en la inteligencia artificial
Pontificia Universidad Católica de Chile
Santiago de Chile, octubre de 2013
MINERÍA DE DATOS
MINERÍA DE DATOS
Aplicaciones o problemas de minería
de datos pueden clasificarse en las
siguientes categorías:
Clasificación
Estimación
Pronóstico
Asociación
Agrupación o segmentación
Prof. Víctor Yepes Piqueras, Ph.D.
[email protected]
Universitat Politècnica de València (España)
5
Métodos de investigación no convencionales
basados en la inteligencia artificial
Pontificia Universidad Católica de Chile
Santiago de Chile, octubre de 2013
MINERÍA DE DATOS
Clasificación:
Examinar las características de un nuevo
objeto y asignarle una clase o categoría
de acuerdo a un conjunto de tales objetos
previamente definido
Ejemplos:
Clasificar aplicaciones a crédito como bajo,
medio y alto riesgo
Detectar reclamos fraudulentos de seguros
MINERÍA DE DATOS
Estimación:
Relacionado con clasificación
Mientras clasificación asigna un valor
discreto, estimación produce un valor
continuo
Ejemplos:
Estimar el precio de una vivienda
Estimar el ingreso total de una familia
Prof. Víctor Yepes Piqueras, Ph.D.
[email protected]
Universitat Politècnica de València (España)
6
Métodos de investigación no convencionales
basados en la inteligencia artificial
Pontificia Universidad Católica de Chile
Santiago de Chile, octubre de 2013
MINERÍA DE DATOS
Pronóstico:
Predecir un valor futuro con base a
valores pasados
Ejemplos:
Predecir cuánto efectivo requerirá un cajero
automático en un fin de semana
MINERÍA DE DATOS
Asociación:
Determinar cosas u objetos que van
juntos
Ejemplo:
Determinar que productos se adquieren
conjuntamente en un supermercado
Prof. Víctor Yepes Piqueras, Ph.D.
[email protected]
Universitat Politècnica de València (España)
7
Métodos de investigación no convencionales
basados en la inteligencia artificial
Pontificia Universidad Católica de Chile
Santiago de Chile, octubre de 2013
MINERÍA DE DATOS
Agrupación o segmentación:
Dividir una población en un número de
grupos más homogéneos
No depende de clases pre-definidas a
diferencia de clasificación
Ejemplo:
Dividir la base de clientes de acuerdo con
los hábitos de consumo
MINERÍA DE DATOS
Un proceso típico de minería de datos consta de los
siguientes pasos generales:
1. Selección del conjunto de datos.
2. Análisis de las propiedades de los datos.
3. Transformación del conjunto de datos de
entrada.
4. Seleccionar y aplicar la técnica de minería de
datos, se construye el modelo de predicción, de
clasificación o segmentación.
5. Evaluar los resultados contrastándolos con un
conjunto de datos previamente reservado para
validar la generalidad del modelo.
Prof. Víctor Yepes Piqueras, Ph.D.
[email protected]
Universitat Politècnica de València (España)
8
Métodos de investigación no convencionales
basados en la inteligencia artificial
Pontificia Universidad Católica de Chile
Santiago de Chile, octubre de 2013
MINERÍA DE DATOS
MINERÍA DE DATOS
Prof. Víctor Yepes Piqueras, Ph.D.
[email protected]
Universitat Politècnica de València (España)
9
Métodos de investigación no convencionales
basados en la inteligencia artificial
Pontificia Universidad Católica de Chile
Santiago de Chile, octubre de 2013
MINERÍA DE DATOS
Según el objetivo del análisis de los datos, los
algoritmos utilizados se clasifican en
supervisados y no supervisados:
Algoritmos supervisados (o predictivos): predicen
un dato (o un conjunto de ellos) desconocido a
priori, a partir de otros conocidos.
Algoritmos no supervisados (o del descubrimiento
del conocimiento): se descubren patrones y
tendencias en los datos.
MINERÍA DE DATOS
Aprendizaje automático:
Objetivo: desarrollar método computacionales
que implementan varias formas de aprendizaje
Aplicación: problemas que carecen de
solución algorítmica eficiente, son vagamente
definidos o informalmente especificados
Ejemplos: diagnóstico médico, reconocimiento
de patrones y detección de regularidades en
enormes cantidades de datos
Algoritmos: árboles de decisión, redes
neuronales, aprendizaje probabilístico y
bayesiano, máquinas de soporte vectorial …
Prof. Víctor Yepes Piqueras, Ph.D.
[email protected]
Universitat Politècnica de València (España)
10
Métodos de investigación no convencionales
basados en la inteligencia artificial
Pontificia Universidad Católica de Chile
Santiago de Chile, octubre de 2013
MINERÍA DE DATOS
Reconocimiento de patrones:
Objetivo: estudiar el desarrollo y aplicación de sistemas
complejos basados en técnicas "blandas" (redes
neuronales, lógica borrosa, algoritmos evolutivos, etc.)
para la clasificación adaptable de patrones, en una doble
vertiente de reconocimiento y de focalización
(conocimiento contextual)
Aplicación: problemas de los que no se dispone de un
modelo matemático, o el modelo es demasiado complejo,
o las propiedades estadísticas de los datos son muy
variables
Ejemplos: patrones visuales basados en imágenes
aéreas o satelitales, clasificación y diagnóstico,
problemas relacionados en el campo del control, etc
MINERÍA DE DATOS
Soft computing:
Técnicas empleadas para solucionar problemas que
manejan información incompleta, con incertidumbre e
inexacta.
Redes neuronales
sistemas difusos
Computación bio-inspirada:
– Algoritmos evolutivos
– Optimización de colonias de hormigas
– Inteligencia de enjambre
Ideas sobre probabilidad:
– Redes bayesianas
Teoría del Caos
Prof. Víctor Yepes Piqueras, Ph.D.
[email protected]
Universitat Politècnica de València (España)
11
Métodos de investigación no convencionales
basados en la inteligencia artificial
Pontificia Universidad Católica de Chile
Santiago de Chile, octubre de 2013
MINERÍA DE DATOS
Métodos estadísticos:
Técnica tradicional en el tratamiento de grandes
volúmenes de datos.
Existen varios modelos:
ANOVA (Análisis de Varianza). Contrasta con variables
Chi cuadrado. Contrasta con la independencia de variables.
Componentes principales. Permite reducir el número de
continuas.
variables.
Análisis de clústers. Permite clasificar poblaciones.
Análisis de discrimante. Permite encontrar reglas de
clasificación de elementos en grupos.
Regresión lineal. Se identifica una variable dependiente de las
independientes, con una relación lineal.
Regresión logística. Trabaja con variables discretas, se requiere
que las variables sean lineales.
REDES NEURONALES
Prof. Víctor Yepes Piqueras, Ph.D.
[email protected]
Universitat Politècnica de València (España)
12
Métodos de investigación no convencionales
basados en la inteligencia artificial
Pontificia Universidad Católica de Chile
Santiago de Chile, octubre de 2013
REDES NEURONALES
REDES NEURONALES
El cerebro humano presenta algunas
características muy interesantes:
Es robusto y tolerante a fallos, diariamente
mueren neuronas sin afectar su rendimiento.
Es flexible, se ajusta a nuevos ambientes por
medio de un proceso de aprendizaje, no h
Comentarios de: Minería de Datos (0)
No hay comentarios