PDF de programación - yatel - Olap sobre redes

Imágen de pdf yatel - Olap sobre redes

yatel - Olap sobre redesgráfica de visualizaciones

Publicado el 14 de Enero del 2017
645 visualizaciones desde el 14 de Enero del 2017
9,5 MB
38 paginas
Creado hace 10a (23/11/2013)
Yatel - OLAP sobre redes

Integrantes

- García, Mario Alejandro

- Cabral, Juan Bautista

- Gimenez Pecci, María de la Paz

- Vera, Carlos

- Liberal, Rodrigo



- Laguna, Irma Graciela

- Bisonard, Eduardo Matías

- Maurino, Fernanda

- Vankeirsbilck, Inés

- Cucco, Noelia del Valle

- Nieto Castillo, Adrián L.












Paper

Título: “Interactive network exploration in the KDD process, Contributions in the study of

population variability of a Corn Fijivirus”

Autores: M. A. García, M. P. Giménez Pecci, J. B. Cabral, A. Nieto, I. G. Laguna.

Publicación: Journal of Data Mining in Genomics & Proteomics 2012 3:3

Editorial: OMICS Publishing Group

ISSN: 2153-0602. Año: 2012

URL: http://goo.gl/pcjdG


Agenda

Un poco de historia y motivaciones.

Un poco de KDD.

Un poco de Network Science.

Proceso de Analisis.

DW - OLAP - BI (hasta acá debería tardar no mas de 20 minutos)

El proyecto en sí

Mini Demo

Historia: Mal de Río Cuarto virus

Análisis electroforético:

Base de datos formada por

Perfiles electroforéticos.

Atributos que definen el ambiente de la planta

Pocos datos: Propuesta transformar la DB en una red y medir su variabilidad.

Knowledge Discovery in Database (KDD)

Es un proceso no trivial de identificación de información útil y desconocida que permanece

oculta en una base de datos [Fayyad, 1996]

Es un proceso centrado en la persona (human-centered) [Brachman, 1996]

Network Science

Es el estudio de las redes que representan fenómenos físicos, biológicos y sociales

conduciendo a modelos predictivos de estos fenómenos.

Topologías.

Características comunes.

Networks 1

Interacción proteína-proteína

Networks 2

Redes sociales/económicas

Networks 3

Red de distribución de energía

Networks 4

Relación entre automotrices

Networks 5

Red semántica TBBT

Proceso de análisis
Los ejemplos van con nuestra investigación (osea: resumen del paper)

Proceso de análisis: Identificación y representación
de haplotipos

Proceso de análisis: Identificación y representación
de haplotipos

Proceso de análisis: Identificación y representación
de haplotipos

Proceso de análisis: Definición de medidas de
distancia

Proceso de análisis: Definición de medidas de
distancia

Proceso de análisis: Cálculo de distancias

Proceso de análisis: Cálculo de distancias

Proceso de análisis: Creación de la red

Proceso de análisis: Creación de la red

Proceso de análisis: Visualización y análisis
topológico

Visualización y análisis topológico

Proceso de análisis: Exploración

Proceso de análisis: Exploración

Proceso de análisis: Generación de hipótesis y
conclusiones

Proceso de análisis: Generación de hipótesis y
conclusiones

Proceso de análisis: Generación de hipótesis y
conclusiones

Proceso de análisis: Conclusiones del proyecto

Según el índice calculado, la variabilidad del Mal de Río Cuarto virus, ha disminuido con el
tiempo, habiendo una clara división del indicador en la campaña posterior a la epidemia de la
campaña 1996/97.

La utilización de redes en el proceso de KDD resultó muy satisfactoria y logró resaltar un

comportamiento del objeto de estudio que no había sido evidente hasta el momento.

En un proceso centrado en la persona (human-centered), donde la creatividad y experiencia
del analista juega un rol fundamental, la herramienta propuesta es capaz de ofrecer una
perspectiva novedosa y complementaria con las demás técnicas del proceso de KDD

Data Warehouse - OLAP - BI
Concluimos que nuestro problema se adaptaba a algo muy similar a "algo" de BI

En el contexto de la informática, un almacén de datos (del inglés data warehouse) es una
colección de datos orientada a un determinado ámbito (empresa, organización, etc.),
integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad
en la que se utiliza.

OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line Analytical
Processing). Es una solución utilizada en el campo de la llamada Inteligencia empresarial (o
Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos.
Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos
resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP). Se usa en
informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas
similares.

Se denomina inteligencia empresarial, inteligencia de negocios o BI (del inglés business
intelligence) al conjunto de estrategias y herramientas enfocadas a la administración y
creación de conocimiento mediante el análisis de datos existentes en una organización o
empresa.

Cubo OLAP
Es una base de datos multidimensional, en la cual el almacenamiento físico de los datos se realiza
en un vector multidimensional. Los cubos OLAP se pueden considerar como una ampliación de las
dos dimensiones de una hoja de cálculo.

Las olap pueden ser implementados en ROLAP - MOLAP - HOLAP

Las consultas OLAP se llaman MDX (son bastante parecidas a SQL)

Para consultas remotas se utiliza XMLA sobre SOAP

Soluciones OpenSource

Mondrian (todo en java soporta XML y MDX) (http://mondrian.pentaho.com/)

python xmla (pip install xmla) para comunicarse con casi cualquier OLAP

(https://pypi.python.org/pypi/xmla/)

Cubes (pip install cubes) puro python pero muy verde (pythonhosted.org/cubes/)

Pentaho (http://www.pentaho.com/), Saiku (http://meteorite.bi/saiku), OpenI (http://openi.org/)

Yatel

http://bitbucket.org/yatel/yatel

Wiskey-Ware License

Es la implementación en gran parte del proceso mencionado anteriormente.

En vez de Cubos usa redes olap.

Falta trabajo (se aceptan colaboraciones)

Posee un lenguaje intermedio denominado QBJ

Puede usarse como librería o como DB remota (alpha)

Posee soportes de ETL, estadísticas y DM rudimentaria.

Su version 0.2 es pip-instalable (pip install yatel) necesitan tener previamente numpy

y pyqt, usa una bd distinta, y es una aplicación desktop

Yatel - Red OLAP

Yatel - la app
En funcionamiento... (0.2 algo así va a ser Yatel BI)

Yatel - Arquitectura

En que se puede aportar

YQL sin implementar.

Más minería de datos propiamente dicha (solo tiene kmeans)

Agregar autenticación rudimentaria en yatel server y dar soporte a algo como... LDAP¿?¿?.

Como es un proyecto homologado por una universidad puede extenderse como parte de un

proyecto de fin de carrera.

La parte científica per-se no esta desarrollada (algún doctorando en la sala?)

Documentación (mucha)

¿Preguntas?

Charlas:

http://bitbucket.org/leliel12/talks

Contacto:

Juan B Cabral

Mail: [email protected]

Twitter: @JuanBCabral

Blog: http://jbcabral.com/
  • Links de descarga
http://lwp-l.com/pdf1523

Comentarios de: yatel - Olap sobre redes (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios...
CerrarCerrar
CerrarCerrar
Cerrar

Tienes que ser un usuario registrado para poder insertar imágenes, archivos y/o videos.

Puedes registrarte o validarte desde aquí.

Codigo
Negrita
Subrayado
Tachado
Cursiva
Insertar enlace
Imagen externa
Emoticon
Tabular
Centrar
Titulo
Linea
Disminuir
Aumentar
Vista preliminar
sonreir
dientes
lengua
guiño
enfadado
confundido
llorar
avergonzado
sorprendido
triste
sol
estrella
jarra
camara
taza de cafe
email
beso
bombilla
amor
mal
bien
Es necesario revisar y aceptar las políticas de privacidad