Publicado el 16 de Abril del 2018
639 visualizaciones desde el 16 de Abril del 2018
4,3 MB
144 paginas
Creado hace 10a (21/06/2013)
UNIVERSIDAD DEL BÍO-BIO
FACULTAD DE CIENCIAS EMPRESARIALES
ESCUELA DE INGENIERÍA CIVIL INFORMÁTICA
“Estudio y diseño de un Data Mart Clínico NonSQL que permita comparar los tiempos de
respuesta versus un ambiente basado en SQL”
Memoria para optar por el título de Ingeniero Civil
en Informática.
Autor:
Celeste Monserrat Torres Varela
Profesor Guía:
Sr. Manuel Crisosto Muñoz
Concepción, Abril 2013
Agradecimientos:
De primera instancia a mis Padres, Mireya Varela y Norberto Torres, por su apoyo incondicional.
Mi hermana Angela por no hacer mi vida monótona y mis hermanos por estar presente en todo
momento.
A Leonel por ser una parte importante en mi vida, por su comprensión y contención durante todo
este tiempo.
A mi amigo Alfredo Arévalo, por su preocupación, ayuda y apoyo constante durante todos los años
académicos.
A Francisco Ortiz, por su buena disposición, apoyo, paciencia y por hacer posible este proyecto.
2
Resumen
Este estudio se realiza con la finalidad de comparar dos modelos de base de datos: el tradicional
modelo de datos relacional y el denominado NoSQL, que una de sus características principales es
su modelado flexible, poca rigidez al almacenar datos y capacidad de gestión de grandes
cantidades de datos.
La comparativa se realiza basado un modelo multidimensional denominado Data Marts, el cual
almacena información histórica y relevante de las entidades.
Se implementan ambos modelos y, finalmente, se realizan pruebas sobre ellos, para obtener
información cuantitativa sobre sus rendimientos.
Abstract
This study was performed in order to compare two database models: the traditional relational data
model and the so-called NoSQL, which one of its main features is its flexible modeling, low stiffness
to store data and ability to manage large amounts of data.
The comparison is performed based on a multidimensional model called data marts, which stores
historical information and relevant entities.
Both models are implemented and, finally, tests are realized on them, to obtain quantitative
information about his performances.
3
IN D IC E
CONTENIDO PAGINA
INDICE ILUSTRACIONES ............................................................................................................................... 7
INDICE TABLAS ............................................................................................................................................ 10
INTRODUCCION ............................................................................................................................................ 11
1 MARCO TEORICO ................................................................................................................................... 12
1.1 HISTORIA BASE DE DATOS ............................................................................................................... 13
1.1.1 LÍNEA DE TIEMPO DE BASE DATOS ...................................................................................................... 19
1.2 BASE DE DATOS ................................................................................................................................. 20
1.2.1 BASE DE DATOS RELACIONALES ......................................................................................................... 22
1.2.2 MODELO MULTIDIMENSIONAL ............................................................................................................... 25
1.2.3 DATA WAREHOUSE (DW) .................................................................................................................... 25
1.2.4 DATA MARTS ........................................................................................................................................ 31
1.3 BASE DE DATOS NO RELACIONALES (NONSQL) ......................................................................... 32
1.3.1 CARACTERÍSTICAS ............................................................................................................................... 33
1.3.2 CLASIFICACIÓN ..................................................................................................................................... 35
1.3.3 LIMITACIÓN DE ATOMICIDAD Y TRANSACCIONES DE INTEGRIDAD. ........................................................ 37
1.4 APACHE CASSANDRA ....................................................................................................................... 40
1.5 ¿QUÉ ES CASSANDRA? .......................................................................................................................... 40
1.6 ¿POR QUÉ CASSANDRA? ........................................................................................................................ 41
1.6.1 MODELO DE DATOS .............................................................................................................................. 42
1.6.2 CONSISTENCIA ..................................................................................................................................... 47
1.6.3 TRANSACCIONES Y CONTROL DE CONCURRENCIA ............................................................................... 50
1.6.4 ARQUITECTURA CASSANDRA ............................................................................................................... 52
1.6.5 HASHING .............................................................................................................................................. 53
1.7 HECTOR ................................................................................................................................................... 55
1.8 PIG .......................................................................................................................................................... 55
2 DEFINICIÓN DE LA EMPRESA ............................................................................................................. 56
2.1 DESCRIPCIÓN DE LA EMPRESA ................................................................................................................ 56
2.2 DESCRIPCIÓN DEL PROBLEMA ................................................................................................................. 56
4
2.2.1 SITUACIÓN ACTUAL .............................................................................................................................. 56
3 DEFINICIÓN DEL PROYECTO ............................................................................................................... 57
3.1 OBJETIVOS .............................................................................................................................................. 57
3.2 APORTES ................................................................................................................................................. 57
3.3 LÍMITES .................................................................................................................................................... 58
3.4 METODOLOGÍA ........................................................................................................................................ 58
4 ACRÓNIMOS, ABREVIACIONES Y SIGNIFICADOS .......................................................................... 59
5 ANÁLISIS .................................................................................................................................................. 61
5.1 MODELO ACTUAL .................................................................................................................................... 61
5.1.1 FUNCIONAMIENTO ................................................................................................................................ 61
5.1.2 COMPONENTES .................................................................................................................................... 62
5.1.3 FLUJO DE DATOS ................................................................................................................................. 65
5.2 MODELO FÍSICO ....................................................................................................................................... 67
5.2.1 DEBILIDADES ........................................................................................................................................ 69
6 DISEÑO ..................................................................................................................................................... 70
6.1 MODELO PROPUESTO ............................................................................................................................. 70
6.1.1 DEBILIDADES ........................................................................................................................................ 71
6.2 DIAGRAMA DE DATOS NONSQL .............................................................................................................. 71
6.3 CONCLUSIÓN ........................................................................................................................................... 75
7
IMPLEMENTACIÓN ................................................................................................................................. 76
7.1.1
Comentarios de: Estudio y diseño de un Data Mart Clínico NonSQL que permita comparar los tiempos de respuesta versus un ambiente basado en SQL (0)
No hay comentarios