PDF de programación - Combinando en un mismo DBMS: Transacciones + Análisis de Rendimiento Extremo

Imágen de pdf Combinando en un mismo DBMS: Transacciones + Análisis de Rendimiento Extremo

Combinando en un mismo DBMS: Transacciones + Análisis de Rendimiento Extremográfica de visualizaciones

Publicado el 2 de Noviembre del 2019
419 visualizaciones desde el 2 de Noviembre del 2019
1,5 MB
46 paginas
Creado hace 12a (09/06/2011)
Jun 9, 1011

Informix Ultimate Warehouse Edition

Combinando en un mismo DBMS:
Transacciones + Análisis de Rendimiento Extremo

Veronica Gomes ([email protected]) – IBM Informix Development

© 2011 IBM Corporation

Software Group – Information Management

Agenda

 Retos y Tendencias en la Industria de Data Warehouse

 Data Warehousing con Informix

 Informix Ultimate Warehouse Edition

 Informix Warehouse Accelerator

 Resultados en Rendimiento

 Información Adicional

 Q & A

2

© 2011 IBM Corporation

Software Group – Information Management

Agenda

 Retos y Tendencias en la Industria de Data Warehouse

 Data Warehousing con Informix

 Informix Ultimate Warehouse Edition

 Informix Warehouse Accelerator

 Resultados en Rendimiento

 Información Adicional

 Q & A

3

© 2011 IBM Corporation

Software Group – Information Management

Transacciones vs Análisis – Uso de la Base de Datos

Base de Datos para Transacciones (OLTP)

Data Warehouse para Análisis (OLAP)

Soporta las operaciones de misión crítica y día-a-día del negocio

Soporta la estrategia y toma de decisiones del negocio

Acceso a través de aplicaciones específicas

Acceso a través de herramientas de inteligencia de negocios

Diseño de BD a partir de la aplicación (Modelo Entidad-Relación)

Diseño multidimensional: métricas y perspectivas del negocio (Estrella)

Data actual, aislada a un sistema, detallada, normalizada

Data histórica, integrada, detallada/sumarizada a cierto nivel, duplicada

Muchos usuarios concurrentes (de niveles operativo e IT)

Pocos usuarios concurrentes (de niveles gerencial y ejecutivo)

Transacciones cortas y simples, lecturas y cambios aleatorios en línea

Queries complejos, joins, filtros, agregaciones; Delta de cargas (batch)

Acceso aleatorio a poco volumen de datos, operaciones sobre registros

Acceso secuencial a gran volumen de datos, operaciones sobre columnas

Uso repetitivo, SQL pre-definidos y pre-optimizados

Uso ad-hoc, queries no conocidos ni optimizados a priori

Métrica de rendimiento: Transaction Throughput

Métrica de rendimiento: Query Throughput & Respuesta

4

© 2011 IBM Corporation

Software Group – Information Management

Almacenamiento por Registro – Ventajas y Retos para OLAP

 Bases de datos con almacenamiento basado en registro (row-based / row-wise database)

 Características de este diseño:

– Usada en disco y memoria por los Sistemas para Manejo de Bases de Datos Relacionales (RDBMS)
– Se almacena un registro completo (tupla/fila) dentro de una página, seguido por el próximo registro
– Optimiza el almacenamiento de nuevos registros y posteriores cambios en ellos (loads, inserts, merge, update, delete)
– Es eficiente en I/O al obtener registros si el query necesita la mayoría de sus columnas
– Si la data es comprimida en el almacenamiento, el registro es descomprimido cuando se obtiene

 Ventajas:

– La tecnología de RDBMS ha evolucionado por décadas, a plataformas que satisfacen altas demandas empresariales
– Alto rendimiento en cargas de trabajo y transacciones en base a registros, como las de tipo OLTP
– Alto rendimiento en operaciones masivas de carga, inserción, merge y actualización, importantes en Data Warehouse

Informix aprovecha esta tecnología
para cargas OLTP y OLAP

5

5

© 2011 IBM Corporation

Software Group – Information Management

Almacenamiento por Registro – Ventajas y Retos para OLAP

 Retos de la carga de trabajo de tipo Warehousing/OLAP producida por consultas analíticas:

– Es inherentemente compleja para los RDBMS, ya que estos queries típicamente:

• Necesitan procesar sólo pocas columnas en millones/billones de registros a la vez
• Producen múltiples joins, scans, funciones de agregación, sorts y predicados
• Son queries ad-hoc, generados al momento desde herramientas de BI/OLAP
• El acceso es costoso: Los valores de la misma columna para cualesquiera dos

registros distintos se encuentran separados entre sí

– Todo esto en una base de datos que crece incrementalmente
– Los usuarios demandan cada vez por tiempos de respuesta rápidos y predecibles

Select col1 c, sum(col3) total
From …
Group by col1
Order by total desc;

6

6

© 2011 IBM Corporation

Software Group – Information Management

Almacenamiento por Registro – Ventajas y Retos para OLAP

 Algunas formas de superar estos retos en un RDBMS incluyen:

– Construcción de índices
– Particionamiento de datos (Fragmentación)
– Compresión de datos
– Construcción de Cubos (MOLAP/ROLAP/HOLAP)
– Creación y mantenimiento de Tablas de Agregados o Vistas Materializadas
– Entonación de la consulta SQL reescribiendo el query
– Actualización de las Estadísticas del Optimizador
– Ajuste de parámetros para optimizar carga de trabajo OLAP/DSS en el motor
– Appliances que agregan nueva capa de hardware y software optimizar el I/O al DBMS

 Tener un sistema con carga de trabajo mixta (OLTP/OLAP) es siempre un reto

– Ajustar y mantener el sistema para rendimiento tanto para OLTP como para OLAP
– La carga de trabajo OLAP afecta el rendimiento de la carga de trabajo OLTP y viceversa

7

7

© 2011 IBM Corporation

Software Group – Information Management

Almacenamiento por Columna – Ventajas y Retos para OLAP

 Bases de datos columnares (column-based / column-oriented / columnar databases)

 Características:

– La tecnología existe desde comienzos la década de los 1970’s y ha resurgido recientemente
– Se almacenan juntos los valores de cada columna, para todas las instancias (registros)

 Ventajas:

– Alto rendimiento en consultas analíticas y cualquier carga de trabajo basada en columna, donde

típicamente se necesitan todos los valores de unas pocas columnas

– Al guardar juntos todos valores de cada columna, se pueden obtener mejores niveles de compresión
– Combinada con tecnología de in-memory database, se alcanzan tiempos extremadamente bajos

Select col1 c, sum(col3) total
From …
Group by col1
Order by total desc;

8

© 2011 IBM Corporation

Software Group – Information Management

Almacenamiento por Columna – Ventajas y Retos para OLAP

 Retos:

– Lentitud en la carga completa e incremental del warehouse: Cada registro a insertar es separado en sus columnas,

cada una se almacena en forma comprimida junto con las otras instancias de valores de dicha columna

– Lentitud en operaciones basadas en registro u obtención de múltiples columnas: Cada vez que se requiere un registro

se obtienen y descomprimen separadamente los valores de sus columnas, y se agrupan para formar el registro

– Tienen necesidad de producir mecanismos internos para “imitar” un sistema relacional en varios aspectos
– Puede necesitarse: disponer de mucha memoria para escalar, crear índices apropiados, y reorganizar toda la data
– No apropiados para ambientes mixtos OLTP/OLAP
– Los datos pueden no estar disponibles durante las cargas/actualizaciones
– Dependiendo de la implementación, pueden ofrecer limitaciones adicionales en: el esquema y jerarquía de datos,

acceso a los datos, uso de estándarles y SQL, alta-disponibilidad, escalabilidad, concurrencia de usuarios, etc

Informix aprovecha esta
tecnología para queries OLAP

9

© 2011 IBM Corporation

Software Group – Information Management

Data Warehousing en 2011

DBMS Market in 2011:

 DBMS market at the close of 2009 was approximately $21.2 billion (2010 data not yet

available)

 Data Warehouse DBMS market was approximately 35% of the DBMS market or $7.42 billion

Key Findings:

 Data warehouse DBMSs have evolved to a broader analytics infrastructure supporting

operational analytics, corporate performance management and other new applications and
uses.

 Cost is driving interest in alternative architectures but performance optimization is driving

multi-tiered data architectures and a variety of deployment options - notably a strong interest
in in-memory data mart deployments.

10

10

© 2011 IBM Corporation

Software Group – Information Management

Data Warehousing en 2011

Market Dynamics for 2011:

 Today, smaller data warehouses, those less than 5 TB's of source system extracted data

(SSED) are the only "data warehouse" for the entire organization and are commonly solving
organizations' analytic needs. Gartner estimates that between 70% and 75% of all systems
referred to as EDW are actually single business departments in nature.

Analysis:

 Optimization techniques such as summaries, aggregates and indexes are simply the result
of performance restrictions inherent to normalized data and the way the RDBMS manages
rows and columns.

11

11

© 2011 IBM Corporation

Software Group – Information Management

Data Warehousing en 2011

A Glimpse Into the Future:

 Vendor solutions began to focus even more on the ability to isolate and prioritize workload

types including strategies for dual warehouse deployments and mixing OLTP and OLAP on
the same platform.

 In-memory DBMS solutions provide a technology which enables OLTP/OLAP combined
solutions. Organizations should increase their emphasis on financial viability during 2011
and even into 2012 as well as aligning their analytics strategies with vendor road maps when
choosing a solution.

12

12

© 2011 IBM Corporation

Software Group – Information Management

Tendencias de Data Warehouse para CIOs, 2011-2012

Data Warehouse Appliances:

 DW appliances are not a new concept. Most vendors have developed an appliance offering or promote

certified configurations. Main reason for consideration is simplicity.

The Resurgence of Data Marts:

 Data marts can be used to optimize DW by offloading part of the workload, returning greater performance

to the warehousing environment

Column-Store DBMSs:

 CIOs should be aware that their current DBMS vendor may offer a column-store solution. Don’t just buy a

column-store-only DBMS because a column store was recommended by your team.

In-Memory DBMSs:

 IMDBMS technology also introduces a higher probability that analytics and t
  • Links de descarga
http://lwp-l.com/pdf16827

Comentarios de: Combinando en un mismo DBMS: Transacciones + Análisis de Rendimiento Extremo (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios...
CerrarCerrar
CerrarCerrar
Cerrar

Tienes que ser un usuario registrado para poder insertar imágenes, archivos y/o videos.

Puedes registrarte o validarte desde aquí.

Codigo
Negrita
Subrayado
Tachado
Cursiva
Insertar enlace
Imagen externa
Emoticon
Tabular
Centrar
Titulo
Linea
Disminuir
Aumentar
Vista preliminar
sonreir
dientes
lengua
guiño
enfadado
confundido
llorar
avergonzado
sorprendido
triste
sol
estrella
jarra
camara
taza de cafe
email
beso
bombilla
amor
mal
bien
Es necesario revisar y aceptar las políticas de privacidad