Bases de Datos Multidimensionales - Introduccion a data warehouse

 
Vista:

Introduccion a data warehouse

Publicado por Jhon Anaya (1 intervención) el 04/10/2011 23:00:47
Hola chicos me estoy iniciando en el tema de los data warehouse y quisiera que me ayuden.
- que es una DW?
- que es la tabla de hechos?
- que son las dimensiones?
- a que se refieren con granularidad?
estaba leyendo algo al respecto pero la informacion es muy avanzada y no entiendo muy bien los conceptos.. muchas gracias
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder

Introduccion a data warehouse

Publicado por Yessica (1 intervención) el 16/05/2019 22:51:56
Buen día Jhon

Te comparto la siguiente información:

¿Qué es Data Warehouse?

Un almacén de datos (del inglés data warehouse) es una colección de datos orientada a un determinado ámbito (empresa, organización, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza.

Data Warehousing es el centro de la arquitectura para los sistemas de información desde la década de los '90. Soporta el procesamiento informático al proveer una plataforma sólida, a partir de los datos históricos para hacer el análisis. Facilita la integración de sistemas de aplicación no integrados. Organiza y almacena los datos que se necesitan para el procesamiento analítico, informático sobre una amplia perspectiva de tiempo.

Un Data Warehouse o Depósito de Datos es una colección de datos orientado a temas, integrado, no volátil, de tiempo variante, que se usa para el soporte del proceso de toma de decisiones gerenciales. Se puede caracterizar un Data Warehouse haciendo un contraste de cómo los datos de un negocio almacenados en un data warehouse, difieren de los datos operacionales usados por las aplicaciones de producción.

Un Data warehouse, es un almacén de datos que usa un proceso para extraer un conjunto de datos históricos, internos y externos de distintas aplicaciones, que están integrados y organizados de tal forma que permiten aplicar eficientemente herramientas para resumir, describir y analizar los datos con el fin de ayudar a la toma de decisiones estratégicas del negocio. Requiere una combinación de metodologías, técnicas, hardware y los componentes de software que proporcionan en conjunto una infraestructura para soportar el proceso de información. La estructura de datos que se defina en la construcción del Data Warehouse, debe reflejar la integración de cada uno de los departamentos y del negocio en general y con el tiempo se vaya convirtiendo en un Data Warehouse corporativo.


¿Qué es la tabla de hechos?

Una tabla de hechos es la tabla central de un esquema dimensional (estrella o copo de nieve) y contiene los valores de las medidas del
negocio (indicadores de negocio). Cada medida se toma mediante la intersección de las dimensiones que lo definen, dichas dimensiones estarán reflejadas en sus correspondientes tablas de dimensiones que rodearán la tabla de hechos y estarán relacionadas con ella.

¿Qué son las dimensiones?

El Data Warehouse organiza un gran conjunto de datos operacionales mediante múltiples dimensiones. Una dimensión es una colección de miembros o entidades del mismo tipo y constituye un calificador conceptual que provee el contexto o significado para una medida. La forma de representar la organización de los datos en un modelo dimensional es a través de un cubo (el cual no necesariamente debe tener tres dimensiones). Los miembros de una dimensión pueden estar organizados en una o más jerarquías.

¿A qué se refieren con granularidad?

La granularidad representa el nivel de detalle al que se desea almacenar la información sobre el negocio que se esté analizando. Por ejemplo, los datos referentes a ventas o compras realizadas por una empresa, pueden registrarse día a día, en cambio, los datos pertinentes a pagos de sueldos o cuotas de socios, podrán almacenarse a nivel de mes.

Mientras mayor sea el nivel de detalle de los datos, se tendrán mayores posibilidades analíticas, ya que los mismos podrán ser resumidos o sumarizados. Es decir, los datos que posean granularidad fina (nivel de detalle) podrán ser resumidos hasta obtener una granularidad media o gruesa. No sucede lo mismo en sentido contrario, ya que por ejemplo, los datos almacenados con granularidad media podrán resumirse, pero no tendrán la facultad de ser analizados a nivel de detalle. O sea, si la granularidad con que se guardan los registros es a nivel de día, estos datos podrán sumarizarse por semana, mes, semestre y año, en cambio, si estos registros se almacenan a nivel de mes, podrán sumarizarse por semestre y año, pero no lo podrán hacer por día y semana.

Referencias:

Castillo I. Data Warehousing e Inteligencia de Negocios. Universidad Cuauhtémoc. México.

DataPrix. Datawarehouse manager. Descargado el 16 de mayo de 2019 de: http://www.dataprix.com/data-warehousing-y-metodologia-hefesto/arquitectura-del-data-warehouse/34-datawarehouse-manager#x1-480003.4.4.5


Espero la respuesta de sea de utilidad.

Saludos.
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar
Revisar política de publicidad