¿Qué es un data warehouse y qué beneficios aporta a las organizaciones?

¿Qué es un data warehouse y qué beneficios aporta a las organizaciones?

¿Qué es un data warehouse y qué beneficios aporta a las organizaciones?

Un data warehouse es una herramienta para la toma de decisiones organizacionales, en función a información integrada y global del negocio.

Bill Inmon, el que para muchos es el padre del data warehouse, lo definió como una colección de datos orientada a temas concretos, no volátil, integrada y variante en el tiempo, que ayuda a la dirección de una empresa u organización, en la toma de decisiones.

Los data warehouses se utilizan para correlacionar una gran cantidad de datos de negocio que suelen provenir de varias fuentes de datos, tanto internas como externas, de forma que puedan aportar conocimiento acerca del rendimiento de la organización.
Características principales y pasos para la construcción de un data warehouse

Orientado a temas concretos: en un data warehouse los datos se organizan alrededor de temas específicos del negocio en lugar de hacerlo alrededor de aplicaciones tales como la gestión de inventario o el procesamiento de pedidos. Por ejemplo, un data warehouse se puede utilizar para analizar las ventas.

No volátil: una vez que los datos están en el data warehouse, ya no van a cambiar. No se actualizan en tiempo real. Hay cargas periódicas de información desde bases de datos transaccionales y otras fuentes para refrescarlos con datos nuevos, pero sin variar los antiguos. Esto hace que la información esté menos expuesta a cambios momentáneos.

Integrado: un data warehouse integra datos de múltiples fuentes. Por ejemplo, la fuente A y fuente B pueden tener diferentes maneras de identificar un producto, pero en un almacén de datos, sólo habrá un único modo de identificar un producto. Tiene que ver con la forma en que los datos se extraen y transforman de las diversas fuentes de datos.

Variante en el tiempo: En un data warehouse se mantienen los datos históricos ordenados por diferentes periodos de tiempo. De esta forma, se pueden recuperar datos de 3 meses, 6 meses, 12 meses, o incluso datos más antiguos. Esto contrasta con un sistema basado en transacciones, donde a menudo sólo se mantienen los datos más recientes. Por ejemplo, de un sistema transaccional se puede obtener la dirección más reciente de un cliente, mientras que en un data warehouse podemos encontrar todas las direcciones asociadas históricamente a un cliente.


El proceso de construcción de un data warehouse consta de una serie de pasos y procesos:

Primero se debe identificar dónde se almacenan los datos relevantes. Esto puede llegar a ser un desafío ya que en las organizaciones los datos de los clientes están en decenas de sistemas diferentes.

En segundo lugar, los datos deben ser extraídos de esos sistemas. Es posible que cuando se desarrollaron no se esperara que fuera necesario alinear sus datos con los de otros sistemas. También es posible que la limpieza de los datos sea distinta en los diferentes sistemas. Por esa razón la información tiene que ser transformada en un formato estandarizado, consistente y limpio.

A continuación, es necesario cargar en el data warehouse. Los datos históricos que tienen poca relevancia para las operaciones actuales pueden dejarse a un lado, o cargar solo si hay espacio suficiente. Los datos operacionales y transaccionales más recientes que provienen de las diversas funciones, canales y puntos de contacto, es muy probable que sean priorizados para su carga. Es muy importante ir refrescando los datos, lo cual se puede hacer de forma diaria o semanal, dependiendo de la velocidad de los cambios en el negocio y su entorno.


Beneficios que aporta un data warehouse para las organizaciones

Muchos tipos de datos de negocio se analizan a través de un data warehouse. La necesidad de contar con este sistema se hace evidente cuando los requerimientos analíticos de la organización entran en conflicto con el rendimiento de las bases de datos operacionales o transaccionales. Sobre todo debido a la ejecución de consultas complejas que muchas veces son imposibles para esas bases de datos. Por lo tanto:

• Un data warehouse se emplea para hacer el trabajo analítico, dejando las bases de datos transaccionales libres para centrarse en las transacciones.

• Tiene la capacidad de analizar datos de múltiples fuentes y puede negociar las diferencias en cuanto a esquemas de almacenamiento utilizando procesos de ETL.

• Al integrar datos de múltiples sistemas de origen, permite una visión central en toda la empresa.

• Mantiene el historial de datos incluso si los sistemas transaccionales de origen no lo hacen.

• Mejora los datos, proporcionando códigos y descripciones coherentes, flags o incluso arreglando datos erróneos.

• Presenta la información de la organización de forma coherente.

• Proporciona un único modelo de datos común para todos los datos de interés independientemente de la fuente de los datos.

• Reestructura los datos de manera que tienen sentido para los usuarios de negocios.

• Reestructura los datos de modo que ofrece un excelente rendimiento para consultas analíticas complejas, sin afectar a los sistemas operativos.

• Añade valor a las aplicaciones de negocio operativas, en especial a las de gestión de relaciones con clientes (CRM).


Un data warehouse puede ayudar a las organizaciones a extraer el máximo valor de los datos que se generan en el día a día, permitiendo además analizarlos y compararlos con sus valores históricos y no solo mediante datos actuales. Aun así, en algunos casos, sobre todo cuando hablamos de big data, el data warehouse puede tener ciertas limitaciones que sin embargo pueden ser resueltas mediante el concepto de data lake.


Power Data
Soluciones de gestión de datos

Visto 585 veces
Corporación Colombia Digital

@colombiadigital

La Corporación Colombia Digital (CCD) es una organización dedicada a promover el uso y apropiación de las tecnologías de información y las comunicaciones, en beneficio del desarrollo social y económico.