Diferencia entre Data Mart y Data Warehouse

Descubre la principal diferencia entre Data Mart y Data warehouse.

17/05/2019
Número de visualizaciones

La diferencia entre Data Mart y Data warehouse es notable, pero ambas son herramientas de businsess intelligence. Son buenos ejemplos de herramientas concebidas para mejorar significativamente la capacidad de una organización a la hora de tomar decisiones de negocio.

Se denomina inteligencia empresarial, inteligencia de negocios o BI (del inglés business intelligence), al conjunto de estrategias y aspectos relevantes enfocados a la administración y creación de conocimiento sobre el medio. A través del análisis de los datos existentes en una organización o empresa.

Diferencia entre Data Mart y Data Warehouse

Al pensar en Business Intelligence, inevitablemente nos vienen a la mente conceptos como datamart, datawarehouse, OLAP (On Line Analytical Processing), Customer Relationship Management (CRM) y Data Mining. Todos estos conceptos se aglutinan bajo el marco común del denominado “Collaborative Business Intelligence”, que nos permite gestionar conocimientos, y no sólo información.

Si quiere conocer más en profundidad el concepto OLAP, consulte el artículo Definición de OLAP.

Por lo tanto, este tipo de herramientas son fundamentales para la nueva sociedad de la información y el conocimiento. Esto, a día de hoy es ya una realidad.

Tal y como adelantaba Michael E. Porter en 1998, las características y el contexto de la sociedad de la información han generado la necesidad de optar por rápidos, mejores y eficientes métodos que puedan extraer y transformar los datos de una empresa y a su vez distribuirlos a lo largo de su cadena de valor. La inteligencia de negocios puede responder ante la necesidad planteada por Porter. Se podría deducir, en una primera instancia, que la inteligencia de negocios es una evolución de los sistemas de soporte de decisiones.

Para saber más sobre Business Intelligence puede consultar el artículo Business Intelligence, ventajas de uso.

 

Definición de Data Warehouse

El concepto de Data Warehouse significa almacén de datos. Nació en la década de los 80 ante la necesidad de desarrollar un sistema de almacenamiento de datos. Con los requerimientos de una gestión fluida y ordenada de los datos. De esta forma conseguimos un significativo ahorro en tiempo y presupuesto frente a los sistemas de datos tradicionales.

Un Data Warehouse recopila y administra datos de diversas fuentes para proporcionar información empresarial significativa. En este almacén se almacenarán los datos durante el período de tiempo necesario para cumplir con las necesidades de consulta de la organización.

Es una recopilación de datos centralizada. Está separada de los sistemas operacionales y apoya la toma de decisiones de la empresa. En un Data Warehouse los datos se almacenan desde una perspectiva histórica.

Los datos en el almacén se obtienen de múltiples fuentes. Se verifica, se limpia y entonces se integra con el sistema Data Warehouse. El almacén de datos requiere una rápida gestión de una gran capacidad de almacenamiento. Esta herramienta puede responder a cualquier consulta compleja relacionada con los datos. Los datos recopilados se utilizan para guiar la toma de decisiones. Data Warehouse pone a nuestra disposición herramientas de análisis, informes y extracción de datos. Constituye una diferencia entre Data Mart y Data warehouse.

Para tener más información sobre su diseño, puede consultar el artículo Guía para construir un Data Warehouse.

Si quiere ver un caso de implementación de un Data Warehouse, puede consultar Implementar un Data Warehouse en AWS

 

Definición de Datamart

Un Data Mart es un subconjunto de un almacén de datos orientado a una línea de negocios específica. Los almacenes de datos contienen depósitos de datos resumidos recopilados para su análisis en una sección o unidad específica dentro de una organización, por ejemplo, el departamento de ventas.

Un Data Mart solo obtiene datos de unas pocas fuentes. Estas fuentes pueden ser el Data Warehouse corporativo, sistemas operacionales internos o fuentes de datos externas.

El DataMart es un sistema orientado a la consulta. La distribución interna de los datos es clara. Se utilizan modelos dimensionales de estrella o copo de nieve para su estructura.

Un Data Mart es un sistema de indexación y extracción. Es un subconjunto importante de un Data Warehouse. Está centrado en un área específica dentro del negocio. Diseñado para satisfacer las necesidades de un grupo específico de usuarios. De esta forma también se considera un almacén de datos departamental, aquí podemos ver otra diferencia entre Data Mart y Data warehouse.

Los Data Mart son rápidos y fáciles de usar, ya que utilizan pequeñas cantidades de datos.

Para ver un ejemplo de aplicación para generar Data Mart, pruebe Data Mart Builder de IQub.

 

Diferencia entre Data Mart y Data warehouse

Como hemos visto, son términos bastante similiares, pero la principal diferencia entre Data Mart y Data Warehouse reside en el alcance.

Un Data Warehouse es un almacén de datos es un gran depósito de datos recopilados de diferentes organizaciones o departamentos dentro de una corporación.

Un Data Mart, en cambio, es un subconjunto único de un Data Warehouse. Está diseñado para satisfacer las necesidades de un determinado grupo de usuarios.

Un Data mart se centra en un solo tema, mientras que los datos de un Data Warehouse comprende datos de todos los departamentos de la organización donde se actualiza continuamente para eliminar datos redundantes

El proceso de implementación un Data Warehouse puede extenderse muchos meses e incluso años. El proceso de implementación de Data Mart está restringido a unos pocos meses.

Los datos almacenados en un Data Warehouse siempre ofrecen más detalle en comparación con los de un Data Mart.

 

Comparativa entre Data Warehouse y Data Mart

A continuación vamos a ver más en detalle la diferencia entre Data Mart y Data Warehouse.

CriterioData WarehouseData Mart
UsoAyuda a tomar una decisión estratégica.Ayuda a tomar decisiones tácticas para el negocio.
ObjetivoEl objetivo principal de Data Warehouse es proporcionar un entorno integrado y una imagen coherente de la empresa en un momento determinado.Utilizado principalmente en una división de negocios a nivel de departamento.
DiseñoComplejoSencillo
Modelo dimensionalPuede o no puede usarse en un modelo dimensional. Sin embargo, puede alimentar modelos dimensionales.Se construye enfocado en un modelo dimensional usando un esquema de inicio.
Gestión de datosIncluye una gran área de la corporación, por lo que se tarda mucho tiempo en procesarla.Son fáciles de usar, diseñar e implementar, ya que solo puede manejar pequeñas cantidades de datos.
FocoEl Data Warehouse se enfoca ampliamente en todos los departamentos. Es posible que incluso pueda representar a toda la empresa.Data Mart está orientado a un área de negocio y se utiliza a nivel de departamento.
Tipo de datosLos datos almacenados en Data Warehouse siempre ofrecen más detalle en comparación con data mart.Los Data Marts están construidos para grupos de usuarios particulares. Por lo tanto, los datos son cortos y limitados.
NormalizaciónLos almacenes modernos están en su mayoría desnormalizados para proporcionar consultas de datos más rápidas y un buen rendimiento de lecturaNo hay preferencia entre una estructura normalizada o desnormalizada.
Área temáticaEl objetivo principal de Data Warehouse es proporcionar un entorno integrado y una imagen coherente de la empresa en un momento determinado.En su mayoría tienen solo un área temática, por ejemplo, cifra de ventas.
Almacenamiento de datosDiseñado para almacenar datos de decisiones de toda la empresa, no solo datos de marketing.Modelado dimensional y diseño de esquema en estrella empleado para optimizar el rendimiento de la capa de acceso.
Tipo de datosLa variación en el tiempo y el diseño no volátil se aplican estrictamente.Principalmente incluye estructuras de datos de consolidación para satisfacer las necesidades de informes y consultas del área temática.
Valor de los datosSolo lectura desde el punto de vista de los usuarios finales.Datos transaccionales agrupados alimentados directamente desde el Data Warehouse.
AlcanceEs más útil ya que puede traer información de cualquier departamento.Data Mart contiene datos, de un departamento específico de una empresa. Puede que haya Data Marts separados para ventas, finanzas, marketing, etc. Tiene un uso limitado
FuenteLos datos provienen de muchas fuentes.Los datos provienen de muy pocas fuentes.
tamañoEl tamaño del Data Warehouse puede variar de 100 GB a más de un TB.El tamaño de Data Mart es inferior a 100 GB.
Tiempo de implementaciónEl proceso de implementación de Data Warehouse puede extenderse de meses a años.El proceso de implementación de Data Mart está restringido a unos pocos meses.

 

1+
Categorizado en: Desarrollo de Aplicaciones

4 Comentarios

  1. Daniel dice:

    Me sirvió mucho para mi clase de análisis de sistemas de negocios, solo una pregunta que no me quedo clara
    ¿La arquitectura de un data mart es igual a un data warehouse?

    0
    • Rafael Marín Rafael Marín dice:

      Buenos días Daniel.
      En esencia la arquitectura es muy parecida pero tiene sutiles diferencias.
      Data Marts son minis Data Warehouse, pueden ser la extensión de un DW o los elementos que lo componen.
      Los primeros proyectos de Data Warehouse (DW) se referían a una arquitectura centralizada. Si bien fue interesante proporcionar uniformidad, control y mayor seguridad, implementar este enfoque no es una tarea fácil. Requiere una metodología rigurosa y una comprensión completa de los negocios de la empresa. Este enfoque puede ser largo y costoso y, por lo tanto, su implementación requiere una planificación muy detallada. Con la aparición de un data mart o almacén departamental, el enfoque descentralizado se convirtió en una de las opciones de arquitectura del almacén de datos. Los data marts pueden venir de dos maneras. El primero es de arriba hacia abajo y el otro es de abajo hacia arriba.
      Espero haberle ayudado.
      Un saludo.

      0
  2. sandra medina dice:

    muy buen articulo , muchas gracias

    1+

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Descubre MasterClass de INESEM. Una plataforma en la que profesionales enseñan en abierto

Profesionales enseñando en abierto