Data WareHouse: ¿Sí o No?

El Data WareHouse (en adelante DWH para simplificar) es ese gran desconocido y maltratado por los usuarios en el que hay que dedicar mucho tiempo para montarlo, más aun para diseñarlo y, si algo de esto se ha hecho mal, maldecir y dedicar más es fuerzos todavía en el rediseño y ajustes del mismo.

Pero pese a todo esto, es algo vital en muchos entornos de producción de BI. Intentaré hacer un poco de abogado del diablo y os comentaré en voz alta (por escrito) el por qué está más al día la pregunta de si es necesario o no.

¿Qué es un DWH?

Literalmente es un almacén de datos donde guardaremos toda la información que queremos utilizar en nuestras herramientas de BI.

Recuperando un esquema de la entrada de mi caja de herramientas, os situaba el DWH

Diapositiva1

por encima de las aplicaciones y por debajo de la capa de BI (por arriba de la BBDD) por el hecho de ubicarnos en una visión más jerárquica donde se situa.

Bien pues este DWH recibirá los datos de nuestras aplicaciones (y cada vez más otros origenes) y la tendremos ordenada y estructurada para poder cargarla en las herramientas de BI. Este proceso de carga se conoce como ETL (Extract, Transform, Load) aunque también se está enfocando como ELT (Extract, Load, Transform)

En cualquiera de los dos enfoques, la idea es la misma:

  1. Extraer la información de los distintos orígenes de datos
  2. Transformarla para dejarla lista para su utilización
  3. Cargarla (Load) en el almacén con la estructura definida en el diseño previamente pensado

Y todo este rollo son horas de BackOffice que no se valoran ni se ven, pero que no nos podemos saltar ¿o sí?

El principio del “dilema”

Si nos planteamos si es necesario o no, no es porque no deba existir, sino porque cada día las herramientas de BI han avanzado mucho y llevan integradas potentes herramientas de ETL con lo que podemos embeber dentro de la solución la generación del almacén de datos.

Esto quiere decir que puedo coger un PowerBI o QlikView y tirarlo directamente contra el DB2 de Geinfor ERP y añadir información de la Wikipedia y del BCE y montar un cuadro de mando con poco esfuerzo y plenamente funcional.

Pudiendo hacer esto y estar “bien hecho” ¿Para qué complicarnos la vida con un DHW? pues para algo tan sencillo como la reutilización y la estandarización.

¿Cuando no es necesario?

Parto de la base de que personalmente opino que siempre es necesario, pero con la tecnología actual, me plantearía no utilizarlo cuando:

  • Tengo un único origen de datos principal (ERP) al que le “añado” poca información del exterior y esta siempre disponible
  • No es un entorno multiempresa
  • El volumen de datos es Medio-Bajo
  • No trabajamos con indicadores que tengamos que “guardar” su estado
  • No tengamos muchas herramientas de informes
  • Como entorno de pruebas para asegurarnos de la estructura del DWH en una nueva área que los usuarios clave no nos dan buena información

¿Cuando sí es necesario?

Siempre. No es broma, casos en los que es sí o sí obligatorio

  • Multiempresa
  • Múltiples plataformas (ERP+CRM o similares)
  • Distintos puntos de explotación de la información. Ej.: Tablas dinámicas de excel, con motor de informes y Qlik o PowerBI
  • Cuando los orígenes de datos no están siempre online o tenemos dudas de su estabilidad

Conclusión

Desde mis distintas batallas, monta un DWH (si puedes). Si estás en alguno de los casos que comento cuando SÍ es necesario, móntalo sin lugar a dudas. En el resto de casos es una zona gris en la que te tienes que sentir cómodo, al final el tiempo dirá si la decisión y la estructura que has pensado es la correcta para tu caso concreto…

…y sino La Culpa de Sistemas 😉

 

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.