Arquitectura Data WareHouse

Diferencias con Data Lake

Datos: Un data warehouse sólo almacena datos que han sido modelados o estructurados, mientras que un Data Lake no hace acepción de datos.

Procesamiento: Antes de que una empresa pueda cargar datos en un data warehouse, primero debe darles forma y estructura, es decir, los datos deben ser modelados

Almacenamiento: Una de las principales características de las tecnologías de big data, como Hadoop, es que el coste de almacenamiento de datos es relativamente bajo en comparación con el de un data warehouse.

Agilidad: Un almacén de datos es un repositorio altamente estructurado, por definición.^

Seguridad: La tecnología del data warehouse existe desde hace décadas, mientras que la tecnología de big data (la base de un Data Lake) es relativamente nueva.

Estructuras

Al añadir un área de ensayo que se puede colocar entre las fuentes de datos y el almacén, ésta proporciona un lugar donde los datos se pueden limpiar antes de entrar en el almacén.

Con una estructura básica, sistemas operativos y archivos planos proporcionan datos en bruto que se almacenan junto con metadatos.

Se puede hacer agregando data marts, que son sistemas diseñados para una línea de negocio en particular.

Características

Orientado hacia la información relevante de la organización

Datos Integrados

Variable en el tiempo

No volátil

Tipos de Data WareHouse

Data warehouses empresariales

Almacén de datos operativos

Mercado de datos

Arquitectura

Almacenamiento de datos que permite a los ejecutivos de negocios organizar, comprender y utilizar datos