Arquitectura Data WareHouse
Diferencias con Data Lake
Datos: Un data warehouse sólo almacena datos que han sido modelados o estructurados, mientras que un Data Lake no hace acepción de datos.
Procesamiento: Antes de que una empresa pueda cargar datos en un data warehouse, primero debe darles forma y estructura, es decir, los datos deben ser modelados
Almacenamiento: Una de las principales características de las tecnologías de big data, como Hadoop, es que el coste de almacenamiento de datos es relativamente bajo en comparación con el de un data warehouse.
Seguridad: La tecnología del data warehouse existe desde hace décadas, mientras que la tecnología de big data (la base de un Data Lake) es relativamente nueva.
Estructuras
Al añadir un área de ensayo que se puede colocar entre las fuentes de datos y el almacén, ésta proporciona un lugar donde los datos se pueden limpiar antes de entrar en el almacén.
Con una estructura básica, sistemas operativos y archivos planos proporcionan datos en bruto que se almacenan junto con metadatos.
Se puede hacer agregando data marts, que son sistemas diseñados para una línea de negocio en particular.
Características
Orientado hacia la información relevante de la organización
Datos Integrados
Variable en el tiempo
No volátil
Tipos de Data WareHouse
Data warehouses empresariales
Almacén de datos operativos
Mercado de datos
Arquitectura
Almacenamiento de datos que permite a los ejecutivos de negocios organizar, comprender y utilizar datos