Categorias: Todos - almacenamiento - arquitectura - datos - procesamiento

por JHONATAN DAVID PULUPA LOACHAMIN 2 anos atrás

162

Arquitectura Data WareHouse

En el ámbito de la gestión de datos, los almacenes de datos y los lagos de datos son dos estructuras esenciales que se distinguen por varias características clave. Un almacén de datos se caracteriza por su capacidad de almacenar datos estructurados y modelados que permiten a los ejecutivos organizar y utilizar la información de manera efectiva.

Arquitectura Data WareHouse

Arquitectura Data WareHouse

Arquitectura

Almacenamiento de datos que permite a los ejecutivos de negocios organizar, comprender y utilizar datos

Tipos de Data WareHouse

Mercado de datos
Almacén de datos operativos
Data warehouses empresariales

Características

No volátil
Variable en el tiempo
Datos Integrados
Orientado hacia la información relevante de la organización

Estructuras

Se puede hacer agregando data marts, que son sistemas diseñados para una línea de negocio en particular.
Con una estructura básica, sistemas operativos y archivos planos proporcionan datos en bruto que se almacenan junto con metadatos.
Al añadir un área de ensayo que se puede colocar entre las fuentes de datos y el almacén, ésta proporciona un lugar donde los datos se pueden limpiar antes de entrar en el almacén.

Diferencias con Data Lake

Seguridad: La tecnología del data warehouse existe desde hace décadas, mientras que la tecnología de big data (la base de un Data Lake) es relativamente nueva.
Agilidad: Un almacén de datos es un repositorio altamente estructurado, por definición.
Almacenamiento: Una de las principales características de las tecnologías de big data, como Hadoop, es que el coste de almacenamiento de datos es relativamente bajo en comparación con el de un data warehouse.
Procesamiento: Antes de que una empresa pueda cargar datos en un data warehouse, primero debe darles forma y estructura, es decir, los datos deben ser modelados
Datos: Un data warehouse sólo almacena datos que han sido modelados o estructurados, mientras que un Data Lake no hace acepción de datos.