jonka JHONATAN DAVID PULUPA LOACHAMIN 2 vuotta sitten
152
Arquitectura Data WareHouse
En el ámbito de la gestión de datos, los almacenes de datos y los lagos de datos son dos estructuras esenciales que se distinguen por varias características clave. Un almacén de datos se caracteriza por su capacidad de almacenar datos estructurados y modelados que permiten a los ejecutivos organizar y utilizar la información de manera efectiva.
Almacenamiento de datos que permite a los ejecutivos de negocios organizar, comprender y utilizar datos
Tipos de Data WareHouse
Mercado de datos
Almacén de datos operativos
Data warehouses empresariales
Características
No volátil
Variable en el tiempo
Datos Integrados
Orientado hacia la información relevante de la organización
Estructuras
Se puede hacer agregando data marts, que son sistemas diseñados para una línea de negocio en particular.
Con una estructura básica, sistemas operativos y archivos planos proporcionan datos en bruto que se almacenan junto con metadatos.
Al añadir un área de ensayo que se puede colocar entre las fuentes de datos y el almacén, ésta proporciona un lugar donde los datos se pueden limpiar antes de entrar en el almacén.
Diferencias con Data Lake
Seguridad: La tecnología del data warehouse existe desde hace décadas, mientras que la tecnología de big data (la base de un Data Lake) es relativamente nueva.
Agilidad: Un almacén de datos es un repositorio altamente estructurado, por definición.
Almacenamiento: Una de las principales características de las tecnologías de big data, como Hadoop, es que el coste de almacenamiento de datos es relativamente bajo en comparación con el de un data warehouse.
Procesamiento: Antes de que una empresa pueda cargar datos en un data warehouse, primero debe darles forma y estructura, es decir, los datos deben ser modelados
Datos: Un data warehouse sólo almacena datos que han sido modelados o estructurados, mientras que un Data Lake no hace acepción de datos.