DATAWARHOUSE

DEFINIZIONE:
è la base di dati concepita per
sistemi a supporto delle decisioni
(business intelligence)

Immon (1992): “collezione di dati integrata,
non volatile, orientata ai soggetti, e variabile nel
tempo, a supporto delle decisioni”

I datawarhouse memorizzano i dati in modo da ottimizare le operazioni OLAP

OPERAZIONI OLAP(On-Line Analitic Processing)

Operatori di manipolazione dei dati modellati con strutture multidimensionali,che producono nuova conoscenza

dati sono aggregati,storici, integrati

operatori di ...aggregazione dei dati

drill-down

-aumenta il dettaglio di una dimensione

roll-up

-restringe il dettagli
-esegue agregazioni delle misure per riduzione di dimensione

operatori di ...restrizioni sui dati

dice

fissa il valore di due o più dimensioni

slice

fissa il valore di una dimensione

push

trasforma una dimensione in una misura

pull

trasforma una misua in una dimensione

A differenza del DB,esprimono la dinamica di un certo fenomeno nel tempo


Attraverso serie temporali, una tecnica che richiede più dati storici (dati di 4 o più anni)

costruzione di un DW

-si basano sul concetto di fatto di interesse

-cardinalità delle relazioni: m:n

MODELLO MULTIDIMENSIONALE

il modello multidiensionale riflette il modo di pensare delle persone

Mette al centro i fatti,poichè essi sono gli oggetti che influenzano il proceso decisionale

FATTO

concetto d'interesse per il modello decisionale

MISURA

proprietà numerica di un fatto,descrive un aspetto quantitativo

DIMENSIONI
proprietà con un dominio finito di un fatto

OCCORENZE
le occorenze di un fatto corrispondono a eventi accaduti

progettazione concettuale di un DW
1.fatti
2.misura
3.dimensioni
4.attributi delle dimensioni
5.aggregazioni e partizionamenti
6.tempo

modello a stella
denormalizzato quindi no implementabile sul database

-ridondante
-tante tabelle(svantaggio)
-denormalizzato

modello a fiocco di neve
normalizzato quindi implementabile sul database

-più colonne che contengono meno dati
-possibile aggiornamento a catena
-normalizzato

NORMALIZZAZIONE è un modo tecnico per dire ottimizzazione

attraverso la data normalistion si
-eliminano le rindondanze
-eiminano le dipendenze funzionali