DATAWARHOUSE
DEFINIZIONE:
è la base di dati concepita per
sistemi a supporto delle decisioni
(business intelligence)
Immon (1992): “collezione di dati integrata,
non volatile, orientata ai soggetti, e variabile nel
tempo, a supporto delle decisioni”
I datawarhouse memorizzano i dati in modo da ottimizare le operazioni OLAP
OPERAZIONI OLAP(On-Line Analitic Processing)
Operatori di manipolazione dei dati modellati con strutture multidimensionali,che producono nuova conoscenza
dati sono aggregati,storici, integrati
operatori di ...aggregazione dei dati
drill-down
-aumenta il dettaglio di una dimensione
roll-up
-restringe il dettagli
-esegue agregazioni delle misure per riduzione di dimensione
operatori di ...restrizioni sui dati
dice
fissa il valore di due o più dimensioni
slice
fissa il valore di una dimensione
push
trasforma una dimensione in una misura
pull
trasforma una misua in una dimensione
A differenza del DB,esprimono la dinamica di un certo fenomeno nel tempo
Attraverso serie temporali, una tecnica che richiede più dati storici (dati di 4 o più anni)
costruzione di un DW
-si basano sul concetto di fatto di interesse
-cardinalità delle relazioni: m:n
MODELLO MULTIDIMENSIONALE
il modello multidiensionale riflette il modo di pensare delle persone
Mette al centro i fatti,poichè essi sono gli oggetti che influenzano il proceso decisionale
FATTO
concetto d'interesse per il modello decisionale
MISURA
proprietà numerica di un fatto,descrive un aspetto quantitativo
DIMENSIONI
proprietà con un dominio finito di un fatto
OCCORENZE
le occorenze di un fatto corrispondono a eventi accaduti
progettazione concettuale di un DW
1.fatti
2.misura
3.dimensioni
4.attributi delle dimensioni
5.aggregazioni e partizionamenti
6.tempo
modello a stella
denormalizzato quindi no implementabile sul database
-ridondante
-tante tabelle(svantaggio)
-denormalizzato
modello a fiocco di neve
normalizzato quindi implementabile sul database
-più colonne che contengono meno dati
-possibile aggiornamento a catena
-normalizzato