ANALISI SECONDARIA
analisi di dati precedentemente raccolti disponibili e organizzati in modo sistematico rispetto ad una unità di analisi individuale o aggregata provenienti da una o più fonti statistiche con lo scopo di rispondere ad una domanda di ricerca definita indipendentemente dalle finalità con cui i dati sono stati originariamente raccolti

ANALISI SECONDARIA NON E'

META-ANALISI
analisi statistica di un largo numero di risultati di ricerca allo scopo di integrarne le conclusioni.analisi primaria. le unità di analisi sono i singoli studi

RIELABORAZIONE di risultati di ricerca pubblicati in rapporti ufficiali o pubblicazioni accademiche

ARCHIVIO AMMINISTRATIVO O ARCHIVIO DI TESTI

STRATEGIA DI RICERCA SPECIFICA
LIVELLI SPECIFICI

DISEGNO DI RICERCA

COSTRUZIONE DELLA BASE EMPIRICA

ORGANIZZAZIONE DEI DATI

ANALISI DEI DATI

ESPOSIZIONE DEI RISULTATI

TROVARE I DATI
scegliere i dataset o il dataset più adeguato considerando i vincoli e le risorse

r

I DATASET SONO DIVERSI PER DISEGNO DI CAMPIONAMENTO TECNICA DI RILEVAZIONE GRADO DI DIFFUSIONE PUBBLICA ECC.

tipologia di dati secondari proposta da Hakinm hanno 3 tipi di problemi:
1. accesso ai dati ristretto
2.alcune fonti sono ricche di informazioni altre meno
3. difficoltà nel collegare fonti diversi di dati

r

CI SI CONCENTRA SU DATI INDIVIDUALI CAMPIONARI CHE VENGONO DISTINTI IN BASE AL DISEGNO DI RICERCA E DEL CARATTERE ISTITUZIONALE O MENO DELLA FONTE.

INDAGINI TRASVERSALI
CROSS SECTIONAL SURVEY
dati poco diffusi ed eterogenei sono per lo più dati non istituzionali

INDAGINI LONGITUDINALI
insieme di indagini limitate ma più governabili delle cross sectional survey. qualità omogenea qualità dei dati buona pubblicamente accessibili

INDAGINI LONGITUDINALI DA FONTI NON ISTITUZIONALI
le più conosciute ILFI e ITANES e quelle sulla condizione giovanile dell'istituto IARD

INDAGINI LONGITUDINALI E COMPARATE DA FONTI NON ISTITUZIONALI
le più usate EES ESS, si tratta di indagini trasversali ripetute SHARE

INDAGINI LONGITUDINALI DA FONTI ISTITUZIONALI
la longitudinalità la diffusione e l'ufficialità sono le caratteristiche primarie indagini progettate per fornire un potenziale illimitato all'analisi secondaria SISTEMA DI INDAGINE ANNUALE MULTISCOPO e l'ISTAT.

INDAGINI LONGITUDINALI E COMPARATE DA FONTI ISTITUZIONALI
ricade l'EUROBAROMETRO, EUSILC dell'EUROSTAT

CENSIMENTO
compiuti dallISTAT ogni 10 anni, dati troppo essenziali

DATASET DERIVATI DA ARCHIVI AMMINISTRATIVI
dati che raccolgono le organizzazioni burocratiche nello svolgimento delle loro proprie funzioni

SCEGLIERE E REPERIRE I DATI
si basa su:
conformità al disegno di ricerca
la qualità dei dati
la loro diffusione

r

NELL'ANALISI SECONDARIA LO SCIENZIATO TIENE CONTO DELLE TEORIE, DELLE IPOTESI E DEI DATI RACCOLTI, AVVIANDO UN PROCESSO DI ADATTAMENTO PER FAR CONVERGERE TEORIA, IPOTESI DATI CONCETTI E VARIABILI

CONFORMITA' AL DISEGNO DI RICERCA

i dataset devono contenere le variabili presupposte dal disegno di ricerca

la domanda di ricerca può avere un carattere più o meno specifico.
DOMANDA GENERALE: RICERCA LONGITUDINALE
DOMANDA SPECIFICA: RICERCA TRASVERSALE.
per la ricerca sui comportamenti e i dati fattuali si possono usare fonti istituzionali
per opinioni atteggiamenti motivazioni si usano fonti non istituzionali

CONTROLLARE NEI DATASET LA PRESENZA DELLE VARIABILI UTILI PER OPERATIVIZZARE I CONCETTI PRESENTI NELLA DOMANDA DI RICERCA (prima le variabili dipendenti e poi quelle indipendenti)

CONFORMITÀ DEL CAMPIONE RISPETTO AL DISEGNO DI RICERCA
le indagini longitudinali contengono campioni rappresentativi della popolazione nazionale
le indagini trasversali contengono campioni della popolazione più specifica.
le indagini longitudinali e comparate devono soddisfare il disegno del ricercatore e possono essere sostituite con indagini trasversali combinate

STRUTTURA DEI DATI
se si vuole rispondere a domande sul cambiamento a livello individuale usare PANEL se si vuole rispondere a domande sulle relazioni familiari usare HOUSEHOLD SURVEY

QUALITÀ DEI DATI dei dataset.Aspetti più importanti:
formulazione delle domande e delle alternative di risposta
modalità di rilevazione
tasso di risposta e valori mancanti
sistema di ponderazione applicato
disegni di campionamento probabilistico non probabilistico

MODALITÀ' DI DIFFUSIONE DEI DATI
bisogna considerare gli aspetti pratici:
i dataset possono essere disponibili presso archivi dati centralizzati, presso l'istituzione responsabile della raccolta dati, ma possono anche non essere pubblici

GLI ARCHIVI DATI DELLE SCIENZE SOCIALI sono notevoli ed eterogenei

approccio deduttivo a partire da un certo quadro teorico il ricercatore formula delle ipotesi e domande di ricerca e ricerca i dataset più appropriati per rispondere

approccio induttivo
l'approfondita conoscenza dell'indagine muove altre domande di ricerca, non bisogna però dimenticare l'impianto teorico che lo studioso deve avere, pena la banalità della ricerca.

DATASET PIU' DIFFUSI
4 SEZIONI

GRANDI INDAGINI MULTISCOPO
ISTAT, ESS, ISSP

STUDIARE LE DISUGUAGLIANZE E LE CONDIZIONI DI VITA IN ITALIA
ILFI, ISTAT, BANCA D'ITALIA

STUDIARE LE DISUGUAGLIANZE E LE CONDIZIONI DI VITA IN PROSPETTIVA COMPARATA
EUROSTAT, EUROFOUND

STUDIARE I VALORI E LA POLITICA
ITANESS, EES, EUROBAROMETRO

COMBINARE DATASET
i dataset possono essere combinati in 3 modi

AGGIUNGENDO CASI
le variabili restano le stesse
avviene nelle inchieste ripetute
nelle inchieste comparate e in quelle cumulate

AGGIUNGENDO VARIABILI PER VARIABILE CHIAVE DELLO STESSO LIVELLO

AGGIUNGENDO VARIABILI PER VARIABILE CHIAVE DI DIVERSO LIVELLO
caso tipico delle analisi multilevel (livello micro e livello macro)

COMPARABILITA' DEI CAMPIONI lavorare su indagini combinate comporta due problemi la comparabilità delle domande e quella dei campioni

POSSIBILI FONTI DI DISTORSIONI
PROCEDURE DI CAMPIONAMENTO
MODALITA' DI RILEVAZIONE DEI DATI

STRATEGIE PER RISOLVERE I PROBLEMI:
INSERIRE VARIABILI DI CONTROLLO
ANALISI MULTI-SAMPLE
CALCOLARE FATTORI DI CORREZIONE CONFRONTANDO I RISULTATI ATTESI CON E SENZA FATTORI DI CORREZIONE

ANALISI SECONDARIA E'
relativamente al livello di aggregazione

DATI TESTUALI
archivi che raccolgono e organizzano sistematicamente informazioni

DATI INDIVIDUALI survey, sondaggi, indagini di mercato

DATI AGGREGATI
raccolti per fini istituzionali o amministrativi
unità di analisi entità geografica o territoriale
il maggior dettaglio di disaggregazione è il comune

DISEGNO DI RICERCA

OPPORTUNITÀ' OFFERTE DALL'ANALISI SECONDARIA
sviluppare teoria e conoscenza su un problema
analizzare il cambiamento nel tempo
studiare un problema comparativamente
controllare e migliorare l'attendibilità dei dati

TEORIA piano esplicativo
si pone l'obiettivo di spiegare un fenomeno

CONOSCENZA piano descrittivo
obiettivo di aumentare la conoscenza su un fenomeno

ANALISI LONGITUDINALE E COMPARATA
obiettivo analizzare il cambiamento nel tempo e in modo comparativo

ATTENDIBILITÀ' problema metodologico l'analisi secondaria è uno strumento utile per controllare l'attendibilità dei dati anche dell'analisi primaria
consente di ovviare alla scarsità del campione, di migliorare l'incertezza delle stime.

DISEGNI DI RICERCA SECONDARIA DISEGNI DIVERSI A SECONDA DELLA TIPOLOGIA: 2 DIMENSIONI
numero di punti nel tempo considerati
numero di contesti da porre a confronto

DISEGNI DI RICERCA TRASVERSALI

ANALISI REPLICATA
cerca di riprodurre i risultati del ricercatore primario
REPLICABILITA' possibilità di controllo dei membri della comunità scientifica. Incentiva la CUMULATIVITA'

ANALISI DI INDAGINI PARALLELE
stessa domanda con diversa indagine.
possibile risposta del problema dell'incertezza delle stime

r

NELLA RICERCA SOCIALE LE FONTI DI INCERTEZZA SONO MOLTEPLICI. INCERTEZZA è L'ERRORE DELLE STIME DEFINITO COME SCARTO TRA VALORE VERO DELLA VARIABILE E VALORE OSSERVATO DELLA VARIABILE. DALL'INDICATORE ALLA VARIABILE 3 ERRORI:SELEZIONE DEI CASIPROCESSO DI OSSERVAZIONE TRATTAMENTO DEI DATI

ANALISI CON DIVERSA DOMANDA DI RICERCA DELLA STESSA INDAGINE
caso classico di analisi secondaria. obiettivo sviluppare la teoria e la conoscenza su un problema a partire dai dati già raccolti. L'analisi secondaria sviluppa la teoria o la confuta.

r

L'ANALISTA SECONDARIO Può INTERVENIRE:SPECIFICANDO L'OGGETTO DI RICERCAMIGLIORANDO LA DEFINIZIONE DEI CONCETTI CHIAVE O UNA LORO Più APPROPRIATA MISURAZIONEAPPROFONDENDO LA RELAZIONE CAUSALE TRA LE VARIABILI

ANALISI DI INDAGINI CUMULATE
combinare i dataset di diverse indagini per rispondere a una domanda di ricerca. untile quando il campione è scarso o le popolazioni sono rare

ANALISI MULTILIVELLO
nata per studiare un fenomeno influenzato da elementi che appartengono a livelli gerarchici diversi. permette di specificare le domande di ricerca in termini micro-macro

r

COLEMAN BOAT QUESTO MODELLO SERVE PER SPIEGARE I CAMBIAMENTI E LE VARIAZIONI A LIVELLO MACRO CHE COSTITUISCONO IL CENTRO DELLO STUDIO SOCIALE E CHE SONO DETERMINATE DA VARIAZIONI A LIVELLO MICRO INDIVIDUALE PER POI RISALIRE AL SOCIALE. TRE PASSAGGI:GLI EFFETTI SUGLI INDIVIDUI DEGLI EVENTI E DELLE CONDIZIONI MACROLE AZIONI INDIVIDUALI CHE NE SEGUONOGLI EFFETTI MACRO DELLE INTERAZIONI INDIVIDUALIDAL PUNTO DI VISTA OPERATIVO L'ANALISI MULTILIVELLO PRESUPPONE CHE IL FILE DATI MICRO CONTENGA UNA SERIE DI VARIABILI MACRO I FILE POSSONO ESSERE GIA' STATI RACCOLTI IN PROSPETTIVA GERARCHICA OPPURE POSSONO ESSERE RESI MULTILIVELLO NEL CORSO DELL'ANALISI SECONDARIA

DISEGNI DI RICERCA LONGITUDINALI E COMPARATI
i dati sono raccolti per ogni variabile per due o più periodi di tempo distinti
i soggetti o i casi analizzati sono gli stessi o almeno comparabili da una periodo all'altro
l'analisi comporta un confronto dei dati tra due o più periodi

r

IL CAMBIAMENTO NEL TEMPO Può ESSERE DECLIANATO IN DUE MODI:CAMBIAMENTO INDIVIDUALECAMBIAMENTO AGGREGATO

ANALISI DI INDAGINI RIPETUTE
misure simili fatte in punti diversi nel tempo su campioni di una popolazione equivalente senza che i casi siano gli stessi nelle diverse occasioni di raccolta dei dati

r

POPOLAZIONE EQUIVALENTE QUELLA CHE RIMANE DEFINITA NEGLI STESSI TERMINI, MA CHE Può CAMBIARE COME COMPOSIZIONE NEL TEMPOCAMBIAMENTO NETTO: CAMBIAMENTO AL NETTO DEI FLUSSI DI CAMBIAMENTO INDIVIDUALE

ANALISI DI TREND
descrivere l'andamento nel tempo a livello aggregato di un determinato fenomeno

r

L'INDAGINE DI TREND Può ESSERE APPROFONDITA STUDIANDO COME SI DIFFERENZIANO GLI ANDAMENTI NEI GRUPPI DIVERSI: GLI ANDAMENTI POSSONO ESSERECOINCIDENTIPARALLELI STABILI NEL TEMPODIVERGENTI DIFFERISCONO AUMENTANDO NEL TEMPOCONVERGENTI LE DIFFERENZE DIMINUISCONO NEL TEMPOINCROCIARSI PRIMA CONVERGONO E POI DIVERGONO

ANALISI DI COORTE
coorte=anno di nascita

ANALISI DI PANEL
le osservazioni sono raccolte sugli stessi soggetti nel tempo e colgono il cambiamento a livello individuale. questo permette di comprendere le cause del cambiamento
2 problemi: logoramento del campione e interferenza del panel tra la prima e la seconda somministrazione

EVENT HYSTORY ANALYSIS
dati di durata permanenza nell'unità di analisi di un certo stato
carattere esplicativo

ANALISI DI SEQUENZE
tecniche dirette ad analizzare una successione di eventi che marcano il passaggio tra diversi stati.
carattere descrittivo

ANALISI DI INDAGINI COMPARATE
studiare lo stesso problema in contesti diversi in punti diversi nel tempo
ci permette di sviluppare una specifica domanda di ricerca estendendola ad una nuova popolazione
Eurobarometro ESS ecc

DISEGNI DI RICERCA NON COMPARATI

STRATEGIE DI INTEGRAZIONE TRA ANALISI PRIMARIA E SECONDARIA

includere nel disegno di ricerca una survey primaria

utilizzare l'analisi secondaria come quadro di riferimento per l'analisi primaria

utilizzare l'analisi secondaria per migliorare il disegno di ricerca primaria

LAVORARE CON LE VARIABILI
il ricercatore secondario deve selezionare tra tutte le variabili dei dati secondari disponibil quelle che possono fungere da indicatori dei concetti implicati nelle ipotesi

OPERATIVIZZAZIONE DI UN CONCETTO NELL'ANALISI SECONDARIA:
interrogativo di ricerca
ipotesi
selezione di dati che contengono informazioni rilevanti rispetto lo scopo al fine di ottenere degli indicatori adeguati per rilevare i concetti .

r

I CONCETTI DEVONO ESSERE OPERATIVIZZATI IN VARIABILI OSSIA IN PROPRIETà DI OGGETTI E QUINDI IN ELEMENTI EMPIRICAMENTE RILEVABILI.LAZARSFELD INDIVIDUA 4 FASI CHE CONDUCONO DAI CONCETTI AGLI INDICI EMPIRICI:1. RAPPRESENTAZIONE FIGURATA DEL CONCETTOSPECIFICAZIONE DEL CONCETTO3. SCELTA DEGLI INDICATORI4. FORMAZIONE DEGLI INDICI

MISURAZIONE E VALIDITA' un indicatore è valido se misura quello che il ricercatore si propone di misurare. VALIDITA' riguarda la relazione tra concetti (teorici) e indicatori (empirici)

VALIDITA' DI CONTENUTO
quanto una serie di indicatori riescono a coprire il campo semantico del concetto, nelle sue diverse dimensioni

VALIDITA' DI COSTRUTTO
usata quando non si riesce a pervenire ad una formazione di indicatori condivisa per un determinato concetto si ha validità di costrutto quando la relazione tra le misure inerenti al concetto e altre misure sono coerenti con l'aspettativa derivata dalla teoria

avere misure per i concetti che si intendono usare

stabilire quali sono le aspettative teoriche rispetto alle relazioni tra concetti

esaminare empiricamente queste relazioni

concludere se la misura può essere considerata valida o meno

CRITERI PER LA SCELTA DI INDICATORI selezionare gli indicatori
valutare l'adeguatezza della scelta
procedere alla definizione della misura o dell'indice usato per rendere osservabile il concetto.

decisioni da prendere

TEORICO/EMPIRICO
guardare la coerenza teorico semantica o al loro funzionamento empirico
VALIDITA' DI CONTENUTO/VALIDITA' DI COSTRUTTO

UN INDICATORE/PIU' INDICATORI la scelta degli indicatori è limitata dalla scelta fatta dai ricercatori primari meglio più indicatori in quanto un indicatore solo compre solo in parte il campo semantico del concetto

TRASVERSALE/LONGITUDINALE
un contesto verso più contesti. 
CROSS SECTIONAL scelta vincolata dalla ricerca primaria
LONGITUDINALE scelta vincolara dall'elenco degli indicatori comparabili nelle varie survey

LIVELLI DI MISURAZIONE DELLE VARIABILI

LIVELLI DI MISURAZIONE DELLE VARIABILI
variabili categoriali nominali o ordinali e variabili quantiative. 
proprietà rilevata con 1 sola variabile la cui modalità è ordinale non può essere elevata ad un altro livello di misurazione. diversamente se la rilevazione viene fatta con più indicatori si possono aggiungere livelli superiori di misurazione

UN INDICATORE PER UN CONCETTO
si usa un solo indicatore per la struttura sociale dell'individuo le dimensioni socio-demografiche la classe sociale CLASSIFICAZIONE EGP

r

LA CLASSE SOCIALE E' DEFINITA IN BASSE ALLA SUA OCCUPAZIONE VALUTATA IN RELAZIONE ALLA SUA POSIZIONE NELLA GERARCHIA LAVORATIVA DEL PROCESSO DI LAVORO E DELLA SUA SITUAZIONE SUL MERCATO

LE VARIABILI POSSONO ESSERE MANIPOLATE per giungere a una operativizzazione valida del concetto

RICODIFICA DI UNA VARIABILE creazione di una nuova variabile dove i codici numerici che corrispondenti alle varie modalità di risposta vengono sostituiti o aggregati

r

esempio di ricodifica di classe sociale che originariamente comprende 8 classi viene raggruppata in una variabile semplificata a 5 modalità

VARIABILI NOMINALI COME SERIE DI VARIABILI DUMMY

r

UNA VARIABILE NOMINALE CON PIU' CATEGORIE VIENE TRASFORMATA IN VARIABILE DUMMY UNA PER CIASCUNA MODALITÀ' DELLA VARIABILE NOMINALE. IN SOSTANZA UNA VARIABILE NOMINALE POLITOMICA VIENE TRASFORMATA IN UNA SERIE DI VARIABILI DICOTOMICHE

RIDUZIONE DEL NUMERO DI CATEGORIE riduzione del numero di modalità

r

SI PUO DECIDERE DI AGGREGARE DUE O PIU' MODALITA' DALL'ANALISI SEMANTICA DEL CONCETTO. TROPPE MODALITA' POSSONO PORTARE A TROPPE RISPOSTE E CONSEGUENTE DISPERSIONE DEI DATI

RICODIFICA IN SITUAZIONE DI INDAGINI COMBINATE i dati provenienti da varie ricerche devono essere armonizzati

r

IL REQUISITO MINIMO PER SVOLGERE ANALISI SU DATI PROVENIENTI DA INDAGINI E DATASET DIVERSI E' CHE OGNUNA DI QUESTI CONTENGA VARIABILI RIFERIBILI AGLI INDICATORI SCELTI. CASO PIU' SEMPLICE APPLICAZIONE DI UN DISEGNO DI RICERCA LONGITUDINALE SI PRENDONO IN CONSIDERAZIONE DIFFERENTI EDIZIONI DELLA STESSA SURVEY. L'ARMONIZZAZIONE DELLE VARIABILI RAPPRESENTA UN PROBLEMA DELICATO QUANDO IL RICERCATORE SECONDARIO VOGLIA COMBINARE NEL DISEGNO MATRICI DATI CHE PROVENGONO DA INDAGINI DIFFERENTI. LE DIFFERENZE SPESSO RISIEDONO NELLE DIVERSE FORMULAZIONI

PIU' INDICATORI PER UN CONCETTO

BATTEERIE DI DOMANDE NELLE INDAGINI CAMPIONARIE
sintetizzare l'informazione che deriva dalla somministrazione di una batteria di domande

PIU' INDICATORI PROVENIENTI DA NON BATTERIE
operativizzazione di un concetto attraverso più indicatori che non provengono da una batteria di domande

ANALISI DI INDICATORI MULTIPLI per affrontare l'analisi di indicatori multipli esistono numerose strategie

STRATEGIE GUIDATE DALLA TEORIA (THEORY DRIVEN) usate dal ricercatore primario

VARIABILE CARDINALEindici sintetici attraverso somma di punteggi.

VARIABILI CATEGORIALIviene usata la tipologia

STRATEGIE GUIDATE DAI DATI (DATA DRIVEN)usate prevalentemente dal ricercatore secondario

VARIABILE CARDINALEè necessario mostrare che le variabili hanno un andamento simile e possono essere assunte come indicatori equivalenti dello stesso concetto. forma di controllo matrice di correlazione e alfa di crombach

VARIABILI CATEGORIALIvengono usate le scale ordinali (distanze o omogeneità o modello cumulativo) o le cluster analysis, combinazioni di modalità osservate

COSTRUZIONE DI UN INDICE stabiliti gli indicatori che soddisfano il significato semantico del concetto questi si dispongono in un indice

r

LA SOLUZIONE PIU' SEMPLICE E' COSTRUIRE UN INDICE CHE FORNISCE LA SOMMA NON PONDERATA DELLE VARIABILI CHE ABBIAMO INCLUSO NELLO STRUMENTO.SOMMA NON PONDERATA=SOMMA SEMPLICE, si sommano i punteggi ottenuti su ciascuna variabile

indici derivati da somme non ponderate

indici derivati da somme ponderate=ANALISI FATTORIALEvariabili alle quali viene associato un peso diverso

r

L'ANALISI FATTORIALE FORNISCE INFORMAZIONI SU SOTTOINSIEMI DI VARIABILI PIU' FORTEMENTE CORRELATE TRA LORO CHE POSSONO ESSERE INTERPRETATE COME INDICATORI DI UNA DIMENSIONE AUTONOMA RISPETTO ALLLE ALTRE VARIABILI CONSIDERATE. L'ANALISI FATTORIALE è UNA TECNICA EFFICACE PER DEFINIRE I PESI DA APPLICARE A UNA SERIE DI VARIABILI PER GIUNGERE AL CALCOLO DI UN INDICE SINTETICO SULLA BASE DI UNA SOMMA PONDERATA

MISURAZIONE ED EQUIVALENZA tecniche che ci permettono di rendere rilevabili empiricamente i concetti che vogliamo usare partendo dai dati raccolti

STRUMENTI DI MISURAZIONE

EQUIVALENZA DI CONFIGURAZIONElista degli indicatori utilizzati per operativizzare un concetto e che deve essere la stessa per tutti i contesti

EQUIVALENZA METRICAgli indicatori devono essere gli stessi e le relazioni tra indicatori devono rimanere costanti nel tempo e nello spazio

EQUIVALENZA SCALAREcondivisione della stessa scala e dello stesso punto di partenza in tutti i contesti considerati