Statistica
Cos'è la statistica?
La statistica è l'arte e la scienza del disegno degli studi e dell'analisi dei dati che tali studi producono. Essa si occupa di:
- Raccolta dati
- Classificazione dati
- Analisi dei dati
- Interpretazione dei dati
I dati si ottengono da:
- Studi osservazionali: si limitano ad osservare il fenomeno senza eseguire un intervento sulle statistiche oggetto di osservazione.
- Studi sperimentali: si somministrano casualmente diversi tipi di trattamento alle unità in studio per misurarne gli effetti.
Concetti chiave
Popolazione statistica: un insieme finito di unità statistiche tra loro omogenee per uno o più caratteristiche.
Campione statistico: è un sottoinsieme della popolazione statistica.
Unità statistiche: l'insieme degli elementi che costituiscono la popolazione.
Indagine statistica: studio di un fenomeno collettivo con metodo statistico.
Fasi dell'indagine statistica
- Definizione del problema oggetto di studio con definizione degli obiettivi (se non preparata in modo accurato l'intera indagine potrebbe essere annullata).
-
Fase preparatoria (dove sono definiti):
- Modalità di raccolta delle informazioni
- Modalità di analisi dei dati
- Tempi e risorse economiche necessarie
- Raccolta di dati necessari per descrivere il fenomeno osservato.
Tipologia raccolta dati
- Primari (rilevati dal ricercatore)
- Secondari (rilevati da fonti ufficiali come le banche dati)
Modalità di raccolta
- Occasionale (svolta senza periodicità)
- Periodica (condotta a intervalli costanti)
- Continua (è continua)
- Diretta (sul campo)
- Indiretta (questionari)
Controllo dei dati
Eseguito prima dell'analisi dei dati per eliminare eventuali bias.
Tipi di bias
- Sistematici (si presentano nella stessa maniera per ogni dato rilevato)
- Accidentali (si verificano irregolarmente, con modalità differenti)
- Casuali (sono dovuti a fattori sconosciuti, non controllabili o dovuti al caso)
Controlli da effettuare
- Controllo di compatibilità (il confronto di due o più dati riguardanti la stessa unità, in modo da evidenziare valori contraddittori)
- Controllo di coerenza e congruità (verificare se il dato rientra nel campo di definizione del fenomeno, cioè entro il limite inferiore e superiore che il fenomeno può assumere)
- Controllo di qualità (verificare la riproducibilità dei dati)
Analisi dei dati
- Codifica
- Memorizzazione dei dati su supporto adeguato
- Analisi statistica
Interpretazione dei risultati e verifica dei dati
Conclusioni
- Divulgazione dei risultati
Accuratezza e precisione
Accuratezza: proprietà di un sistema di misura a fornire dati che coincidono con la qualità effettivamente misurata.
Precisione: proprietà di un sistema di misura a fornire dati poco dispersivi o molto vicini al loro valore medio.
Campionamento
Processo che consente di selezionare un sottoinsieme di unità statistiche per giungere a conclusioni generalizzabili per tutta la popolazione.
Perché eseguirlo
- Tempo (troppo per studiare l'intera popolazione)
- Costi (risorse spesso limitate)
- Difficoltà e identificare l'intera popolazione
Buon metodo
Definire la popolazione oggetto di studio, compilare un elenco dal quale estrarre campioni a caso.
Cattivo metodo
Scegliere il campione su basi e criteri di convenienza.
Campionamento casuale semplice
Meccanismo di estrazione di un campione di popolazione finita, con criterio probabilistico, dove ciascuna unità ha la stessa probabilità di essere inclusa.
Modalità di campionamento
- Con reintroduzione (un elemento dopo essere stato selezionato, è reintrodotto nella lista dove ha le stesse probabilità di essere selezionato in estrazioni successive)
- Senza reintroduzione (un elemento dopo essere stato selezionato, non viene reintrodotto)
Campionamento rappresentativo
Come ottenerlo:
- Creare una lista che includa ogni unità