Alice Giussani - Statistica
La statistica è una scienza basata sull’osservazione della realtà, che fornisce risposte a specifiche domande di ricerca associando una misura di probabilità ad ogni risposta. È caratterizzata da un insieme di metodologie finalizzate a disegnare esperimenti in funzione della domanda posta, ricavare dati, organizzare, sintetizzare, analizzare, interpretare, presentare e rappresentare graficamente le conclusioni derivate dai dati e quantificare l’incertezza delle misure.
Il processo statistico
- Identificare l’obiettivo della ricerca
- Le domande devono essere formulate in modo dettagliato al fine di identificare la popolazione da esaminare.
- Raccogliere i dati necessari
- Spesso l’osservazione/misura dell’intera popolazione è difficoltosa o costosa.
- Si osserva/misura solo un campione della popolazione.
- Se i dati non sono raccolti in modo corretto, le conclusioni che si traggono sono prive di significato.
- Descrivere i dati
- La statistica descrittiva permette di ottenere una panoramica generale dei dati a disposizione e suggerisce quali metodi statistici inferenziali potrebbero essere utilizzati.
- Fare inferenza
- Estendere alla popolazione i dati ottenuti sul campione, usando appropriate tecniche, e riportare il livello di affidabilità delle conclusioni che si sono tratte.
Lo scopo della statistica è scoprire qualcosa riguardo a un gruppo (popolazione) attraverso l’esame dei dati relativi ad alcuni elementi (o individui) del gruppo (campione). La popolazione è l’insieme completo di tutti gli elementi che sono soggetto a studio e la raccolta di dati riguardanti ogni elemento della popolazione è definita censimento. Un parametro è una misura che descrive una caratteristica di un’intera popolazione. Un campione è un sottoinsieme di elementi selezionati da una popolazione e una statistica è una misura che descrive una caratteristica di un campione.
Tipologie di dati
Alcuni insiemi di dati numerici sono costituiti da numeri mentre altri non sono numerici; si distinguono dunque dati quantitativi e dati qualitativi, dove i dati quantitativi sono numeri che rappresentano conteggi o misure mentre i dati qualitativi possono essere suddivisi in differenti categorie distinte in base a caratteristiche non numeriche.
I dati quantitativi possono essere ulteriormente distinti in discreti e continui. I dati discreti corrispondono ai casi in cui i valori possibili sono in numero finito o numerabile, invece i dati continui emergono da osservazioni in cui i valori possibili sono infiniti e corrispondono a una scala continua che copre un intervallo di valori senza interruzioni. È importante quando si opera con dati quantitativi fare uso delle unità di misura.
È possibile classificare le variabili in base a 4 diverse tipologie:
- Nominale: Sono categorie. I dati non possono essere disposti in alcun ordine.
- Ordinale: Le categorie sono ordinate, ma le differenze tra esse non possono essere calcolate o sono prive di significato.
- Intervallare: Le differenze sono significative, ma non c’è uno zero assoluto e i rapporti sono privi di senso.
- Rapportabile: C’è uno zero di riferimento e i rapporti sono significativi.
Disegno degli esperimenti
Un uso efficace della statistica richiede buon senso e, piuttosto che concentrarsi su algoritmi di calcoli, conviene focalizzarsi sull’interpretazione dei dati e dei risultati.
Campione volontario
Un campione volontario, o autoselezionato, è costituito cioè da individui che decidono se essere o non essere inclusi nello studio. Esso non è rappresentativo dell’intera popolazione.
La raccolta dei dati
Se i dati di un campione della popolazione sono raccolti in modo inappropriato possono essere inutili e nessuno studio statistico potrà ricavare conclusioni significative da questi dati.
I dati possono essere raccolti con due modalità:
- Studi osservativi: Si osservano/misurano delle caratteristiche senza intervenire sui soggetti esaminati. Esempio: sondaggio d’opinione.
- Esperimenti pianificati: I soggetti esaminati vengono osservati/misurati dopo essere stati trattati. Esempio: test clinico per valutare gli effetti di un farmaco (con gruppo di trattamento e gruppo di controllo). Per quanto riguarda gli esperimenti pianificati bisogna evitare il fenomeno di confondimento degli effetti delle variabili. Una variabile di confondimento maschera o distorce la stima della relazione causa-effetto fra le variabili di interesse valutate nello studio.