Il teorema del limite centrale
Consideriamo la distribuzione del QI nella popolazione degli studenti di scuola superiore. Immaginiamo di conoscere le caratteristiche della popolazione, che ha media m = 99 e deviazione standard s = 4. Assumiamo inoltre che la distribuzione sia normale.
Immaginiamo ora di estrarre una serie di campioni dalla popolazione di studenti, e di misurare il QI. Abbiamo estratto in tutto 20 campioni di n = 25. Su ogni campione abbiamo calcolato la media: le medie variano tra 96.71 e 100.00. Questa distribuzione viene definita distribuzione campionaria delle medie (rappresenta un concetto fondamentale nell'inferenza statistica).
La distribuzione campionaria delle medie
In questo caso abbiamo una distribuzione campionaria delle medie di ampiezza 25 (n = 25). Come per qualsiasi distribuzione, anche per la distribuzione campionaria delle medie è possibile definire tendenza centrale (media), dispersione (deviazione standard) e forma della distribuzione.
Tendenza centrale: la media della distribuzione campionaria delle medie (98.90) è molto simile alla media della popolazione (μ = 99.00).
Dispersione: poiché le medie dei 20 campioni estratti dalla popolazione sono tutte molto simili tra loro, la distribuzione campionaria delle medie ha una deviazione standard ridotta (s = 0.76), inferiore a quella della popolazione (σ = 4.00).
Forma: la forma della distribuzione campionaria delle medie approssima la forma della popolazione. Entrambe le distribuzioni hanno forma normale.
- Media campione => X
- Media popolazione => μ
- Media distribuzione campionaria delle medie => μ X
- Deviazione standard del campione => s
- Deviazione standard popolazione => σ
- Deviazione standard della distribuzione campionaria delle medie => σ X
Come detto, la distribuzione che abbiamo descritto si basa solo su 20 campioni. In teoria, la distribuzione campionaria delle medie si riferisce alle medie di tutti i possibili campioni di ampiezza n (nel nostro esempio 25) che è possibile estrarre. In questo caso dovremmo:
- Estrarre dalla popolazione tutti i possibili campioni di ampiezza 25 (un numero infinito di combinazioni)
- Calcolare la media di ciascun campione
- Calcolare la media e la deviazione standard della distribuzione che include tutte queste medie [distribuzione campionaria della media]
Ovviamente non è possibile calcolare in questo modo la media e la deviazione standard della distribuzione campionaria delle medie. Non è possibile, infatti, estrarre un numero infinito di campioni!
Per calcolare la distribuzione campionaria delle medie possiamo sfruttare le proprietà del teorema del limite centrale.
Conclusione
Il teorema del limite centrale è uno dei pilastri dell'inferenza statistica, che ci permette di comprendere il comportamento delle distribuzioni campionarie rispetto alle caratteristiche della popolazione da cui provengono i campioni.