Statistiche campionarie
Sia X1, X2, …, Xn un campione casuale di n osservazioni appartenenti a una popolazione finita o infinita. Una statistica campionaria è una funzione delle osservazioni campionarie X1, X2, …, Xn.
Media campionaria
Tra le statistiche più frequentemente utilizzate, la media campionaria ricopre un ruolo particolare dovuto alle sue proprietà campionarie.
Sia X la variabile casuale di interesse e siano μ e σ rispettivamente la sua media e varianza. Sia, inoltre, X1, X2, …, Xn un campione casuale di dimensione n estratto dalla popolazione, formato da n variabili casuali indipendenti ed identicamente distribuite (poiché E(Xi)=μ e Var(Xi)=σ2 per ogni i = 1, 2, …, n).
Distribuzione della variabile media campionaria
Se il campionamento è effettuato con reimmissione, si dimostra che per dimostrare che la media campionaria segue, nelle applicazioni pratiche di nostro interesse, una distribuzione normale è sufficiente riferirsi al Teorema del Limite Centrale.
Quest’ultimo è importante poiché grazie ad esso, la distribuzione della variabile casuale media campionaria, si riconduce (per n sufficientemente grande) a una distribuzione normale, qualunque sia la distribuzione della variabile nella popolazione dalla quale il campione è estratto.
Teorema del Limite Centrale
Ipotesi: siano X1, X2, …, Xn variabili casuali indipendenti ed identicamente distribuite (cioè ciascuna di esse ha media μ e varianza σ2 ma non è specificato che sono distribuite normalmente).
Tesi: per n sufficientemente grande (n>30), la somma (e quindi la media) di tali variabili è approssimativamente normale. Oppure in altri termini: la variabile casuale Z converge in distribuzione, per n>30, alla variabile casuale normale standardizzata.
Osservazione
Se la distribuzione X della variabile in popolazione (e conseguentemente la distribuzione delle variabili X1, X2, …, Xn) fosse già normale, la variabile media campionaria seguirebbe di riflesso, la distribuzione normale. In questo caso non c’è bisogno del Teorema del Limite Centrale (segue dimostrazione).
Se il campionamento è effettuato senza reimmissione?
Se il campionamento è effettuato senza reimmissione, viene meno l’ipotesi di variabili indipendenti tra loro e ciò comporta alcune differenze con i risultati precedenti, relativamente alla varianza della variabile media campionaria.
Osservazioni
Il valore atteso della media campionaria nel campionamento casuale è quindi sempre uguale alla media della popolazione nei due casi.