Inferenza statistica: procedimento mediante il quale è possibile ricavare conclusioni su un’intera popolazione partendo da un campione.
Si divide in:
Stima campionaria: partendo dal campione si trovano media/var./freq. della popolazione
Problema di verifica delle ipotesi: tramite il campione si decide se un’ipotesi è accettabile
Campionamento casuale semplice: campione scelto a caso, avente determinate caratteristiche:
Ogni unità della popolazione ha eguale probabilità di essere il campione
Ogni campione(n) ha la stessa probabilità di essere formato
Scelta del campione: mediante:
Estrazione bernoulliana (con rip.): eventi indipendenti, p = 1 / N
Estrazione in blocco (senza rip.): combinazioni N,n
Spazio dei campioni: costituito dall’insieme dei campioni
Distribuzioni campionarie: costituite da parametri e stimatori
Parametro: valore caratteristico della popolazione
Stimatore: funzione delle variabili campionarie Xi
Stima: valore T calcolato
Media campionaria (mu):
Stimatore: !X = SOMM(Xi/n, i=n, i=1)
Media stimatore: M(!X) = 1 / n * M(SOMM(Xi, i = n, i = 1)) = 1 / n * nmu = mu
Varianza stimatore:
Bernouilliana: Var(!X) = 1 / n^2 * [Var(X1) + … + Var(Xn)] = 1 / n^2 * nsigma^2 = sigma^2 / n
Blocco: Var(!X) = sigma^2/n * (N – n) / (N – 1)
Varianza campionaria (sigma^2) in CHI^2 (n * S^2 / sigma^2 tende a (CHI^2 con n - 1 gradi di libertà)):
Stimatore: S^2 = SOMM((Xi - !X)^2, i = n, i = 1) / n
Media stimatore:
Bernoulliana: M(S^2) = sigma^2 * (n – 1) / n
Blocco: M(S^2) = sigma^2 * N * (n – 1) / (n * (N – 1))
Differenza tra medie (mu1 – mu2):
Stimatore: !X1 - !X2
Media stimatore: M(!X1 - !X2) = mu1 – mu2
Varianza stimatore:
Bernouilliana: Var(!X1 - !X2) = sigma1^2 / n1 + sigma2^2 / n2
Blocco: Var(!X1 - !X2) = sigma1^2 / n1 * (N1 – n1) / (N1 – 1) + (= con il 2)
Frequenza campionaria: si considera quando il campione si presenta sottoforma di mutabile.
Campionamento con estrazione bernouilliana: distribuzione binomiale:
F = X / n (n: n° elementi campione, X: n° elementi campione possedenti l’attributo)
Stimatore: p = K / N (N: n° elementi popolazione, K: n° elementi popolazione possedenti l’attributo)
BIN (np, np1): COMB(n, x) * p^x * q ^ (n – x)
Media: M(F) = M(X / n) = 1 / n * M(X) = 1 / n * np = p
Varianza: Var(F) = Var (X / n) = 1 / n^2 * Var(X) = 1 / n^2 * npq = p * q / n
Campionamento con estrazione in blocco: distribuzione ipergeometrica:
F = X / n (n: n° elementi campione, X: n° elementi campione possedenti l’attributo)
Stimatore: p = K / N (N: n° elementi popolazione, K: n° elementi popolazione possedenti l’attributo)
Media: M(F) = M(X / n) = 1 / n * M(X) = 1 / n * n * K / N = K / N = p
Varianza: Var(F) = Var(X / n) = 1 / n^2 * Var(X) = 1 / n^2 * npq * (N –n) / (N – 1) = p * q / n * (N – n) / (N – 1)
Teorema limite centrale: qualunque sia la distribuzione della popolazione, purchè abbia media mu e varianza sigma^2 finite, le medie dei campioni, al crescere della dimensione n del campione, tendono ad una distribuzione normale con media mu e varianza sigma^2 / n