Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
à STIMA INTERVALLARE:
Vengono calcolate 2 stime diverse che costituiscono il limite inferiore e quello superiore di un intervallo.
Entro questo intervallo di probabilità cadrà il parametro della popolazione e utilizzeremo questo intervallo per
prendere una decisione.
DISTRIBUZIONI CAMPIONARIE:
se estraiamo un campione da una popolazione e il campione è rappresentativo di quella popolazione, il campione
dovrebbe avere gli stessi indici statistici. Ovviamente non è sempre vero, ma possiamo vedere/calcolare/studiare
quanto potrebbero differire le statistiche calcolate su un campione rispetto ai parametri della popolazione da cui sono
state tratte.
Per questo useremo campioni estratti da una popolazione come se fossero “individui” e ci concentreremo sulla media
(ma potremmo fare lo stesso discorso sulla mediana).
ESEMPIO:
Ipotizziamo di estrarre un campione di 100 casi da una popolazione e di calcolare la media di una certa variabile.
Usiamo la variabile FONDAMENTALISMO da un campione di 659 persone come popolazione. La sua media è 90.3915.
Estraiamo un campione casuale di 100 persone e calcoliamo la media di questo campione: 91.46.
Estraiamo altri 20 campioni di ampiezza 100 dalla stessa popolazione e calcoliamo la media per ciascuno:
87.83 90.63 91.90 91.99 90.10 90.80 93.84 90.80 89.90 90.12 90.71 88.56 89.67 90.76 87.77 90.51
89.78 90.86 90.40 89.27
Poiché vengono tutti dalla stessa popolazione, la loro media (la media delle 20 medie) tenderà a cadere vicino alla
media della popolazione: 90.296.
Anziché 20 campioni ne potremmo estrarre 10.000, avremo 10.000 medie e potremmo costruire una distribuzione di
frequenza di quelle medie.
L’importante è che ogni campione sia casuale, ovvero:
1) ogni caso di un singolo campione ha la stessa probabilità di essere estratto degli altri
2) ogni possibile campione estraibile dalla popolazione ha la stessa probabilità degli altri
La distribuzione di frequenza che costruiremmo con le medie dei campioni si chiama DISTRIBUZIONE CAMPIONARIA
DELLE MEDIE.
Se il numero di campioni estratto è sufficientemente elevato, le medie dei campioni tenderanno a distribuirsi secondo
la curva della normale.
Se effettivamente estraessimo un numero elevatissimo di campioni da una popolazione (METODO MONTE CARLO),
avremmo una DISTRIBUZIONE SPERIMENTALE, mentre quella su cui lavoreremo noi è una DISTRIBUZIONE TEORICA.
àLa distribuzione campionaria delle medie si basa sul TEOREMA DEL LIMITE CENTRALE, che afferma che,
all’aumentare dell’ampiezza dei campioni, la distribuzione campionaria della media si avvicinerà sempre più ad una
distribuzione normale, indipendentemente dalla forma delle misurazioni individuali.
àse una variabile si distribuisce normalmente, anche piccoli campioni produrranno una distribuzione campionaria
normale.
à con variabili normali, la distribuzione campionaria deve avere N uguale a 30 o 40
(vedi slides 13-‐16).
ERRORE STANDARD DELLA MEDIA:
la distribuzione campionaria è una distribuzione di probabilità e per una numerosità (N) del campione superiore o
uguale a 30, tende verso una curva stabile (e “normale”). !
M = μ =
σ
X X !
è la deviazione standard delle medie, anche conosciuta come ERRORE STANDARD DELLA MEDIA e indica quanto
σ X
affidabile è ciascuna media campionaria.
Valori piccoli indicano che, estraendo più campioni, le medie sarebbero abbastanza vicine tra loro.
Valori grandi, che le medie campionarie sarebbero abbastanza disperse intorno a μ.
à L’errore standard della media è più piccolo della deviazione standard della popolazione (più precisamente diventa
sempre più piccolo quanto più aumenta la dimensione del campione al crescere di N, le medie campionarie sono
à
più raggruppate e l’errore standard diventa sempre più piccolo).
à singoli “punteggi estremi” (anomali) sono più probabili di “medie estreme”, quindi la distribuzione delle medie sarà
meno variabile rispetto alla popolazione.
LA VERIFICA D’IPOTESI:
A) POSSIBILITÀ 1: (IPOTESI NULLA): la moneta NON È truccata
P(t) = P(c) = 0,5
B) POSSIBILITÀ 2: (IPOTESI ALTERNATIVA): la moneta È truccata
P(t) P(c) = 0,5
≠
à L’IPOTESI NULLA (indicata anche come H ) è tale, perché si basa su informazioni che abbiamo già e di cui siamo
0
sicuri (una moneta non truccata ha probabilità 1/2).
L’ipotesi nulla è l’unica su cui si possono effettivamente fare calcoli.
Se l’ipotesi nulla si dimostra PROBABILE, la accetteremo per vera.
Se l’ipotesi nulla si dimostra IMPROBABILE, opteremo per quella alternativa.
à L’IPOTESI ALTERNATIVA (indicata anche come H ) è l’ipotesi che contrapponiamo a quella nulla.
1
L’ipotesi alternativa apre, invece, ad un insieme di possibilità (P(t) = 0,4; P(t) = 0,3; P(t) = 0,2 …) che non è