vuoi
o PayPal
tutte le volte che vuoi
❑ MODELLI DI VARIABILI CASUALI CONTINUE:
~
1. UNIFORME: X uni (a, b) è caratterizzata da una distribuzione di probabilità che assegna la
stessa probabilità a tutte le possibili realizzazioni di x.
2. NORMALE:
X ~ N (media, sigma quadro) costituita da una forma campanulare, è simmetrica, media
moda e mediana coincidono.
La v.a normale approssima molto bene le distribuzioni di probabilità di un numero elevato di
variabili aleatorie. In presenza di campioni “grandi” la distribuzione della media campionaria
è approssimata dalla distribuzione normale.
La probabilità relativa all’intervallo sarà (P(a<X<b) = F(b) - F(a).
Qualunque distribuzione normale può essere trasformata nella DISTRIBUZIONE NORMALE
STANDARD Z: con media 0 e varianza 1. Z ~ N (0, 1) questo ci permette di trasformare i valori
di X in valori di Z, usare le tavole di ripartizione di Z per calcolare la probabilità Z= x- m/
sigma.
• La tavola della Normale standard fornisce valori della funzione di ripartizione della
distribuzione normale standard. Per un dato valore di Z, la tavola fornisce F(a). Per valori
negativi di Z si sfrutta la proprietà della simmetria della distribuzione per trovare la
probabilità desiderata. (1- Z)
• Approssimazione di una binomiale con la distribuzione normale: la forma della
distribuzione binomiale p approssimativamente normale se n è grande, si può approssimare
in una normale se nP(1-P) > 9
3. ESPONENZIALE:
usata per modellare l’ammontare di tempo che intercorre tra due eventi. La variabile T ha
funzione di densità di probabilità
dove lambda è il numero medio di occorrenze per intervallo di tempo e t rappresenta il
numero di unità di tempo sino alla prossima occorrenza.
4. CHI-QUADRO:
si distribuisce con una funzione di densità di probabilità con r gradi di libertà, dipende dal
parametro r.
I gradi di libertà sono il numero di osservazioni indipendenti del campione,
meno il k di parametri della popolazione che devono essere stimati per mezzo del
campione.
All'aumentare dei gradi di libertà r tende all’infinito la distribuzione chi-quadro tende
sempre alla simmetria della distribuzione normale. Quindi può essere standardizzata. La
funzione di densità è asimmetrica, con una lunga coda per valori positivi. La sua media e la
sua varianza sono rispettivamente uguali al numero di gradi di libertà e a due volte il numero
di gradi di libertà.
5. T DI STUDENT:
La distribuzione t di Student è il rapporto tra due distribuzioni: la distribuzione normale
standard e la radice quadrata della distribuzione chi-quadrato, divisa per i suoi gradi di
libertà r. La T- Student tende ad una normale già per r>30, infatti si ottiene valor medio nullo
e varianza 1.07.
CAMPIONAMENTO E STIMATORI
❑ IN GENERALE
− Facciamo inferenza sulla popolazione esaminando i risultati campionari, estrarre conclusioni
e/o prendere decisioni riguardanti una popolazione sulla base dei risultati campionari.
Tramite la stima e la verifica delle ipotesi.
− Con il termine distribuzione campionaria si fa riferimento alla distribuzione di tutti i possibili
valori di una statistica ottenuti da campioni della stessa ampiezza estratti dalla popolazione.
• Uno STIMATORE di un parametro della popolazione è:
Una variabile aleatoria che dipende dall’informazione contenuta in un campione, il cui valore
fornisce un’approssimazione su un parametro non noto. Uno specifico valore della variabile
aleatoria viene chiamato stima puntuale.
Per esempio, possiamo stimare il parametro della popolazione come la media, tramite una
statistica campionaria (stima puntuale) che è la media campionaria.
Le proprietà dello stimatore:
1. CORRETTEZZA:
dato uno stimatore puntuale T si dice non distorto se il suo valore atteso, è uguale al
parametro della popolazione θ. Es. La media campionaria è uno stimatore corretto della
media della popolazione.
La distorsione è misurata dalla differenza tra il valore atteso dello stimatore e il parametro
da stimare (distorsione di bias) è quindi D(T) = E(T) - . la distorsione di uno stimatore non
distorto, quindi, vale 0.
2. EFFICENZA:
supponiamo esistano diversi stimatori non distorti, lo stimatore più efficiente è lo stimatore
non distorto con varianza più piccola, aventi entrambi lo stesso numero di osservazioni
campionarie. lo stimatore più efficiente richiede un campione più piccolo.
L’efficienza relativa di uno stimatore rispetto a un altro è il rapporto tra le loro varianze.
3. CONSISTENZA:
Tn è uno stimatore consistente θ (parametro della popolazione) se la differenza del valore
atteso di Tn e di diminuisce al crescere dell’ampiezza del campione.
❖ TEOREMA DEL LIMITE CENTRALE
Al crescere della dimensione del campione la distribuzione campionaria diventa quasi
normale indipendentemente dalla distribuzione della popolazione, possiamo applicare il
teorema del limite centrale anche se la popolazione non è normale, la media campionaria
sarà approssimativamente normale purché l’ampiezza del campione sia abbastanza grande.
❑ DISTRIBUZIONE MEDIA CAMPIONARIA:
1. CASO 1: VARIANZA NOTA DELLA POPOLAZIONE
La media campionaria è definita come:
Mentre la variabilità nel valore della media del campione è data dall’errore standard
(diminuisce all’aumentare del campione):
Se la popolazione è normale con media e scarto quadratico medio, allora Z per la
distribuzione media campionaria è:
2. CASO 2: VARIANZA NON NOTA
Non conosco la varianza, non posso standardizzare, stimare la varianza della popolazione
2
non nota con la varianza campionaria S
sì, distribuisce come chi quadro con n-1 gradi di libertà.
❑ DISTIBUZIONE DELLA PROPORZIONE CAMPIONARIA
La proporzione campionaria è il numero di unità del campione fratto la dimensione del
campione: Sn/n, è un numero compreso tra 0 e 1. può essere approssimata da una
distribuzione normale quando np(1-p)>9.
Standardizzando abbiamo:
❑ DISTRIBUZIONE DELLA VARIANZA CAMPIONARIA
Si definisce varianza campionaria la quantità: 2
Dividendo per n-1 viene corretta la piccola distorsione e perciò S è uno stimatore non
distorto. Abbiamo corretto i gradi di libertà. Quindi la varianza campionaria è una variabile
aleatoria distribuita con chi quadro con n-1 gradi di libertà:
❑ DISTRIBUZIONE DELLA DIFFERENZA TRA MEDIE
DUE CASI:
2 2
σx e σy Note:
1. campioni aleatori e indipendenti, entrambe le popolazioni hanno distribuzione normale,
varianze note.
2 2
2. σx e σy Non note, ma uguali:
stimare la varianza campionaria delle due variabili. Stimo Sx con ampiezza nx e stimo Sy con
ampiezza ny. Stimare poi la varianza ponderata:
INTERVALLI DI CONFIDENZA
Rispetto a una stima puntuale la stima per intervallo fornisce maggiori informazioni sulla
caratteristica della popolazione oggetto di studio. Le stime per intervallo sono chiamate intervalli di
confidenza. Un intervallo fornisce una serie di valori:
− È basato sulle osservazioni di un campione
− Fornisce informazioni sulla vicinanza allo sconosciuto parametro della popolazione
− Espresso in termini di livello di confidenza
Se P (A< θ < B) = 1- α.
La quantità 1- α viene definita livello di confidenza dell’intervallo. (α compreso tra 0 e 1)
La formula generare per tutti gli intervalli di confidenza è:
STIMA PUNTUALE ± FATTORE DI AFFIDABILITA’ × ERRORE STANDARD
L'obbiettivo è quello di determinare un intervallo entro il quale verosimilmente cadono i valori delle
medie campionarie per una data media e varianza della popolazione.
Sia Z α/2 il valore della Z che lascia nella coda destra della distribuzione normale standard l’area α/2"
(ossia, l'intervallo che va da - Zα/2 a +Z α/2 racchiude. Probabilità 1- α) allora
È l’intervallo che include X probabilità 1- α.
I livelli di confidenza più usati sono 95% 90% e 99%.
1. INTERVALLO DI CONFIDENZA PER LA MEDIA
− VARIANZA NOTA: popolazione ha distribuzione normale, con campioni grandi
Intervallo di confidenza:
− VARIANZA NON NOTA: sostituiamo la varianza della popolazione con la varianza campionaria
2
S questo introduce ulteriore incertezza siccome S varia da campione a campione, quindi
usiamo la v.a T di Student invece della variabile normale.
Intervallo di confidenza:
2. INTERVALLO DI CONFIDENZA PER LA PROPORZIONE
Ricordiamo che se il campione è grande, la distribuzione della proporzione campionaria è
approssimativamente normale.
Intervallo di confidenza:
3. INTERVALLO DI CONFIDENZA PER LA VARIANZA
Utilizziamo la distribuzione chi quadro.
Calcoliamo la varianza campionaria, l’intervallo di confidenza è:
→ MARGINE DI ERRORE
È possibile calcolare l’ampiezza campionaria (n) necessaria per garantire un desiderato
margine di errore (ME), con uno specificato livello di confidenza.
Il margine di errore e anche chiamato errore di campionamento, ed è l’ammontare di
imprecisione nella stima del parametro della popolazione e l’ammontare aggiunto e
sottratto dalla stima puntuale per formare l’intervallo di confidenza.
• PER LA MEDIA: ampiezza campionaria
• PER LA PROPORZIONE: ampiezza campionaria 2
SE VOGLIAMO DETERMINARE L’AMPIEZZA DELL’INTERVALLO INVECE: W= 2 ME
4. INTERVALLO DI CONFIDENZA PER LA DIFFERENZA TRA MEDIE
− CAMPIONI DIPENDENTI: stima della differenza tra le medie di due popolazioni dipendenti,
Campioni appaiati
Misure ripetute (prima/dopo)
Usiamo le differenze fra valori accoppiati: di= xi- yi
La stima puntuale della differenza tra medie delle popolazioni è d= Σdi/n (n numero di copie
del campione) 2
(−)
√∑
La deviazione standard è: Sd= −1
Intervallo di confidenza:
− < < +
−1, −1,
√ √
2 2
− −
CAMPIONI INDIPENDENTI: costruire un intervallo per la differenza tra le medie . il
campione selezionato da una popolazione non influenza il campione selezionato dall’altra
popolazione.
a. VARIANZE NOTE:
b. VARIANZE NON NOTE MA UGUALI:
5. INTERVALLO DI CONFIDENZA PER LA DIFFERENZA TRA PROPORZIONI
L'intervallo di confidenza per p p è:
x – y
- Risolvere un problema di matematica
- Riassumere un testo
- Tradurre una frase
- E molto altro ancora...
Per termini, condizioni e privacy, visita la relativa pagina.