vuoi
o PayPal
tutte le volte che vuoi
X=
Variabile casuale binomiale
Esperimento probabilistico: è un esperimento binomiale, condizioni:
- L’esperimento è ripetuto un numero definito di volte (dette prove);
- Le prove sono indipendenti, ovvero una prova non influisce sulle altre prove;
- In ogni prova ci sono solo due eventi mutuamente esclusivi (disgiunti);
- La probabilità di successo è la stessa in ciascuna prova;
- Se npq≥10 la distribuzione di probabilità sarà approsimativamente normale.
x n-x
Funzione della distribuzione di probabilità binomiale: P(x)= C *p *(1-p) , x=1,2,…,n, p è la
n x
probabilità di successo e C è il coefficiente binomiale, che indica il numero di modi diversi per
n x
ottenere x successi in n prove. ʯ=np.
Media di una variabile casuale binomiale:
Devianza di una variabile casuale binomiale: σ=√npq.
Distribuzione normale
Densità: Il termine densità è impiegato in quanto si riferisce al numero di individui per un’unità di
area.
Funzione di densità: La funzione di densità è un’equazione utilizzata per calcolare le probabilità
per variabili casuali continue. Condizioni:
- L’area sottesa dal grafico dell’equazione, su tutti i possibili valori assunti dalla variabile
casuale, deve essere pari a 1;
- L’altezza del grafico deve essere ≥ 0 per tutti i possibili valorri assunti dalla variabile
casuale.
Curva normale: Una variabile casuale continua è normalmente distribuita, se l’istogramma
della frequenza relativa della variabile casuale ha la forma della curva normale.
Proprietà: ʯ
- La curva normale è simmetrica rispetto alla media ; ʯ
- Dato che M =Me=Moda, il punto più alto della curva corrisponde a x= ;
1 ʯ ʯ
- I punti di flesso sono situati a -σ e +σ;
- L’area sottesa della curva è pari a 1;
ʯ
- L’area alla sinistra della media è uguale all’area di destra ed è pari a ½;
- All’aumentare del valore sull’asse x, il grafico si avvicina all’asse orizzontale, ma senza
toccarlo. Al decrescere del valore sull’asse x, il grafico si avvicina all’asse orizzontale, ma
senza toccarlo. ʯ ʯ
- Intervalli tipici: il 68% dell’area sottesa è compresa tra x= -σ e x= +σ; il 95% dell’area
ʯ ʯ ʯ
sottesa è compresa tra x= -2σ e x= +2σ; il 97,7% dell’area sottesa è compresa tra x= -
ʯ
3σ e x= +3σ.
Passaggio dalla curva normale alla standardizzata: ̅
Zi=(x - x)/σ.
i
Proprietà: ʯ
- E’ simmetrica rispetto alla sua media =0 e ha σ=1;
- Dato che M =Me=Moda=0, il punto più alto della curva corrisponde a z=0;
1 ʯ ʯ
- I punti di flesso sono situati a -σ=-1 e +σ=1;
- L’area sottesa della curva è pari a 1;
ʯ
- L’area alla sinistra della media =0 è uguale all’area di destra ed è pari a ½;
- All’aumentare/ridursi del valore Z, il grafico approssima lo 0;
- Intervalli tipici: il 68% dell’area sottesa è compresa tra z=-1 e z=1; il 95% dell’area sottesa
è compresa tra z=-2 e z=2; il 97,7% dell’area sottesa è compresa tra z=-3 e z=3.
Processo statistico:
1. Identificare l’obbiettivo della ricerca;
2. Raccogliere i dati necessari per fornire una risposta alle domande;
3. Descrivere i dati;
4. Fare inferenza. Distribuzioni campionarie
Distribuzione campionaria: la distribuzione campionaria di una statistica è una distribuzione di
probabilità associata a tutti i possibili valori della statistica calcolati per un campione di ampiezza
n. ̅ ̅
Distribuzione della media campionaria x: La distribuzione della media campionaria x è la
̅
distribuzione di probabilità associata a tutti i possibili valori della variabile casuale x calcolati in
ʯ
corrispondenza di un campione di ampiezza n estratto da una popolazione con media e
devianza standard σ. Se una variabile casuale X è distribuita normalmente, anche la distribuzione
̅ ʯ ʯ
della media campionaria x è distribuita normalmente. Dove: Media= = ; Devianza
̅
x
standard=errore standard della media= σ = σ/√n.
x̅
Teorema del limite centrale: Siano x1,x2,..,xn v.c. indipendenti e identicamente distribuite con
2
aspettativa E(xi)>u, var(xi)= σ , dove i=1,..,n sono quantità finite. La somma delle v.c è
Sn=x1+x2+..+xn. L’aspettativa di Sn è: E(Sn)=E(x1+x2+..+xn)=E(x1)+E(x2)+..+E(xn)=nu. La
2
var(Sn)=var(x1+x2+..+xn)=nσ . Data l’indipendenza della v.c. X al crescere di n la funzione
2
cumulata della v.c. Sn-nu/σ √n converge alla funzione di ripartizione della v.c. standardizzata.
Quindi P((Sn-nu/ σ√n)≤z)=F(z). ̅
La distribuzione campionaria di x si approssima alla normale al crescere della numerosità
campionaria n≥30.
Frequenza relativa campionaria: p=x/n;
̂
• la forma della distribuzione campionaria di p è approssimativamente normale a condizione
̂
che: npq≥10,
• ʯ
la media della distribuzione campionaria p è =p,
̂ p̂
• la devianza standard dell distribuzione campionaria di p è σ =√pq/n,
̂ p̂
• l’ipotesi d’indipendenza è verificata se n≤0,05N.
Probabilità della fr relativa campionaria: Z=p-p/ √(pq/n).
̂
Intervalli di confidenza
Stima puntuale: è il valore di una statistica che fornisce il valore di un parametro.
Intervallo di confidenza: Un intervallo di confidenza per un parametro ignoto consiste in un
intervallo di numeri. Il livello di confidenza rappresenta la proporzione prevista di intervalli che
contengono il parametro oggetto di studio, indicato con (1-α)*100%.
Costruzione:
• ʯ ʯ ʯ
σ e noti: = ; σ σ/√n; [x̅ +-Z * σ/√n].
x x= α/2
• ʯ ̅ ̅ ʯ
2
σ e non noti: S=√ Σ(x -x) /(n-1), t= x- /(S /√n), [x̅ +-t * S/√n].
i α/2
Interpretazione: Un intervallo di confidenza (1-α)*100% indica che l’(1-α)*100% di tutti i campioni
casuali semplici di ampiezza n estratti da una popolazione il cui parametro è ignoto conterrà il
parametro stesso.
Margine d’errore: misura quanto è accurata la stima, E=Z * σ/√n, dipende da:
α/2
• livello di confidenza (all’aumentare del livello di confidenza il margine d’errore aumenta;
• ampiezza campionaria (all’aumentare dell’ampiezza del campione casuale, il margine
d’errore diminuisce);
• deviazione standard della popolazione: quanto maggiore è la variabilità della popolazione
tanto più sarà ampio l’intervallo di confidenza ottenuto.
2
Ampiezza campionaria: n=[(Z * σ)/E]
α/2
Proprietà della t di Student:
• La distribuzione t differisce a seconda dei gradi di libertà;
• La distribuzione t è centrata e simmetrica rispetto a 0;
• L’area sotto la curva è 1;
• Le code della distribuzione t sono asintotiche rispetto all’asse delle x;
• L’area delle code della distribuzione t è più grande dell’area delle code della normale
standard;
• All’aumentare della dimensione campionaria n, la curva di densità di t si avvicina alla curva
di densità della normale standard. Il valore di S si avvicina a σ per la legge dei grandi
numeri.
Intervallo di confidenza per la frequenza relativa della popolazione
La stima puntuale della frequenza relativa di una popolazione è p=x/n
̂ ʯ
Una distribuzione campionaria di p è approsimativmente normale con media =p e deviazione
̂ p̂
standard σ =√pq/n, con npq>=10 e ogni prova sia indipendente n<=0,05N.
p̂
Intervallo: [p+-Z √p(1-p)/n]
̂ ̂ ̂
α/2 2
Ampiezza campionaria: n=p(1-p)*[ Z /E] , quando p=0,5 si ottiene il massimo valore p(1-p
̂ ̂ ̂ ̂
α/2
)=0,25.
̂ Verifica d’ipotesi
Sistema d’ipotesi:
Ipotesi nulla H0: rappresenta l’info che vogliamo testare, l’ipotesi nulla è l’ipotesi di nessun
cambiamento o nessun effetto.
Ipotesi alternativa H1: rapresenta l’info che vogliamo sostenere attraverso una prova
campionaria.
Risultati verifica di ipotesi:
1.Rifiutare l’ipotesi nulla quando l’ipotesi alternativa è vera.Questa decisione sarebbe corretta.
2.Accettare l’ipotesi nulla quando l’ipotesi nulla è vera. Questa decisione sarebbe corretta.
3.Rifiutare l’ipotesi nulla quando l’ipotesi nulla è vera. Questa decisione sarebbe sbagliata e
l’errore che commettiamo è definito errore di I tipo.
4.Accettare l’ipotesi nulla quando l’ipotesi alternativa è vera.Questa decisione sarebbe sbagliata e
l’errore che commettiamo è definito errore di II tipo.
Devianza Nota σ:
Condizioni:
• ̅
x è normale e devianza standard= σ/√n
• avere a disposizine un campione casuale semplice
• avere una numerosità campionaria n>=30
Statisticamente significativi: quando i risultati osservati sono diversi da quelli attesi nel caso in
cui l’ipotesi nulla sia vera, quindi possiamo rifiutare Ho.
Metodo classico:
Logica: Se la media campionaria, misurata in unità di deviazione standar, è molto inferiore alla
media indicata nell’ipotesi nulla, allora rifiutiamo l’ipotesi nulla
Condizioni
1. Il campione è ottenuto utilizzando un capionamento casuale semplice con σ noto.
2. Il campione non ha valori anomali e la popolazione da cui è stato estratto è distribuita come
una variabile casuale normale oppure la numerosità campionaria è sufficientemente
elevata (n>=30).
Step:
1. Vado a determinare l’ipotesi nulla e l’ipotesi alternativa.
Bilaterale Unilaterale sinistro Unilaterale destro
ʯ ʯ ʯ ʯ ʯ ʯ
H : = H : = H : =
0 0 0 0 0 0
ʯ ʯ ʯ ʯ ʯ ʯ
H : ≠ H : < H : >
1 0 1 0 1 0
2. Vado a selezionare un livello di significatività α, basato sulla possibilità di commettere
l’errore di I tipo. ̅
3. Soddisfatte le condizioni affermiamo che x è normale e devianza standard= σ/√n, quindi
̅ ʯ ʯ
z = x- / σ/√n rappresenta la distanza dalla media campionaria dalla media assunta ,
0 0 0
espressa in numero di deviazioni standard. Questo valore è chiamato statistica test.
4. Il livello d