vuoi
o PayPal
tutte le volte che vuoi
Distribuzione normale
Densità: Il termine densità è impiegato in quanto si riferisce al numero di individui per un’unità di area.
Funzione di densità: La funzione di densità è un’equazione utilizzata per calcolare le probabilità per
variabili casuali continue. Condizioni:
- L’area sottesa dal grafico dell’equazione, su tutti i possibili valori assunti dalla variabile casuale,
deve essere pari a 1;
- L’altezza del grafico deve essere ≥ 0 per tutti i possibili valorri assunti dalla variabile casuale.
Curva normale: Una variabile casuale continua è normalmente distribuita, se l’istogramma della
frequenza relativa della variabile casuale ha la forma della curva normale.
Proprietà:
- La curva normale è simmetrica rispetto alla media ʯ;
- Dato che M =Me=Moda, il punto più alto della curva corrisponde a x=ʯ;
1
- I punti di flesso sono situati a ʯ-σ e ʯ+σ;
- L’area sottesa della curva è pari a 1;
- L’area alla sinistra della media ʯ è uguale all’area di destra ed è pari a ½;
- All’aumentare del valore sull’asse x, il grafico si avvicina all’asse orizzontale, ma senza toccarlo. Al
decrescere del valore sull’asse x, il grafico si avvicina all’asse orizzontale, ma senza toccarlo.
- Intervalli tipici: il 68% dell’area sottesa è compresa tra x=ʯ-σ e x=ʯ+σ; il 95% dell’area sottesa è
compresa tra x=ʯ-2σ e x=ʯ+2σ; il 97,7% dell’area sottesa è compresa tra x=ʯ-3σ e x=ʯ+3σ.
Passaggio dalla curva normale alla standardizzata: Zi=(x - x
)/σ.
i
Proprietà:
- E’ simmetrica rispetto alla sua media ʯ=0 e ha σ=1;
- Dato che M =Me=Moda=0, il punto più alto della curva corrisponde a z=0;
1
- I punti di flesso sono situati a ʯ-σ=-1 e ʯ+σ=1;
- L’area sottesa della curva è pari a 1;
- L’area alla sinistra della media ʯ=0 è uguale all’area di destra ed è pari a ½;
- All’aumentare/ridursi del valore Z, il grafico approssima lo 0;
- Intervalli tipici: il 68% dell’area sottesa è compresa tra z=-1 e z=1; il 95% dell’area sottesa è
compresa tra z=-2 e z=2; il 97,7% dell’area sottesa è compresa tra z=-3 e z=3.
Processo statistico:
1. Identificare l’obbiettivo della ricerca;
2. Raccogliere i dati necessari per fornire una risposta alle domande;
3. Descrivere i dati;
4. Fare inferenza. Distribuzioni campionarie
Distribuzione campionaria: la distribuzione campionaria di una statistica è una distribuzione di probabilità
associata a tutti i possibili valori della statistica calcolati per un campione di ampiezza n.
Distribuzione della media campionaria : La distribuzione della media campionaria x è la distribuzione di
probabilità associata a tu i possibili valori della variabile casuale x calcola in corrispondenza di un
campione di ampiezza n estratto da una popolazione con media ʯ e devianza standard σ. Se una variabile
casuale X è distribuita normalmente, anche la distribuzione della media campionaria x è distribuita
normalmente. Dove: Media= ʯ = ʯ ; Devianza standard=errore standard della media= σ = σ/√n.
x x
Teorema del limite centrale: Siano x1,x2,..,xn v.c. indipendenti e identicamente distribuite con aspettativa
2
E(xi)>u, var(xi)= σ , dove i=1,..,n sono quantità finite. La somma delle v.c è Sn=x1+x2+..+xn. L’aspettativa di
2
Sn è: E(Sn)=E(x1+x2+..+xn)=E(x1)+E(x2)+..+E(xn)=nu. La var(Sn)=var(x1+x2+..+xn)=nσ . Data l’indipendenza
2
della v.c. X al crescere di n la funzione cumulata della v.c. Sn-nu/σ √n converge alla funzione di ripartizione
della v.c. standardizzata. Quindi P((Sn-nu/ σ√n)≤z)=F(z).
La distribuzione campionaria di x si approssima alla normale al crescere della numerosità campionaria
n≥30.
Frequenza relativa campionaria: p =x/n;
la forma della distribuzione campionaria di p è approssima vamente normale a condizione che:
npq≥10,
la media della distribuzione campionaria p è ʯ =p,
p
la devianza standard dell distribuzione campionaria di p è σ =√pq/n,
p
l’ipotesi d’indipendenza è verificata se n≤0,05N.
Probabilità della fr relativa campionaria: Z=p
-p/√(pq/n).
Intervalli di confidenza
Stima puntuale: è il valore di una statistica che fornisce il valore di un parametro.
Intervallo di confidenza: Un intervallo di confidenza per un parametro ignoto consiste in un intervallo di
numeri. Il livello di confidenza rappresenta la proporzione prevista di intervalli che contengono il
parametro oggetto di studio, indicato con (1-α)*100%.
Costruzione:
σ e ʯ noti: ʯ =ʯ; σ σ/√n; [x +-Z * σ/√n].
x x= α/2
2
σ e ʯ non noti: S=√ Σ(x -x ) /(n-1), t= x
-ʯ/(S/√n), [x
+-t * S/√n].
i α/2
Interpretazione: Un intervallo di confidenza (1-α)*100% indica che l’(1-α)*100% di tutti i campioni casuali
semplici di ampiezza n estratti da una popolazione il cui parametro è ignoto conterrà il parametro stesso.
Margine d’errore: misura quanto è accurata la stima, E=Z * σ/√n, dipende da:
α/2
livello di confidenza (all’aumentare del livello di confidenza il margine d’errore aumenta;
ampiezza campionaria (all’aumentare dell’ampiezza del campione casuale, il margine d’errore
diminuisce);
deviazione standard della popolazione: quanto maggiore è la variabilità della popolazione tanto più
sarà ampio l’intervallo di confidenza ottenuto.
2
Ampiezza campionaria: n=[(Z * σ)/E]
α/2
Proprietà della t di Student:
La distribuzione t differisce a seconda dei gradi di libertà;
La distribuzione t è centrata e simmetrica rispetto a 0;
L’area sotto la curva è 1;
Le code della distribuzione t sono asintotiche rispetto all’asse delle x;
L’area delle code della distribuzione t è più grande dell’area delle code della normale standard;
All’aumentare della dimensione campionaria n, la curva di densità di t si avvicina alla curva di
densità della normale standard. Il valore di S si avvicina a σ per la legge dei grandi numeri.
Intervallo di confidenza per la frequenza relativa della popolazione
La stima puntuale della frequenza rela va di una popolazione è p
=x/n
na distribuzione campionaria di p è approsima vmente normale con media ʯ =p e deviazione standard
p
σ =√pq/n, con npq>=10 e ogni prova sia indipendente n<=0,05N.
p
Intervallo: [p
+-Z √p (1-p )/n]
α/2 2
Ampiezza campionaria: n=p (1-p
)*[ Z /E] , quando p
=0,5 si ottiene il massimo valore p (1-p )=0,25.
α/2 Verifica d’ipotesi
Sistema d’ipotesi:
Ipotesi nulla H0: rappresenta l’info che vogliamo testare, l’ipotesi nulla è l’ipotesi di nessun cambiamento
o nessun effetto.
Ipotesi alternativa H1: rapresenta l’info che vogliamo sostenere attraverso una prova campionaria.
Risultati verifica di ipotesi:
1.Rifiutare l’ipotesi nulla quando l’ipotesi alternativa è vera.Questa decisione sarebbe corretta.
2.Accettare l’ipotesi nulla quando l’ipotesi nulla è vera. Questa decisione sarebbe corretta.
3.Rifiutare l’ipotesi nulla quando l’ipotesi nulla è vera. Questa decisione sarebbe sbagliata e l’errore che
commettiamo è definito errore di I tipo.
4.Accettare l’ipotesi nulla quando l’ipotesi alternativa è vera.Questa decisione sarebbe sbagliata e l’errore
che commettiamo è definito errore di II tipo.
Devianza Nota σ:
Condizioni:
x è normale e devianza standard= σ/√n
avere a disposizine un campione casuale semplice
avere una numerosità campionaria n>=30
Statisticamente significativi: quando i risultati osservati sono diversi da quelli attesi nel caso in cui l’ipotesi
nulla sia vera, quindi possiamo rifiutare Ho.
Metodo classico:
Logica: Se la media campionaria, misurata in unità di deviazione standar, è molto inferiore alla media
indicata nell’ipotesi nulla, allora rifiutiamo l’ipotesi nulla
Condizioni
1. Il campione è ottenuto utilizzando un capionamento casuale semplice con σ noto.
2. Il campione non ha valori anomali e la popolazione da cui è stato estratto è distribuita come una
variabile casuale normale oppure la numerosità campionaria è sufficientemente elevata (n>=30).
Step:
1. Vado a determinare l’ipotesi nulla e l’ipotesi alternativa.
Bilaterale Unilaterale sinistro Unilaterale destro
H : ʯ=ʯ H :ʯ=ʯ H :ʯ=ʯ
0 0 0 0 0 0
H :ʯ≠ʯ H :ʯ<ʯ H :ʯ>ʯ
1 0 1 0 1 0
2. Vado a selezionare un livello di significatività α, basato sulla possibilità di commettere l’errore di I
tipo.
3. Soddisfatte le condizioni affermiamo che x è normale e devianza standard= σ/√n, quindi z = x
-ʯ /
0 0
σ/√n rappresenta la distanza dalla media campionaria dalla media assunta ʯ , espressa in numero
0
di deviazioni standard. Questo valore è chiamato statistica test.
4. Il livello di significatività è utilizzato per determinare il valore critico , che rappresenta il numero
massimo di deviazioni standard. Inoltre, possiamo osservera la regione critica (o regione di rifiuto)
che rappresenta l’insieme di valori per cui rifiutiamo l’ipotesi nulla.
5. Confronto il valore critico con la statistica test (regola di decisione).
Bilaterale Unilaterale sinistro Unilaterale destro
Z <-Z o Z >Z Z <-Z Z >Z
0 α/2 0 α/2 0 α 0 α
Rifiutiamo l’ipotesi nulla
6. Formulo la conclusione
Metodo P-value
Il p-value è la probabilità di osservere una statistica test con un valore pari (o più estremo) a quello
osservato sotto l’assunzione che l’ipotesi nulla sia vera. In altre parole, rappresenta la verosomiglianza o la
probabilità di estrarre un campione la cui media campionaria corrisponda a quella ottenuta nell’analisi, nel
caso di ipotesi nulla vera.
Logica: Assumendo che l’ipotesi H0 sia vera, se la probabilità di avere una media campionaria pari o anche
più esterna a quella che abbiamo ottenuto è bassa, allora rifiutiamo l’ipotesi nulla.
Condizioni
1. Il campione è ottenuto