vuoi
o PayPal
tutte le volte che vuoi
H
Se è vera allora:
0
2
~ con = ∑
−1
2
=1
Allora per il teorema di Cochran: ⊥
2
~
−
2
2
~
−1
2
8
Dunque scelgo la statistica test: 1
∙ −
2
− 1
= = ∙ ~
−1,−
1 − 1
∙ 2
−
Da cui il set critico è: = >
{ }
−1,−,
Confronto tra medie di più gruppi (ANOVA a due vie)
() (,
)
{ },
Se i dati sono dove denota la l-esima ripetuta del dato (assumiamo che ogni ha lo stesso
numero di ripetute), allora: () ()
= + + + +
Dove è l’effetto combinato di e e è l’effetto della classe j-ma.
Il test ora è: ≠ 0 per almeno un
= 0
≠ 0 per almeno un
= 0
H : H :
oppure
0 1
= 0 (,
≠ 0 per almeno un )
Denotiamo:
1 ()
(, ) ̂ = ∑ per = 1 … , = 1 … ℎ
Media di ogni gruppo
=1 ℎ
1 ()
̂ = ∑ ∑ per = 1 …
Media di ogni gruppo ,∙,∙
∙ℎ =1 =1
1 ()
Media di ogni gruppo ̂ = ∑ ∑ per = 1 … ℎ
∙,,∙
∙ =1 =1
Consideriamo la varianza campionaria totale:
/ = / + / + / + /
1 2
ℎ 2
()
∑ ∑ ∑ ( − ̂ )
Varianza totale
=1 =1 =1
ℎ ℎ
2
() 2
∑ ∑ ( − ̂ ) = − − − = ∑ ∑ ̂
Varianza nei gruppi 1 2 ,
=1 =1 =1 =1
2
Varianza tra i gruppi
ℎ ∙ ∑(̂ − ̂ )
1 ,∙,∙
=1
ℎ 2
∙ ∑(̂ − ̂
)
Varianza tra i gruppi ∙,,∙
2 =1
ℎ 2
(, ) ∑ ∑ ((̂ + ̂ − + ̂
) (̂ ))
Varianza tra i gruppi ,∙,∙ ∙,,∙
=1 =1 9
Se ho verificato:
()
4 { }
I dati devono essere gaussiani (verificato con un test)
()
{ }
5 I dati devono essere tra loro omoschedastici (verificato con il test di Bartlett)
H
E è vara allora:
0 2
~ con = ∙ ℎ ∙
−1
2
Allora per il teorema di Cochran: ⊥ ⊥ ⊥
1 2
1 2
2 2
2 2
~ , ~ , ~ , ~
−1 ℎ−1 (−1)(ℎ−1)
ℎ(−1)
2 2 2 2
Scegliamo le statistiche test:
ℎ( − 1)
1 = { > }
= ∙ ~ 1 −1,ℎ(−1),
1 −1,ℎ(−1)
−1
ℎ( − 1)
2 = { > }
= ∙ ~ 2 ℎ−1,ℎ(−1),
2 ℎ−1,ℎ(−1)
ℎ−1
ℎ( − 1)
= { > }
= ∙ ~ (−1)(ℎ−1),ℎ(−1),
(−1)(ℎ−1),ℎ(−1)
(
− 1)(ℎ − 1)
Confronto tra medie di più gruppi (ANOVA a due vie senza repliche)
= + + +
Denoto come: ℎ
1
̂ = ∑ ∑
Media del campione
∙ℎ =1 =1
ℎ
1
̂ = ∑ per = 1 …
Media di ogni gruppo ,∙
ℎ =1
1
Media di ogni gruppo ̂ = ∑ per = 1 … ℎ
∙,
=1
Possiamo analizzare la varianza dei dati come:
/ = / + / + /
1 2 ℎ 2
∑ ∑( − ̂ )
Varianza totale
=1 =1
ℎ 2
∑ ∑ (( + ̂ − (̂ + ̂ )) = − −
)
Varianza nei gruppi ,∙ ∙, 1 2
=1 =1
10 2
Varianza tra i gruppi
ℎ ∑(̂ − ̂ )
1 ,∙
=1
ℎ 2
∑(̂ − ̂
)
Varianza tra i gruppi ∙,
2 =1
Nota che non è presente solo perché non riusciamo a modellarla esplicitamente. Se ho verificato:
{ }
4 I dati devono essere gaussiani (verificato con un test)
{ }
5 I dati devono essere tra loro omoschedastici (verificato con il test di Bartlett)
H
E è vara allora:
0 2
~ con = ∙ ℎ
−1
2
Allora per il teorema di Cochran: ⊥ ⊥
1 2
1 2
2 2 2
~ , ~ , ~
−1 ℎ−1
(ℎ−1)(−1)
2 2 2
Scegliamo le statistiche test:
(ℎ − 1)( − 1)
1 = { > }
= ∙ ~ 1 −1,(ℎ−1)(−1),
1 −1,(ℎ−1)(−1)
−1
(ℎ
− 1)( − 1)
2 = { > }
= ∙ ~ 2 ℎ−1,(ℎ−1)(−1),
2 ℎ−1,(ℎ−1)(−1)
ℎ−1
ANOVA a una via di Kruskal-Walls Condizioni necessarie
…
1 I gruppi indipendenti di numerosità 1
2 I valori di ogni gruppo hanno la stessa unità di misura
≈ ⋯ ≈
3 I gruppi devono avere 1
{ }
4 I dati devono essere non gaussiani
{ }
5 I dati devono essere tra loro omoschedastici (verificato con il test di Levene)
L’algoritmo sfrutta, invece che il valore del dato , il rango di questo.
ANOVA a una via di Welch Condizioni necessarie
…
1 I gruppi indipendenti di numerosità 1
2 I valori di ogni gruppo hanno la stessa unità di misura
≈ ⋯ ≈
3 I gruppi devono avere 1
{ }
4 I dati devono essere non gaussiani
{ }
5 I dati devono essere tra loro eteroschedastici
11
Poiché i dati non hanno stessa accuratezza, si ha che la media dei dati deve essere equalizzata:
′
̂ = ∑ ∙ ̂ = ∑ ∙ ̂
2
̂
=1 =1
~
E la statistica test è una con un molto complicato.
Stratificazione
Tale tecnica serve a pianificare l’esperimento in modo da raccogliere i dati distribuendo opportunamente la
numerosità del campione tra le varie classi o strati.
1
Media della popolazione = ∑ ∑ = ∑ ∙ = ∑
=1 =1 =1 =1
1
Media della classe = ∑
=1
1
̂ = ∑ ∑
Media del campione
=1 =1
1
̂ = ∑
Media del campione nella classe
=1
(̂ =
)
2
, se il campione è indipendente
̂ ⟹
2
=
̂ 2
−
∙ , se il campione è non indipendente
{ − 1
{
Da cui: )
(̂ =
2
2
∑ , se il campione è indipendente
̂ ⟹
=1
2 2
2
= ∑ =
̂ ̂
2
−
=1
2
∑ ∙ , se il campione è non indipendente
− 1
{ {
=1
̂
Dunque per avere un più accurato possiamo scegliere un opportuno:
= ∙
Attribuzione proporzionale
2
2
= argmin , . . ∑ = }
{∑
̂
=1 =1
∙ , se il campione è indipendente
Attribuzione ottimale =1
∑
= − 1)
√/(
∙ , se il campione è non indipendente
∑ √/( − 1)
{
=1
12
Regressione lineare di dati omoschedastici
= + ∑ + , per = 1 …
0
=1
+1
[ ]
= … ∈ ℝ
Per trovare il valore di bisogna minimizzare la seguente funzione di costo:
0 2
1 1 1 2
2
)
() = ∑ − ( + ∑ )] = ∑( − ̂ = ∑
[
0
=1 =1 =1 =1
̂ = argmin{()}
Ossia e affinché esista:
2
0 = − ∑ − ( + ∑ )] = 0
[
0
0 =1 =1
∇() = = 0 ⟹
1
2
⋮ = − ∑ ∙ − ( + ∑ )] = 0, per = 1 &