Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
V
Nei gruppi −1 T
Totale
Anova a due vie:
Lo stesso tipo di analisi può essere condotta se la misura della grandezza di interesse x è influenzata da
più di un attributo. Ora, il generico dato può essere rappresentato nel seguente modo:
= ̂ + + + +
Senza perdita di generalità, per semplificare le notazioni, si assume che ciascuna classe sia composta
1 ≤ ≤
dallo stesso numero di elementi, per cui per ogni i,j .
rappresenta l’influenza esercitata dall’iesimo fattore, l’influenza dovuta alla seconda causa di
modella l'effetto combinato dei due attributi, la sinergia,l’interazione dei fattori. Al solito
variazione,
2
modella la variabilità statistica del dato e si assume
~(0, )
= 0
= 0
: {
0 = 0
[1, [1,
: ≠ 0 ∈ ] ≠ 0 ∈ ℎ] ≠
1
[1,
0 (, ) ∈ ][, ℎ]
1
∑
̂ = media all’interno di ciascun gruppo
=1
1 ℎ
∑ ∑
̂ = effetto netto primo fattore
,∙,∙ =1
=1
ℎ−
1
∑ ∑
̂ = effetto netto secondo fattore
∙,,∙ =1
=1
−
La variabilità totale dei dati può essere ora decomposta come:
ℎ
1 2
2
= ∑ ∑ ∑( −
̂) =
=1 =1 =1
2 2 2
1 =1 ℎ=1 =1 ℎ=1 =1 ℎ=1 =1 ℎ=1
∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑
= ( ( −
̂ ) + (
̂ −
̂) + (
̂ −
̂) + (
̂ −
,∙,∙ ∙,,∙
=1 =1 =1 =1
2
̂
̂ −
̂ + ) )
∙,,∙ ,∙,∙
ℎ ℎ ℎ
1 2 2 2 2
̂
= (∑ ∑ ∑( −
̂ ) + ℎ ∑(
̂ −
̂) + ∑(
̂ −
̂) + ∑ ∑(
̂ −
̂ −
̂ + ) )
,∙,∙ ∙,,∙ ∙,,∙ ,∙,∙
=1 =1 =1 =1 =1 =1 =1
= + + +
1 2
V rappresenta la variabilità statistica dei dati all'interno di ciascun gruppo.
rappresentano rispettivamente la variabilità dovuta all'effetto del primo attributo ed all'effetto
1 2
del secondo attributo.
viene detto interazione e quantifica l'effetto legato alla sinergia degli attributi.
2 2
2 2
2 1 2
~ , ~ ~ ~ , ~
, ,
Se H0 vera −1 −1 ℎ−1 (−1)(ℎ−1) ℎ(−1)
2 2 2 2 2
1
1 −1
= ~
1 −1,ℎ(−1)
1
ℎ (−1)
1
2 ℎ−1
= ~
Statistiche: 2 ℎ−1,ℎ(−1)
1
ℎ (−1)
1
(−1)(ℎ−1)
= ~
(−1)(ℎ−1),ℎ(−1)
1
{ ℎ (−1)
{ > } ∪ { > } ∪ { > }
Set critico: (−1)(ℎ−1),ℎ(−1)
1 −1,ℎ(−1) 2 ℎ−1,ℎ(−1)
Algoritmo di Kruskal-Wallis:
è un test ANOVA non parametrico che si può applicare tutte le volte che la distribuzione dei dati differisca
significativamente dalla gaussiana, pur rimanendo la stessa per tutta la popolazione, per cui deve sempre
valere l'omoschedasticità. In questo caso per prima cosa si devono ordinare i dati in ordine crescente. Si
crea poi una tabella simile a quella dei dati di partenza dove ad ogni dato viene sostituito il suo numero
d'ordine nella lista (rank). Se due o più dati dovessero avere lo stesso valore e quindi occupare lo stesso
rank, questo viene ripartito in parti uguali in modo da non privilegiare nessun gruppo. Indicando con le
̂
numerosità dei singoli gruppi, k il numero di gruppi,N il numero totale di dati, la media di ogni gruppo e
̂ la media di tutto l’insieme dei dati, la statistica del test sarà:
=1
∑ (
̂ −
̂ )
= ~
−1
1 ( + 1)
12
Se tuttavia i dati avessero la stessa distribuzione ma soffrissero di una forte eteroschedasticità, il test K-W
non è affidabile. In caso che la distribuzione sia gaussiana si può ricorrere al seguente test.
Welch ANOVA:
= ∑
̂
=1
Nei pesi wi facciamo comparire la precisione in modo tale da tener conto del fatto che i dati sono
eteroschedastici.
= la statistica è troppo complessa…
2
Piano degli esperimenti:
Un campione che rappresenta bene la popolazione deve contenere unità estratte da ciascuno strato. Nasce
quindi l’esigenza di pianificare l’esperimento in modo da raccogliere i dati distribuendo opportunamente la
numerosità del campione tra le varie classi o strati; questa tecnica prende il nome di stratificazione (o
clusterizzazione). La situazione generale è quindi quella di un insieme di N elementi suddivisi in k
il valor medio di un certo attributo degli elementi considerati nella
µ
strati ognuno con unità. Sia
classe i-esima, e sia il peso della classe i-esima nell’insieme, che supponiamo noto ( ad
= ,
esempio ottenuto da una precedente indagine sperimentale condotta ad hoc);è facile verificare che il
valore medio di insieme µ è:
=
∑ µ
=1
Stimiamo µ µ
̂ ,
con la media campionaria sappiamo infatti che
[µ
̂ ] = µ
2
−
2
=
̂
µ −1
2
2
=
̂
µ
{
2 à:
è la varianza intraclasse dell’attributo considerato. Dunque la stima di
µ
̂ = ∑ µ
̂
=1
Che è una stima precisa. La sua varianza invece sarà:
2
−
2
= ∑
− 1
=1
2 2
2
= ∑ =
̂ ̂
µ µ
2
=1 2
∑
{
=1
Come si vede la varianza della stima dipende dagli , per cui una corretta scelta di essi può rendere la
µ
̂
stima più accurata possibile una volta fissato, per motivi di costi o altri motivi di ordine pratico, la
n
numerosità totale del campione. Esaminiamo due possibili strategie:
Attribuzione proporzionale:
In questo caso si sceglie = =
Riproduco cioè un campione in cui il peso dei campioni negli strati è uguale a quello degli strati sulla
popolazione, cioè il campione ha lo stesso rapporto di numerosità con lo strato che ha lo strato con la
popolazione.
2
− −
2
2
= ∑ = ∑
− 1 − 1
=1 =1
2 2
2
= ∑ =
̂ ̂
µ µ
2
=1 2
2
=
∑ = ∑
{
=1 =1
Attribuzione ottimale: 2
∗
In questo caso si cercano i valori ottimi
che rendono minima la varianza della stima. Mediante la
̂
µ
tecnica dei moltiplicatori di lagrange si ottiene:
√
− 1
∗
=
=1
∑ √
− 1
∗
=
∑
{
=1
1
2 =1 2
= (∑ )
e la varianza della stima all’ottimo vale:
̂
µ
per campioni non indipendenti troppo complesso da calcolare
Identificazione dei modelli:
Nella maggior parte dei casi un modello lineare risulta essere sufficiente per rappresentare in modo
, , … ,
significativo il legame tra la grandezza di misura y e le variabili indipendenti 1 2
= + + + ⋯ + + = + ∑ +
0 1 1 2 2 0