Anteprima
Vedrai una selezione di 6 pagine su 23
Sintesi modelli Pag. 1 Sintesi modelli Pag. 2
Anteprima di 6 pagg. su 23.
Scarica il documento per vederlo tutto.
Sintesi modelli Pag. 6
Anteprima di 6 pagg. su 23.
Scarica il documento per vederlo tutto.
Sintesi modelli Pag. 11
Anteprima di 6 pagg. su 23.
Scarica il documento per vederlo tutto.
Sintesi modelli Pag. 16
Anteprima di 6 pagg. su 23.
Scarica il documento per vederlo tutto.
Sintesi modelli Pag. 21
1 su 23
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

V

Nei gruppi −1 T

Totale

Anova a due vie:

Lo stesso tipo di analisi può essere condotta se la misura della grandezza di interesse x è influenzata da

più di un attributo. Ora, il generico dato può essere rappresentato nel seguente modo:

= ̂ + + + +

Senza perdita di generalità, per semplificare le notazioni, si assume che ciascuna classe sia composta

1 ≤ ≤

dallo stesso numero di elementi, per cui per ogni i,j .

rappresenta l’influenza esercitata dall’iesimo fattore, l’influenza dovuta alla seconda causa di

modella l'effetto combinato dei due attributi, la sinergia,l’interazione dei fattori. Al solito

variazione,

2

modella la variabilità statistica del dato e si assume

~(0, )

= 0

= 0

: {

0 = 0

[1, [1,

: ≠ 0 ∈ ] ≠ 0 ∈ ℎ] ≠

1

[1,

0 (, ) ∈ ][, ℎ]

1

̂ = media all’interno di ciascun gruppo

=1

1 ℎ

∑ ∑

̂ = effetto netto primo fattore

,∙,∙ =1

=1

ℎ−

1

∑ ∑

̂ = effetto netto secondo fattore

∙,,∙ =1

=1

La variabilità totale dei dati può essere ora decomposta come:

1 2

2

= ∑ ∑ ∑( −

̂) =

=1 =1 =1

2 2 2

1 =1 ℎ=1 =1 ℎ=1 =1 ℎ=1 =1 ℎ=1

∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑

= ( ( −

̂ ) + (

̂ −

̂) + (

̂ −

̂) + (

̂ −

,∙,∙ ∙,,∙

=1 =1 =1 =1

2

̂

̂ −

̂ + ) )

∙,,∙ ,∙,∙

ℎ ℎ ℎ

1 2 2 2 2

̂

= (∑ ∑ ∑( −

̂ ) + ℎ ∑(

̂ −

̂) + ∑(

̂ −

̂) + ∑ ∑(

̂ −

̂ −

̂ + ) )

,∙,∙ ∙,,∙ ∙,,∙ ,∙,∙

=1 =1 =1 =1 =1 =1 =1

= + + +

1 2

V rappresenta la variabilità statistica dei dati all'interno di ciascun gruppo.

rappresentano rispettivamente la variabilità dovuta all'effetto del primo attributo ed all'effetto

1 2

del secondo attributo.

viene detto interazione e quantifica l'effetto legato alla sinergia degli attributi.

2 2

2 2

2 1 2

~ , ~ ~ ~ , ~

, ,

Se H0 vera −1 −1 ℎ−1 (−1)(ℎ−1) ℎ(−1)

2 2 2 2 2

1

1 −1

= ~

1 −1,ℎ(−1)

1

ℎ (−1)

1

2 ℎ−1

= ~

Statistiche: 2 ℎ−1,ℎ(−1)

1

ℎ (−1)

1

(−1)(ℎ−1)

= ~

(−1)(ℎ−1),ℎ(−1)

1

{ ℎ (−1)

{ > } ∪ { > } ∪ { > }

Set critico: (−1)(ℎ−1),ℎ(−1)

1 −1,ℎ(−1) 2 ℎ−1,ℎ(−1)

Algoritmo di Kruskal-Wallis:

è un test ANOVA non parametrico che si può applicare tutte le volte che la distribuzione dei dati differisca

significativamente dalla gaussiana, pur rimanendo la stessa per tutta la popolazione, per cui deve sempre

valere l'omoschedasticità. In questo caso per prima cosa si devono ordinare i dati in ordine crescente. Si

crea poi una tabella simile a quella dei dati di partenza dove ad ogni dato viene sostituito il suo numero

d'ordine nella lista (rank). Se due o più dati dovessero avere lo stesso valore e quindi occupare lo stesso

rank, questo viene ripartito in parti uguali in modo da non privilegiare nessun gruppo. Indicando con le

̂

numerosità dei singoli gruppi, k il numero di gruppi,N il numero totale di dati, la media di ogni gruppo e

̂ la media di tutto l’insieme dei dati, la statistica del test sarà:

=1

∑ (

̂ −

̂ )

= ~

−1

1 ( + 1)

12

Se tuttavia i dati avessero la stessa distribuzione ma soffrissero di una forte eteroschedasticità, il test K-W

non è affidabile. In caso che la distribuzione sia gaussiana si può ricorrere al seguente test.

Welch ANOVA:

= ∑

̂

=1

Nei pesi wi facciamo comparire la precisione in modo tale da tener conto del fatto che i dati sono

eteroschedastici.

= la statistica è troppo complessa…

2

Piano degli esperimenti:

Un campione che rappresenta bene la popolazione deve contenere unità estratte da ciascuno strato. Nasce

quindi l’esigenza di pianificare l’esperimento in modo da raccogliere i dati distribuendo opportunamente la

numerosità del campione tra le varie classi o strati; questa tecnica prende il nome di stratificazione (o

clusterizzazione). La situazione generale è quindi quella di un insieme di N elementi suddivisi in k

il valor medio di un certo attributo degli elementi considerati nella

µ

strati ognuno con unità. Sia

classe i-esima, e sia il peso della classe i-esima nell’insieme, che supponiamo noto ( ad

= ,

esempio ottenuto da una precedente indagine sperimentale condotta ad hoc);è facile verificare che il

valore medio di insieme µ è:

=

∑ µ

=1

Stimiamo µ µ

̂ ,

con la media campionaria sappiamo infatti che

̂ ] = µ

2

2

=

̂

µ −1

2

2

=

̂

µ

{

2 à:

è la varianza intraclasse dell’attributo considerato. Dunque la stima di

µ

̂ = ∑ µ

̂

=1

Che è una stima precisa. La sua varianza invece sarà:

2

2

= ∑

− 1

=1

2 2

2

= ∑ =

̂ ̂

µ µ

2

=1 2

{

=1

Come si vede la varianza della stima dipende dagli , per cui una corretta scelta di essi può rendere la

µ

̂

stima più accurata possibile una volta fissato, per motivi di costi o altri motivi di ordine pratico, la

n

numerosità totale del campione. Esaminiamo due possibili strategie:

Attribuzione proporzionale:

In questo caso si sceglie = =

Riproduco cioè un campione in cui il peso dei campioni negli strati è uguale a quello degli strati sulla

popolazione, cioè il campione ha lo stesso rapporto di numerosità con lo strato che ha lo strato con la

popolazione.

2

− −

2

2

= ∑ = ∑

− 1 − 1

=1 =1

2 2

2

= ∑ =

̂ ̂

µ µ

2

=1 2

2

=

∑ = ∑

{

=1 =1

Attribuzione ottimale: 2

In questo caso si cercano i valori ottimi

che rendono minima la varianza della stima. Mediante la

̂

µ

tecnica dei moltiplicatori di lagrange si ottiene:

− 1

=

=1

∑ √

− 1

=

{

=1

1

2 =1 2

= (∑ )

e la varianza della stima all’ottimo vale:

̂

µ

per campioni non indipendenti troppo complesso da calcolare

Identificazione dei modelli:

Nella maggior parte dei casi un modello lineare risulta essere sufficiente per rappresentare in modo

, , … ,

significativo il legame tra la grandezza di misura y e le variabili indipendenti 1 2

= + + + ⋯ + + = + ∑ +

0 1 1 2 2 0

Dettagli
Publisher
A.A. 2017-2018
23 pagine
2 download
SSD Ingegneria industriale e dell'informazione ING-INF/04 Automatica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher lucia23111995 di informazioni apprese con la frequenza delle lezioni di Modellistica e identificazione e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Roma La Sapienza o del prof De Santis Alberto.