Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
E C D G
Si può osservare che non c’è un ordine alfabetico, ma un ordine specifico che bisogna mantenere; se si guarda
per colonna si hanno dei blocchi completi (ogni lettera si presenta una sola volta), mentre per riga sono
incompleti per mancanza di spazio all’interno della riga stessa; si ottiene un rettangolo da un quadrato latino
monco. Si può usare esattamente come un quadrato latino; con tale disposizione si può tenere conto non solo
del fattore blocco ma anche del fattore posizione (i.e. A viene provato in posizione 1, 2, 3 e 4 così come gli altri).
Prima non era possibile controllare la posizione, ovvero si doveva randomizzare (ciò che non è possibile
controllare va sempre randomizzato).
Per analizzare questi dati bisogna tenere presente che la progettazione è bilanciata nel suo complesso, ma non
dentro ogni blocco (come nei quadrati latini). Dunque, è necessario eliminare gli effetti di blocco quando si
esaminano gli effetti del fattore principale, solitamente attraverso l’uso del general linear model (g.l.m.):
5
μ
dove α rappresenta l’effetto dell’i‐esimo trattamento e β l’effetto del j‐esimo blocco. Si tratta allora di un
i j
modello additivo a due fattori senza repliche e senza interazioni. Tale modello fornisce la parte di varianza
spiegata da tutti i fattori e bisognerà semplicemente valutare da questi dati se si è o meno in regione di rifiuto.
Il residuo S si può ottenere dal g.l.m. La tabella ANOVA è presentata a seguire. Possiamo poi calcolare S
R B
come medie dell’usuale one‐way ANOVA. Si ricordi che in tale somma dei quadrati rientra una componente
legata al trattamento, perché blocchi e trattamenti non sono ortogonali. Infine Δ può ottenersi tramite
⁄ 1 / /
differenza, così come ν. Il test per saggiare l’ipotesi H : α = 0 è: , che è una F‐ Fisher con
0 i
t – 1 e ν g.d.l.
Inoltre si tenga presente che nel valore atteso dell’MS dei blocchi c’è la presenza del trattamento. Dunque se
si vuole saggiare l’ipotesi H : β = 0 bisogna scambiare il ruolo dei fattori Blocks e Treatments, determinando la
0 i
somma dei quadrati dei Block adjusted . Come sappiamo, le due differenze così ottenute, blocks adjusted e
1
treatments adjusted, non sono additive perché i rispettivi regressori non sono ortogonali.
I Quadrati di Yourden (anche detti incomplete Latin squares) sono dei b.i.b. con due variabili di blocco. Il modello
è quindi lo stesso dei b.i.b. con un termine in più:
μ
dove β rappresenta l’effetto del j‐esimo blocco per riga (j=1,…,b) e γ l’effetto dell’l‐esimo blocco per colonna
j l
(l=1,2,…,k). Per costruire la tabella ANOVA bisogna determinare l’SS del residuo atraverso il g.l.m. Le quantità
da allocare in Rows e Columns, essendo due fattori bilanciati, può ottenersi come un usuale two‐way ANOVA
senza repliche. La parte relativa a Treatments adjusted è ottenuta per differenza. : α = 0, ricorriamo
In tabella, g denota una opportuna costante positiva. Come sempre, per saggiare l’ipotesi H 0 i
al test F‐Fisher con regione di rifiuto unilaterale a destra:
⁄ 1
/
6
1 Questa analisi, chiamata è valida sia se i blocchi sono ad effetti fissi che variabili. Nel secondo caso è
intra-blocks, ∑ 0.
possibile ottenere informazioni aggiuntive sugli effetti dei trattamenti, imponendo il vincolo
Capitolo 2.
Fino ad ora ci si è occupato di fattori di ingresso di tipo qualitativo (categorial factors) e si sono trascurate le
interazioni, tant’è vero che con l’utilizzo dei quadrati latini non si hanno abbastanza g.d.l. per studiarle (i.e.
con due fattori con L livelli ciascuno ne servirebbero [L–1] ). In questo capitolo gli altri fattori non sono di
2
blocco, ma altri fattori tecnologici a cui si è interessati, e pertanto le interazioni non soltanto sono d’interesse
scientifico, ma non è possibile escluderle. Chiariamo che per fattoriale s’intende la situazione opposta ad un
design annidato, ovvero ciascun livello di ciascun fattore è incrociato con ogni livello di ogni altro.
Naturalmente più sono i fattori controllati simultaneamente, più elevata sarà la potenza del test. Infatti se
l’errore residuo può decomporsi in sempre più elementi significativi, è più probabile riconoscere come
significativi fattori che non hanno grande influenza. Tutto ciò potrebbe essere oscurato se c’è un forto disturbo
di fondo causato da errori troppo grandi. Allo stesso tempo, però, il modello si complica poiché con k fattori
si hanno C interazioni di secondo ordine tra coppie di fattori e C interazioni di terzo ordine ordine tra
2 k 3 k
triadi e così via. Sicuramente più è alto l’ordine dell’interazione, minore è la reale influenza sulla variabile di
risposta; inoltre il numero di prove sperimentali da effettuare per una progettazione completa aumenta
notevolmente con il numero di fattori controllati. È necessario trovare un modo per ridurre il numero di prove
da effettuare attraverso design incompleti, che permettano lo studio degli effetti di ordini bassi, sacrificando
quelli di ordine più alto.
Per mantenere il massimo numero di fattori con il minimo numero di repliche, una soluzione è evitare repliche
e fissare al minimo i livelli dei fattori, ovvero porli pari a 2. La scelta di utilizzare due livelli risulta appropriata
per variabili in cui si possono identificare i livelli “basso” e “alto” o per variabili dicotomiche. In tal caso,
convenzionalmente, si assegna valore –1 al livello inferiore e si denota con (‐), e +1 al livello superiore e si
denota con (+) . Bisogna sottolineare subito che con due soli punti si può sperare di apprezzare solo una
1
componente di tipo lineare, cioè se il fenomeno aumenta o diminuisce passando da un livello basso ad uno
alto; se invece si ha la necessità di apprezzare un andamento che sia di tipo diverso (i.e. quadratico) due punti
non saranno sufficienti. Quindi di solito questi piani vengono utilizzati come piani di screening iniziale, cioè
per stabilire se il fenomeno dipende o meno da un fattore di ingresso.
Vediamo qualitativamente qual è il
duplice vantaggio di una pianificazione
fattoriale. L’effetto di un fattore è la
differenza rispetto al risultato medio,
ovvero bisogna verificare qual è la
distanza sulla variabile di risposta tra il
risultato con il livello alto e quello con il
livello basso. Con il “one factor at a time” si
intende studiare un fattore alla volta con
due esperimenti, tenendo l’altro a livello
“standard”, ossia a zero. Sembrerebbe più
semplice da trattare. Sullo schema
fattoriale, per valutare l’effetto di X ,
1
bisogna valutare la differenza dalla media
delle due osservazioni, meno la media
delle altre due. Nei one factor at a time la variabilità di queste due osservazioni è la somma della varianza
secondo la proprietà che la varianza di una differenza è data, nel caso di indipendenza (garantita dalla
7
1 I simboli + o – possono anche usarsi per indicare “presente” o “non presente”. Inoltre la scelta di attribuire valori
rispettivi +1 e –1 è assolutamente arbitraria. Nel caso di presente o assente non c'è nessun tipo di arbitrarietà, ma nel caso
di alto e basso bisogna già avere un'idea di qual è il range operativo di questo fattore. Allora è opportuno che una parte
del materiale sperimentale sia destinato inizialmente a fare delle prove preliminari per rendersi conto di quali sono i range
operativi all'interno del quale si hanno delle risposte di tipo lineare. Quindi si possono condurre inizialmente degli
esperimenti anche controllando i fattori uno alla volta.
randomizzazione), dalla somma delle varianze. Nel caso fattoriale è la somma delle varianze delle medie.
Passando a tre fattori la situazione è analoga (per il one factor at a time si fissano a zero due fattori e se ne fa
variare solo uno). Si dimostra che lʹefficienza della sperimentazione un fattore alla volta resta sempre la stessa
e resta sempre bassa perché la differenza è semplicemente tra due osservazioni. Nel piano fattoriale, invece,
l’efficienza va aumentando, perché si fanno medie tra un numero sempre maggiore di valori. Inoltre si è in
grado di valutare l’interazione.
Descriviamo il modello 2 , con il quale si denota un modello completo a due livelli e due fattori (ciò implica
2
che le prove coinvolte sono 2 =4). Per ognuna delle quattro prove i segni mostrati nelle colonne x e x indicano
2 1 2
come eseguire la prova. Nella tabella, i segni determinano anche i coefficienti (–1 e 1) che, divisi per i divisors,
costituiscono i contrasti lineari che stimano i vari effetti. Il primo si usa
per stimare la media complessiva, poiché con un contrasto con tutti i
coefficienti pari ad 1 si ha la somma di 4 valori che, divisi per 4, danno la
media di cui sopra. Il quadrato del secondo contrasto, ottenuto usando i
coefficienti secondo il segno della colonna l , stima la semi‐variabilità di y
1
spiegata dal fattore 1: 2
• • • • •
in cui gli indici i e j assumono unicamente i valori – 1 o 1. Ogni contrasto può essere trattato come un regressore
basato su due soli punti. Dal momento che il co‐prodotto tra due contrasti qualsiasi è zero, questi sono
ortogonali tra loro. In questa situazione i regressori sono anch’essi ortogonali e il coefficiente di regressione di
x può calcolarsi come:
1 1
4 • •
2
è pari alla metà della stima dell’effetto del primo fattore, che indica di quanto cambia la risposta
Si noti che b
1
media passando dal fattore “basso” a quello “alto”. Infatti passando da – 1 a +1, si incrementa il fattore di due
punti, pertanto il coefficiente angolare, che deve spiegare un incremento unitario, deve essere pari alla metà
della stima dell’effetto. La varianza spiegata da tale variabile è data da:
4
• • • , ottenuto moltiplicando
Lo stesso discorso vale per il fattore 2. Il coefficiente di regressione per il regressore x 12
i contrasti di x e x è dato da:
1 2 /4
4
La parte di varianza spiegata dall’interazione tra i due fattori risulta pari a:
1 4
• • •• 4 , dove
Si noti anche che l’interazione può scriversi come:
il primo addendo misura la differenza tra i risultati medi usando il primo o i