Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
FATTORI FISSI E FATTORI RANDOM
Esistono due tipi di predittori o fattori nei modelli lineari: fissi e random
La tipologia dei fattori è una funzione del modo in cui vengono stabilite le ipotesi. Non è una proprietà dell’analisi. La
differenza dipende da se:
• Si è interessati a trattamenti specifici, con requisiti identificabili (fattore fisso)
• Si è interessati a un problema generale, alcune componenti del quale sono incluse (in modo rappresentativo)
nell’esperimento (fattore random)
Fattore fisso: tutti i livelli rilevanti per l’ipotesi che si vuole testare vengono inclusi nell’esperimento. L’esperimento
fornisce il razionale preciso per rigettare o no l’ipotesi nulla H0
Fattore random: include solo un campione dei livelli rilevanti. La popolazione dei livelli (o trattamenti) a cui si applica
l’ipotesi è molto più grande del numero di livelli inclusi. L’esperimento fornisce una risposta meno precisa ma più
generale
Criterio proposto da Simpson e colleghi (1960) utile per stabilire se un fattore è fisso o random: porsi la seguente
domanda: l’eventuale ripetizione dello studio, e quindi il riesame della stessa ipotesi può essere eseguito includendo
esattamente gli stessi livelli del fattore considerato, o la stessa ipotesi può essere analizzata considerando livelli
diversi? Nel primo caso (necessito degli stessi livelli) il fattore è fisso (i livelli sono specificati interamente dalla ipotesi).
Nel secondo (posso analizzare livelli diversi) il fattore è random: un campione qualunque (purché rappresentativo) di
possibili livelli permette l’analisi della stessa ipotesi
Nei fattori fissi l’intera serie di livelli scelti del fattore è necessaria per testare l’ipotesi nulla. Nei fattori random un
certo numero di livelli (siti, tempi o altro) viene scelto per rappresentare quelli disponibili e definiti come rilevanti per
l’ipotesi nulla. -> Se l’ipotesi nulla viene rigettata, le differenze fra i livelli indicano che ci sono differenze fra i campioni
dei livelli del fattore. I livelli individuali non sono importanti, e i confronti fra i livelli non sono né necessari né utili
Nell’analisi cambia l’algebra a seconda che i fattori siano fissi o random
Il modello lineare dell’analisi della varianza con fattore fisso: X = μ + A + e . Dove X è la j-esima replica nell’i-esimo
ij i ij ij
trattamento (i-esimo livello del fattore A; i=1….a); A è la differenza fra l’i-esimo livello del fattore A e la media generale
i
μ; e è la deviazione della replica j-esima nel campione i-esimo dalla media di quella popolazione
ij +
In definitiva: un fattore fisso fornisce una misura delle differenze fra i livelli scelti -> segue che una volta che l’ANOVA
permette di rigettare H0 sono necessari confronti successivi. Un fattore random fornisce un risultato generale sulle
differenze (se ce ne sono) fra qualsiasi set di livelli scelti -> segue che non ha senso effettuare confronti fra i livelli
indagati una volta che l’ANOVA permette di rigettare H0
Le proprietà dei fattori fissi e dei fattori random possono essere combinate con opportuni disegni sperimentali,
permettendo l’analisi di ipotesi complesse
Inoltre l’analisi di ipotesi più complesse richiede esperimenti multifattoriali basati su più variabili predittive (fattori)
Due possibili modalità:
1. Fattori gerarchizzati o nested: un fattore B si dice gerarchizzato in A (fattore gerarchizzante) se ogni livello di
B è rappresentato in un singolo livello di A
2. Fattori ortogonali: due fattori si dicono ortogonali se tutti i livelli di A sono rappresentati in tutti i livelli di B e
viceversa
ANOVA A DUE FATTORI NESTED
Analisi della varianza come metodo di disegni sperimentali -> permette di scomporre la variabilità totale in diverse
sorgenti di variazione
Disegno nested o gerarchico
Disegno a un fattore (che può avere diversi livelli) -> il modello lineare comprende un fattore (predittore) singolo. In
molti casi è un’impostazione troppo elementare: implica che la variabilità presente nei diversi gruppi (livelli del fattore)
a confronto sia determinata solo dalle modalità dell’unico fattore in esame
Varianza tra = varianza trattamento -> se ipotesi nulla non è vera stima varianza naturale + aggiunta di variabilità
dovuta al fattore che stiamo tenendo sotto controllo. Differenza se abbiamo a che fare con fattori fissi o random
I sistemi bio-ecologici sono molto complessi, quindi spesso è necessario introdurre più fattori per:
• Tentare di ridurre la variabilità non spiegata (varianza d’errore, residua, naturale, entro) della variabile risposta
• Esaminare l’interazione tra fattori, cioè se l’effetto di un particolare fattore sulla variabile risposta dipende da
un altro fattore
Accanto a uno o più fattori di interesse possiamo includere nel disegno altri fattori di variabilità + la variabilità casuale
non spiegata
Errore: variabilità non spiegata, dovuta a fattori non tenuti presente (sotto controllo)
Nella fase di programmazione di uno studio (disegno sperimentale) è necessario conoscere il sistema per individuare
i fattori che possono incidere sulla variabile in studio: ANOVA a più fattori
Si possono distinguere due tipi di disegni multifattoriali (che si possono integrare tra di loro)
• Disegni gerarchizzati o nested: un fattore B si dice gerarchizzato in A (fattore gerarchizzante) se ogni livello di
B è rappresentato in un singolo livello di A
• Disegni fattoriali o ortogonali o incrociati (crossed): due fattori si dicono ortogonali se tutti i livelli di A sono
rappresentati in tutti i livelli di B e viceversa
• Nei disegni con tre o più fattori si possono avere disegni misti: es: due fattori tra loro ortogonali (crossed) e il
terzo nested nel secondo, o nell’interazione tra i due fattori
Disegni nested (gerarchici): si utilizzano quando ci si può trovare con il problema del «confounding», termine che indica
che le differenze dovute ai trattamenti sperimentali (quelli specificati nell’ipotesi) non possono essere separate da
altri fattori che potrebbero causare le differenze osservate
Caratteristica dei disegni nested: permette di ridurre la variazione non spiegata (o residua) nella variabile risposta
Nel disegno nested:
• Il fattore principale può essere fisso o random
• Il fattore (fattori) nested è generalmente random
• I livelli del fattore (fattori) nested all’interno di ciascun livello del fattore principale sono differenti
• Spesso i livelli del fattore random rappresentano livelli di replicazione nella scala spaziale e/o temporale
Disegno e impianto sperimentale:
Trattamenti di manipolazione della densità (fattore densità): 4 livelli -> 0% (nessun riccio); 33% della densità originale;
66% della densità originale; 100% della densità originale 2
I trattamenti sono stati replicati in 4 distinte «patches» (fattore spaziale): di scogliera (3-4 m ) per ciascun trattamento
Repliche: 5 quadrati per ciascuna “patch”
Variabile misurata: copertura percentuale delle alghe filamentose
Dall’esempio si evince che è stato adottato un disegno nested. Il trattamento densità è il fattore fisso – i patches è il
fattore random e nested (gerarchizzato) al fattore densità
Ipotesi nulle:
• Nessuna differenza fra le medie della quantità di alghe filamentose fra i 4 trattamenti (livelli) di densità dei
ricci (fattore A)
• Nessuna differenza fra le medie della quantità di alghe filamento
B gerarchizzato in A -> B (A)
Fattore A (densità ricci) comprende «a» gruppi (4 nell’esempio): i=1 ad «a»
Fattore B (patch) comprende «b» gruppi all’interno (within) di ciascun livello di A (j=1 a «b»)
Repliche (quadrati) con «k» da1 ad «n» all’interno di ciascuna combinazione di B e A (patch e densità)
Nota: i gruppi (livelli) del fattore B (nel presente esempio: patches) sono differenti all’interno di ciascun livello di A. Lo
stesso vale per le repliche all’interno dei livelli “b”
Possiamo calcolare la media per ogni patch, per ogni A e la media generale
Per ogni livello di B in ciascun livello di A posso calcolare una media
Media per ciascun livello di A: somma di ogni osservazione per tutte le repliche per tutti i livelli di B -> quindi diviso
per b*n
La media generale è la somma di tutto
Modello
Media mu μ la stimiamo con la media generale
A è media a – media generale
B è differenza fra ciascuna media di B dalla propria media di livello
Ripartizione della variabilità
Abbiamo le basi per poter scomporre la variabilità totale nella varie sorgenti di variazione
Per ottenere le rispettive varianze, gli SS (o devianze) vengono divisi per gli appropriati gradi di libertà
Se è rispettata l’assunzione dell’omogeneità delle varianze, le varianze stimano i valori (parametri) della popolazione:
esempio in cui: Fattore A fisso; Fattore B(A) random
Le ipotesi nulle:
• Fattore A: H0: m1=m2=…mi=…m; Ai = 0; SAi 2 = 0
Esempio: non ci sono differenze di coperture percentuali algali medie fra le densità di ricci
• Fattore B(A): H0: m1(1) = m2(1) =…mj(i) =…m; Bj(i) = 0; SBj(i) 2 = 0
Non c’è una varianza aggiuntiva dovuta alle differenze fra tutti i possibili livelli di B nei livelli di A
Esempio: non c’è un’aggiunta di variabilità dovuta alle differenze fra le medie della copertura percentuale
algale fra le patches all’interno dei trattamenti densità
Costruzione del rapporto F
Il numeratore della statistica F è definito dal MS della sorgente di variazione a cui è associata l’ipotesi da analizzare
Il denominatore appropriato è definito dalla sorgente di variazione il cui MS atteso include gli stessi termini del
numeratore, eccetto il termine a cui è associata l’ipotesi
H0 vera implica che l’effetto del trattamento è nullo, per cui nullo sarà anche il contributo al valore di MS del termine
a cui è associata l’ipotesi. Quindi, numeratore e denominatore di F stimano lo stesso MS se H0 è vera, per cui il valore
atteso della statistica F, data vera l’ipotesi nulla, è 1
Ciò permette di identificare il denominatore appropriato per il test di ciascuna ipotesi in un esperimento multifattoriale
Soluzione di problemi di pseudoreplicazione
Il confronto usato (fra la varianza del fattore trattamento e il fattore gerarchico) non comporta confusione