DIFFERENZE TRA PIU’ DI DUE GRUPPI SPERIMENTALI (DISEGNO AD UN FATTORE)
Esempio ecologico: effetti della predazione di lucertole su popolazioni di ragni alle
Bahamas
Ci sono piccole isole dove si hanno lucertole e ragni, è necessario il confronto di più livelli,
e infatti si fanno 3 trattamenti, ci sono delle aree libere dove le lucertole possono predare i
ragni in materia naturale, delle aree chiuse (gabbie) con lucertole escluse e poi delle aree
chiuse con le lucertole dentro. Se non c’è effetto gabbia, il controllo (dove non c’è la
gabbia) dovrà avere una stessa densità di ragni dell’area con una densità di lucertole pari a
quella esterna.
Sapendo che non ho effetto gabbia e noto che la popolazione di ragni è inferiore dove le
lucertole sono presenti rispetto a dove sono escluse posso confermare che le lucertole
predano i ragni su questi isolotti.
Confronto tra più di due livelli
Livelli: 1) controllo naturale, consumatore libero di usufruire della risorsa, 2) esclusione del
consumatore, 3) controllo artefatto con barriera permeabile al consumatore o che lo
contenga
Se non c’è artefatto, la nostra variabile di risposta come “densità di una specie” in questo
caso, non deve differire tra il controllo naturale e il controllo artefatto
Livelli di un fattore: ogni fattore è rappresentato da più livelli (trattamenti) ciascuno dei
quali rappresenta un gruppo di osservazioni esposte alla stessa condizione sperimentale
relativamente a quel fattore.
09/03/2023
Confronto tra più di due livelli
Chiamiamo fattore A una variabile predittiva, questo fattore può essere:
-random (i livelli che scegliamo sono casuali tra un insieme possibile di livelli)
-fisso (l’ipotesi ci dice di scegliere esattamente determinati livelli)
Testare ipotesi che il battito cardiaco dei topi vari con la temperatura, posso formulare
l’ipotesi anche nel modo in cui il battito cardiaco dei topi vari con tra temperatura di 15,20
e 25 gradi. Ovviamente la prima ipotesi sarebbe fattore random e la seconda fattore fisso.
Se prendiamo 5 temperature, A sarà uguale a 5, mentre il pedice i rappresenta il generico
livello del fattore A.
Per ciascun livello avremo un numero di osservazioni, noi dobbiamo replicare per ridurre
l’errore casuale, infatti le osservazioni andranno prese in modo casuale facendo attenzione
nel prendere un campione rappresentativo.
Con j indichiamo la generica osservazione.
Se io prendessi 10 repliche per livello, n sarebbe uguale a 10.
Per ciascun livello del mio fattore, io posso calcolare una stima campionaria della media,
campionaria perchè ho estratto un certo numero di osservazioni da tutte quelle possibili.
Stimo una media per ogni livello e una media generale (X)
Se io comparo due osservazioni all’interno dello stesso livello, queste posso differire per
l’unicità dell’osservazione (U), ci sarà comunque variabilità.
Se invece comparo osservazioni di due livelli differenti, differiscono sia per l’unicità delle
osservazioni sia per l’effetto di passare da un livello a l’altro del fattore A.
Quindi dovremo costruire un test che ci permetta di capire se la variabilità nel passare da
un livello all’altro è maggiore o no di quella all’interno del livello. Se U+A non è maggiore di
U significa che l’effetto del fattore A non c’è.
L’obiettivo dell’analisi della varianza è valutare se la variabilità generata dall’effetto del
fattore A è significativamente superiore alla naturale variabilità tra osservazioni
Stiamo testando l’ipotesi nulla che le medie siano tutte uguali H0: μ1= μ2= μj= μa
Ripartizione della variabilità:
Algebra (per scomporre la variabilità totale in queste due sorgenti, in maniera che si
➢ possano comparare)
Modello lineare (ci aiuta a capire le sorgenti di variabilità)
➢ Test statistico (dato dalla distribuzione F)
➢
Algebra
Scompongo la variabilità totale in variabilità entro i gruppi e variabilità tra gruppi tramite
arrangiamenti matematici (sommatorie)
La variabilità totale è data dalla somma delle differenze di ciascuno di questi numeri dalla
media generale (quanto ciascun singolo valore si discosta dalla media generale), e noi
dobbiamo scomporre questa variabilità totale nelle due sorgenti che abbiamo identificato:
quella dovuta all’unicità delle osservazioni e quella generata dal fattore.
Dobbiamo elevare la sommatoria al quadrato, altrimenti il risultato sarebbe uguale a 0.
Per mezzo di ulteriori passaggi algebrici (teoria della distribuzione normale), è possibile
dimostrare che la divisione delle devianze tra gruppi ed entro i gruppi per i rispettivi gradi
di libertà, produce stime di varianze (definite come scarti quadratici medi o MS, Mean
Square) che esprimono la variabilità dovuta all’unicità delle osservazioni e all’effetto del
fattore in esame, se tale effetto è presente nei dati
xij-xi rappresenta la variabilità negli stessi livelli, mentre in xi-x ho la variabilità tra i vari
livelli. Quindi ho così scomposto la variabilità totale in due sorgenti di variabilità, quella
entro i gruppi, che rappresenta quanto ciascuna osservazione si discosta dalla media del
livello del fattore a cui appartiene, e quella tra i gruppi dove vedo quanto la media di
ciascun fattore si scosta dalla media generale.
Possiamo notare che negli scarti non c’è un pedice n, quindi quello che troviamo alla fine
esce dalla sommatoria.
Il passo successivo sarà comparare queste variabili e decidere in maniera oggettiva se una
è più grande o meno dell’altra.
Per arrivare alla varianza dalla devianza, dobbiamo dividere queste devianze per i gradi di
libertà.
Definizione gradi di libertà: numero di elementi di cui si può far a meno per compiere
un’operazione aritmetica
Quindi, a ciascuna di queste devianze possiamo associare dei gradi di libertà. Se dividiamo
le devianze per i gradi di libertà otteniamo queste varianze attese (o MS, che significa
2e
mean square), otteniamo una stima della varianza che indichiamo con σ dove “e” sta per
errore. Quando ho una serie di numeri, posso calcolare la sommatoria, dividerla per i gradi
2e
di libertà e quello che ottengo è una stima della varianza all’interno dei gruppi (σ ), lo
stesso faccio con le devianze, dividendo per i gradi di libertà ottenendo una varianza
2e 2a
attesa tra gruppi (σ + nσ )
Modello lineare
Significa una combinazione lineare che ci possa rappresentare qualsiasi osservazione. Alla
fine noi abbiamo dei valori di una variabile che abbiamo estratto da una popolazione che
sarà descritta da una distribuzione di frequenza. Quindi ciascuna osservazione si discosta dalla
media del livello per l’unicità dell’osservazione.
Questo modello ci aiuta a visualizzare come
può essere espressa la generica osservazione
Xij tramite la media della popolazione dalla
quale il campione è prelevato sommata al
termine residuo, ovvero quanto si discosta
l’osservazione dal valore medio (ogni individuo
è unico)
Posso modificare la prima equazione (solo se l’esperimento riguarda un solo fattore)
aggiungendo l’effetto di un livello del fattore. Se H0 è falsa ci sarà un effetto del livello A.
Per definizione se l’effetto di i non c’è μi= μ, e l’effetto di Ai lo trovo calcolando quanto μi è
distante da μ.
Ai è la differenza tra la media parametrica del livello i e la media parametrica dell’intera
distribuzione mentre eij è quanto ciascun’osservazione si discosta dalla media parametrica
del livello a cui appartiene. Posso calcolare così l’effetto dell’iesimo
livello del trattamento e il termine residuo
Se c’è un effetto del livello i, la media del livello si discosta dalla media generale.
Se H0 è vera, le medie parametriche di tutti i livelli sono uguali e quindi μ generale per tutti
e Ai=0, ciascuna osservazione si discosta dal valore medio solo per l’unicità delle
osservazioni
Se H0 è falsa, ciascun livello è descritto da una distribuzione di frequenza che ha una
media che si discosta da quella generale, le medie parametriche di ogni livello si
discosteranno tra di loro e tra la media generale.
Livelli sperimentali in un ipotetico esperimento di esclusione di predatori
La sommatoria degli scarti quadratici da 338, quindi vorrà dire che escludere predatori o
tenerli presenti sarà differente in termini della variabile di risposta che stiamo studiando.
Ogni colonna rappresenta le 5 osservazioni relative alla densità delle prede quando c’è il
predatore, senza predatore e quando c’è controllo dell’arte fatto, quindi ciascuna colonna
ci da il valore medio della densità delle prede in presenza, assenza del predatore e ca. Da
questi valori possiamo ottenere un valore medio, che stima μ. Ai è la differenza del valore
medio di ciascun livello e la media generale (es 35-20=15).
Ai mi da 0, ma se elevo le medie al quadrato non mi da più zero. L’ipotesi nulla, se è vera,
lo scarto MS deve essere zero.
Test statistico
La statistica F
Abbiamo un rapporto del MS tra gruppi ed entro i gruppi, io voglio vedere se la variabilità
generata dal fattore A è maggiore o no di quella all’interno del livello. Se non c’è variabilità
2e
generata dal fattore A, la quantità n σ è uguale a 0.
Usiamo una distribuzione di frequenza statistica che è quella del valore di F, che è un
rapporto tra varianze, questa distribuzione di frequenza è stata tabulata è centrata su 1.
Anche in questo caso la forma della curva cambia a seconda dei gradi di libertà,
cerchiamo un valore di F critico tabulato che ci permette di distinguere il 5% dal 95%, per il
resto funziona come il test T
Caratteristiche statistica F:
1. Questo test ha una sola coda in quanto A sposta i valori verso DX.
2. La forma della curva è influenzata dal n° di repliche ma anche dai gradi di libertà del
numeratore (a-1) e del denominatore(a(n-1)).
3. Fcrit separa la coda che contiene il 5% dell’intera distribuzione. Essendo la stat.F
tabulata posso ricavarlo Fcrit e confrontarlo con la risposta del mio test, che se maggiore
mi porta a rifiutare l’ipotesi nulla accetto distr.alternativa.
15/03/2023
Assunzioni dell’analisi della varianza
‘Assunzione’ significa che la probabilit&
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.