Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
▪ FORMALIZZAZIONE DEL TEST D’IPOTESI
Le k popolazioni da cui sono tratti tutti i campioni hanno la stessa media
Almeno una delle medie delle popolazioni da cui sono tratti i
campioni differisce dalle altre. N.B. m rappresenta il numero di livelli del trattamento!
8
▪ LA RANDOMIZZAZIONE COMPLETA
- Si tratta del modello più semplice di ANOVA e prevede un campionamento in cui:
o ciascun trattamento viene assegnato in modo totalmente casuale ai soggetti (omogenei) su cui si
effettuano le misure, per determinare l’effetto dei singoli trattamenti;
o le repliche (osservazioni) sono assegnate casualmente ai vari livelli del trattamento, i quali possono non
avere lo stesso numero di osservazioni.
- La rappresentazione: ▪ LE DEVIANZE
La metodologia dell’ANOVA si basa
sul fatto che la variazione totale
nella risposta misurata a una certa
sollecitazione o trattamento si può
suddividere in componenti che
vengono attribuite a specifiche
cause di variabilità.
Occorre calcolare:
▪ I GRADI DI LIBERTÀ
- Alcune stime si basano su un numero di informazioni più alto rispetto ad altre. Ad esempio, una stima della
varianza a partire da un campione di taglia 100 si basa su un numero maggiore di informazioni rispetto al caso in
cui la taglia del campione sia pari a 5.
- I Gradi di Libertà rappresentano il numero di informazioni indipendenti su cui si basa una stima.
- Esempio 1: Supponiamo che la media (µ) di una popolazione sia nota. Se, «per assurdo», volessimo stimare la
media della popolazione, di quante informazioni avremmo bisogno? Ovviamente zero perché µ la conosciamo
già. Di conseguenza, in questo caso (paradossale), i gradi di libertà della stima sono pari a zero.
- Esempio 2: Supponiamo che la media di una popolazione sia ignota. Se vogliamo stimare la media della
popolazione, di quante informazioni abbiamo bisogno? Sappiamo che le osservazioni (cioè i campionamenti
dalla popolazione) devono essere indipendenti e perciò tale è l’informazione che contengono. In questo caso
quindi i gradi di libertà coincidono con il numero delle osservazioni stesse. D’altra parte, la media campionaria si
definisce proprio come la somma delle singole osservazioni diviso il loro numero…
9
▪ LE VARIANZE
- Sfruttando la regola di calcolo dei gdl: il numero di gradi di libertà si ricava dalla differenza tra il numero di dati e
il numero di parametri (o informazioni preliminari) che è necessario calcolare per ottenere la stima voluta,
otteniamo:
▪ TEST F DI FISCHER
- Come già detto, lo scopo dell’ANOVA a 1 via è quello di verificare l’ipotesi nulla
- Occorre quindi definire un metodo che ci permetta di distinguere se le differenze che osserviamo tra le medie
dei diversi campioni sono dovute a reali differenze TRA i trattamenti o alla naturale differenza che si osserva
campionando ripetutamente ENTRO la stessa popolazione.
10
- Sappiamo che “Varianza TRA” e “Varianza ENTRO” dipendono dalla variabilità esistente nei dati ed essendo due
misure della stessa variabilità, dovrebbero avere lo stesso valore. Indice dell’uguaglianza tra queste due
componenti della varianza è il rapporto:
- Il rapporto è la statistica del test F di Fisher. F si distribuisce approssimativamente come una distribuzione di
Fisher con k-1 e N-k gradi di libertà:
▪ ESEMPIO DI CALCOLO “A MANO” [EXCEL]
- Supponiamo di avere il seguente dataset, e riportiamo i dati su un foglio Excel
Attraverso la funzione DEV.Q calcoliamo la devianza
totale e riportiamo i relativi gdl
Se il caso non esistesse, allora non ci sarebbe variabilità
nel campionamento e quindi ogni osservazione
sarebbe uguale alla media del relativo trattamento.
Questo dataset «ideale» contiene esclusivamente la
variabilità dovuta ai trattamenti, perciò possiamo
usarlo per calcolare la devianza TRA i trattamenti
esattamente come fatto prima.
Riportiamo anche i relativi gdl.
11
Calcolo la Devianza Entro (=Devianza Totale -Devianza TRA). =G7-G15
Calcoliamo i gdl Entro (=gdl Totale – gdl TRA). =G8-G16
A questo punto abbiamo tutte le informazioni per
calcolare le due varianze e di conseguenza il
valore del loro rapporto F. =G17/117
Attraverso la funzione INV.F.DS otteniamo il valore tabulato
-1
F (0,05)
(3,16)
Rifiutiamo quindi l’ipotesi nulla con un livello di significatività pari al
5%
Infine, attraverso la funzione DISTRIB.F calcoliamo il valore della probabilità p di commettere il cosiddetto
«errore di I specie» (detto anche p-value), che rappresenta il livello di significatività osservato).
▪ ESEMPIO ERRORE DI PRIMA SPECIE
- Chiariamo ora il concetto di errore di prima specie con un esempio basato sull’analisi della varianza a 1 via.
- Sappiamo che l’errore di prima specie rappresenta la probabilità H di rifiutare, quando questa invece è vera.
0
Impostare un livello di significatività α = 0,05 vuol dire quindi accettare di avere falsi positivi nel 5% dei casi.
- Detto in altre parole, fissare α = 0,05 significa che (TEORICAMENTE), ripetendo 100 volte lo stesso esperimento
e verificando 100 volte se è possibile rifiutare o no H , 5 volte accadrà di giungere ad una conclusione errata.
0
- Illustriamo con un esempio pratico le affermazioni precedenti:
12
[3] ANOVA A 2 O PIÙ VIE
- L'analisi della varianza a 1 via è lo schema più semplice di confronto simultaneo tra più medie. Nella pratica
sperimentale spesso però rappresenta un’impostazione troppo elementare: infatti, in modo implicito, assume
che tutta la variabilità presente nei diversi gruppi a confronto sia determinata dai differenti livelli del singolo
fattore in osservazione. Analisi della
- Sovente è utile prendere in considerazione almeno due fonti di variabilità, allo scopo di: varianza a 2 o più
o Analizzare gli effetti di due o più cause contemporaneamente vie (o fattoriale)
o Ridurre la varianza d'errore, isolando gli effetti dovuti ad altre cause note
PRO CONTRO
- studio contemporaneo dell’effetto di 2 o più fattori - difficoltà con esperimenti sbilanciati
- identificazione dell’interazione tra fattori - difficoltà d’interpretazione (se i fattori sono più di 2)
- maggiore potenza - complessità dei calcoli (trascurabile)
L’ANOVA a 2 o più vie è da preferire per esperimenti finalizzati all’identificazione dell’effetto di specifici
trattamenti, mentre è meno efficace nell’analisi di sistemi reali.
▪ INTERAZIONE TRA FATTORI
- Tra 2 (o più) fattori applicati contemporaneamente può esservi:
o Indifferenza: I fattori esercitano il loro effetto senza variazioni dovute al livello degli altri fattori
(comportamento additivo).
o Sinergismo: La presenza contemporanea di determinati livelli dei fattori migliora il risultato rispetto alla
semplice additività.
o Antagonismo: La presenza contemporanea di determinati livelli dei fattori peggiora il risultato rispetto alla
semplice additività.
- Comportamenti sinergici o antagonistici indicano interazione tra i fattori
- Esempio (didattico) di interazione con 2 fattori, ciascuno con 2 livelli
Livello 0 Livello 1 Le combinazioni possibili tra i livelli dei fattori sono N0-P0, N0-P1, N1-P0
-1
N (Kg ha ) 0 100 e N1-P1. Per ciascuna combinazione
-1
P O (Kg ha ) 0 60 sono state effettuate 3 ripetizioni.
2 5
o Le combinazioni vanno considerate come se fossero singoli
trattamenti nell’ANOVA a 1 via.
o Obiettivo della sperimentazione è quello di valutare l’effetto
contemporaneo dei due fattori sulla produzione di frumento.
Assenza di interazione:
i segmenti sono
paralleli!
Presenza di interazione: i segmenti NON sono paralleli,
poiché l’effetto di un fattore dipende dal livello dell’altro.
13 - Gli effetti dovuti a un singolo
fattore sono anche detti effetti
semplici o di primo ordine e
quelli dovuti all’interazione tra
2 fattori sono detti effetti di
secondo ordine, quelli dovuti
all’interazione tra 3 fattori
sono detti effetti di terzo
ordine e via discorrendo.
- Al crescere del numero dei
fattori, il modello matematico
dell’Anova Fattoriale diventa
subito molto complesso:
Quando il modello tiene conto di tutti questi elementi, parliamo di modello fattoriale completo.
- Alcune osservazioni:
o Normalmente ci si limita a considerare il caso di ANOVA a 2 o 3 vie, per l’impossibilità pratica di
interpretare interazioni troppo complesse.
o È sempre opportuno che il numero di repliche sia uguale per ogni fattore e livello del fattore (esperimento
bilanciato). In questo caso infatti si garantisce la massima potenza del test statistico e l’unicità della
soluzione numerica nel caso di ANOVA a più vie.
▪ IPOTESI NULLA
- Consideriamo il caso di un’ANOVA a 2 vie, in cui quindi sono presenti due fattori: A (p livelli) e B (q livelli).
- Nel modello fattoriale completo corrispondente a questa situazione si possono verificare 3 ipotesi distinte:
o Nessuna differenza tra le medie di A
o Nessuna differenza tra le medie di B
o Nessuna interazione tra i fattori A e B
▪ ESECUZIONE DEI CALCOLI: Ipotizziamo di avere un esperimento bilanciato con r repliche
1. Stimare la devianza errore e la devianza dovuta ai trattamenti
Eseguiamo gli stessi calcoli per l’ANOVA a 1 via, considerando le combinazioni come singoli trattamenti
Una volta ottenute la devianza dei
trattamenti nel loro complesso dev TRA
(utile successivamente) e la devianza
errore dev calcoliamo i gdl
ERR
corrispondenti e, di conseguenza, le
rispettive varianze
14
2. Stimare le varianze dovute agli effetti semplici
Consideriamo l’esperimento come se fosse presente un solo fattore (A). Si hanno quindi rq unità sperimentali
che hanno ricevuto un determinato livello del trattamento A
Per calcolare la devianza del fattore A è allora sufficiente sostituire ogni dato con la media del livello di A cui
appartiene e calcolare la devianza di tutti i dati così ottenuti:
In maniera del tutto analoga si procede per il fattore B
3. Stimare le varianze dovute all’interazione
4. Impostare la tabella dell’ANOVA
5. Impostare la tabella dell’ANOVA
Occorre osservare innanzitutto la significatività dell’interazione: se l’effetto interattivo è significativo, allora va
considerata solo l’interazione e NON È LECITA ALCUNA CONCLUSIONE SUGLI EFFETTI SEMPLICI. Infatti in
presenza di interazione, l’effetto di un fattore è condi