Anteprima
Vedrai una selezione di 15 pagine su 67
Metodi statistici per la gestione del rischio e dell'innovazione Pag. 1 Metodi statistici per la gestione del rischio e dell'innovazione Pag. 2
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Metodi statistici per la gestione del rischio e dell'innovazione Pag. 6
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Metodi statistici per la gestione del rischio e dell'innovazione Pag. 11
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Metodi statistici per la gestione del rischio e dell'innovazione Pag. 16
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Metodi statistici per la gestione del rischio e dell'innovazione Pag. 21
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Metodi statistici per la gestione del rischio e dell'innovazione Pag. 26
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Metodi statistici per la gestione del rischio e dell'innovazione Pag. 31
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Metodi statistici per la gestione del rischio e dell'innovazione Pag. 36
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Metodi statistici per la gestione del rischio e dell'innovazione Pag. 41
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Metodi statistici per la gestione del rischio e dell'innovazione Pag. 46
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Metodi statistici per la gestione del rischio e dell'innovazione Pag. 51
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Metodi statistici per la gestione del rischio e dell'innovazione Pag. 56
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Metodi statistici per la gestione del rischio e dell'innovazione Pag. 61
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Metodi statistici per la gestione del rischio e dell'innovazione Pag. 66
1 su 67
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

E C D G

Si può osservare che non c’è un ordine alfabetico, ma un ordine specifico che bisogna mantenere; se si guarda

per colonna si hanno dei blocchi completi (ogni lettera si presenta una sola volta), mentre per riga sono

incompleti per mancanza di spazio all’interno della riga stessa; si ottiene un rettangolo da un quadrato latino

monco. Si può usare esattamente come un quadrato latino; con tale disposizione si può tenere conto non solo

del fattore blocco ma anche del fattore posizione (i.e. A viene provato in posizione 1, 2, 3 e 4 così come gli altri).

Prima non era possibile controllare la posizione, ovvero si doveva randomizzare (ciò che non è possibile

controllare va sempre randomizzato).

Per analizzare questi dati bisogna tenere presente che la progettazione è bilanciata nel suo complesso, ma non

dentro ogni blocco (come nei quadrati latini). Dunque, è necessario eliminare gli effetti di blocco quando si

esaminano gli effetti del fattore principale, solitamente attraverso l’uso del general linear model (g.l.m.):

5

μ

dove α rappresenta l’effetto dell’i‐esimo trattamento e β l’effetto del j‐esimo blocco. Si tratta allora di un

i j

modello additivo a due fattori senza repliche e senza interazioni. Tale modello fornisce la parte di varianza

spiegata da tutti i fattori e bisognerà semplicemente valutare da questi dati se si è o meno in regione di rifiuto.

Il residuo S si può ottenere dal g.l.m. La tabella ANOVA è presentata a seguire. Possiamo poi calcolare S

R B

come medie dell’usuale one‐way ANOVA. Si ricordi che in tale somma dei quadrati rientra una componente

legata al trattamento, perché blocchi e trattamenti non sono ortogonali. Infine Δ può ottenersi tramite

⁄ 1 / /

differenza, così come ν. Il test per saggiare l’ipotesi H : α = 0 è: , che è una F‐ Fisher con

0 i

t – 1 e ν g.d.l.

Inoltre si tenga presente che nel valore atteso dell’MS dei blocchi c’è la presenza del trattamento. Dunque se

si vuole saggiare l’ipotesi H : β = 0 bisogna scambiare il ruolo dei fattori Blocks e Treatments, determinando la

0 i

somma dei quadrati dei Block adjusted . Come sappiamo, le due differenze così ottenute, blocks adjusted e

1

treatments adjusted, non sono additive perché i rispettivi regressori non sono ortogonali.

I Quadrati di Yourden (anche detti incomplete Latin squares) sono dei b.i.b. con due variabili di blocco. Il modello

è quindi lo stesso dei b.i.b. con un termine in più:

μ

dove β rappresenta l’effetto del j‐esimo blocco per riga (j=1,…,b) e γ l’effetto dell’l‐esimo blocco per colonna

j l

(l=1,2,…,k). Per costruire la tabella ANOVA bisogna determinare l’SS del residuo atraverso il g.l.m. Le quantità

da allocare in Rows e Columns, essendo due fattori bilanciati, può ottenersi come un usuale two‐way ANOVA

senza repliche. La parte relativa a Treatments adjusted è ottenuta per differenza. : α = 0, ricorriamo

In tabella, g denota una opportuna costante positiva. Come sempre, per saggiare l’ipotesi H 0 i

al test F‐Fisher con regione di rifiuto unilaterale a destra:

⁄ 1

/

6

1 Questa analisi, chiamata è valida sia se i blocchi sono ad effetti fissi che variabili. Nel secondo caso è

intra-blocks, ∑ 0.

possibile ottenere informazioni aggiuntive sugli effetti dei trattamenti, imponendo il vincolo

Capitolo 2.

Fino ad ora ci si è occupato di fattori di ingresso di tipo qualitativo (categorial factors) e si sono trascurate le

interazioni, tant’è vero che con l’utilizzo dei quadrati latini non si hanno abbastanza g.d.l. per studiarle (i.e.

con due fattori con L livelli ciascuno ne servirebbero [L–1] ). In questo capitolo gli altri fattori non sono di

2

blocco, ma altri fattori tecnologici a cui si è interessati, e pertanto le interazioni non soltanto sono d’interesse

scientifico, ma non è possibile escluderle. Chiariamo che per fattoriale s’intende la situazione opposta ad un

design annidato, ovvero ciascun livello di ciascun fattore è incrociato con ogni livello di ogni altro.

Naturalmente più sono i fattori controllati simultaneamente, più elevata sarà la potenza del test. Infatti se

l’errore residuo può decomporsi in sempre più elementi significativi, è più probabile riconoscere come

significativi fattori che non hanno grande influenza. Tutto ciò potrebbe essere oscurato se c’è un forto disturbo

di fondo causato da errori troppo grandi. Allo stesso tempo, però, il modello si complica poiché con k fattori

si hanno C interazioni di secondo ordine tra coppie di fattori e C interazioni di terzo ordine ordine tra

2 k 3 k

triadi e così via. Sicuramente più è alto l’ordine dell’interazione, minore è la reale influenza sulla variabile di

risposta; inoltre il numero di prove sperimentali da effettuare per una progettazione completa aumenta

notevolmente con il numero di fattori controllati. È necessario trovare un modo per ridurre il numero di prove

da effettuare attraverso design incompleti, che permettano lo studio degli effetti di ordini bassi, sacrificando

quelli di ordine più alto.

Per mantenere il massimo numero di fattori con il minimo numero di repliche, una soluzione è evitare repliche

e fissare al minimo i livelli dei fattori, ovvero porli pari a 2. La scelta di utilizzare due livelli risulta appropriata

per variabili in cui si possono identificare i livelli “basso” e “alto” o per variabili dicotomiche. In tal caso,

convenzionalmente, si assegna valore –1 al livello inferiore e si denota con (‐), e +1 al livello superiore e si

denota con (+) . Bisogna sottolineare subito che con due soli punti si può sperare di apprezzare solo una

1

componente di tipo lineare, cioè se il fenomeno aumenta o diminuisce passando da un livello basso ad uno

alto; se invece si ha la necessità di apprezzare un andamento che sia di tipo diverso (i.e. quadratico) due punti

non saranno sufficienti. Quindi di solito questi piani vengono utilizzati come piani di screening iniziale, cioè

per stabilire se il fenomeno dipende o meno da un fattore di ingresso.

Vediamo qualitativamente qual è il

duplice vantaggio di una pianificazione

fattoriale. L’effetto di un fattore è la

differenza rispetto al risultato medio,

ovvero bisogna verificare qual è la

distanza sulla variabile di risposta tra il

risultato con il livello alto e quello con il

livello basso. Con il “one factor at a time” si

intende studiare un fattore alla volta con

due esperimenti, tenendo l’altro a livello

“standard”, ossia a zero. Sembrerebbe più

semplice da trattare. Sullo schema

fattoriale, per valutare l’effetto di X ,

1

bisogna valutare la differenza dalla media

delle due osservazioni, meno la media

delle altre due. Nei one factor at a time la variabilità di queste due osservazioni è la somma della varianza

secondo la proprietà che la varianza di una differenza è data, nel caso di indipendenza (garantita dalla

7

1 I simboli + o – possono anche usarsi per indicare “presente” o “non presente”. Inoltre la scelta di attribuire valori

rispettivi +1 e –1 è assolutamente arbitraria. Nel caso di presente o assente non c'è nessun tipo di arbitrarietà, ma nel caso

di alto e basso bisogna già avere un'idea di qual è il range operativo di questo fattore. Allora è opportuno che una parte

del materiale sperimentale sia destinato inizialmente a fare delle prove preliminari per rendersi conto di quali sono i range

operativi all'interno del quale si hanno delle risposte di tipo lineare. Quindi si possono condurre inizialmente degli

esperimenti anche controllando i fattori uno alla volta.

randomizzazione), dalla somma delle varianze. Nel caso fattoriale è la somma delle varianze delle medie.

Passando a tre fattori la situazione è analoga (per il one factor at a time si fissano a zero due fattori e se ne fa

variare solo uno). Si dimostra che lʹefficienza della sperimentazione un fattore alla volta resta sempre la stessa

e resta sempre bassa perché la differenza è semplicemente tra due osservazioni. Nel piano fattoriale, invece,

l’efficienza va aumentando, perché si fanno medie tra un numero sempre maggiore di valori. Inoltre si è in

grado di valutare l’interazione.

Descriviamo il modello 2 , con il quale si denota un modello completo a due livelli e due fattori (ciò implica

2

che le prove coinvolte sono 2 =4). Per ognuna delle quattro prove i segni mostrati nelle colonne x e x indicano

2 1 2

come eseguire la prova. Nella tabella, i segni determinano anche i coefficienti (–1 e 1) che, divisi per i divisors,

costituiscono i contrasti lineari che stimano i vari effetti. Il primo si usa

per stimare la media complessiva, poiché con un contrasto con tutti i

coefficienti pari ad 1 si ha la somma di 4 valori che, divisi per 4, danno la

media di cui sopra. Il quadrato del secondo contrasto, ottenuto usando i

coefficienti secondo il segno della colonna l , stima la semi‐variabilità di y

1

spiegata dal fattore 1: 2

• • • • •

in cui gli indici i e j assumono unicamente i valori – 1 o 1. Ogni contrasto può essere trattato come un regressore

basato su due soli punti. Dal momento che il co‐prodotto tra due contrasti qualsiasi è zero, questi sono

ortogonali tra loro. In questa situazione i regressori sono anch’essi ortogonali e il coefficiente di regressione di

x può calcolarsi come:

1 1

4 • •

2

è pari alla metà della stima dell’effetto del primo fattore, che indica di quanto cambia la risposta

Si noti che b

1

media passando dal fattore “basso” a quello “alto”. Infatti passando da – 1 a +1, si incrementa il fattore di due

punti, pertanto il coefficiente angolare, che deve spiegare un incremento unitario, deve essere pari alla metà

della stima dell’effetto. La varianza spiegata da tale variabile è data da:

4

• • • , ottenuto moltiplicando

Lo stesso discorso vale per il fattore 2. Il coefficiente di regressione per il regressore x 12

i contrasti di x e x è dato da:

1 2 /4

4

La parte di varianza spiegata dall’interazione tra i due fattori risulta pari a:

1 4

• • •• 4 , dove

Si noti anche che l’interazione può scriversi come:

il primo addendo misura la differenza tra i risultati medi usando il primo o i

Dettagli
A.A. 2016-2017
67 pagine
3 download
SSD Scienze economiche e statistiche SECS-S/02 Statistica per la ricerca sperimentale e tecnologica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher RiccardoScimeca di informazioni apprese con la frequenza delle lezioni di Metodi statistici per la gestione del rischio e dell'innovazione e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Palermo o del prof Lombardo Alberto.