Estratto del documento

APPUNTI FOR EXPERIMENTS AND FORECAST IN

THE FIELD OF TECHNOLOGY

Anno: 2025-2026 1

Sommario

1. Concetti generali ..................................................................................................... 4

2. Linear Regression Model .......................................................................................... 6

2.1 Modello con k regressori ................................................................................................. 6

2.2 Stima dei parametri adattamento del modello (model fitting) ........................................ 7

à

2.3 Stima di ................................................................................................................... 11

2.4 Proprietà degli stimatori ................................................................................................ 12

3. Test di significatività ............................................................................................... 12

3.1 Test del modello ............................................................................................................ 13

3.2 Regressione dovuta al modello SSR ............................................................................... 14

3.3 Indice di determinazione .......................................................................................... 15

3.4 Test di un singolo coeFiciente ........................................................................................ 15

3.5 Test di un sottoinsieme di coeFicienti ............................................................................ 16

4. Intervallo di confidenza, intervallo di previsione e diagnostica ................................. 17

4.1 Intervallo di confidenza ................................................................................................. 17

4.2 Previsione di nuove risposte .......................................................................................... 18

4.3 Diagnostica sui residui .................................................................................................. 19

4.4 Test di Lack-of-Fit (mancanza di adattamento) ............................................................... 21

5. DoE ....................................................................................................................... 22

5.1 Primi concetti sul DoE (e ANOVA) ................................................................................... 24

5.2 Esempio delle plantule .................................................................................................. 24

5.3 ANOVA one-way ............................................................................................................ 26

5.4 ANOVA one-way steps ................................................................................................... 27

5.5 Example (Logothetis e Wynn, 1989) ................................................................................ 28

5.6 Modello ANOVA (two-way) per il disegno RCB ................................................................. 30

5.7 Full Factorial Design - example by Montgomery (1991) .................................................... 30

5.8 Concetto di interazione ................................................................................................. 32

5.9 ANOVA – parametrizzazione a punto di riferimento (corner point) .................................... 33

6. Fractional Factorial Design ..................................................................................... 34

6.1 Esempio – full factorial design .................................................................................. 34

2

6.2 Electric welding example – experimental planning .......................................................... 38

7. Resolution criterium .............................................................................................. 40

7.1 complete defining relation ............................................................................................ 42

8. RSM – Response Surface Methodology .................................................................... 45

8.1 RSM – concetti teorici di modellazione ........................................................................... 46

8.2 RSM – metodo di ottimizzazione steepest ascent/discent (1° ordine) ............................... 48

8.3 RSM – Superficie stimata di secondo ordine ................................................................... 51

8.4 Rotabilità ...................................................................................................................... 52

9. RSM – modello di primo ordine ................................................................................ 53

9.1 Il metodo Steepest ascent ............................................................................................. 55

9.2 Passaggio dal primo al secondo ordine .......................................................................... 62

10. Steepest ascent/descent – teoria integrata con un esempio ................................... 65

11. Central Composite Design (CCD) .......................................................................... 73

12. Fractional Factorial a tre livelli .............................................................................. 77

13. Modelli RSM di secondo ordine ............................................................................. 78

14. Split Plot Design ................................................................................................... 79

14. Esempi ................................................................................................................ 81

14.3 Riepilogo .................................................................................................................... 85

15. Modello Lineare Misto (MLM) ................................................................................ 86

16. Mixed RSM ........................................................................................................... 87

16.1 Split plot e modello RSM misto .................................................................................... 88

3

1. Concetti generali

DoE – Design for Experiments: il DoE è un insieme di metodologie statistiche per pianificare,

eseguire e analizzare esperimenti in modo sistematico, con l’obiettivo di studiare l’eEetto di

uno o più fattori sulla variabile di risposta (RV), riducendo il numero di prove e massimizzando

l’informazione ottenuta.

Dati statistici: esistono due tipi diversi di dati:

- Dati osservazionali: nessun dataset è pianificato in anticipo e la fonte dei dati è ignota.

Il ricercatore non manipola alcuna variabile, ma si limita a osservare ciò che accade.

- Dati sperimentali: i ricercatori hanno pianificato un disegno sperimentale per

campionare i dati in modo strutturato. Manipolano le variabili per controllare le

condizioni a testare ipotesi specifiche, al fine di identificare relazioni di causa eEetto.

Si tratta di due tipologie di dati completamente diverse.

Di4erenza tra variabile e fattore:

- Variabili (2° step del DoE, modellazione statistica): possono essere quantitative o

qualitative e possono assumere tutti i valori contenuti in X.

- Fattori (1° step del DoE, pianificazione dell’esperimento): rappresentano le SoV,

possono essere categorici o quantitativi e assumono un insieme specifico di valori

chiamati livelli, che definiscono X.

RV: Response Variable (variabile di risposta).

SoV – Sources of Variability (fonti di variabilità): sono variabili che possono influenzare i

risultati di un esperimento. Una fonte di variabilità è una porzione della variabilità della RV

(variabile di risposta) catturata da un fattore.

Se un fattore è categorico:

- La RV viene stimata per ciascun livello del fattore;

- Si può sostituire con un fattore quantitativo, in cui ciascun insieme di valori identifica

una stima di primo livello della RV.

Interazione: misura come l’eEetto di un fattore sulla RV dipenda (o venga influenzato) dal

cambiamento del livello di un altro fattore. Se è nulla o trascurabile, significa che l’eEetto di

un fattore sulla RV è lo stesso per diversi livelli dell’altro fattore.

2 Fattori: possiamo definire l’interazione AB come la diEerenza media tra l’eEetto di B al livello

alto di A e l’eEetto di B al livello basso di A.

E4etto: l’eEetto è diverso dalla variabile. È l’impatto diretto (o indiretto) di un fattore sulla RV

ed è misurato tramite un coeEiciente. Può essere:

- Fisso: variabili i cui valori sono noti e fissati, perché controllabili 4

- Casuale: variabili i cui valori non sono noti in anticipo e non sono fissati; non possono

essere controllate a priori (ad esempio metodo Xz).

Modello statistico: descrive la relazione (espressa tramite i parametri del modello) tra le

variabili indipendenti e la variabile di risposta, con l’obiettivo di fare inferenza. Non si

adattano esattamente tutti i punti dati, ma si cerca di minimizzare i residui.

DoF – Gradi di Libertà: rappresentano la quantità di informazione indipendente disponibile

per stimare la variabilità dopo aver tenuto conto dei vincoli del modello.

Replicazione classica: esecuzione della stessa combinazione sperimentale nelle stesse

condizioni sperimentali. 5

2. Linear Regression Model

Il LRM è un modello che descrive la relazione tra un insieme di variabili indipendenti

(regressori) e una variabile dipendente (RV) adattando ai dati (osservazionali o sperimentali)

un’equazione lineare.

obiettivo: comprendere e quantificare la relazione lineare ed eEettuare previsioni.

à

Ipotesi:

- Linearità

~

- indipendenti e normalmente distribuiti, con omoschedasticità e media pari a zero.

!

Esempio:

iniziamo adattando modelli di regressione lineare. Per illustrare il concetto, possiamo

considerare un esempio che mette in relazione la resa di una reazione chimica con la

temperatura e la portata di alimentazione del catalizzatore.

Il modello base è:

Dove y rappresenta la resa, x1 rappresenta la temperatura e x2 rappresenta la portata di

alimentazione del catalizzatore. X1 e x2 sono le due variabili indipendenti (chiamate anche

variabili predittive o regressori).

il termine lineare è utilizzato perché l’equazione è una funzione lineare dei parametri

à ,

incogniti e .

" # $

CoeEicienti di regressione parziali e l’unità di misura è importante.

à à

# $

Questo modello descrive un piano nello spazio bidimensionale definito da x1 e x2. Il

parametro definisce l’intercetta del piano. e sono i coeEicienti di regressione parziali,

" # $

poiché misura la variazione attesa di y per una variabile unitaria di x1 quando x2 è

#

mantenuta costante. Lo stesso vale per , che misura la variazione attesa di y per una

$

variazione unitaria di x2 quando x1 è mantenuta costante.

Nel LRM l’errore casuale () è la diEerenza tra la risposta osservata e il valore osservato.

2.1 Modello con k regressori

In generale, la variabile di risposta y può essere correlata a k variabili regressori. Il modello

generale è quindi: 6

Si tratta di un modello di regressione lineare multipla con k variabili regressori. I parametri

, = 0, 1, … , , sono detti coeEicienti di regressione.

%

Questo modello descrive un iperpiano nello spazio k-dimensionale delle variabili regressori

{xj}. Il parametro rappresenta la variazione attesa della risposta y per una variazione

%

unitaria , mantenendo costanti tutte le altre variabili indipendenti .

% !

Modelli più complessi rispetto a questa equazione possono spesso considerare l’aggiunta di

un termine di interazione a un modello di primo ordine con due variabili; tuttavia, ciò

comporta una modifica delle caratteristiche delle variabili.

2.2 Stima dei parametri adattamento del modello (model fitting)

à

Quando applichiamo un modello, è necessario che la dimensione del campione sia maggiore

del numero di parametri che vogliamo stimare.

OLS (Ordinary Least Squares): il metodo dei minimi quadrati ordinari è tipicamente utilizzato

per stimare i coeEicienti di regressione in un modello di regressione lineare multipla in una

situazione standard (cioè in assenza di over disposizione o eteroschedasticità).

Supponiamo che n sia la dimensione del campione; dobbiamo quindi avere n>k osservazioni

, , … ,

. Per ogni risposta osservata , avremo una corrispondente osservazione delle

# $ & !

variabili . Assumiamo inoltre che il termine di errore nel modello abbia valore atteso

% $

() = 0 () =

e varianza , e che le { } siano le variabili casuali non correlate tra loro. I

!

dati sono assunti essere normalmente distribuiti.

quando applichiamo il metodo OLS, dobbiamo assumere che i residui abbiamo valore

à

atteso pari a zero e che vangano le ipotesi di omoschedasticità. Stiamo quindi assumendo

che la varianza sia costante (ipotesi che spesso non è verificata) e che i dati siano iid:

$

~~(0, )

Questo implica omoschedasticità e che le siano normalmente distribuite.

!

Omoschedasticità ed eteroschedasticità descrivono la variazione della dispersione

(varianza) degli errori di un modello al variare delle variabili indipendenti.

- Omoschedasticità significa che la varianza dei residui è costante per tutti i livelli delle

variabili indipendenti.

- Eteroschedasticità si verifica quando la varianza dell’errore cambia al variare dei

predittori.

L’omoschedasticità è l’opposto dell’eteroschedasticità (che implica varianza non costante).

In presenza di eteroschedasticità si utilizza la WLS (Weighted Least Square). 7

Con l’OLS tutte le variabili sono considerate fisse. Se abbiamo variabili casuali, non possiamo

applicare il LRM. Il LRM è un modello limitato che può essere applicato solo se valgono le

ipotesi di omoschedasticità, normalità, iid e se le variabili sono continue.

Possiamo scrivere il modello (2) in termini di stime come nella formula seguente:

Il metodo OLS consente di ottenere le stime dei coeEicienti in modo tale da minimizzare la

Somma dei Quadrati (SS) degli errori . Questo non implica necessariamente che il modello

!

sia il migliore in assoluto per i dati.

Somma dei Quadrati (SS): è una misura della variabilità che quantifica quanto i dati osservati

si discostino da un valore di riferimento, tipicamente la media. In ANOVA è utilizzata per

Anteprima
Vedrai una selezione di 7 pagine su 29
Appunti Statistica per la sperimentazione e le previsioni in ambito tecnologico (parte 1) in italiano Pag. 1 Appunti Statistica per la sperimentazione e le previsioni in ambito tecnologico (parte 1) in italiano Pag. 2
Anteprima di 7 pagg. su 29.
Scarica il documento per vederlo tutto.
Appunti Statistica per la sperimentazione e le previsioni in ambito tecnologico (parte 1) in italiano Pag. 6
Anteprima di 7 pagg. su 29.
Scarica il documento per vederlo tutto.
Appunti Statistica per la sperimentazione e le previsioni in ambito tecnologico (parte 1) in italiano Pag. 11
Anteprima di 7 pagg. su 29.
Scarica il documento per vederlo tutto.
Appunti Statistica per la sperimentazione e le previsioni in ambito tecnologico (parte 1) in italiano Pag. 16
Anteprima di 7 pagg. su 29.
Scarica il documento per vederlo tutto.
Appunti Statistica per la sperimentazione e le previsioni in ambito tecnologico (parte 1) in italiano Pag. 21
Anteprima di 7 pagg. su 29.
Scarica il documento per vederlo tutto.
Appunti Statistica per la sperimentazione e le previsioni in ambito tecnologico (parte 1) in italiano Pag. 26
1 su 29
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/02 Statistica per la ricerca sperimentale e tecnologica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Sarina24 di informazioni apprese con la frequenza delle lezioni di Statistica per la sperimentazione e le previsioni in ambito tecnologico e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Firenze o del prof Berni Rossella.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community