APPUNTI FOR EXPERIMENTS AND FORECAST IN
THE FIELD OF TECHNOLOGY
Anno: 2025-2026 1
Sommario
1. Concetti generali ..................................................................................................... 4
2. Linear Regression Model .......................................................................................... 6
2.1 Modello con k regressori ................................................................................................. 6
2.2 Stima dei parametri adattamento del modello (model fitting) ........................................ 7
à
2.3 Stima di ................................................................................................................... 11
2.4 Proprietà degli stimatori ................................................................................................ 12
3. Test di significatività ............................................................................................... 12
3.1 Test del modello ............................................................................................................ 13
3.2 Regressione dovuta al modello SSR ............................................................................... 14
3.3 Indice di determinazione .......................................................................................... 15
3.4 Test di un singolo coeFiciente ........................................................................................ 15
3.5 Test di un sottoinsieme di coeFicienti ............................................................................ 16
4. Intervallo di confidenza, intervallo di previsione e diagnostica ................................. 17
4.1 Intervallo di confidenza ................................................................................................. 17
4.2 Previsione di nuove risposte .......................................................................................... 18
4.3 Diagnostica sui residui .................................................................................................. 19
4.4 Test di Lack-of-Fit (mancanza di adattamento) ............................................................... 21
5. DoE ....................................................................................................................... 22
5.1 Primi concetti sul DoE (e ANOVA) ................................................................................... 24
5.2 Esempio delle plantule .................................................................................................. 24
5.3 ANOVA one-way ............................................................................................................ 26
5.4 ANOVA one-way steps ................................................................................................... 27
5.5 Example (Logothetis e Wynn, 1989) ................................................................................ 28
5.6 Modello ANOVA (two-way) per il disegno RCB ................................................................. 30
5.7 Full Factorial Design - example by Montgomery (1991) .................................................... 30
5.8 Concetto di interazione ................................................................................................. 32
5.9 ANOVA – parametrizzazione a punto di riferimento (corner point) .................................... 33
6. Fractional Factorial Design ..................................................................................... 34
6.1 Esempio – full factorial design .................................................................................. 34
2
6.2 Electric welding example – experimental planning .......................................................... 38
7. Resolution criterium .............................................................................................. 40
7.1 complete defining relation ............................................................................................ 42
8. RSM – Response Surface Methodology .................................................................... 45
8.1 RSM – concetti teorici di modellazione ........................................................................... 46
8.2 RSM – metodo di ottimizzazione steepest ascent/discent (1° ordine) ............................... 48
8.3 RSM – Superficie stimata di secondo ordine ................................................................... 51
8.4 Rotabilità ...................................................................................................................... 52
9. RSM – modello di primo ordine ................................................................................ 53
9.1 Il metodo Steepest ascent ............................................................................................. 55
9.2 Passaggio dal primo al secondo ordine .......................................................................... 62
10. Steepest ascent/descent – teoria integrata con un esempio ................................... 65
11. Central Composite Design (CCD) .......................................................................... 73
12. Fractional Factorial a tre livelli .............................................................................. 77
13. Modelli RSM di secondo ordine ............................................................................. 78
14. Split Plot Design ................................................................................................... 79
14. Esempi ................................................................................................................ 81
14.3 Riepilogo .................................................................................................................... 85
15. Modello Lineare Misto (MLM) ................................................................................ 86
16. Mixed RSM ........................................................................................................... 87
16.1 Split plot e modello RSM misto .................................................................................... 88
3
1. Concetti generali
DoE – Design for Experiments: il DoE è un insieme di metodologie statistiche per pianificare,
eseguire e analizzare esperimenti in modo sistematico, con l’obiettivo di studiare l’eEetto di
uno o più fattori sulla variabile di risposta (RV), riducendo il numero di prove e massimizzando
l’informazione ottenuta.
Dati statistici: esistono due tipi diversi di dati:
- Dati osservazionali: nessun dataset è pianificato in anticipo e la fonte dei dati è ignota.
Il ricercatore non manipola alcuna variabile, ma si limita a osservare ciò che accade.
- Dati sperimentali: i ricercatori hanno pianificato un disegno sperimentale per
campionare i dati in modo strutturato. Manipolano le variabili per controllare le
condizioni a testare ipotesi specifiche, al fine di identificare relazioni di causa eEetto.
Si tratta di due tipologie di dati completamente diverse.
Di4erenza tra variabile e fattore:
- Variabili (2° step del DoE, modellazione statistica): possono essere quantitative o
qualitative e possono assumere tutti i valori contenuti in X.
- Fattori (1° step del DoE, pianificazione dell’esperimento): rappresentano le SoV,
possono essere categorici o quantitativi e assumono un insieme specifico di valori
chiamati livelli, che definiscono X.
RV: Response Variable (variabile di risposta).
SoV – Sources of Variability (fonti di variabilità): sono variabili che possono influenzare i
risultati di un esperimento. Una fonte di variabilità è una porzione della variabilità della RV
(variabile di risposta) catturata da un fattore.
Se un fattore è categorico:
- La RV viene stimata per ciascun livello del fattore;
- Si può sostituire con un fattore quantitativo, in cui ciascun insieme di valori identifica
una stima di primo livello della RV.
Interazione: misura come l’eEetto di un fattore sulla RV dipenda (o venga influenzato) dal
cambiamento del livello di un altro fattore. Se è nulla o trascurabile, significa che l’eEetto di
un fattore sulla RV è lo stesso per diversi livelli dell’altro fattore.
2 Fattori: possiamo definire l’interazione AB come la diEerenza media tra l’eEetto di B al livello
alto di A e l’eEetto di B al livello basso di A.
E4etto: l’eEetto è diverso dalla variabile. È l’impatto diretto (o indiretto) di un fattore sulla RV
ed è misurato tramite un coeEiciente. Può essere:
- Fisso: variabili i cui valori sono noti e fissati, perché controllabili 4
- Casuale: variabili i cui valori non sono noti in anticipo e non sono fissati; non possono
essere controllate a priori (ad esempio metodo Xz).
Modello statistico: descrive la relazione (espressa tramite i parametri del modello) tra le
variabili indipendenti e la variabile di risposta, con l’obiettivo di fare inferenza. Non si
adattano esattamente tutti i punti dati, ma si cerca di minimizzare i residui.
DoF – Gradi di Libertà: rappresentano la quantità di informazione indipendente disponibile
per stimare la variabilità dopo aver tenuto conto dei vincoli del modello.
Replicazione classica: esecuzione della stessa combinazione sperimentale nelle stesse
condizioni sperimentali. 5
2. Linear Regression Model
Il LRM è un modello che descrive la relazione tra un insieme di variabili indipendenti
(regressori) e una variabile dipendente (RV) adattando ai dati (osservazionali o sperimentali)
un’equazione lineare.
obiettivo: comprendere e quantificare la relazione lineare ed eEettuare previsioni.
à
Ipotesi:
- Linearità
~
- indipendenti e normalmente distribuiti, con omoschedasticità e media pari a zero.
!
Esempio:
iniziamo adattando modelli di regressione lineare. Per illustrare il concetto, possiamo
considerare un esempio che mette in relazione la resa di una reazione chimica con la
temperatura e la portata di alimentazione del catalizzatore.
Il modello base è:
Dove y rappresenta la resa, x1 rappresenta la temperatura e x2 rappresenta la portata di
alimentazione del catalizzatore. X1 e x2 sono le due variabili indipendenti (chiamate anche
variabili predittive o regressori).
il termine lineare è utilizzato perché l’equazione è una funzione lineare dei parametri
à ,
incogniti e .
" # $
CoeEicienti di regressione parziali e l’unità di misura è importante.
à à
# $
Questo modello descrive un piano nello spazio bidimensionale definito da x1 e x2. Il
parametro definisce l’intercetta del piano. e sono i coeEicienti di regressione parziali,
" # $
poiché misura la variazione attesa di y per una variabile unitaria di x1 quando x2 è
#
mantenuta costante. Lo stesso vale per , che misura la variazione attesa di y per una
$
variazione unitaria di x2 quando x1 è mantenuta costante.
Nel LRM l’errore casuale () è la diEerenza tra la risposta osservata e il valore osservato.
2.1 Modello con k regressori
In generale, la variabile di risposta y può essere correlata a k variabili regressori. Il modello
generale è quindi: 6
Si tratta di un modello di regressione lineare multipla con k variabili regressori. I parametri
, = 0, 1, … , , sono detti coeEicienti di regressione.
%
Questo modello descrive un iperpiano nello spazio k-dimensionale delle variabili regressori
{xj}. Il parametro rappresenta la variazione attesa della risposta y per una variazione
%
unitaria , mantenendo costanti tutte le altre variabili indipendenti .
% !
Modelli più complessi rispetto a questa equazione possono spesso considerare l’aggiunta di
un termine di interazione a un modello di primo ordine con due variabili; tuttavia, ciò
comporta una modifica delle caratteristiche delle variabili.
2.2 Stima dei parametri adattamento del modello (model fitting)
à
Quando applichiamo un modello, è necessario che la dimensione del campione sia maggiore
del numero di parametri che vogliamo stimare.
OLS (Ordinary Least Squares): il metodo dei minimi quadrati ordinari è tipicamente utilizzato
per stimare i coeEicienti di regressione in un modello di regressione lineare multipla in una
situazione standard (cioè in assenza di over disposizione o eteroschedasticità).
Supponiamo che n sia la dimensione del campione; dobbiamo quindi avere n>k osservazioni
, , … ,
. Per ogni risposta osservata , avremo una corrispondente osservazione delle
# $ & !
variabili . Assumiamo inoltre che il termine di errore nel modello abbia valore atteso
% $
() = 0 () =
e varianza , e che le { } siano le variabili casuali non correlate tra loro. I
!
dati sono assunti essere normalmente distribuiti.
quando applichiamo il metodo OLS, dobbiamo assumere che i residui abbiamo valore
à
atteso pari a zero e che vangano le ipotesi di omoschedasticità. Stiamo quindi assumendo
che la varianza sia costante (ipotesi che spesso non è verificata) e che i dati siano iid:
$
~~(0, )
Questo implica omoschedasticità e che le siano normalmente distribuite.
!
Omoschedasticità ed eteroschedasticità descrivono la variazione della dispersione
(varianza) degli errori di un modello al variare delle variabili indipendenti.
- Omoschedasticità significa che la varianza dei residui è costante per tutti i livelli delle
variabili indipendenti.
- Eteroschedasticità si verifica quando la varianza dell’errore cambia al variare dei
predittori.
L’omoschedasticità è l’opposto dell’eteroschedasticità (che implica varianza non costante).
In presenza di eteroschedasticità si utilizza la WLS (Weighted Least Square). 7
Con l’OLS tutte le variabili sono considerate fisse. Se abbiamo variabili casuali, non possiamo
applicare il LRM. Il LRM è un modello limitato che può essere applicato solo se valgono le
ipotesi di omoschedasticità, normalità, iid e se le variabili sono continue.
Possiamo scrivere il modello (2) in termini di stime come nella formula seguente:
Il metodo OLS consente di ottenere le stime dei coeEicienti in modo tale da minimizzare la
Somma dei Quadrati (SS) degli errori . Questo non implica necessariamente che il modello
!
sia il migliore in assoluto per i dati.
Somma dei Quadrati (SS): è una misura della variabilità che quantifica quanto i dati osservati
si discostino da un valore di riferimento, tipicamente la media. In ANOVA è utilizzata per
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Appunti Statistica per la sperimentazione e le previsioni in ambito tecnologico (parte 1)
-
Appunti Statistica per la sperimentazione e le previsioni in ambito tecnologico (parte 3)
-
Appunti Statistica per la sperimentazione e le previsioni in ambito tecnologico (parte 2)
-
Appunti Statistica per la sperimentazione e le previsioni in ambito tecnologico (parte 3) in italiano