Appunti Statistica per la sperimentazione e le previsioni in ambito tecnologico (parte 1) in italiano

Name: Appunti Statistica per la sperimentazione e le previsioni in ambito tecnologico (parte 1) in italiano
Brand: Skuola.net
Availability: InStock
Rating: 3.0 (2 reviews)
Author: Sarina24

Revisionato il 19/02/2026

di Sarina24

Publisher

Vota 3,0/5 (2)

Contenuto verificato e approvato dal Team di Esperti di Skuola.net

Appunti Statistica per la sperimentazione e le previsioni in ambito tecnologico, 2025-2026 del corso di ingegneria gestionale magistrale (management engineering) delle lezioni della …

Esame Statistica per la sperimentazione e le previsioni in ambito tecnologico

Facoltà Ingegneria

Dal corso del Prof. Berni Rossella

Università Università degli Studi di Firenze

A.A. 2025-2026

29 pagine

Appunti esame

Scarica

Estratto del documento

APPUNTI FOR EXPERIMENTS AND FORECAST IN

THE FIELD OF TECHNOLOGY

Anno: 2025-2026 1

Sommario

1. Concetti generali ..................................................................................................... 4

2. Linear Regression Model .......................................................................................... 6

2.1 Modello con k regressori ................................................................................................. 6

2.2 Stima dei parametri adattamento del modello (model ﬁtting) ........................................ 7

2.3 Stima di ................................................................................................................... 11

2.4 Proprietà degli stimatori ................................................................................................ 12

3. Test di signiﬁcatività ............................................................................................... 12

3.1 Test del modello ............................................................................................................ 13

3.2 Regressione dovuta al modello SSR ............................................................................... 14

3.3 Indice di determinazione .......................................................................................... 15

3.4 Test di un singolo coeFiciente ........................................................................................ 15

3.5 Test di un sottoinsieme di coeFicienti ............................................................................ 16

4. Intervallo di conﬁdenza, intervallo di previsione e diagnostica ................................. 17

4.1 Intervallo di conﬁdenza ................................................................................................. 17

4.2 Previsione di nuove risposte .......................................................................................... 18

4.3 Diagnostica sui residui .................................................................................................. 19

4.4 Test di Lack-of-Fit (mancanza di adattamento) ............................................................... 21

5. DoE ....................................................................................................................... 22

5.1 Primi concetti sul DoE (e ANOVA) ................................................................................... 24

5.2 Esempio delle plantule .................................................................................................. 24

5.3 ANOVA one-way ............................................................................................................ 26

5.4 ANOVA one-way steps ................................................................................................... 27

5.5 Example (Logothetis e Wynn, 1989) ................................................................................ 28

5.6 Modello ANOVA (two-way) per il disegno RCB ................................................................. 30

5.7 Full Factorial Design - example by Montgomery (1991) .................................................... 30

5.8 Concetto di interazione ................................................................................................. 32

5.9 ANOVA – parametrizzazione a punto di riferimento (corner point) .................................... 33

6. Fractional Factorial Design ..................................................................................... 34

6.1 Esempio – full factorial design .................................................................................. 34

6.2 Electric welding example – experimental planning .......................................................... 38

7. Resolution criterium .............................................................................................. 40

7.1 complete deﬁning relation ............................................................................................ 42

8. RSM – Response Surface Methodology .................................................................... 45

8.1 RSM – concetti teorici di modellazione ........................................................................... 46

8.2 RSM – metodo di ottimizzazione steepest ascent/discent (1° ordine) ............................... 48

8.3 RSM – Superﬁcie stimata di secondo ordine ................................................................... 51

8.4 Rotabilità ...................................................................................................................... 52

9. RSM – modello di primo ordine ................................................................................ 53

9.1 Il metodo Steepest ascent ............................................................................................. 55

9.2 Passaggio dal primo al secondo ordine .......................................................................... 62

10. Steepest ascent/descent – teoria integrata con un esempio ................................... 65

11. Central Composite Design (CCD) .......................................................................... 73

12. Fractional Factorial a tre livelli .............................................................................. 77

13. Modelli RSM di secondo ordine ............................................................................. 78

14. Split Plot Design ................................................................................................... 79

14. Esempi ................................................................................................................ 81

14.3 Riepilogo .................................................................................................................... 85

15. Modello Lineare Misto (MLM) ................................................................................ 86

16. Mixed RSM ........................................................................................................... 87

16.1 Split plot e modello RSM misto .................................................................................... 88

1. Concetti generali

DoE – Design for Experiments: il DoE è un insieme di metodologie statistiche per pianiﬁcare,

eseguire e analizzare esperimenti in modo sistematico, con l’obiettivo di studiare l’eEetto di

uno o più fattori sulla variabile di risposta (RV), riducendo il numero di prove e massimizzando

l’informazione ottenuta.

Dati statistici: esistono due tipi diversi di dati:

- Dati osservazionali: nessun dataset è pianiﬁcato in anticipo e la fonte dei dati è ignota.

Il ricercatore non manipola alcuna variabile, ma si limita a osservare ciò che accade.

- Dati sperimentali: i ricercatori hanno pianiﬁcato un disegno sperimentale per

campionare i dati in modo strutturato. Manipolano le variabili per controllare le

condizioni a testare ipotesi speciﬁche, al ﬁne di identiﬁcare relazioni di causa eEetto.

Si tratta di due tipologie di dati completamente diverse.

Di4erenza tra variabile e fattore:

- Variabili (2° step del DoE, modellazione statistica): possono essere quantitative o

qualitative e possono assumere tutti i valori contenuti in X.

- Fattori (1° step del DoE, pianiﬁcazione dell’esperimento): rappresentano le SoV,

possono essere categorici o quantitativi e assumono un insieme speciﬁco di valori

chiamati livelli, che deﬁniscono X.

RV: Response Variable (variabile di risposta).

SoV – Sources of Variability (fonti di variabilità): sono variabili che possono inﬂuenzare i

risultati di un esperimento. Una fonte di variabilità è una porzione della variabilità della RV

(variabile di risposta) catturata da un fattore.

Se un fattore è categorico:

- La RV viene stimata per ciascun livello del fattore;

- Si può sostituire con un fattore quantitativo, in cui ciascun insieme di valori identiﬁca

una stima di primo livello della RV.

Interazione: misura come l’eEetto di un fattore sulla RV dipenda (o venga inﬂuenzato) dal

cambiamento del livello di un altro fattore. Se è nulla o trascurabile, signiﬁca che l’eEetto di

un fattore sulla RV è lo stesso per diversi livelli dell’altro fattore.

2 Fattori: possiamo deﬁnire l’interazione AB come la diEerenza media tra l’eEetto di B al livello

alto di A e l’eEetto di B al livello basso di A.

E4etto: l’eEetto è diverso dalla variabile. È l’impatto diretto (o indiretto) di un fattore sulla RV

ed è misurato tramite un coeEiciente. Può essere:

- Fisso: variabili i cui valori sono noti e ﬁssati, perché controllabili 4

- Casuale: variabili i cui valori non sono noti in anticipo e non sono ﬁssati; non possono

essere controllate a priori (ad esempio metodo Xz).

Modello statistico: descrive la relazione (espressa tramite i parametri del modello) tra le

variabili indipendenti e la variabile di risposta, con l’obiettivo di fare inferenza. Non si

adattano esattamente tutti i punti dati, ma si cerca di minimizzare i residui.

DoF – Gradi di Libertà: rappresentano la quantità di informazione indipendente disponibile

per stimare la variabilità dopo aver tenuto conto dei vincoli del modello.

Replicazione classica: esecuzione della stessa combinazione sperimentale nelle stesse

condizioni sperimentali. 5

2. Linear Regression Model

Il LRM è un modello che descrive la relazione tra un insieme di variabili indipendenti

(regressori) e una variabile dipendente (RV) adattando ai dati (osservazionali o sperimentali)

un’equazione lineare.

obiettivo: comprendere e quantiﬁcare la relazione lineare ed eEettuare previsioni.

Ipotesi:

- Linearità

- indipendenti e normalmente distribuiti, con omoschedasticità e media pari a zero.

Esempio:

iniziamo adattando modelli di regressione lineare. Per illustrare il concetto, possiamo

considerare un esempio che mette in relazione la resa di una reazione chimica con la

temperatura e la portata di alimentazione del catalizzatore.

Il modello base è:

Dove y rappresenta la resa, x1 rappresenta la temperatura e x2 rappresenta la portata di

alimentazione del catalizzatore. X1 e x2 sono le due variabili indipendenti (chiamate anche

variabili predittive o regressori).

il termine lineare è utilizzato perché l’equazione è una funzione lineare dei parametri

à ,

incogniti e .

" # $

CoeEicienti di regressione parziali e l’unità di misura è importante.

à à

# $

Questo modello descrive un piano nello spazio bidimensionale deﬁnito da x1 e x2. Il

parametro deﬁnisce l’intercetta del piano. e sono i coeEicienti di regressione parziali,

" # $

poiché misura la variazione attesa di y per una variabile unitaria di x1 quando x2 è

mantenuta costante. Lo stesso vale per , che misura la variazione attesa di y per una

variazione unitaria di x2 quando x1 è mantenuta costante.

Nel LRM l’errore casuale () è la diEerenza tra la risposta osservata e il valore osservato.

2.1 Modello con k regressori

In generale, la variabile di risposta y può essere correlata a k variabili regressori. Il modello

generale è quindi: 6

Si tratta di un modello di regressione lineare multipla con k variabili regressori. I parametri

, = 0, 1, … , , sono detti coeEicienti di regressione.

Questo modello descrive un iperpiano nello spazio k-dimensionale delle variabili regressori

{xj}. Il parametro rappresenta la variazione attesa della risposta y per una variazione

unitaria , mantenendo costanti tutte le altre variabili indipendenti .

% !

Modelli più complessi rispetto a questa equazione possono spesso considerare l’aggiunta di

un termine di interazione a un modello di primo ordine con due variabili; tuttavia, ciò

comporta una modiﬁca delle caratteristiche delle variabili.

2.2 Stima dei parametri adattamento del modello (model ﬁtting)

Quando applichiamo un modello, è necessario che la dimensione del campione sia maggiore

del numero di parametri che vogliamo stimare.

OLS (Ordinary Least Squares): il metodo dei minimi quadrati ordinari è tipicamente utilizzato

per stimare i coeEicienti di regressione in un modello di regressione lineare multipla in una

situazione standard (cioè in assenza di over disposizione o eteroschedasticità).

Supponiamo che n sia la dimensione del campione; dobbiamo quindi avere n>k osservazioni

, , … ,

. Per ogni risposta osservata , avremo una corrispondente osservazione delle

# $ & !

variabili . Assumiamo inoltre che il termine di errore nel modello abbia valore atteso

% $

() = 0 () =

e varianza , e che le { } siano le variabili casuali non correlate tra loro. I

dati sono assunti essere normalmente distribuiti.

quando applichiamo il metodo OLS, dobbiamo assumere che i residui abbiamo valore

atteso pari a zero e che vangano le ipotesi di omoschedasticità. Stiamo quindi assumendo

che la varianza sia costante (ipotesi che spesso non è veriﬁcata) e che i dati siano iid:

~~(0, )

Questo implica omoschedasticità e che le siano normalmente distribuite.

Omoschedasticità ed eteroschedasticità descrivono la variazione della dispersione

(varianza) degli errori di un modello al variare delle variabili indipendenti.

- Omoschedasticità signiﬁca che la varianza dei residui è costante per tutti i livelli delle

variabili indipendenti.

- Eteroschedasticità si veriﬁca quando la varianza dell’errore cambia al variare dei

predittori.

L’omoschedasticità è l’opposto dell’eteroschedasticità (che implica varianza non costante).

In presenza di eteroschedasticità si utilizza la WLS (Weighted Least Square). 7

Con l’OLS tutte le variabili sono considerate ﬁsse. Se abbiamo variabili casuali, non possiamo

applicare il LRM. Il LRM è un modello limitato che può essere applicato solo se valgono le

ipotesi di omoschedasticità, normalità, iid e se le variabili sono continue.

Possiamo scrivere il modello (2) in termini di stime come nella formula seguente:

Il metodo OLS consente di ottenere le stime dei coeEicienti in modo tale da minimizzare la

Somma dei Quadrati (SS) degli errori . Questo non implica necessariamente che il modello

sia il migliore in assoluto per i dati.

Somma dei Quadrati (SS): è una misura della variabilità che quantiﬁca quanto i dati osservati

si discostino da un valore di riferimento, tipicamente la media. In ANOVA è utilizzata per

Anteprima

Vedrai una selezione di 7 pagine su 29