Domande orali berni
Domande orali gennaio
Orale 1
- Ruolo dell’axial point nel ccd? Sono i punti sperimentali, posti lungo gli assi dei
fattori, a una distanza + o – alpha dal centro del design, con tutti gli altri fattori fissati al
livello centrale (0). Servono per stimare la curvatura della superficie di risposta.
- Cos’è rotability? Un disegno sperimentale è rotabile se la varianza della risposta
stimata è la stessa distanza dal centro del design, indipendentemente dalla direzione.
- Perchè nel primo ordine sono tutti rotatable? (Dimostra). I modelli di primo ordine
sono sempre rotatable perché la varianza della risposta stimata dipende solo dalla
distanza dal centro del disegno e non dalla direzione, in quanto il modello contiene
esclusivamente termini lineari e non presenta curvatura.
- Building fractional factorial design
- Cosa significa e=ABC? We are building a comumn vector …
- Word defining relation is? Non è moltiplicating ma mettere tutto insieme
Orale 2
- Diagnostic measurement in regression model? Le diagnostic measurements in un
modello di regression sono strumenti utilizzati per verificare l’adeguatazza del modello
e la validità delle assunzioni sugli errori. Esse includono l’analisi dei residui, misure di
outlier, leverage e influenza, e test di lack of fit, e permettono di individuare
osservazioni problematiche e possibili violazioni delle ipotesi del modello.
- What is the main disadvantages of this standardization of the residuals?
- Il principale svantaggio è che la varianza usata per standardizzare è stimata usando
TUTTI i dati, incluso il punto che si sta valutando.
- When we have a linear regression model we have diagn and hypoteses test… what
is the most important to see the goodness, including also diagnostic?
L’aspetto più importante nella valutazione della bontà di un modello di regressione
lineare è la diagnostica dei residui. I test di significatività e l’R² forniscono evidenza
statistica, ma non garantiscono che le assunzioni del modello siano soddisfatte. Un
buon modello deve produrre residui approssimativamente normalmente distribuiti,
indipendenti, con varianza costante e privi di pattern sistematici. Solo dopo aver
verificato queste condizioni, i test di ipotesi e le misure di bontà dell’adattamento
possono essere considerati aSidabili.
- Considering to have obs data, what can be included in the pure error?
Il pure error rappresenta la variabilità tra repliche eSettuate alle stesse condizioni
sperimentali. Nei dati osservazionali può essere stimato solo se esistono osservazioni
ripetute con gli stessi valori delle variabili indipendenti; in tal caso include la variabilità
intrinseca del processo e l’errore di misura. In assenza di repliche identiche, il pure
error non può essere separato dal lack-of-fit.
- Lack of fit with obs data?
Con dati osservazionali il test classico di lack of fit non è generalmente applicabile
perché non è possibile stimare separatamente il pure error in assenza di repliche alle
stesse condizioni dei fattori. In questo caso la valutazione dell’adeguatezza del
modello si basa principalmente sull’analisi dei residui e sul confronto tra modelli
alternativi.
- Cosa fare prima di applicare linear regression model? Check the assumptions.
Prima di applicare un modello di regressione lineare è necessario comprendere il
problema, identificare correttamente le variabili, eSettuare un’analisi esplorativa dei
dati per verificare la plausibilità della linearità e individuare eventuali outlier o
problemi nei dati, e assicurarsi che le condizioni di applicabilità del modello siano
ragionevolmente soddisfatte.
- Cosa non possiamo fare nel linear regression model, sia con obs data che con
experimental data? Cosa non possiamo stimare? Le interraction.
Un modello di regressione lineare consente di stimare relazioni tra variabili ma non
permette automaticamente di inferire causalità, soprattutto nel caso di dati
osservazionali. Inoltre, non consente extrapolazioni aSidabili al di fuori della regione
osservata, non permette di separare pure error e lack of fit in assenza di repliche, e può
stimare solo gli eSetti esplicitamente inclusi nel modello, a condizione che non vi sia
collinearità perfetta tra i regressori.
- Build fractional factorial design 2 up 6-2 resolution 4.
- DiPerence between word defining relation and complete defining relation?
In a fractional factorial design, a word defining relation is a single defining word
generated by a generator and set equal to the identity. The complete defining relation is
the set of all words obtained from all generators and their products, and it fully
describes the alias structure of the design.
- Split plot: why in split plot we have a double randomization?
In a split–plot design we have a double randomization because there are two levels of
experimental units: whole plots and subplots. Whole-plot factors are randomized
among whole plots, generating a whole-plot error, while subplot factors are
randomized within whole plots, generating a subplot error. This leads to two distinct
sources of variability and requires two separate error terms in the analysis.
- If i have a factor? I should include a whole-plot factors?
La presenza di un fattore non implica automaticamente che si tratti di un whole-plot
factor. Un fattore diventa whole-plot solo quando esistono restrizioni nella
randomizzazione, tipicamente perché è diSicile o costoso modificarlo tra un’unità
sperimentale e l’altra. Lo split-plot design si utilizza quando almeno un fattore non può
essere completamente randomizzato a livello di unità sperimentale.
- What is the diPerence between block or non block factors?
Un block factor è un fattore introdotto nel disegno sperimentale per controllare una
fonte nota di variabilità non di interesse, con l’obiettivo di ridurre l’errore sperimentale
e migliorare la precisione delle stime. Un non-block factor, invece, è un fattore di
interesse il cui eSetto sulla risposta viene stimato e testato. La diSerenza
fondamentale è che il block factor serve a controllare la variabilità, mentre i treatment
factors servono a generare informazione sul processo.
- Quando hai completamente randomizzato blcok design hai una situazione
diPerente, perché?
In un Randomized Complete Block Design la situazione è diversa rispetto a un disegno
completamente randomizzato semplice perché la variabilità totale viene scomposta
includendo anche l’eSetto dei blocchi. Il blocco assorbe una parte della variabilità
sistematica non di interesse, riducendo l’errore sperimentale e aumentando la
precisione dei test sui trattamenti. Di conseguenza cambiano la struttura dell’ANOVA e
il termine di errore utilizzato nei test F.
Orale 3
- Speak about Linear regression model. (write the model)
Il modello di regressione lineare descrive la relazione tra una variabile risposta e una o
più variabili esplicative assumendo che la risposta sia una combinazione lineare dei
= +
regressori più un termine di errore casuale. In forma generale il modello è ! "
#$%&
∑ + , dove gli errori hanno media zero e varianza costante. I parametri
$ !$ !
vengono stimati mediante il metodo dei minimi quadrati ordinari.
- What is the interpretation of the model? (explain beta0, …)
Nel modello di regressione lineare il valore atteso della risposta è espresso come
combinazione lineare delle variabili esplicative. L’intercetta β₀ rappresenta il valore
medio della risposta quando tutte le variabili sono pari a zero. Il coeSiciente βⱼ
rappresenta la variazione attesa della risposta per un incremento unitario di Xⱼ,
mantenendo costanti le altre variabili. Il termine di errore rappresenta la variabilità non
spiegata dal modello.
- Why we consider the unit of the measurements of beta
È importante considerare l’unità di misura dei coeSicienti β perché ciascun
coeSiciente rappresenta la variazione attesa della risposta per un’unità di variazione
della variabile esplicativa corrispondente. Le unità di β sono quindi date dal rapporto
tra l’unità della risposta e l’unità della variabile indipendente. Cambiando la scala di
misura di una variabile cambia anche il valore numerico del coeSiciente, per cui
l’interpretazione deve sempre tener conto delle unità utilizzate.
- And the unit of measurement of x?
L’unità di misura di una variabile esplicativa X è l’unità fisica con cui essa viene
misurata nel problema reale, ad esempio gradi Celsius, secondi o bar. Poiché il
coeSiciente di regressione β rappresenta la variazione della risposta per un’unità di
variazione di X, il valore numerico di β dipende direttamente dall’unità di misura di X.
Cambiando scala di misura, cambia il valore di β pur mantenendo invariata la
relazione funzionale.
- Polynomial model in RSM?
Nella Response Surface Methodology si utilizza un modello polinomiale per
approssimare la relazione tra la risposta e i fattori quantitativi. Il modello più
importante è il polinomio di secondo ordine, che include termini lineari, quadratici e di
interazione, e consente di descrivere la curvatura della superficie e individuare
eventuali punti stazionari. Questo modello rappresenta un’approssimazione locale
della vera funzione risposta.
- When you consider this kind of data…
- When you have observational data we have limits? With observational data we have
not limits, instead with experimental data we have a limit so the experimental region.
Nei dati osservazionali esistono limiti significativi rispetto ai dati sperimentali. In
particolare non è possibile stabilire relazioni causali in modo aSidabile a causa
dell’assenza di randomizzazione e controllo dei fattori. Inoltre non è generalmente
possibile separare pure error e lack-of-fit in assenza di repliche, e possono verificarsi
problemi di confondimento e collinearità. Per questo motivo l’inferenza basata su dati
osservazionali deve essere interpretata con maggiore cautela.
- RSM: response phase methodology, why we use the term methodology? Because
we are dealing with some methods for each step.
Si utilizza il termine methodology perché la Response Surface Methodology non è un
singolo metodo statistico ma un insieme integrato e sistematico di tecniche
sperimentali, modelli di regressione e strumenti di ottimizzazione utilizzati per
modellare e ottimizzare una risposta. Essa comprende la scelta del disegno
sperimentale, la stima del modello, l’analisi della superficie e la ricerca dell’ottimo,
rappresentando quindi una strategia completa e non solo una tecnica analitica isolata.
- Which are the steps of RSM?
La Response Surface Methodology è una procedura sequenziale composta da diverse
fasi: inizialmente si definisce la regione sperimentale e si stima un modello di primo
ordine mediante un disegno fattoriale; successivamente, se non vi è curvatura
significativa, si applica il metodo della salita più ripida per spostarsi verso una regione
migliore. Quando si rileva curvatura, si realizza un disegno di secondo ordine, come il
Central Composite Design, si stima il modello quadratico e si analizza la superficie per
individuare il punto stazionario e l’eventuale ottimo, che viene poi validato
sperimentalmente.
- Why n0 is so important in RSM? What is n0?
In Response Surface Methodology, rappresenta il numero di repliche nel punto
"
centrale del disegno. È fondamentale perché consente di stimare il pure error, di
testare la presenza di curvatura nel caso di modelli di primo ordine e di migliorare la
precisione delle stime nel centro della regione sperimentale. Senza un numero
adeguato di repliche centrali non è possibile eSettuare un corretto test di lack-of-fit né
ottenere una stima stabile dell’errore sperimentale.
- Why we don’t speak about ePiciency?
Nella Response Surface Methodology non si enfatizza il concetto di eSicienza nel
senso classico della minima varianza dei parametri stimati, perché l’obiettivo
principale non è la stima eSiciente degli eSetti, ma la modellazione locale e
l’ottimizzazione della superficie di risposta. In RSM si dà maggiore importanza alla
rotatability, alla capacità di stimare la curvatura e alla qualità della previsione nella
regione sperimentale piuttosto che all’eSicienza parametrica in senso stretto.
- What is a classical replicate? We do several times the same trial, so we collect a lot
of replicates along the experimental point.
Una classical replicate è la ripetizione completa di un trattamento nelle stesse
condizioni dei fattori ma su un’unità sperimentale indipendente. Essa consente di
stimare il pure error e di migliorare la precisione delle stime del modello. Non va
confusa con una semplice ripetizione della misura sulla stessa unità, che non
garantisce indipendenza statistica.
- I have n0 in first and in second order, n0 is always the center of the design (and the
number of replicates), but what is the diPerence in n0 from first to second order?
Il numero di repliche nel punto centrale è sempre riferito al centro del disegno, ma il
"
suo ruolo cambia tra il primo e il secondo ordine. Nel modello di primo ordine, è
"
fondamentale per testare la presenza di curvatura e decidere se il modello lineare sia
adeguato o se sia necessario passare a un modello quadratico. Nel modello di
secondo ordine, invece, la curvatura è già inclusa, quindi serve principalmente a
"
migliorare la stima del pure error e la precisione del modello.
- In the second order when we find n0? For example in the CCD, why? Why is so
important n0? It’s important for the properties of the second order, like orthogonality
and rotability.
Nel Central Composite Design, rappresenta il numero di repliche nel punto centrale
"
ed è una componente strutturale del disegno di secondo ordine. In questo contesto
non serve più per testare la curvatura, che è già inclusa nel modello quadratico, ma è
fondamentale per stimare il pure error con maggiore precisione, stabilizzare la stima
dell’errore sperimentale e migliorare la qualità statistica del disegno, contribuendo
anche alle proprietà di rotatability e alla precisione delle previsioni nel centro della
regione sperimentale.
- Write conditions for rotability, and orthogonality.
Un disegno è rotatable se la varianza della predizione dipende esclusivamente dalla
distanza dal centro del disegno e non dalla direzione nello spazio dei fattori; nel caso
del Central Composite Design questa proprietà si ottiene scegliendo la distanza degli
# &/( )
= (2 ) è
axial points pari a . Un disegno è ortogonale se la matrice diagonale,
cioè se le colonne della matrice del disegno sono tra loro ortogonali, garantendo
stimatori non correlati e una interpretazione più semplice dei coeSicienti.
- What is the dual response approach? Talk about it, during the case study, before
the case study… the main topic is when we do excercise… we use when we do
multiresponse optimization. Why?
La dual response approach è una strategia utilizzata nella Response Surface
Methodology quando si vuole ottimizzare non solo il valore medio della risposta ma
anche la sua variabilità. In questo approccio si costruiscono due modelli, uno per la
media e uno per la varianza, e si formula un problema di ottimizzazione che minimizza
la variabilità mantenendo la media su un valore desiderato o target. Essa rappresenta
un caso particolare di multiresponse optimization ed è utilizzata quando è necessario
ottenere un processo robusto e stabile, non semplicemente un valore medio ottimale.
- Can i do dual response approach with canonical analysis?
L’analisi canonica e la dual response approach hanno obiettivi diSerenti. L’analisi
canonica si applica al modello quadratico della media e serve a individuare e
classificare il punto stazionario analizzando la curvatura della superficie. La dual
response approach, invece, costruisce due modelli distinti per media e varianza e
formula un problema di ottimizzazione robusta. Non si può applicare direttamente
l’analisi canonica per risolvere la dual response, ma le due tecniche possono essere
utilizzate in modo complementare: prima per analizzare la superficie della media, poi
per valutare e ottimizzare anche la variabilità.
- If i cant do the replicates can i do the dual response approach? Is not mandatory
La dual response approach richiede la stima separata della media e della varianza
della risposta. Per modellare la varianza è necessario disporre di repliche alle stesse
condizioni sperimentali, in modo da stimare il pure error. In assenza di repliche non è
possibile costruire un modello aSidabile della varianza e quindi la dual response
approach non può essere applicata in modo corretto. Si può eventualmente
ottimizzare la media, ma non la robustezza del processo.
Orale 4
- Curvature test
Il curvature test è un test statistico utilizzato nella fase iniziale della Response Surface
Methodology per verificare se un modello di primo ordine è adeguato. Esso confronta
la media della risposta nei punti centrali con la media nei punti fattoriali; se la
diSerenza è significativa, significa che esiste curvatura e che è necessario passare a
un modello quadratico di secondo ordine. Il test richiede repliche nel punto centrale
per stimare correttamente l’errore sperimentale.
- How many degrees of freedom has the denominator in this test? N zero minus 1
#
2
Nel curvature test applicato a un disegno fattoriale con punti centrali, il
denominatore dell’F-test utilizza i gradi di libertà del pure error stimato dalle repliche
− 1,
nel punto centrale. Pertanto i gradi di libertà del denominatore sono pari a dove
"
è il numero di repliche al centro del disegno.
"
- Mixed linear model?
Un mixed linear model è un modello lineare che include sia eSetti fissi sia eSetti
casuali. Gli eSetti fissi rappresentano fattori di interesse i cui livelli sono scelti
specificamente, mentre gli eSetti casuali rappresentano fonti di variabilità derivanti da
un campionamento casuale da una popolazione più ampia, come blocchi o lotti. Il
= + + ,
modello generale è e comporta una struttura di varianza più
complessa rispetto alla regressione lineare classica, richiedendo metodi di stima
come REML o GLS.
- DiPerence between fixed and random ePects?
Un eSetto è detto fisso quando i livelli del fattore sono scelti specificamente e sono gli
unici di interesse, e si vogliono confrontare direttamente le loro medie. Un eSetto è
detto casuale quando i livelli osservati sono considerati un campione da una
popolazione più ampia e l’interesse principale è stimare la variabilità associata al
fattore piuttosto che i singoli livelli. La distinzione dipende dall’obiettivo dell’inferenza
e determina la struttura del modello statistico.
- When considering … diPerences between mixed response surface and mixed
linear model?
Il mixed linear model è un modello lineare generale che include sia eSetti fissi sia
eSetti casuali e viene utilizzato quando esiste una struttura gerarchica o correlazione
tra osservazioni. Il mixed response surface model, invece, è un caso particolare di
modello lineare misto applicato alla Response Surface Methodology, in cui la parte
fissa del modello è tipicamente un polinomio di secondo ordine utilizzato per
descrivere e ottimizzare una superficie di risposta. In sintesi, il mixed response surface
model è un’applicazione specifica del mixed linear model nell’ambito della RSM.
- If i have a mixed linear model, i can include a variable categorical?
Sì, in un mixed linear model è possibile includere variabili categoriche. Esse possono
essere modellate come eSetti fissi quando i livelli sono di interesse specifico e si
vogliono confrontare direttamente le loro medie, oppure come eSetti casuali quando i
livelli rappresentano un campionamento da una popolazione più ampia e l’interesse è
stimare la variabilità associata al fattore. Il modello misto consente quindi di
combinare variabili quantitative e qualitative all’interno della stessa struttura
statistica.
- Can you include split plot considering mixed response surface and mixed linear
model?
Uno split-plot design richiede l’
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Domande orali Statistica per la sperimentazione e le previsioni in ambito tecnologico
-
Domande con risposte/ schemi riassuntivi Statistica per la sperimentazione e le previsioni in ambito tecnologico
-
Appunti + domande esame di Statistica per la sperimentazione e le previsioni in ambito tecnologico
-
Appunti Statistica per la sperimentazione e le previsioni in ambito tecnologico (parte 3)