Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
ŷi = β0 + ∑j=1k β3 XjƐi i = 1, 2, ..., n
y = β0 + β1X1 + β2X2 + ... + βkX + e
dove βj = Coefficienti di regressione
βj = Rappresenta la variazione attesa della risposta y per ogni variazione unitaria di Xj,
supposto tutte le rimanenti variabili indipendenti
siano mantenute costanti.
Metodo dei minimi quadrati ordinari (OLS)
Utilizzato per stimare i coefficienti di regressione in
un modello di regressione lineare multipla in una
popolazione standard senza iperdispersione né effetti
di sostanzialità.
Si assume che E(ɛ) = 0; V(Ɛ) = δ2 e che {Ɛi siano variabili
casuali. Le n coppie (x, ŷ) sono normalmente
distribuite.
Il metodo dei minimi quadrati ordinari permette di
ottenere le stime di βi in modo tale da che l'occorrenza dei
suoi valori (stima) sia più prossima ai valori osservati. Questo
non implica però che esso assuma un valore ridotto/allegro.
Funzione asimmetrica e quadratica
y = Xβ + e
da cui ŷ = y̅ = β0 β = 1/N X Ɛ
d'obiettivo è tracciare il vettore degli stimatori di (β) che
minimizzano I [ - 1/2 Eᵢ͟ = ɛᵀɛ = (y - xβ)ᵀ(y - xβ)
dlasod deve soddisfare dAi = -2X'ɛ + 2XX'β = 0
Che si semplifica con la formula X'XX'βXy
per cui B̂ = (X'X)-1 X'y
Il modello di regressione adattato è: ŷ = Χβ̂
Ossia in formula standard obiettiva: ŷ = β1 =₃Хβ3Xjɛi
da differenza tra l'osservazione effettiva yi e la
corrispondente fitten value ȳ e chiamata residuo
e residuo = y - ŷ ei
SSE = somma dei = ∑ni=1 (yi - ŷi)2 = ∑ni=1 ei.
ŷg's = β̂'X'y
QUADRATI del residuo
(con n-p Grado)
Incerte: E(SSE) = θ^2 = SSE/n-p
Il teorema degli LS permette una stima imparziale
del parametro β nel modello di regressione
LINEARE
Infatti
(β/₁) = β
1(xi) = 2)/(xTAx1x-1I
quindi var(β̂) = [(β̂) - ɛ{(B̲̂]} [β-ch(B)I]ᶦ
SST = SOMMA DEI QUADRATI TOTALE
SSR = ........ DOVUTA ALLA REGRESSIONE
TEST DI SIGNIFICATIVITÀ
L'ipotesi standard è che i residui eᵢ siano distribuiti in modo indipendente e normale con media zero e varianza costante.
Il test serve per vedere se c'è relazione tra la variabile di risposta (y) e x₁x₂…xₖ
- H₀ : β₁ = β₂ = βₖ = 0
- H₁ : βⱼ ≠ 0 per almeno un j
Ovvero si deve dimostrare nulla implica che almeno una delle variabili (regressori x₁x₂…xₖ) contribuisca in modo reale al modello.
SST = SSR + SSE
STATISTICA TEST : F₀ = SSR/k = MSR
SSE/n-k-1 MSE
Rifiuto H₀ se: F₀ > fα,k,n-k-1
pvalue < α
SSE = y'y - B'x'y
SST = y'y - (Σiy(bar)²/n)
R 2₂ = SSR
SSE
R²Adj = 1 - SSE/(n-p) = 1 - (n-1) (1-R²)
SST/(n-1) (n-p-1)
VERIFICA DI UN SINGOLO COEFFICIENTE
Le HP per testare il significato di un singolo coefficiente di regressione sono:
- H₀ : β₃ = 0
- H₁ : β₃ ≠ 0
Se accetto H₀ allora Xⱼ può essere cancellata
dallo modello
STATISTICA TEST = B₃
Rifiuto t₀ se |t₀| > tα/2, n-k-1
TESTARE UN SOTTOINSIEME DI COEFFICIENTI
Consideriamo un modello di regressione con variabili. Vediamo velocemente come se un insieme di variabili rispetto altre variabili continui a rilevare significatività nel modello.
H₀ : β₃ = 0
H₁ : β₃ ≠ 0
Il modello è scritto come: y = xβ + ε = xᵢ β₁ + x₂ β₂ + ε
SSR (Bα|B₂) = SSR (A₡|B₁) - SSR (Bα|B₂)
Design of Experiments (D.o.E)
Un fattore di disturbo (fonte di variabilità) può influenzare un esperimento e produrre una risposta che non interessa allo sperimentatore.
Disegno Sperimentale
- Rappresenta la selezione delle prove sperimentali per ottenere osservazioni.
- Consiste inizialmente in osservazioni (sperimentali) ottenute effettuando un esperimento con variabile di risposta quindi trattura continua (y) in cui le unità sono osservazioni associate casualmente secondo k gruppi (k livelli) di un fattore.
Fonti di Variabilità
- Ciò che influenza l'osservazione (vero fenomeno)
Esempio Plantule
- 20 plantule = campioni = n esercito
- Fattore = unica fonte di variabilità
Disegno
- Bilanciato = stesso n di osservazioni per ogni livello k
- Completamente randomizzato = assegnazione casuale delle unità sperimentali alle combinazioni sperimentali
Scopo del Disegno Sper.
Minimizzare la variabilità accidentale non spiegata
Devianza
- Within (entro) = d. var. acciden. non spiegata
- Dw = ∑∑ (yij - μi)2
- Between (tra) = d. var. sistematica
- Db = ∑(μi - μ)2 ni
dw è dovuta alle diverse combinazioni sperimentali ai livelli del fattore
- y̅i = media campionaria del livello i del fattore
- μi = media calcolata per il livello i
- μ = media generale
STRINGA CHE USO
PER FRAZIONARE
Se frazionassi più vetre avrei tantissimi Defining Contrast.
CONFOUNDING EFFECT
Esempio:
- Becco
- Positivo
- I = ABC
Il Confounding Effect comporta problemi. Non riesco a stimare separatamente gli effetti.
MATRICE ORTOGONALE
- Se in un fattoriale a 2 livelli, la matrice è ortogonale sia.
- Se la matrice è ortogonale, .. individua i 2 vettori e l'ultimo quindi il prodotto ..
AUIAS PATTERN
- Rappresenta la strutturazione di tutti i confondimenti, ci identifica ...
CRITERIO DI RISOLUZIONE
- Identifica la Ipoteco ai Confondimenti.
- R = Criterio di Risoluzione:
2) ROTABILITÀ
OMOGENEITÀ = Omogeneità delle varianze
I disegni del I ordine si basano su queste ipotesi:
- Eu ~ N(0; σ2)
- Eu indipendenti
- Eu = Normale
Per Hp de Covariante Eu e Ei sono nulle
Var(Bi) = θ2/N
Var(B0) = θ2/N N= B0 = 5/i
= Var (y(xi)) = Var(Bo) + Σ Var(Bi xi2) =θ2(1 + Σ xi2) l/1 + p2)
= distanza euclidea del punto dal centro del disegno costituisce
–> la varianza del punto sperimentaleequidistante da centro il punto è
del disegno
2) DISEGNO HANNO LA STESSA VARIANZA
SE UN DISEGNO È ROTABILE, LA VARIANZASPERIMENTALE E LA STESSA PER TUTTI I PUNTI CHESONO EQUIDISTANTI DAL CENTRO DEL DISEGNO
3) UNIFORME PRECISIONE = Assicura chePunti in area di Raggio
Unitario (R = 1) hanno La STESSAVARIANZA
SEQUENZIALITÀ DELL’ESPLORAZIONE DI UN RSI.
S da Metodologia Corese Superficie di Risposta
1 - Varianze dell’Errore
- approccio sequenziale è in tutte e due tipologie,
- Varianze dell’Errore nel I e del der
- sequenzialità tra I 1o e II ordine
- SEQUENZIALITÀ NEL II ORDINE
- PIANIFICAZIONE DOE
- Combinazione statistica
- ottimizzazione
Pianificazione Doe – In base a Fattori e a quei diversi casiRilevati per la misura di errori Il range immagine dei pattern è scelto sulla
anom o condisioni scelte a priori o un’analisi precedentemente
sue