Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
MODELLO REGRESSIONE LINEARE SEMPLICE UNIVARIATO
SPECIFICAZIONE DEL MODELLO
Yi = β1 + β2 xi + εi
POPOLAZIONE
Yi = β1 + β2 xi + εi, n = 1, 2
CAMPIONE OSSERVATO
yi = β0 + β2 xi + εi, i = 1, 2, ... m
IPOTESI CLASSICHE
- Yi = β0 + β2 x0 + εi, n = 1, 2, ... m; Stabile & deterministico tra X e Y
- E(εi) = 0, i = 1, 2, ... m; Errori non correlati con la retta di regressione
- Var(εi) = σ2, i = 1, 2, ... m; Omogeneità della varianza degli errori
- cov(εi, εj) = 0, ∀ i ≠ j; Errori non correlati tra di loro (cor = 0)
- X è deterministico e noto senza errori di misurazione
Fig. 22.2. Assunzioni del modello di regressione: a) xi fissi; b) X = x condizionati.
PROPRIETÀ RETTA REGRESSIONE
1) la retta è sempre passante e trova il min della funzione Q(β1, β2)
2) la retta passa sempre per il punto che contiene medie (x, y)
Infatti, dalla relazione β0 = y - β2 x, si deduce anche y = β0 + β2 x, che dimostra che il punto di coordinate (x, y) soddisfa l'eq. della retta di regressione => la retta passa per (x, y)
3) la retta è tale per cui la media delle yi osculate coincide con la media delle yi stimate
- La matrice X deve essere deterministica, cioè bisogna avere una conoscenza certa delle variabili esplicative per cui il modello presuppone che il campione osservato sia il risultato di un esperimento pianificato.
È bene sottolineare che vi sono molte situazioni reali in cui una o più assunzioni classiche potrebbero essere violate per ragioni oggettive o per questioni di misurazione.
A tal proposito, si pongono due questioni riguardanti:
- la validità dei risultati in quanto:
- se valgono le ipotesi classiche, le procedure inferenziali sono ottimali.
- se una delle ipotesi non è verificata, il modello potrebbe ancora registrare una validità complessiva in termini di adattamento tra dati e schema teorico, ma il rigore delle proprietà sarà attenuato.
- la necessità di rimuovere una o più delle ipotesi precedenti considerando:
- modelli non lineari;
- v.c. errori non omoschedastiche e/o tra loro correlate
- variabili esplicative stocastiche
È quindi consigliabile controllare il rispetto delle ipotesi, prima di sviluppare calcoli, interpretazioni e utilizzazioni del modello.
Le variabili Yi sono v.c. in quanto somma di una componente sistematica e della componente aleatoria εi:
Y = Xβ + ε
Dalla ipotesi classiche si ottiene facilmente:
- il valore atteso di tale variabile casuale:
E(Y) = Xβ
- la matrice delle varianze e covarianze
Var(Y) = σ2In
dove In è una matrice identità di ordine n
In forma vettoriale:
- E(Yi) = β0 + ∑pj=1 βjxij
- Var(Yi) = σ2
- Cov(Yi, Yj) = 0
Non distorsione di β̂
Si ha:
β̂ = (XTX)-1XTY
Essendo:
Y = Xβ + ε
allora
β̂ = (XTX)-1XT(Xβ + ε)
= (XTX)-1XTXβ + (XTX)-1XTε
= β + (XTX)-1XTε
Si consideri il valore atteso di entrambi i membri:
E(β̂) = E(β + (XTX)-1XTε)
Ricordando che il valore atteso di una somma è uguale alla somma dei valori attesi, si ha:
E(β̂) = E(β) + E((XTX)-1XTε) = β + (XTX)-1XTE(ε)
per la ipotesi 2, E(ε) = 0 quindi:
E(β̂) = β
MISURA DELLA BONTA DI ACCOPPIAMENTO (MODELLO LINEARE)
Un modello con coefficienti tutti significativi e residui comparativamente piccoli deriva da una retta di regressione che attraversa la nuvola di punti in modo da fornire una buona rappresentazione sintetica della relazione tra X e Y.
Il coefficiente di determinazione multipla R2 è un indicatore capace di riassumere la capacità esplicativa del modello.
- Deriva dalla decomposizione devianza totale
SST = SSE + SSR
ed ha questa forma:
R2 = SSR/SST = 1 - SSE/SST
- Proprietà di R2
- 0 ≤ R2 ≤ 1
- Misura la percentuale di variabilità del fenomeno "spiegata" dalla retta stimata
MISURA DELLA BONTA DI ACCOPPIAMENTO (MODELLO MULTIPLO)
Analogamente al modello di regressione semplice, possiamo calcolare il coefficiente di determinazione multipla (R2), considerando la decomposizione della devianza totale
SST = SSE + SSR
come
R2 = SSR/SST = 1 - SSE/SST
dove
SSR = ∑i=1n(yi - ȳ)2
SST = ∑i=1n(yi - ȳ)2
SSE = ∑i=1nεi2
Se all'interno del modello non avete la costante dovete usare un'altra formula che si chiama R2 non centrato, indicato con R2nc e definito come:
R2nc = 1 - ∑i=1nεi2/∑i=1nYi2
TEST RESET:
A questo punto, nasce spontanea la domanda: come scegliere la forma funzionale corretta? Come possiamo sapere se la semplice forma lineare è appropriata o meno? Una possibilità è quella di partire dall’ipotesi nulla che la forma lineare è corretta e usare una procedura di test per valutare la plausibilità di questa ipotesi. È quello che fa il cosiddetto test di Ramsey o test RESET (Regression Specification Error Test).
- test di modelli multivariati (che Sui, t indti modlli multiati)
- Y = Xβ + Es
- Ŷ …uove ŷm (m intier≥1)
- e ns elabora i sla Ŷ . 0 berave ŷ (e m intier≥1)
- representare la f. lin. libero della x. Penny aggiuanti I
- modelli multivati e
- modelli multivati un scettlete con generale non−liberetta secluta
- soun incoginsio:
- (en u regionne û’ del oŝ dueto ŷmy^3 + … + δm ŷm + Es)
- ŷ−Xβ+δ1 ŷ2+δi ŷ3+…+ ⊢m ŷ^+Es
- H0: δ1 = δ2 = ... = δm = 0
- H1: H0
Ubblorooo il sudto test F pn decide o naiaiute H0 e,
- pgn valreu elti della vutentitlra F cononta, il TEST RESET w
- due le calbotne rintutniso l’ptputa la haventa, e che w con
- problemos da specihicazina fumontale nal modillo restitutice.