Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Teoria
Si consideri un modello di regressione lineare multipla
Yᵢ = β₁xᵢ₁ + ... + βₖxᵢₖ + εᵢ i = 1, ..., n
-
Si fornisca la definizione dello stimatore ai minimi quadrati BLUE del vettore β = (β₁, β₂, ..., βₖ)′, ossia
Y = Xβ + ε
stima a m.q. β̂ = (X′X)⁻¹ X′y
dove H := X(X′X)⁻¹X′
dove A := (X′X)⁻¹X′
-
Si mostri che β̂ è uno stimatore corretto di β
E[β̂] = E[β + Aε] = β + A E[εᵢ] = β ⇨ lo stimatore è corretto
-
Si calcoli la matrice di covarianza del vettore aleatorio β̂
Σ̂βRF = σ²(X′X)⁻¹ =
| Var(βₖ) |
| Var(β₁) |
in posizione (i,j) con i ≠ j:
Cov( βi, βj)
-
Enunci il teorema di Gauss-Markov
Se valgono le assunzioni
1) yᵢ = (Xβ)ᵢ + εᵢ (linearità);
2) E[εᵢ] = 0 e Var(ε) = σ² Iₙ
3) rango(X) = k+1
Allora lo stimatore ai M.Q. θ̂ è tra gli stimatori lineari e corretti di β il più efficiente ⇨ BLUE, i.e.
Si considera un modello di regressione lineare multipla
yi | β0 + β1xi1 + ... + βkxik + εi i=1,...,n
a) Si elenchino sinteticamente le assunzioni tipicamente fatte sulle variabili errore εi
Le assunzioni sulle variabili errore sono: media nulla, omoschedasticità, incorrelazione, normalità
εi | N(0, σ2• I) i = 1,...,n
ε | N(0,σ2In)
b) Si mostri che sia il vettore di valori previsti ŷ = (ŷ1, ŷ2, ... , ŷn) sia il vettore dei residui e = (e1, e2, ... , en) sono trasformazioni lineari del vettore delle osservazioni y = (y1, y2, ... , yn)
ŷ | ŷ1 | = X(X'X)-1X'y
→ ŷ = Hy → ŷ è trasformazione lineare delle osservazioni y
e | ei = yi - ŷi = y - Hy = y - (In - H)y → e è trasformazione lineare delle osservazioni y
Enunciare la scomposizione della devianza totale
Devianza Totale = Devianza Spiegata + Devianza Residua
SQT = SQReg + SQRes
SQT non dipende dal modello, ma solo da {y1, y2, ... , yn}
SQT = Σi (yi - ӯ)2 | SQRes = Σi (yi - ŷi)2 | SQReg = Σi (ŷi - ӯ)2
Assumendo valida la seguente identità
(yi - ӯ)2 = (yi - ŷi)2 + (ŷi - ӯ)2 + 2(yi - ŷi)(ŷi - ӯ)
Si dimostri la validità della scomposizione della devianza totale per il modello di regressione lineare semplice yi = β0 + β1xi + εi | i = 1,...,n
Σi=1 (yi - ӯ)2 = Σi=1 ((β0 + β1xi + εi) - β0 - β1xi)2
= Σi=1 (εi2)
= Σi=1 ((ŷi - β1xi) + β1xi - ӯ)2
= β1xi
Esercizio 1
Si considera il modello di regressione lineare multipla =Xβ+ε, modello con intercetta. Si conoscano valori assunti da X'X, dove X è la matrice dei disegni, cioè
X'X:
- 6.00 10.56 7.16
- 10.56 17.86 13.58
- 7.16 13.58 14.09
- Quali sono le osservazioni?
- X'X in posizione (1,1) ha (1+1,..1) 1n ∑ 1 =
= #osservazioni 6
- Quali sono le variabili esplicative?
Matrice del disegno [x(+1)]
X'X [+1x +1] X'X [x(+1)]X [x]
k+1=3 ⇒ k=2 ⇒ 2 # esplicative
- Qual è la media della prima esplicativa?
Media 1 = X1 + 10.56 /6 = 1.76
Su 200 aziende sono stati rilevati il fatturato dell'ultimo anno (variabile V,espressa in migliaia di euro) e il numero di dipendenti (variabile X). Un modellodi regressione semplice volto a spiegare il fatturato in funzione del numerodi dipendenti ha fornito il seguente output parziale:
VariabileStimaS.E.t-valuesp-valuesIntercetta384.01838.5773.970.0001N. dipendenti9.3440.332629.540.0001a) completare la tavola ed interpretare i valori delle stime dei dueparametri β0 e β1
t.values (β1) t = (9.344) / 0.3326 = 29.5042 ≈ 29.54t0.001 = (T198 = 29.5)=0.0001
β1: 9.32; 7.358 ≤ 384.018β2: 0.001 ≤ P(T198 ≥|29.5|)=0.0001
Interpretazione valori stime:In media per circa 10dipendenti l'azienda avràun fatturato annuo di:circa €344
Un cuoco ha deciso di creare una nuova tipologia di cereali. A questo scopo ha acquistato 27 scatole di cereali scelte casualmente e ha rilevato il numero di calorie (Xi) e la componente cadrica (vi espressa in polynomy) e, inoltre, un indice di gradimento (Yi) espresso dagli amici a cui li ha chiesto di assaggiare i cereali acquistati.
- a) Dopo aver specificato il modello lineare avente come risposta Y si completi la seguente tabella sugli elementi in merito alla significatività dei coefficienti di regressione e si interpreti la stima
X1:0 molle calorie D1:0 porho calorie
Yi = β0+β1Xi+β2Di+Ei
Stima S.E t-value = 0.211 / 0.241 = 1.506
P-value 2P(t n-1 | ≤ |1.506|) = 0.13627
- b) Si determini l’errore standard della regressione e l’indice R2 sapendo che il valore della devianza campionaria in Y è pari a 14802.66 e che la matrice (X’X)-1 assume la seguente formula
(X’X)-1 =0.0480.0031 -0.0154
0.0003 0.0005
-0.0154 -0.0005 0.0065
0.0009 0.211 1 0.0009 0.5σ2 0.211 234.494
σ2 0.211 0.0009
DR = s2 (n-k-1) = 14802.66 1/0.5 234.494 213,494.856
R2 = 1 - DB = 1 -
OT = 14802.66
- c) Si sottoponga a verifica l’ipotesi Ho: β0 β2 specificando forma della statistica test utilizzata e suo valore empirico con il p-value
Ho: β0, β2 = 0
H1: β2 # 0
t-value = 7.14
P-value = 0.13627
Rifiuto Ho per α
Accetto Ho per α