Anteprima
Vedrai una selezione di 6 pagine su 24
Modelli statistici Pag. 1 Modelli statistici Pag. 2
Anteprima di 6 pagg. su 24.
Scarica il documento per vederlo tutto.
Modelli statistici Pag. 6
Anteprima di 6 pagg. su 24.
Scarica il documento per vederlo tutto.
Modelli statistici Pag. 11
Anteprima di 6 pagg. su 24.
Scarica il documento per vederlo tutto.
Modelli statistici Pag. 16
Anteprima di 6 pagg. su 24.
Scarica il documento per vederlo tutto.
Modelli statistici Pag. 21
1 su 24
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Teoria

Si consideri un modello di regressione lineare multipla

Yᵢ = β₁xᵢ₁ + ... + βₖxᵢₖ + εᵢ i = 1, ..., n

  1. Si fornisca la definizione dello stimatore ai minimi quadrati BLUE del vettore β = (β₁, β₂, ..., βₖ)′, ossia

    Y = Xβ + ε

    stima a m.q. β̂ = (X′X)⁻¹ X′y

    dove H := X(X′X)⁻¹X′

    dove A := (X′X)⁻¹X′

  2. Si mostri che β̂ è uno stimatore corretto di β

    E[β̂] = E[β + Aε] = β + A E[εᵢ] = β ⇨ lo stimatore è corretto

  3. Si calcoli la matrice di covarianza del vettore aleatorio β̂

    Σ̂βRF = σ²(X′X)⁻¹ =

    | Var(βₖ) |

    | Var(β₁) |

    in posizione (i,j) con i ≠ j:

    Cov( βi, βj)

  4. Enunci il teorema di Gauss-Markov

    Se valgono le assunzioni

    1) yᵢ = (Xβ)ᵢ + εᵢ (linearità);

    2) E[εᵢ] = 0 e Var(ε) = σ² Iₙ

    3) rango(X) = k+1

    Allora lo stimatore ai M.Q. θ̂ è tra gli stimatori lineari e corretti di β il più efficiente ⇨ BLUE, i.e.

Si considera un modello di regressione lineare multipla

yi | β0 + β1xi1 + ... + βkxik + εi i=1,...,n

a) Si elenchino sinteticamente le assunzioni tipicamente fatte sulle variabili errore εi

Le assunzioni sulle variabili errore sono: media nulla, omoschedasticità, incorrelazione, normalità

εi | N(0, σ2• I) i = 1,...,n

ε | N(0,σ2In)

b) Si mostri che sia il vettore di valori previsti ŷ = (ŷ1, ŷ2, ... , ŷn) sia il vettore dei residui e = (e1, e2, ... , en) sono trasformazioni lineari del vettore delle osservazioni y = (y1, y2, ... , yn)

ŷ | ŷ1 | = X(X'X)-1X'y

→ ŷ = Hy → ŷ è trasformazione lineare delle osservazioni y

e | ei = yi - ŷi = y - Hy = y - (In - H)y → e è trasformazione lineare delle osservazioni y

Enunciare la scomposizione della devianza totale

Devianza Totale = Devianza Spiegata + Devianza Residua

SQT = SQReg + SQRes

SQT non dipende dal modello, ma solo da {y1, y2, ... , yn}

SQT = Σi (yi - ӯ)2 | SQRes = Σi (yi - ŷi)2 | SQReg = Σii - ӯ)2

Assumendo valida la seguente identità

(yi - ӯ)2 = (yi - ŷi)2 + (ŷi - ӯ)2 + 2(yi - ŷi)(ŷi - ӯ)

Si dimostri la validità della scomposizione della devianza totale per il modello di regressione lineare semplice yi = β0 + β1xi + εi | i = 1,...,n

Σi=1 (yi - ӯ)2 = Σi=1 ((β0 + β1xi + εi) - β0 - β1xi)2

= Σi=1i2)

= Σi=1 ((ŷi - β1xi) + β1xi - ӯ)2

= β1xi

Esercizio 1

Si considera il modello di regressione lineare multipla =Xβ+ε, modello con intercetta. Si conoscano valori assunti da X'X, dove X è la matrice dei disegni, cioè

X'X:

  • 6.00 10.56 7.16
  • 10.56 17.86 13.58
  • 7.16 13.58 14.09

  1. Quali sono le osservazioni?
    • X'X in posizione (1,1) ha (1+1,..1) 1n ∑ 1 =

= #osservazioni 6

  1. Quali sono le variabili esplicative?

    Matrice del disegno [x(+1)]

    X'X [+1x +1] X'X [x(+1)]X [x]

    k+1=3 ⇒ k=2 ⇒ 2 # esplicative

  2. Qual è la media della prima esplicativa?

    Media 1 = X1 + 10.56 /6 = 1.76

Su 200 aziende sono stati rilevati il fatturato dell'ultimo anno (variabile V,espressa in migliaia di euro) e il numero di dipendenti (variabile X). Un modellodi regressione semplice volto a spiegare il fatturato in funzione del numerodi dipendenti ha fornito il seguente output parziale:

VariabileStimaS.E.t-valuesp-valuesIntercetta384.01838.5773.970.0001N. dipendenti9.3440.332629.540.0001

a) completare la tavola ed interpretare i valori delle stime dei dueparametri β0 e β1

t.values (β1) t = (9.344) / 0.3326 = 29.5042 ≈ 29.54t0.001 = (T198 = 29.5)=0.0001

β1: 9.32; 7.358 ≤ 384.018β2: 0.001 ≤ P(T198 ≥|29.5|)=0.0001

Interpretazione valori stime:In media per circa 10dipendenti l'azienda avràun fatturato annuo di:circa €344

Un cuoco ha deciso di creare una nuova tipologia di cereali. A questo scopo ha acquistato 27 scatole di cereali scelte casualmente e ha rilevato il numero di calorie (Xi) e la componente cadrica (vi espressa in polynomy) e, inoltre, un indice di gradimento (Yi) espresso dagli amici a cui li ha chiesto di assaggiare i cereali acquistati.

  1. a) Dopo aver specificato il modello lineare avente come risposta Y si completi la seguente tabella sugli elementi in merito alla significatività dei coefficienti di regressione e si interpreti la stima
VariabileStimaS.E.t-valuep-valueX11.5060.2117.140.13627

X1:0 molle calorie D1:0 porho calorie

Yi = β01Xi2Di+Ei

Stima S.E t-value = 0.211 / 0.241 = 1.506

P-value 2P(t n-1 | ≤ |1.506|) = 0.13627

  1. b) Si determini l’errore standard della regressione e l’indice R2 sapendo che il valore della devianza campionaria in Y è pari a 14802.66 e che la matrice (X’X)-1 assume la seguente formula

(X’X)-1 =0.0480.0031 -0.0154

0.0003 0.0005

-0.0154 -0.0005 0.0065

0.0009 0.211 1 0.0009 0.5σ2 0.211 234.494

σ2 0.211 0.0009

DR = s2 (n-k-1) = 14802.66 1/0.5 234.494 213,494.856

R2 = 1 - DB = 1 -

OT = 14802.66

  1. c) Si sottoponga a verifica l’ipotesi Ho: β0 β2 specificando forma della statistica test utilizzata e suo valore empirico con il p-value

Ho: β0, β2 = 0

H1: β2 # 0

t-value = 7.14

P-value = 0.13627

Rifiuto Ho per α

Accetto Ho per α

Dettagli
A.A. 2021-2022
24 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher anna_dilorenzo di informazioni apprese con la frequenza delle lezioni di Modelli statistici e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano - Bicocca o del prof Nipoti Bernardo.