Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Lezione 4
Esame scritto 2h
APPELLO: DIC., GEN., SETT
- 2 esercizi (calcolatrice/tavole) -> 1 sulla 1ª parte, 1 sulla 2ª parte
- + 1 domanda aperta di teoria
- Rispondere in maniera ESAUSTIVA, linguaggio preciso. Una parte del programma va studiata da sè.
Materiali didattici:
- capitoli del libro
- dispense
- casi da commentare
Ricevimento: MERCOLEDÌ dalle 14:00 alle 16:00
Programma:
- Modello di repressione multipla
- Analisi delle serie storiche
- Teoria dei numeri indice
Modello di Regressione Semplice
mette in relazione due variabili:
Y = var. dipendente
X = var. indipendente / esplicativa -> spiega la Y
è un modello LINEARE tra X e Y
relazione -> Yi = α + βX + υ
α/β = parametri (due numeri incogniti da stimare)
υ = variabile casuale sulla quale si fanno delle assunzioni (proprie dei modelli di regressione)
Es. se Yi = consumo X = reddito -> dichiariamo che c'è relazione tra consumo e reddito, in generale
per i = 1,...n indico le UNITÀ STATISTICHE (le famiglie)
per la generica famiglia iesima -> Yi = α + βXi + υi
Abbiamo una popolazione di n famiglie
Reddito | Consumo x1 | y1 x2 | y2 ... | ... xn | yn
rappresentazione → DIAGRAMMA di DISPERSIONE che riporta tutte le unità statistiche e una nuvola di punti
y = C y1 y2 y3 x1 x2 x3 x=R
Mi aspetto che y e x covarino nella stessa direzione (cov > 0) positiva
Se reddito ↑ consumo ↑
ES
Prezzo - Domanda
P ↑ D ↓
Covariano in senso opposto, NEGATIVA
1a IPOTESI nel MODELLO SEMPLICE
→ LA VARIABILE x è PREDETERMINATA FISSA Popolazione italiana dividiamo le famiglie in 3 urne
_____________ | | |__________| R = 4000€
_____________ | | |__________| R = 2000€
_____________ | | |__________| R = 3000€
Classificazione in base al livello di reddito
4a IPOTESI
il Consumo condizionato al reddito si distribuisce come una NORMALE
06/11/2012
x domani: 4 pagine
un esempio di stima del modello di regressione semplice
OMOSCHEDASTICITA'
Var (Y|X) = σ²
Normlita' → Y|X ∼ N (α + βX , σ²)
5a IPOTESI
INDIPENDENZA delle ESTRAZIONI
Non conosciamo la popolazione ma un CAMPIONE
nel modello multiplo
Y = consumo X1 = reddito X2 = no componenti famiglia
Y = α + β1X1 + β2X2 + &omeg
X1 X2 Y X11 X12 Y1 X21 X22 Y2 X31 X32 Y3colonne = no variabili + la Y matrice n x (p + 1) = n x 3
Rappresentazione nel grafico di dispersione
SEMPLICE
Y ↑ | | x | x x | α E [Y|X] = α + βX | ______________________ |_________________________ δ_δR = X
MULTIPLA
Y ↑ Y (***/X1 y4 )unità | | |
E [Y|x1, x2] = α + β1X1 + β2X2
α = intercetta in cui il piano taglia l'asse delle ordinate (Y)
β1 e β2 = pendenza dei piano rispetto a x1 e x2
ESEMPIO PRATICO
α = consumo quando R = O e NCF = O. Non ha senso
- INTERCETTA NON HA SEMPRE SIGNIFICATO ECONOMICO, ma serve per posizionare il piano.
Residui della regressione(= spesa lim osservata - stimata)
"Standardized":
- Se i residui sono 11 positivi -> la retta e' passato sotto
- Se i residui sono 11 negativi -> la retta eil passato sopra
FAMIGLIE
spesa lim: valori effettivi e stimati
- Stime
- Effettivi
IN GENERALE
β̂ ~ N (β, ĝ2β̂)
β̂ - β ~ N (0, ĝ2β̂)
β̂ - β √ĝ2β̂ ≈ tn-2 ≈ N (0,1)
- se ĝ2β̂ NON NOTO (sempre)
- se n sufficientemente grande [n > 40/50 osservazioni]
nel nostro caso n = 20
- o usiamo la t
- oppure usiamo il p-value
se P-VALUE < α RIFIUTO H0
α0.05
P-value = P { β1 > Δ1 } t-ratio
P-value di α = 0.59 > α = 0.05 ACCETTO H0 se accetto H0 β = 0 le rette escono tutte dentro i piani degli assi dobbiamo ristimare il modello!!
P-value di β < 0,00001 < α = 0.05 RIFIUTO H0 Rifiuto che β = 0 Accetto che β ≠ 0
All'esame:
- commento sul segno della correlazione - valutazione della significatività dei n. della tavola
corr(R, SA) = M - (R:SA) - N(R) M(SA) / √Var(R) Var(SA)
dove M = medio
ERRORE STANDARD PICCOLO=
- DISTRIBUZIONE è CONCENTRATA
- IL VALORE STIMATO è VICINO AL VERO VALORE β
P-VALUE: strumento per capire la significatività dei coefficienti (≠0)
α/2 0,05 > 0,025 Area di accettazione di Ho Ho: α = 0 Ha: α ≠ 0
P-VALUE < LIVELLO DI CONFIDENZA → LE VARIABILI SONO SIGNIFICATIVE! RIFIUTO Ho
Quale delle due variabili spiega di più SA?
- R e NC
Non possiamo guardare il valore numerico, perchè hanno unità di misura diversa
GUARDO RAPPORTO T - RAPPORTO T MAGGIORE = REDDITO MI SPIEGA PIÙ DI NC
MODELLO GENERALE
Y = α + β1 X1 + β2 X2 + d D1 + U
perchè ha natura diversa
SOTTOMODELLI
se D1 = 1 capofamiglia femmina → Y = α + β1 X1 + β2 X2 + d + U
se D1 = 0 capofamiglia maschio → Y = α + β1 X1 + β2 X2 + U
tutti e due i sottomodelli sono di dimensione 3
- E (Y | X1, X2, D1) = α + β1 X1 + β2 X2 + d D1 GENERALE
- E (Y | X1, X2) = α + β1 X1 + β2 X2 + d1 GRUPPO FEMMINE
- E (Y | X1, X2) = α + β1 X1 + β2 X2 GRUPPO MASCHI
- la spesa media alimentare sta su un iperpiano 4 parametri: α, β1, β2, d1
- la spesa media alimentare è posta su un piano (α + d) e l'intercetta del piano (R=0 NC=0)
- la spesa media alimentare dei maschi è posta su un piano intercetta α
il piano è sotto quello delle donne se d1 > 0
il piano è sopra quello delle donne se d1 < 0
la differenza delle ordinate tra i due piani è d+1
rimangono inalterate le pendenze rispetto a R e NC
Introdurre variabili dummy → effetto cambia solo l'intercetta
i piani N e F sono PARALLELI!