Teoria e Pratica di Modelli Statistici + Stata

48 lezioni numerate

Codici STATA con lettura e comprensione degli Output

Argomenti trattati:
- Modello lineare classico
- Scelta del Modello
- Diagnostica
- Regressione Binaria
- Modello Logit
- Inferenza Statistica
- Cumulative Logit Model (per risposte categoriche ordinate)
- Multinomial Logit Model (per risposte categoriche non ordinate)
- Poisson Model (per dati di conteggio)
- Modelli Lineari Generalizzati (GLM)
- Regressione Quantile
- Modelli Multilivello (Random Intercept, Random Slope)"> Lezioni di "Teoria e Pratica di Modelli Statistici" - Statistica e Data Science, UNIFI48 lezioni numerateCodici STATA con lettura e comprensione degli OutputArgomenti trattati:- Modello lineare …

Esame Teoria e Pratica di Modelli Statistici

Facoltà Economia

Dal corso del Prof. Grilli Leonardo

Università Università degli Studi di Firenze

Publisher nicolacalca

A.A. 2020-2021

109 pagine

Appunto

Vota 3,5 / 5 (2)

Scarica

Estratto del documento

Modello statistico Modello lineare classico

Un modello è uno schema teorico che si concentra sugli aspetti strutturali più importanti. Un modello statistico tiene conto della relazione tra teoria e dati, e ha due componenti deterministico e sistematico (regola) e casuale (rumore).

I dati non seguono mai un'espressione matematica esatta a causa dell'errore di misurazione e di campionamento (es: le osservazioni di S_t, il rumore su una retta perfetta).

In generale un modello statistico è un modello per una variabile di risposta o dipendente Y:

Y = f(X_obj, X_unobs)

= f(X_obj) + E_unobs

in cui f = funzione non nota,

X_obj, X_unobs = variabili esplicative o indipendenti o covariate,

E_unobs = errori causati dalle X_unobs.

Solitamente assumiamo un modello statistico:

Y = x'β + E_unobs = β₀ + β₁x₁ + ... + β_kx_k + e

(appena modelli non vanno fuori guida)

β₀, ..., β_k = k+1 coefficienti di regressione,

β₀ = intercetta,

e = componente casuale con distribuzione c∞ma di 1g più parametri (≡N(0,σ))

Per modello lineare si intende lineare nei parametri, cioè che può essere ricondotto a lineare tramite trasformazione:

y = β₀ + β₁x + e →

y = β₀ + β₁x² + e →

y = β₀x + e →

log(y) = (β) ; β₁ (x) + (1/e) →

y = β₀ + β₁x^e

Ma si può linearizzare

Se abbiamo campioni di grandezze m assumiamo che la relazione valga per ogni unità campionaria:

Y_i = β₀x_i + ... + β_kx_ik + e_i

(Vettore col hall

(unità campionarie)

_{| x₁₁ | .... | x_k1 |}

_{| x₁₂ | .... | x_k2 |}

_{| y₁ | .... | y_m | variabili colonna definizione}

Regressione lineare semplice

È il modello con una sola variabile esplicativa (k=1).

In cui:

γ₁ = coefficiente angolare (pendenza)
σ² = ^ver=Y_i = varianza residua

Pendenza γ₁ = parametro più importante dei dati di

cambia con x_i =...
Y_i

Pend=σ_Y / σ_X = risultato.

cambia con ...

Metodo dei minimi quadrati

arg min_β0,β1 Σ (y_i - (y₀ + y₁x_i))²

v 4,a .club = è riprova la ...

Pend = (y₂ - y₁) / (x₂ - x₁)

Perché si utilizzano modelli statistici?

Generalmente sono utilizzati per spiegare fenomeni: per capire come si influenzano e. Ma possono essere utilizzati anche per prevedere una certa risposta. Infatti, la spiegazione e previsione possono essere ottenute diverse perchè per la spiegazione preferisco una struttura semplice, comprensibile, mentre per la previsione devo minimizzare l'errore di previsione tenendo conto della complessità. Assumerò di non voler trattare modelli con complessità estreme che sono piccoli black box cioè tanto complessi da non sapere cosa fanno (come in reti neurali).

Si sono create due strade:

scopo di spiegazione → statistica semplice
scopo di previsione → statistica e machine learning

La distinzione tra parametri e bassa stima: i dati del campione (β hat) parametri di regressione sono spesso stimati usando il metodo dei minimi quadrati.

La stima della media: ĥ = E(y_i) = x_iβ̂

Il vettore dei residui e = y - ẏβ possono essere residui parziali e_i = y_i - x_i β̂ - y_j = e_iβ̂₀ + e_i β̂₁: e_i β̂₁

Secondo metodo dei massimi quadrati coefficienti di regressione β non esaltare sono stimati massimizzando la somma delle deviazioni al quadrato.

L(3β) = Σ [y² + Σ β]² + e²

Altrimenti si può utilizzata rmma cosiddetta 3β(β) = Σ: della regressione moderna (caso speciale della repressione normale)

Somme a minimizzare L3(β) | Divisibile e complessione necessaria)

L3(β) = e e = X(3β)(Y - X(β) = y'Z Y Σ βX)β: (β) X(β) al X(β)X(Y) = Σy'Z X. X.B(Y) X(β) = Σ X(β)^-1₂ X(β)X(β): a l a sum: ando normotra scalare

con β = vettore (p+1)

X = matrice (nXp)

X = matrice (nXp)=

y = vettore (nx1)

con l’facile dell' derivata rispetto x β β^:

Anteprima

Vedrai una selezione di 10 pagine su 109