Modelli per le analisi socio-economiche

Name: Modelli per le analisi socio-economiche
Brand: Skuola.net
Rating: 3 (1 reviews)

Aggiornato il 21/02/2025

di Simo.pa

Publisher

Vota 3,0/5 (1)

Contenuto originale e autentico, validato dal Team di Esperti di Skuola.net

Appunti con esercizi di Modelli per le analisi socio-economiche della professoressa Carota. Sono completi e integrati perfetti per passare l'esame, perché comprendono gli appunti presi a …

Esame Modelli per le analisi socio-economiche

Facoltà Economia

Dal corso del Prof. Carota Cinzia

Università Università degli studi di Torino

A.A. 2022-2023

54 pagine

Appunti esame

Scarica

Estratto del documento

Modelli statistici per le analisi socioeconomiche

Un po' di Ripasso!

Variabile casuale - è una funzione di eventi a valori reali (definita sullo spazio degli eventi elementari associati ad un esperimento fissato), le cui modalità hanno una probabilità associata che misura la possibilità del fatto che si verifichino.
- es. Gaussiana, Bernoulli

Faccio un esperimento estraendo a caso un individuo dalla popolazione tra giovane, intermedio e vecchio e assegno un numero reale a ciascuno (v.c.) che misura la plausibilità che tale evento si verifichi p(x_i).

Variabile statistica - un esempio può essere l'età e sarà esposta rispetto all'osservazione di un intero collettivo (prima è v.c. ma dopo questa osservata diventa v.s.)
Stimatore - Lo stimatore di θ (parametro ignoto) è una funzione campionaria che serve a stimare θ, quindi serve a produrre valori plausibili per θ e può farlo commettendo errori di stima misurabili.
- Proprietà:
  - 1) Correttezza -> E(t_n)=θ non distorsione
  - 2) Efficienza -> MSE(t₁) < MSE(t₂) relativa
  - 3) Consistenza -> ^lim_n→∞Var(t_n)=0 ^lim_n→∞E(t_n)=θ
Stima - è il valore assunto da uno stimatore.
Variabile aleatoria - è una funzione che per ogni evento appartenente allo spazio campionario (insieme di tutti i possibili esiti di un esperimento casuale) assume un unico valore reale.
Variabile discreta - è data se l'insieme finito o infinito numerabile di numeri reali (es. la Bernoulli con media e varianza 1/2).

È nota se esiste una funzione F(x)

Variabile continua → Assume tutti i valori compresi in un intervallo di R (es. l'uniforme continua in (a,b) che ha media ^a+b⁄₂ e varianza ^(b-a)²⁄₁₂.
Gradi di libertà → Sono il n° di osservazioni indipendenti e quindi sono gli n parametri da stimare preliminarmente.
Intervallo di confidenza → Nel caso della stima puntuale si usa uno stimatore per inferire sul valore di θ e il risultato è un singolo numero, che generalmente non corrisponde al θ. La stima per intervallo invece restituisce un intervallo di θ che garantisce, con un certo livello di confidenza, di contenere θ. Le stime intervallari hanno un estremo superiore e uno inferiore.
Statistica test → È una funzione campionaria usata per verificare le ipotesi statistiche.
Errori → Ci sono 2 tipi di errori, di 1^a specie quando io rifiuto un'ipotesi vera (è il più grave) e di 2^a specie quando io accetto un'ipotesi falsa.

Domanda delle slide 5 o 6

Quanto vi aspettate che sia l’utile di un uomo che guadagna 1000 $ e ha un livello educativo misurato in 18 anni di scolarizzazione?
Quanto vi aspettate che sia l’utile di una donna che guadagna 1000 $ e ha un livello educativo misurato in 18 anni di scolarizzazione?
Qual è la differenza tra R quadro ed R quadro aggiustato?
Quali sono le osservazioni tratte da questa analisi?
Ritenete che la differenza tra le risposte fornite ad a) e b) sia statisticamente significativa oppure dovuta al caso?

dataset "Prestige":

educational: average education of occupational incumbents, years, in 1971. income: average income of incumbents, dollars, in 1971. women: percentage of incumbents who are women. prestige: Pineo-Porter prestige score for occupation, from a social survey conducted in the mid-1960s.

La rappresentazione matriciale sarebbe:

Dopo aver visto le matrici graficamente, adesso possiamo riscrivere lo schema del modello lineare (LM) in forma matriciale, ovvero:

LM → y_i = β₀ + β₄ x_i4 +...+ β₁ x_i1,n-4 + ε_i

y_i = x'_iβ + ε_i

Y_i ~ N(τ_i, σ²)

Noi però ci dobbiamo occupare degli GLM, ovvero dei modelli lineari generalizzati. Qui la Y_i non sarà distribuita secondo una Normale, ma secondo... Sarà una distribuzione qualsiasi della famiglia esponenziale.

Y_i ~ EF(ε, φ)

g(τ_i) = x'_iβ

g dev'essere monotona, derivabile, e invertibile (sono le 3 proprietà di g).

Valore atteso della generica osservazione ε_i dove ε_i ~ EY_i... parametro di dispersione...

Distribuzione Geometrica o v.c. geometrica

Sarà discreta e avremo la possibilità di ottenere un successo o un insuccesso. Questo tipo di distribuzione ripete un esperimento Bernoulliano (due soli risultati ovvero successo o insuccesso) fino a quando non si osserva il 1^o successo. Le prove o esperimenti Bernoulliani sottostanti saranno indipendenti.

Y₁=1 P{Y=1}=r
Y₂=2 P{Y=2}=(1-r)r
Y₃=3 P{Y=3}=(1-r)(1-r)r

Quindi una distribuzione geometrica sarà:

Y_rf(y;r) = (1-r)^y-1r dove y=1,2,3...

probabilità del successo della singola prova Bernoulliana ∈(0,1).

Vi è inoltre un'altra interpretazione di Y, ovvero quella della Y che contra il numero degli insuccessi realizzati prima di osservare il 1^o successo, quindi il tempo di attesa misurato nel discreto prima di ottenere il 1^o successo. Quindi avremo che quando:

Y₁=0 → r (estraggo subito successo)
Y₂=1 → (1-r)r (estraggo successo dopo aver estratto un insuccesso)
Y₃=2 → (1-r)(1-r)r (estraggo successo dopo aver estratto due insuccessi)
Y₄=3 → (1-r)(1-r)(1-r)r (estraggo successo dopo aver estratto tre insuccessi)

In questa nuova interpretazione avremo:

Quando invece siamo in presenza di una variabile continua, dobbiamo distinguere il caso di una continua per intervalli e di una continua. Quella continua per intervalli sarà una spezzata, ovvero:

F_X(x) = F_I{X ≤ x2}

Ricapitoliamo: che la funzione di densità è l’inclinazione della funzione di ripartizione

È invertibile perché ad ogni x corrisponde una y non si derivabile nei punti angolosi, perché la derivata destra sarà uguale a quella sinistra.

Quando invece è continua la raffigureremo così:

F_X(x)

In questo caso sarà sia monotona, che derivante, che invertibile.

Questa sarà quella che utilizzeremo per la nostra g che sarà monotona, derivabile e invertibile o la (0,1) a ℝ {−∞;+∞}

F_X⁻¹(x)

Funzione Logistica

L'abbiamo introdotta quando abbiamo parlato della Bernoulli, in particolare della media e della varianza Bernoulliana appartenente alla famiglia esponenziale. Se ci pensiamo, abbiamo che:

E(Y|x) = μ(x) = a + bx

Siccome questo pezzettino varia in ℝ ma sappiamo che la Bernoulli è presente soltanto con valori a allora questo pezzettino è un po' insensato

Pr {Y = 1|X = x>j}(0,1)

CASO 2

x livello di istruzione

E(Ŷi|xi) =

β₀ + β₁ 0 + β₂ 0 se i è scuola o obbligo
β₀ + β₁ 1 + β₂ 0 se i è diploma
β₀ + β₁ 0 + β₂ 1 se i è laurea o più

L'interpretazione dei parametri sarà la seguente:

β₀ sarà il reddito medio di chi ha e a x=sc.obbligo
β₀ + β₁ sarà il reddito medio di chi ha e a x=diploma
β₀ + β₂ sarà il reddito medio di chi ha e a x=laurea o più

dove β₀ è il reddito medio se e a x=scuola dell'obbligo, β₁ è l'incremento/decremento del reddito medio rispetto alla scuola dell'obbligo per chi ha x=diploma e β₂ rappresenta l'incremento/decremento del reddito medio rispetto alla scuola dell'obbligo se x=laurea o più.

X =

matrice disegno associata alla corner point parametrisation

1 0 0

1 1 0

1 0 1

→ in R specifico il modello con y~x

X =

matrice disegno associata alla group parametrisation

1 1 0 0

1 0 1 0

1 0 0 1

→ in R specifico il modello con y~ -1+x

Anteprima

Vedrai una selezione di 12 pagine su 54