Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Statistica Descrittiva
Variabili statistiche e le loro rappresentazioni
Vedere le slide dei prof.
Variabili e Popolazione
Popolazione: Σ di tutte le unità statistiche
Variabilità nelle unità statistiche
Es. popolazione che sostiene l‘esame di statistica
Variabilità: non tutti prenderanno lo stesso voto
Statistica descrittiva
scopo: descrivere
Variabili categoriche (o qualitative)
Appartenenza ad un gruppo Es. sesso esperienza lavorativa
Gerarchia dei modi in cui le variabili possono almestarsi
Codificazione attraverso codici o numeri
- 1 = pessimo
- 2 = insuff.
- 3 = suff. ecc.
non sono variabiliLA VARIABILE É UNA
Variabili qualitative possono essere:
- Ordinali (PICCOLO - MEDIO - GRANDE)
- Non ordinali (NOMINALI)
Variabili numeriche
DISCRETE
- N° di figli per famiglia a Venezia
CONTABILIMISURABILI
CONTINUE
Peso
Dati quantitativi
- Scala ad intervallo (non esiste lo zero assoluto)
- Scala di rapporto (esiste lo zero assoluto)
- Peso (0 uguale per tutti!)
- K0=0 vuoto
Non esiste lo zero temperaturaDire che t=0 non ha alcun senso
Dati grezzi
è consentito
- è necessario organizzarli in
- tabelle
- grafici
Distribuzione di frequenza
Tabelle utilizzate per organizzare i dati
n= n° totale delle unità statistiche osservate
Frequenze assolute
Modalità in cui possiamo osservare una variabile
Frequenze relative
fi = ni/n (freq assoluta/n)
∑ j=1 k fi = 1
PERCENTUALI
Analogia formale
Tra distribuzione di probabilità e distribuzione di frequenza relativa
Non vanno confuse Non c'è probabilità
Diagrams:
- barre
- torta
- bastonini
Classificazione
Perdiamo il dettaglio della cifra classi confrontanti = stessa ampiezza
campione rappresentativo
peso 3 unità statistiche e vedo quanto hanno in tasca
x1 = 0.60 € x2 = 100 € x3 = 20 €
x̄ = 120.6⁄3 = 40,2 € 1o campionamento
altro campionamento:
x1 = 80 € x2 = 60 € x3 = 120 €
x̄ = 260⁄3 = 80 € 2o campionamento
inferenzia statistica
ogni campionamento è frutto di casualità → problema!
[ES]
elezioni politiche
- 2 formazioni A e B
- A ci incarica di vedere quanto A gode di consensi
- Θ = fraz di elettori favorevoli ad A
- 0 ≤ Θ ≤ 1 estraggo
un solo campione:
- 0 = il lettore estratto è favorevole a B
- 1 = " " " " ad A
Θ = probabilità = P(x = 1)i - Θ
X = variabile casuale di Bernoulli
X ~ Bor (Θ)
definiamo
X vc. strettamente legato all'evento che ci interessa
X1, X2, ..., XnFθ θ ∈ ℍ ⫅ ℝK
per particolare distribuz di prob. GENERALIZZARE
fissiamo la dimensione dei campione: [n]
Xi ~Fθ iid i=1,...,n [MODELLO PARAMETRICO]
n vc che penserano n osservazioni campionarie
vettore di v.c.
(X1, ..., Xn) ∈ S
SPAZIO CAMPIONARIO
in cui troviamo tutti i possibili
campioni che possiamo estrarre
n = osservazioni (non n campioni! il campione è uno solo)
[statistica] = una qualsiasi trasformazione Tn
delle variabili campionarie X1, Xn tale
che Tn va dallo spazio campionario a
ℝM
Tn: S → ℝm con m≥1
é una variabile casuale /
sempre calcolabile percio non deve dipendere
DA θ
con una formula analitica
tn = Tn (X1, ..., Xn)
realizzazione campionaria della statistica Tn
ES di Prima
X̄n=1/n Σn(i=1)Xi = esempio di statistica Tn (X1, ..., Xn
ETÀ (xi)
- 21
- 23
- 26
- 30
- 32
- 33
- 34
- 38
- 40
- 41
- 47
- 49
- 50
- 53
- 55
- 61
- 65
FREQ. ASSOLUTA
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 2
- 1
- 2
- 1
- 1
- 1
- 1
- 1
- 2
FREQ. RELATIVA
- 0.05
- 0.10
- 0.05
- 0.10
- 0.05
- 0.10
FREQ. REL. CUMULATA
- 0.05
- 0.10
- 0.15
- 0.20
- 0.25
- 0.30
- 0.35
- 0.40
- 0.50
- 0.55
- 0.65
- 0.70
- 0.75
- 0.80
- 0.85
- 0.90
- 1.00
Distribuzione delle frequenze di età
Xi ~ N(θ, 52) iid
Xn = ½ i=1 [Σ] Xi ~ N(θ, 52 / n)
En = Xn - θ ~ N(0, 52 / n)
Fissati due numeri reali a e b con a ≤ b
possiamo calcolare P(En ∈ [0,6]) P(-0.5 ≤ En ≤ 0.5) ≈ 0.03
X ~ Fθ
↓ qualsiasi distribuzione con parametro θ (dipende da θ)
modello probabilistico
n variabili campionarie Xi i = 1, ..., n iid
definiamo uno stimatore
Tn(X1,...,Xn) ~ Gθ
↓ qualsiasi
PRINCIPIO DEI CAMPIONAMENTO RIPETUTO:
ripetere il campionamento A PARITA' di CONDIZIONI
definiamo n dimensione del campione
tn = valore assunto dallo stimatore su campione
tn = Tn (X1..., Xn,)
B(Tn) = E[Tn - θ] = 0
↓
distansione della stimatore Tn (Bias)
se B(Tn) > 0 aspettanzia ≠ 0, >0 sovrastimiamo il parametro
se B(Tn) < 0 sovrastimiamo il parametro θ
P(Z ≤ c)=1 - α/₂
C = quantile di ordine 1 - α/₂
C = Z1-α/2
P (- Z1-α/2 < Z ≤ Z1-α/2 ) = 1 - α
P (- Z1-α/2 ≤ √n (Xn - 9) / 6 ≤ Z1-α/2 )
- moltiplico tutto per 6
- 6 Z1-α/2 ≤ √n (Xn - 9) ≤ 6 Z1-α/2
- divido per √n
- 6/√n Z1-α/2 ≤ (Xn - 9) ≤ 6/√n Z1-α/2
-Xn - 6/√n Z1-α/2 ≤ - 9 ≤ -Xn + 6/√n Z1-α/2
- moltiplico tutto per -1
P ( - Xn - 6/√n Z1-α/2 ≤ θ ≤ Xn + 6/√n Z1-α/2 ) = 1 - α
INTERVALLO CASUALE CHE CONTIENE θ