Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
STATISTICA II
POPOLAZIONE - Collettività dei possibili esiti:
- FINITA - unità statistiche realmente esistenti che possono essere rilevate
- INFINITA/VIRTUALE - insieme potenziale delle osservazioni connesse alla ripetizione (teorica, mente illimitata) di un esperimento casuale condotto nelle stesse condizioni
- Non sappiamo a priori quante → potenzialmente ∞
MODELLO - rappresentazione numerica della popolazione
CAMPIONE - sottoinsieme finito degli elementi della popolazione
- n-pla di variabili aleatorie i.i.d
INFERENZA STATISTICA - insieme di tecniche statistiche che a partire dal campione
- Cercano di inferire dei comportamenti a livello dell'intera popolazione
- modo di procedere induttivo → rischio di errore (e!)
La TEORIA DELLA PROBABILITÀ fornisce i modelli probabilistici che identificano le popolazioni di riferimento
CAMPIONAMENTO CASUALE (es. campionamento con reinserimento)
- Il campione prima dell'estrazione è costituito da n variabili casuali Xᵢ con i = 1,...,n. Xᵢ ha una distribuzione (FXᵢ) rappresenta il modello che descrive la popolazione
- Dato la v.c. X → oggetto di studio con (FX), un campione casuale è l'insieme di v.c. X₁, X₂,..., Xₙ "tra loro i.i.d (indipendenti e identicamente distribuite)
- n osservazioni
Il campione selezionato è uno dei possibili campioni estraibili dalla popolazione
SPAZIO CAMPIONARIO - insieme dei possibili campioni di numerosità prefissata estraibili dalla popolazione
STATISTICA = stima/approssimazione dei dati campionari - valore numerico calcolato sulla base del campione osserva → è una funzione
STIMATORE - particolare statistica per approssimare il parametro della popolazione è il valore che for o una stima
In corrispondenza dei t campioni ottengo t campionari diverso - le statistiche campionarie calcolate sui campioni calcolate e sono affette da variabilità
ESEMPIO: Popolazione formata da 3 u dove X può assumere valori 0, 1, 2 voglio estrarre un reinserimento un campione di unità 2 → n = 2
Prima dell'estrazione: X1, X2
Uno dei possibili campioni estraibili è 0,1. Ma quanti sono i possibili campioni estraibili ? X1 può assumere valori 0,1,2 X2 può assumere valori 0,1,2 P(X1=x1, X2=x2) = P(X1=x2).
= 1/3 * 1/3 = 1/9
= probabilità di realizzazione di 1 campione
ESEMPIO 2: Stesso esempio di prima ma senza reinserimento - possibili campioni sono 6
Descrizione dello spazio campionario:
- C1 C2 C3 C4 C5 C6 Una volta estratta la prima pallina
- X = 1 2 0 2 0 1 dall'urna ne rimangono solo 2
- X = 2 0 2 1 perché non c'è reinserimento
Probabilità di ottenere un generico campione = P(X1=x1)P(X2=x2) = 1/3 * 1/2 = 1/6
=> Lo schema di campionamento considerato non produce un campionamento casuale poiché la 2a estrazione non è indipendente dalla prima e inoltre le probabilità non sono identicamente distribuite
ESEMPIO popolazione infinita Chiamo Θ = P(X<=1)
X = {1 -> chip difettato 0 -> chip funziona
Estrego un c.c. con n=3 → X1=1, X2=0, X3=0, P2 di estrarre il campione è; P(X1=1, X2=0, X3=0) = P(X1=x1)P(x1=0)P(x3=0) = Θ(1-Θ)2
ESEMPIO: Abbiamo un campione di 3 osservazioni estratte da una distribuzione normale dove xi~N(0,1)
- P(X2=x2, X2=x2, X3=x3) = 3∏i=1 3φ(xi) dove φ(x) = 1/√2π e-1/2 x2
- Se X4=0.5, X = 2=1, X3 = 0.5 → P(X4=0.5...) = 0.02999
Abbiamo detto che XnF(x,Θ) caratterizzata da E(X) e VAR(X), (parametri). Questi parametri sono fissi ma (noti->noti) stimatori - 2 possibili stimatori naturali sono media campionaria x e varianza campionaria s2
Alcune precisazioni... X~N F(x,Θ) con , Θ ϵ Σ
ϴ ϵ ℝd con d ≥1 é lo spazio parametro - l'insieme dei possibili valori esumibili dal parametro della popolazione
DISUGUAGLIANZA DI JENSEN
Sia g(x) una funzione continua e convessa e X una v.c. tale che E(X) è finito, allora E(g(X)) ≥ g(E(X))
- Sia g(x) una funzione continua e concava e Xv, allora E(g(X)) ≤ g(E(X))
! E(g(x)) + g(E(x)) quando g(x) √(x) v.c. lineare (dimostrazione sul quaderno)
DISTRIBUZIONE DELLA VARIANZA CAMPIONARIA DI UNA POPOLAZIONE NORMALE
X~N(μ, σ2) co μ e σ2 nn noti. È una relazione tra χ2n(0, 1) e la gaussiana: = 2 * y~χ2n∫n2
Quindi riformo uno: Σz2i = Σ(x1−)/σ)2) ... = Σ((xi−μ2/σ2))
Dato che x̅~N(0, 1) −> Σz2i = χ2n2→ x̅ ~ N(0, 1) ,−> x̅2 = (x̅/σ√m)2 n