Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Statistica Descrittiva
- Distribuzioni
Frequenza Assoluta: f
Frequenza Relativa: fᵣ = f/n n = num. tot. di eventifᵣ% = f/n * 100
Frequenza Cumulata: f꜀ = disporre in ordine crescente le variabili ecalcolare le fᵣ di ognuna:
- f꜀ del 1° elemento = f₁ᵣ
- f꜀ del 2° elemento = somma delle sue fᵣe quelle del 1° elemento
- f꜀ del 8° elemento = somma della sue fᵣ,del 7° e del 1°
- ...
- f꜀ ultimo elemento = 100%
Ampiezza Classi = V.max - V.min/num di classi
Grafici:- A Barre: Vₒ = qualitative o quantitative discrete- A Torta: Vₒ = qualitative- Istogramma: V = qualitative continue- Ogliva: V = quantitative continue- Ramo-Foglia: V = qualitative
Indici di Tendenza Centrale
Media:x̄ = X₁ + X₂ + ... + Xₙ/n = 1/n∑i=1n Xi
Media di popolazione: M = 1/N∑i=1N XiN = una statistica che costituisce la popolazionen = campione modellistico che la variabileVᵢ assume nel campione
- Con frep Amm.: x̄ = 1/n ∑i=1n βi Vi
- Con frep Rel.: x̄ = ∑i=1n fri Vi
Moda = valore più frequente
Mediana = valore centrale in una serie ordinata di n valori- n dispari: median occupa la posizione(n + 1)/2- n pari: median è la media tra i valori di posizionen/2 e (n/2 + 1)
Quartili:1° quartile (Q1) = mediana dei valori minori2° quartile (Q2) = mediana3° quartile (Q3) = mediana dei valori maggiori
Box-Plot[1]:a = max {Xmin, Q1 - 1,5 (Q3 - Q1)}b = min {Xmax, Q3 + 1,5 (Q3 - Q1)}
Indici di Variabilità
Campo di Variazione = Xmax - Xmin
Varianza Campionaria: S2 = (xi - x̄)2
Varianza della Popolazione: σ2 =
Momento N-esimo: μn = (xi)n
Deviazione Standard: σ = √(xi - μ)2
Deviazione Standard Campionaria: s = √(xi - x̄)2
Coefficiente di Variazione: CV = σ / |μ|
Differenza Interquartile: DQ = Q3 - Q1
Covarianza: cov(x, y) = (xi - x̄)(yi - ȳ)
Indice di Correlazione: r = (xi - x̄)(yi - ȳ) / SxSy
Variabili
- Qualitative: esprimono una caratteristica
- Nominali: non ordinabili
- Ordinali: ordinabili
- Quantitative: misurano una quantità
- Discrete: sono valori interi (es. numero di)
- Continue: assumono infiniti valori compresi in un intervallo
VARIABILI ALEATORIE DISCRETE
FUNZIONE DI MASSA DI PROBABILITÀ: P(x) := P(X = x)
- P(x) > 0 ∀ x ∈ X
- P(x) = 0 ∀ x ∉ X
- Σx∈X P(x) = 1
FUNZIONE DI RIPARTIZIONE: F(a) := Σx≤a P(x)
COPPIE DI VARIABILI ALEATORIE DISCRETE
FUNZIONE DI RIPARTIZIONE:
- → CONGIUNTA: F(x, y) := P(X ≤ x, Y ≤ y)
- → MARGINALE x: FX(x) = P(X ≤ x, Y < ∞)
- → MARGINALE y: FY(y) = P(X < ∞, Y ≤ y)
FUNZIONE DI MASSA DI PROBABILITÀ:
- → CONGIUNTA: p(xi, yj) = P(X = xi, Y = yj)
- → MARGINALE x: pX(xi) := Σj P(X = xi, Y = yj)
- → MARGINALE y: pY(yj) := Σi P(X = xi, Y = yj)
INDIPENDENZA V.A. DISCRETE: p(x, y) = pX(x)pY(y)
FUNZIONE DI MASSA DI PROBABILITÀ CONDIZIONATA: pX|Y(x|y) = P(X=x,Y=y)/ P(Y=y) = pXY(x,y) / pY(y), pY(y) > 0
VALORE ATTESO: E[X] := Σi xip(xi)
FUNZIONE GENERATRICE DEI MOMENTI: φ(t) := EX[etX] = Σx etxp(x) ∀t ∈ ℝ
MODELLI PER VARIABILI ALEATORIE DISCRETE
➔ BERNOULLI: X~Ber(p)
- ->Esperimento causale: esperimenti di tipo successo/insuccesso, vero/falso
- ->Spazio degli eventi: Ω = {V, F}
- ->Variabile aleatoria X assume valori in X ={0,1}
- FUNZIONE DI MASSA DI PROBABILITÀ: P(X = 0) = 1 - p , P(X = 1) = p
- p = parametro della distribuzione, corrisponde alla probabilità di successo.
- VALORE ATTESO: E[X] = 1 ⋅ P(X = 1) + 0 ⋅ P(X = 0) = p
- VARIANZA: Var(X) = p ⋅ (1 - p)
➔ BINOMIALE: X~Bin(n,p)
- ->Esperimento causale: n ripetizioni indipendenti di esperimenti di tipo successo/insuccesso, vero/falso
- Spazio degli eventi: {(F,F,...,F), (F,V,...,V), ..., (V,V,...,V)}\
- ->Variabile aleatoria Y indica il numero di successi nelle n prove e assume valori in Y ={0,1,...,n}. Essa è la somma di n variabili di Bernoulli indipendenti.
- Se Y1~Bin(n1, p) e Y2~Bin(n2, p) = Y1 + Y2~Bin(n1 + n2, p)
- FUNZIONE DI MASSA DI PROBABILITÀ: P(X = i) = (n i) pi(1 - p)n-i i = 0,1,...n
- p = parametro del modello, n è un intero essere assunto noto.
- Coefficiente binomiale= numero di combinazioni semplici di n elementi in classe i: n!/ i!(n-i)!
- VALORE ATTESO: E[X] = np
- VARIANZA: Var(X) = np ⋅ (1 - p)
T di STUDENT
Tn = Z/√(Cn/n)
Z = normale standard, Cn = chi-quadro
VALORE ATTESO: E[Tn] = 0 per n ≥ 2
VARIANZA: Var[X] = n/n-2 per n ≥ 3
P(Tn ≤ tα,n) = α
Fn,m di FISHER-SNEDECOR
Fn,m = Cm/m/Cn/m
P(Fn,m > fn,m,α) = α
VERIFICA DELLE IPOTESI
H0: ipotesi nulla da verificare su θaccetto H0 se (x1,x2,...,xn) ∉ C → C = regione critica
H1: ipotesi alternativa (H1 ≠ H0)
α = probabilità di errore di 1a SPECIE = probabilità che il campione cada nella regione critica
VERIFICA DI IPOTESI SU μ : μ ∼ N(μ, σ2), σ2 NOTA
H0: μ = μ0 vs H1: μ ≠ μ0
REGIONE CRITICA: C = (x1,x2,...,xn): |X̄ − μ0| > ccon X̄ = 1/n Σi=1n xi → stimatore puntuale per μ
ERRORE DI 1a SPECIE: α = P(errore di 1a specie) = Pμ0(|X̄ − μ0| > c) = 2P ( Z > c√n/σ = zα/2)→ c = zα/2 σ/√n
RIFIUTO H0 se → |X̄ − μ0| > zα/2σ/√no equivalentemente quando → |X̄ − μ0|/σ/√n| > zα/2
β = probabilità di errore di 2a SPECIE = probabilità di scegliere H0 pur essendo vero H1 (μ ≠ μ0)
β = Pμ(accettare H0) = Pμ[ |X̄ − μ0|/σ/√n| ≤ zα/2 ] = ϕ( μ0 − μ0 + zα/2) − ϕ( μ0 − μ/σ/√n − zα/2)
FUNZIONE POTENZA del test: 1 − β(μ)
DETERMINAZIONE DI n A PARTIRE DA β: β ≈ ϕ( μ0−μ/σ/√n − zα/2) n ≈ [ (zα/2+zβ)σ/(μ0−μ) ]2NUMEROSITA' CAMPIONARIA
P-VALUE:--> approccio alternativo alla verifica delle ipotesi
--> usa solo e si valuta la probabilità di osservare stime del parametro uguali o più estreme di quelle osservate sul campione
Una volta calcolato il valore di X̄−μ0/σ/√n si vedese è compreso nell’intervallo [−zα/2, zα/2 ]:-se è compreso → accetto H0-se non è compreso → rifiuto H0
P-VALUE:< - CASO UNIDIREZIONALE:p-value = 1 − ϕ( X̄−μ0/σ/√n )- rifiuto H0 se p-value < α- accetto H0 se p-value ≥ α- - CASO BIDIREZIONALE:p-value = 2 [ 1 − ϕ(X̄−μ0/σ/√n)]