Anteprima
Vedrai una selezione di 6 pagine su 24
Formulario di Statistica Pag. 1 Formulario di Statistica Pag. 2
Anteprima di 6 pagg. su 24.
Scarica il documento per vederlo tutto.
Formulario di Statistica Pag. 6
Anteprima di 6 pagg. su 24.
Scarica il documento per vederlo tutto.
Formulario di Statistica Pag. 11
Anteprima di 6 pagg. su 24.
Scarica il documento per vederlo tutto.
Formulario di Statistica Pag. 16
Anteprima di 6 pagg. su 24.
Scarica il documento per vederlo tutto.
Formulario di Statistica Pag. 21
1 su 24
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Statistica Descrittiva

  • Distribuzioni

Frequenza Assoluta: f

Frequenza Relativa: fᵣ = f/n n = num. tot. di eventifᵣ% = f/n * 100

Frequenza Cumulata: f꜀ = disporre in ordine crescente le variabili ecalcolare le fᵣ di ognuna:

  • f꜀ del 1° elemento = f₁ᵣ
  • f꜀ del 2° elemento = somma delle sue fᵣe quelle del 1° elemento
  • f꜀ del 8° elemento = somma della sue fᵣ,del 7° e del 1°
  • ...
  • f꜀ ultimo elemento = 100%

Ampiezza Classi = V.max - V.min/num di classi

Grafici:- A Barre: Vₒ = qualitative o quantitative discrete- A Torta: Vₒ = qualitative- Istogramma: V = qualitative continue- Ogliva: V = quantitative continue- Ramo-Foglia: V = qualitative

Indici di Tendenza Centrale

Media:x̄ = X₁ + X₂ + ... + Xₙ/n = 1/ni=1n Xi

Media di popolazione: M = 1/Ni=1N XiN = una statistica che costituisce la popolazionen = campione modellistico che la variabileVᵢ assume nel campione

- Con frep Amm.: x̄ = 1/ni=1n βi Vi

- Con frep Rel.: x̄ = ∑i=1n fri Vi

Moda = valore più frequente

Mediana = valore centrale in una serie ordinata di n valori- n dispari: median occupa la posizione(n + 1)/2- n pari: median è la media tra i valori di posizionen/2 e (n/2 + 1)

Quartili:1° quartile (Q1) = mediana dei valori minori2° quartile (Q2) = mediana3° quartile (Q3) = mediana dei valori maggiori

Box-Plot[1]:a = max {Xmin, Q1 - 1,5 (Q3 - Q1)}b = min {Xmax, Q3 + 1,5 (Q3 - Q1)}

Indici di Variabilità

Campo di Variazione = Xmax - Xmin

Varianza Campionaria: S2 = (xi - x̄)2

Varianza della Popolazione: σ2 =

Momento N-esimo: μn = (xi)n

Deviazione Standard: σ = √(xi - μ)2

Deviazione Standard Campionaria: s = √(xi - x̄)2

Coefficiente di Variazione: CV = σ / |μ|

Differenza Interquartile: DQ = Q3 - Q1

Covarianza: cov(x, y) = (xi - x̄)(yi - ȳ)

Indice di Correlazione: r = (xi - x̄)(yi - ȳ) / SxSy

Variabili

  • Qualitative: esprimono una caratteristica
    • Nominali: non ordinabili
    • Ordinali: ordinabili
  • Quantitative: misurano una quantità
    • Discrete: sono valori interi (es. numero di)
    • Continue: assumono infiniti valori compresi in un intervallo

VARIABILI ALEATORIE DISCRETE

FUNZIONE DI MASSA DI PROBABILITÀ: P(x) := P(X = x)

  • P(x) > 0 ∀ x ∈ X
  • P(x) = 0 ∀ x ∉ X
  • Σx∈X P(x) = 1

FUNZIONE DI RIPARTIZIONE: F(a) := Σx≤a P(x)

COPPIE DI VARIABILI ALEATORIE DISCRETE

FUNZIONE DI RIPARTIZIONE:

  • → CONGIUNTA: F(x, y) := P(X ≤ x, Y ≤ y)
  • → MARGINALE x: FX(x) = P(X ≤ x, Y < ∞)
  • → MARGINALE y: FY(y) = P(X < ∞, Y ≤ y)

FUNZIONE DI MASSA DI PROBABILITÀ:

  • → CONGIUNTA: p(xi, yj) = P(X = xi, Y = yj)
  • → MARGINALE x: pX(xi) := Σj P(X = xi, Y = yj)
  • → MARGINALE y: pY(yj) := Σi P(X = xi, Y = yj)

INDIPENDENZA V.A. DISCRETE: p(x, y) = pX(x)pY(y)

FUNZIONE DI MASSA DI PROBABILITÀ CONDIZIONATA: pX|Y(x|y) = P(X=x,Y=y)/ P(Y=y) = pXY(x,y) / pY(y), pY(y) > 0

VALORE ATTESO: E[X] := Σi xip(xi)

FUNZIONE GENERATRICE DEI MOMENTI: φ(t) := EX[etX] = Σx etxp(x) ∀t ∈ ℝ

MODELLI PER VARIABILI ALEATORIE DISCRETE

➔ BERNOULLI: X~Ber(p)

  • ->Esperimento causale: esperimenti di tipo successo/insuccesso, vero/falso
  • ->Spazio degli eventi: Ω = {V, F}
  • ->Variabile aleatoria X assume valori in X ={0,1}
  • FUNZIONE DI MASSA DI PROBABILITÀ: P(X = 0) = 1 - p , P(X = 1) = p
  • p = parametro della distribuzione, corrisponde alla probabilità di successo.
  • VALORE ATTESO: E[X] = 1 ⋅ P(X = 1) + 0 ⋅ P(X = 0) = p
  • VARIANZA: Var(X) = p ⋅ (1 - p)

➔ BINOMIALE: X~Bin(n,p)

  • ->Esperimento causale: n ripetizioni indipendenti di esperimenti di tipo successo/insuccesso, vero/falso
  • Spazio degli eventi: {(F,F,...,F), (F,V,...,V), ..., (V,V,...,V)}\
  • ->Variabile aleatoria Y indica il numero di successi nelle n prove e assume valori in Y ={0,1,...,n}. Essa è la somma di n variabili di Bernoulli indipendenti.
  • Se Y1~Bin(n1, p) e Y2~Bin(n2, p) = Y1 + Y2~Bin(n1 + n2, p)
  • FUNZIONE DI MASSA DI PROBABILITÀ: P(X = i) = (n i) pi(1 - p)n-i i = 0,1,...n
  • p = parametro del modello, n è un intero essere assunto noto.
  • Coefficiente binomiale= numero di combinazioni semplici di n elementi in classe i: n!/ i!(n-i)!
  • VALORE ATTESO: E[X] = np
  • VARIANZA: Var(X) = np ⋅ (1 - p)

T di STUDENT

Tn = Z/√(Cn/n)

Z = normale standard, Cn = chi-quadro

VALORE ATTESO: E[Tn] = 0 per n ≥ 2

VARIANZA: Var[X] = n/n-2 per n ≥ 3

P(Tn ≤ tα,n) = α

Fn,m di FISHER-SNEDECOR

Fn,m = Cm/m/Cn/m

P(Fn,m > fn,m,α) = α

VERIFICA DELLE IPOTESI

H0: ipotesi nulla da verificare su θaccetto H0 se (x1,x2,...,xn) ∉ C → C = regione critica

H1: ipotesi alternativa (H1 ≠ H0)

α = probabilità di errore di 1a SPECIE = probabilità che il campione cada nella regione critica

VERIFICA DI IPOTESI SU μ : μ ∼ N(μ, σ2), σ2 NOTA

H0: μ = μ0 vs H1: μ ≠ μ0

REGIONE CRITICA: C = (x1,x2,...,xn): |X̄ − μ0| > ccon X̄ = 1/n Σi=1n xi → stimatore puntuale per μ

ERRORE DI 1a SPECIE: α = P(errore di 1a specie) = Pμ0(|X̄ − μ0| > c) = 2P ( Z > c√n/σ = zα/2)→ c = zα/2 σ/√n

RIFIUTO H0 se → |X̄ − μ0| > zα/2σ/√no equivalentemente quando → |X̄ − μ0|/σ/√n| > zα/2

β = probabilità di errore di 2a SPECIE = probabilità di scegliere H0 pur essendo vero H1 (μ ≠ μ0)

β = Pμ(accettare H0) = Pμ[ |X̄ − μ0|/σ/√n| ≤ zα/2 ] = ϕ( μ0 − μ0 + zα/2) − ϕ( μ0 − μ/σ/√n − zα/2)

FUNZIONE POTENZA del test: 1 − β(μ)

DETERMINAZIONE DI n A PARTIRE DA β: β ≈ ϕ( μ0−μ/σ/√n − zα/2) n ≈ [ (zα/2+zβ)σ/(μ0−μ) ]2NUMEROSITA' CAMPIONARIA

P-VALUE:--> approccio alternativo alla verifica delle ipotesi

--> usa solo e si valuta la probabilità di osservare stime del parametro uguali o più estreme di quelle osservate sul campione

Una volta calcolato il valore di X̄−μ0/σ/√n si vedese è compreso nell’intervallo [−zα/2, zα/2 ]:-se è compreso → accetto H0-se non è compreso → rifiuto H0

P-VALUE:< - CASO UNIDIREZIONALE:p-value = 1 − ϕ( X̄−μ0/σ/√n )- rifiuto H0 se p-value < α- accetto H0 se p-value ≥ α- - CASO BIDIREZIONALE:p-value = 2 [ 1 − ϕ(X̄−μ0/σ/√n)]

Dettagli
Publisher
A.A. 2022-2023
24 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Giuliab17 di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Firenze o del prof Corradi Fabio.