Estratto del documento

STAT. DESCRITTIVA

X = matrice dei dati

X = [xij]

elementi della matrice

  • (non per forza numeri)

v2 = risultato blu

v1 = risultato rosso

x -> minuscolax -> maiuscola

campione = insieme unita' statistiche

righe -> omogeneecolonne -> non sempre omogenee

STAT. UNIVARIATA

1 sola colonna omogeneita' delle features

X =

(x1, x2, x3, .., xn) (Xi) i = 1,.. n

tipi di dati

  • Qualitativi (categorici)

nominali: (es. maschio/femmina) -> Xi e' una categoriaXi ∈ {c1, c2, ...}

ordinali: (es. taglie vestiti categorie che hanno un ordine)Xi ∈ {c1, c2, ... ck}con c1 ≤ c2 ≤ ... ≤ ck

Xi ∈ una categoria "ordinata"

  • Quantitativi (numerici)

discreti: Xi ∈ insieme finito/infinito numerabile e CR (es. eta’ angrafica) voto in 30esimi

continui: Xi ∈ insieme infinito e non numerabile e CR (cardinalita' infinita) tonalita’ infinita(es. temperatura stelle nella galassia)

STAT. DESCRITTIVA

X = matrice dei dati

X = [ xij ]

elementi della matrice

vz = risultato blu

v1 = risultato rosso

NB

x → minuscola

X → maiuscola

campione = insieme unità statistiche

STAT. UNIVARIATA

1 sola colonna omogeneità delle features

X -

(x1, x2, x3, ..., xn) (Xi) i = 1, ..., n

tipi di dati

Qualitativi (categorici)

  • nominali: (es. maschio/femmina) → Xi è una categoriaXi ∈ {c1, c2, ...}
  • ordinali: (es. taglie vestiti) categorie che hanno un ordine, → Xi ∈ {c1, c2, ..., ck}con c1 ≤ c2 ≤ ... ≤ ck

Quantitativi (numerici)

  • discreti: Xi ∈ insieme finito/infinito numerabile e CR (es. età anagrafica) (voto in 30esimi)
  • continui: Xi ∈ insieme infinito e non numerabile e CR (cardinalità infinita) (temperatura stelle nella galassia)

Indici Statistici

dati numerici

indici di posizione

  • media campionaria: n1i=1n xi (baricentro, migliore approssimazione deterministica dei dati)

indici di dispersione

  • varianza campionaria: S2 = n-11i=1n (xi - ∑)2 (quadrato perché >= sempre > 0 )
  • deviazione standard campionaria: s = √ S2

→ Indici robusti (robusti rispetto alla presenza di outlier nel dataset)

  • medie trimmed
  • mediana campionaria = med(X)

dato un dataset di n punti, → se n = dispari, c'è un numero che divide in due parti di ugual peso il dataset

  • Q1(X) = QX) = intervallo interquartile

Quartili Campionari

  • Q1 (25%/75%)
  • Q2 (50%/50%)
  • Q3 (75%/25%)

dividono la nuvola di punti in 4 parti (25%) di igual peso

n = 3

0.25 = 1.75

Questi quartili possono essere punti/intervalli

  • tendenzialmente punto centrale

dataset

Indici Statistici

dati categorici

x1, x2, x3, ... xn ∈ {C1, C2, ... Cs}

i = 1, ..., n   g = 1, ..., G

numero dati

numero possibili categorie

Frequenze assolute campionarie

ng = ni=1Σ 1xi = Cg

Funzione indicatrice

→ valore SE la condizione in input è vera, valore 0 se è falsa

NB

La somma delle Freq. ass. è n

Gg=1Σ ng = n

Frequenze relative campionarie

Fg = ngn

→ proporzione di volte che ho osservato classe g-esima

NB

Gg=1Σ Fg = 1

Moda campionaria = valore che massimizza le frequenze assolute relative

fmoda = max Fg g= 1, ..., G

(se la maggior parte sono bocciati → fmoda = bocciato)

Entropia campionaria (Dispersione)

entropy = Gg=1Σ g2

Anteprima
Vedrai una selezione di 7 pagine su 26
Statistica Pag. 1 Statistica Pag. 2
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Statistica Pag. 6
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Statistica Pag. 11
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Statistica Pag. 16
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Statistica Pag. 21
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Statistica Pag. 26
1 su 26
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher elisabetta.tea di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Politecnico di Milano o del prof Vantini Simone.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community