Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Statistica Lez 1
Osservazioni su variabile X (x1, x2, x3, ..., xm)
- Variabili
- Tipo qualitativo
- Tipo ordinabile
- Esempio: giudizi come buono, distinto, ottimo...
- Tipo non ordinabile
- Esempio: gusti di gelato nocciola, pistacchio, fragola...
- Tipo ordinabile
- Tipo quantitativo
- Discrete
- Esempio: numero figli o esami fatti
- Continue
- Esempio: altezza, peso
- Discrete
- Tipo qualitativo
La statistica permette di passare dalle osservazioni x1, x2, x3, ..., xm a una classificazione che le aggruppa in classi omogenee al loro interno ed eterogeneità di loro
Il numero delle classi Mi dovrà essere molto minore delle osservazioni N
x1, x2, x3, ..., xm
Studiare delle diverse modalità della caratteristica X
Con le classi perdo il collegamento con le unità statistiche che si mischiano e raggruppano
Numero di unità statistiche che presentano la prima modalità X detta primaria
Modalità della caratteristica X
Mo = la prima modalità della caratteristica X
∑i=1mmi = n
Esempio variabile qualitativa ordinabile
Mi Xi i m1 Frequenza assoluta
1 2
2 3
2 7
Xi mi
1 2
2-3 3
4 2
7
Diviso per l'ampiezza [Non c'importa il valore dei numeri ma quanti numeri sono]
mi = Xi
3 / 2
Perché 2 e 3 sono 2 numeri
una delle due ha ampiezza 3 e
nell'istogramma di frequenze la disposizione
cambia perché non posso mettere 6 quadretti
devo pensarlo come se avess. 6 unità
statistiche perchè ne ha 3 quali: devo
fare la media 3:2 = 1,5. ∞ vuote della
base mentre 1 sul 2 1 muto sul 3.
La media aritmetica gode di 5 proprietà
1) Proprietà di identità di somma
∑i=1mxᵢ = m * x̄
In un'operazione complessa del calcolo i valori di prodotto tra il numero di osservazioni per la media aritmetica
2) Proprietà di nullità degli scarti
∑ (xᵢ - x̄) = 0
La somma per i che va da 1 a m di xᵢ - meno la media è uguale a 0
3) Proprietà di minimo quadrato degli scarti
∑i=1m (xᵢ - x̄)² = min
DIM∑i=1m (xᵢ - c)² = ∑i=1m (xᵢ - c + x̄ - x̄)² = ∑i=1m [(xᵢ - x̄) + (x̄ - c)]² =
= ∑i=1m [(xᵢ - x̄)² + (x̄ - c)² + 2(xᵢ - x̄)(x̄ - c)] =
= ∑i=1m (xᵢ - x̄)² + ∑i=1m (x̄ - c) + ∑i=1m 2(x̄ - c)(xᵢ - x̄) =
= ∑i=1m (xᵢ - x̄)² + m(x̄ - c)² + 2 * (x̄ - c) ∑i=1m (xᵢ - x̄) =
= ∑i=1m (xᵢ - x̄)² + m(x̄ - c)²
Indicatori di posizione
- Mediana → qualitativi ordinabili
- Moda → valore al quale corrisponde la frequenza più elevata
Media aritmetica ponderata
- 1Xi voto 27, 28, 24
- 1CFU 6, 12, 11
xXpn = ∑i=1m Xi Wi / ∑i=1m Wi
xX- = ∑k=1m Xi ηi Wi / ∑mn=1 Mi Wi
Media aritmetica trimmed
Visto che la media è sensibile ai valori estremi in questa versione questi ultimi vengono tagliati.
Una media trimmed al 50% vuol dire che negli estremi di media setto ho tolto il 25% più basso e il 25% più alto.
Una trimmed al 80% → tolgo 10% più basso e 10% più alto
2) MASSIMA CONCENTRAZIONE: tutte le unità non hanno nulla tranne una unità che ha l'ammontare complessivo del carattere.
X1 = X2 = ... Xn-1 = 0
XM = ∑ x = n x̄
RAPPORTO DI CONCENTRAZIONE DI GINISi riferimento a 2 oggetti: le FREQUENZE CUMULATE DELLA POPOLAZIONEX1, X2, ... Xm ORDINATI
Fi = ȳi / n Ai = X1 + X2 + ... Xi
Ai / A = Qi: FREQUENZE CUMULATE DEL CARATTERE
SE Fi = Qi: HO EQUIDISTRIBUZIONE [85 10% pop poneva ha il 10% del reddito]
CON IL CARATTERE ORDINATO L'ALTERNATIVA È CHE Fi > Qi
R = ∑ (Fi - Qi) m+1 i=1 TANTO PIÙ È MAGGIORATO TANTO PIÙ C'È CONCENTRAZIONE
Ε' UN INDICATORE NORMALIZZATO CHIASSI MANIERA TRA 0 E 1 CURNO E DIVISOPER IL SUO MASSIMO, LO 0 E L'EQUIDISTRIBUZIONE E L'1 E LA MASSIMA CONCENTRAZIONE
L’assimmetria si misura facendo riferimento ai momenti della distribuzione.
Il momento primo:
- m1 → x̄ = 1/n ∑ixi = x̄
Momento secondo:
- m2 = 1/n Σi (xi - x̄)2 = σ2
Momento terzo:
- m3 = 1/n Σi (xi - x̄)3
Momento quarto:
- mu = 1/n Σi (xi - x̄)u
Indice di asimmetria
Indice Fisher
β = M3/σ3
L’indice = 0 nel caso di distribuzione simmetrica, >0 nel caso di asimmetria positiva e <0 nel caso di asimmetria negativa.
Con asimmetria positiva la media aritmetica > mediana mentre con asimmetria negativa il contrario. In caso di distribuzione simmetrica x̄ = x̄me.
Frequenze Teoriche
mi,j* = mi,0 * m0,j / n
m*1,1 = m1,0 * m0,1 / n
m*i,s = mi,0 * m0,s / n
Questa cosa non vale per la dipendenza
mi,j = m*i,j ⇨ indipendenza
mi,j - m*i,j = ci,j ⇨ il valore è noto come contingenza
I valori teorici sono sempre ≠ 0
Solo se X e Y sono qualitative e simmetriche (cioè se X indipendente da Y anche Y è indipendente da X)
RAPPORTO DI CORRELAZIONE η2
η2 = VARIANZA TRA/VARIANZA TOTALE
η2 = 1/n ∑j=1k (x̄j - x̅ )2 nj/1/n ∑i=1n (xi - x̅ )2
È un rapporto tra una parte e il tutto, visto che la varianza totale è il tutto col massimo l'indicatore
0 ≤ η2 ≤ 1
η2 = 0 ⇒ TUTTE LE MEDIE PARZIALI SONO UGUALI TRA LORO E SONO UGUALI A x̅.
x̄j/x̄ = x̅ ∀ j
η2 = 1 ⇒
VARIANZA TRA = VARIANZA TOTALE
QUANDO LA VARIANZA ENTRO = 0 E ANNULLA LA VARIANZA TOTALE. LA VARIANZA ENTRO È UGUALE A 0 QUANDO DENTRO AI GRUPPI NON C'È VARIABILITÀ, LE VARIANZE ENTRO I GRUPPI SONO NULLE.
Y1YkX13000000000XM1020
Nelle distribuzioni sparse in tutti gli n2 forme un elemento ho la variabilità massima
ossia tutti numerati negli n2
ossia assenza di variabilità