Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
STATISTICA
1
CARATTERI
- le caratteristiche (nome, età, sesso,...)
- osservate sugli individui
MODALITÀ
- es: carattere sesso
- M
- F
UNITÀ STATISTICA
- ogni elemento su cui si osservano e lavorano: es. tabella con 5 persone
- unità statistica = 5
POPOLAZIONE
- insieme di tutte le unità statistiche
QUALITATIVI
- (modalità non numeriche)
- NOMINALI CONNESSI
- caratteri in cui le due modalità possono solo dirsi sinon… o …
- ORDINATI
- (c'è un ordinamento tra le modalità)
- l'ordinamento si può stabilire
QUANTITATIVI
- (modalità numeriche)
- DISCRETI
- (l'insieme delle modalità che possono assumere può essere messo in corrispondenza biunivoca con un sottoinsieme dei numeri interi)
- ad ogni modalità corrisp. un solo numero
- CONTINUI
- (in corrispondenza con un sottoinsieme dei numeri reali)
- TRASFERIBILI (es. ricchezza)
- NON TRASFERIBILI (es. peso)
DISTRIBUZIONE UNITARIA
- (assoc. carattere)
DISTRIBUZIONE UNITARIA MULTIPLA
- (p.d.i carattere)
SU SCALA DI RAPPORTI
- (altezza)
- c'è uno 0 assoluto naturale non arbitrario
SU SCALA DI INTERVALLI
- (temper.)
- c'è uno 0 assoluto naturale non arbitrario
x = temp in °C
y = temp in °F
y = αx + β
x
x + c
αx + β
α(x + c) + β
x + c
x
≠
α(x + c) + β
αx + β
Quando non c'è 0 naturale non ha senso fare i rapporti
Distribuzione e rappresentazione
Frequenza assoluta
- numero di unità statistiche che assumono una determinata modalità (es. fare il conteggio)
nj
- indice che indica la modalità
n1 = 65 n2 = 35
EA e EC sono modalità → Xj MODALITÀ
Xj
nj
x1
x2
n1
n2
N = Σj=1k nj
CON FREQUENZA ASSOLUTA
nj frequenza assoluta | area indici frequenza
hj densità=[nj / aj] (altezza)
Se unissimo le ultime due classi:
- aj = ampiezza degli estremi considerati
- nj = frequenza assoluta | area indici frequenza
- hj = densità = Fm - Fm-1
Om
⇒ Om = dm
⇒ Me = Im + 0,5·Fm-1·Om / Fm-Fm-1
5) \(\overline{y} = \alpha\overline{x} + \beta\)
\(\overline{y}\) la media aritmetica di un carattere
\(y\), ottenuto attraverso una trasformazione
lineare \(\overline{y} = \alpha x + \beta\) di un carattere \(X\)
di medio \(\overline{X} = ...\) uguale a...
Dim.
\(\frac{1}{N\)} \(\left(\sum_{i=1}^{N}\right)\) = \(\frac{1}{N\)} \(\left(\sum_{i=1}^{N}\right)\) (\(\alpha x_i + \beta\)) = \(\frac{1}{N\)} \(\left(\sum_{i=1}^{N}\right)\) \(\alpha x_i\) + \(\frac{1}{N\)} \(\left(\sum_{i=1}^{N}\right)\) \(\beta\)) =
= \(\alpha\frac{1}{N\)} \(\left(\sum_{i=1}^{N}\right)\) \(x_i\) + \(\beta\frac{1}{N\)} \(\left(\sum_{i=1}^{N}\right)\) 1
queste proprietà vale solo per trasformazioni lineari
es. \(y = x^2\) \(y = e^x\)
\(\sqrt{y}\sqrt{x}\) \(y + e^x\) (non vale)
_ _ 0 _ _ 0 _ _ 0 _ _ 0 _ _
Una caratteristica della media è quella di essere molto
sensible ai valori estremi
es. 18 20 25 27 300 -> media altissima -> mediana = 25 (non risente dei
valori anomali)
-> mediana viene detta
misura robusta (robustezza)
Cosa succede con un cambio di unità di misura?
X = altezza in m
Y = altezza in cm
Y = 100 X (β=0)
\( \bar{Y} = 100 \bar{X} \)
\( \bar{y} = 100 \bar{x} \)
6ᵧ = 100 6ₓ
In generale: CVᵧ = 6ᵧ / \(\bar{y}\) = \(\alpha\) 6ₓ / \(\alpha\)\(\bar{x}\) = CVₓ
COEFFICIENTE DI VARIAZIONE
\(CV_{y} = \frac{6_{y}}{\bar{y}} = \frac{100 6_{x}}{100 \bar{x}} = CV_{x}\)
(per caratteri, quantità espresse in scala o da rapporti)
STANDARDIZZAZIONE
\(Y = \frac{X - \bar{X}}{6_{x}}\) - un particolare tipo di trasformazione lineare
\( = \frac{1}{6_{x}}\) X \( = \frac{X}{6_{x}}\)
\( \bar{Y} = \alpha x + \beta \frac{1}{6_{x}} X = \frac{X}{6_{x}} = 0 \)
\( 6 \bar{y} = α² 6_{x²} + \frac{1}{6_{x}}^ 6\)
= 1
Distribuzione Frequenze Congiunte
vedere i caratteri in relazione tra loro
- qualitativi
- quantitativi
distribuzione di frequenze assoluta congiunta
frequenza assoluta marginale di X
frequenza assoluta marginale di Y
tabelle doppie frequenze assolute
distribuzione di frequenze assolute congiunte di due cose
frequenze assolute congiunte che indicano quante unità statistiche presentano la stessa modalità per il carattere X e la j-esima modalità per il carattere Y
INDIPENDENZA/DIPENDENZA
es. voti esami
- X: 22 25 26 28
- M: 2 3 4 1 = 10
- F: 4 6 8 2 = 20
chi è il più bravo?
- =
- 22 25 26 28
- M: 2 3 4 1 = 10
- F: 4 6 8 2 = 20
- 6 9 12 3 30
chi è il più bravo?
- =
ma perché?
Devo vedere frequenze relative condizionate
- (dist. di freq. rel. cond. di Y supp. X)
- 22 25 26 28
- M: 0,2 0,3 0,4 0,1
- F: 0,2 0,3 0,4 0,1
- 0,2 0,3 0,4 0,1
le freq. rel. som =
- INDIPENDENZA
- la distribuzione di Y non dipende da X
indipendenza di Y ed X
Questo è un caso di indipendenza perfetta
- le freq. rel. coincidono con le marginali
Altro es.
- 22 25 26 28
- M: 2 1 1 6 = 10
- F: 5 2 2 1 = 10
- 20
- “OGGI” DIPENDENZA
- ma ci serve un indice a che ci dice se siamo vicini a indp. o dip.
Nel nostro caso (3)
nij
25 26
M 5 5
F 5 5
10:10
25 26
M 5 5
F 5 5
→ (0-5)2
5 = 5
χ2 = 20 (somma dei 5 dentro la tabella)
Φ2 = 1
V = 1
Considerando le medie condizionate
22 25 26 28
M 2 3 4 1 10
F 2 3 4 1 10
Y̅M=F
Y̅X = Y̅M=F
Non c’è indipendenza
Y̅X=1 = 25,1
Y̅X+F=1 = 25,1
→ INDIPENDENZA IN MEDIA (medie condizionate sono uguali)