Indice
- Pag 3 La variabilità, intervalli di variazione
- Pag 4-5 La varianza e le sue proprietà
- Pag 6-7 La diseguaglianza di Tchebychev, mutabili/variabili statistiche bivariate, la distribuzione di frequenze congiunte
- Pag 8 La variabile statistica condizionata, medie e varianze condizionate
- Pag 9 La covarianza
- Pag 10 Le proprietà della covarianza, coefficiente di correlazione lineare
- Pag 11 Combinazione lineare di variabili statistiche
Uno strumento grafico per la variabilità e simmetria di una distribuzione: il box-plot
Come si rappresenta
Sul piano cartesiano rappresento un rettangolo centrato di base un segmento i cui estremi sono sul 1° e 3° quartile. Ai lati della scatola si aggiungono due segmenti (baffi) con estremi il valore minimo e massimo dei dati. Se la scatola è centrata sui baffi e la mediana poggia sul punto medio della scatola, si ha distribuzione simmetrica.
La variabilità rispetto a un valore medio
Per quanto riguarda la dispersione dei dati attorno a un valore medio, la misura di variabilità più utilizzata è la varianza.
La varianza
Si dice varianza la media aritmetica dei quadrati degli scarti di ogni singola modalità dalla media aritmetica della variabile statistica. La formula è V[X] = (1/n) Σ (x_i - μ_x)2 ⋅ n_i oppure V[X] = E[(X - E[X])2].
Lo scarto quadratico medio
È la radice della varianza, cioè:
Esempio: 18 19 20 21 22 27 V(x) = (18-20)2 * 5 + (19-20)2 * 10 + (22-20)2 * 5 = 1333/45 = σx2
Proprietà della varianza
- La varianza è positiva o nulla. V(x) > 0
- Può essere vista come V[x] = E[x2] - (E[x])2
- È il valore assunto delle funzioni. Data la variabile statistica con μx e σx2, la varianza della trasformata y = a + b * x è data da V[y] = b2 * V[x]
Esempio: uno stipendio del primo mese da 35 dipendenti. Pagamento base 800€ e ore di straordinario = 25€. y = 800 + 25 x Si sa che E[y] = 800 + 25 E[x] e che V[y] = b2 * V[x] Avviene che 804 * 25 - 9.458 = 1038 458 = E[y] o che V[y] = 252 * 22,498 = 14672,78
Procedura di standardizzazione
Con la trasformazione lineare si hanno media nulla e varianza unitaria:
E[z] = 0
V[z] = 1
Diseguaglianza di Tchebychev
Data una variabile statistica X con μx e σx2, la proporzione di unità statistiche per cui X(ω) risulta esterno all'intervallo [μx - Kσx, μx + Kσx] è non maggiore di 1/K2, con K > 0. Tchebychev fornisce anche informazioni sulle unità all'interno dell'intervallo. La proporzione di unità statistiche appartenenti all'intervallo è maggiore di 1 - 1/K2.
Esempio: μx = 34,42
Capitolo 7: Statistiche bivariate
L'applicazione che associa a ciascuna unità wi di Ω un solo elemento dell'insieme Hx × H2 viene detta:
- Variabile statistica bivariata (A, B) se gli elementi di H1 e H2 sono ambedue
- Variabile statistica bivariata cl(x, Y)
- Variabile statistica mista (X, Y)
-
Statistica - Fondamenti Statistica Descrittiva
-
Statistica - Fondamenti Statistica Descrittiva
-
Statistica - fondamenti statistica descrittiva
-
Appunti Statistica