Riassunti di statistica descrittiva
Grafico box plot / diagramma a scatola e baffi
Grafico Box-Plot (per dispersione dati): Per tale grafico occorrono: la mediana (Me), i quartili (Q1-Q3), il valore minimo e massimo (Xmin, Xmax) ed i limiti inferiore e superiore (Linf, Lsup).
Se nella distribuzione non ci sono valori anomali (troppo grandi o troppo piccoli), i baffi della scatola sono dati da Xmin - Xmax. Questo grafico può essere usato nel caso di un confronto del reddito in più paesi, sovrapponendo i relativi profili (rappresentazioni multi-dimensionali).
Esempio:
Me = 1575
Q1 = 1062.5
Q3 = 1767.46
Xmin = 800
Xmax = 3000
Lsup = Q3 + 1.5 * Q = 1767.46 + 1.5 * (1767.46 - 1062.5) = 2825.9
I valori al di sopra di 2825.9 sono anomali (3000 = il più grande) → si riduce il baffo = 3000 viene rappresentato con un *. Questo può legare che la distribuzione presenta un valore anomalo. Tutti i valori dopo l'estremo superiore che sono una volta e mezzo la differenza interperiquartile, sono valori anomali).
Linf = Q1 - 1.5 * Q = 1062.5 - 1.5 * (1767.46 - 1062.5) = 46.6 (valori più piccoli di 46.6 = valori anomali) → il baffo resta sul valore minimo.
N.B. il limite inferiore può essere negativo.
Studio della relazione tra due variabili
Esistono tre tipi di tabelle per tale studio:
- Tabella di contingenza per lo studio della relazione tra due variabili di tipo qualitativo;
- Tabella di correlazione per lo studio della relazione tra due variabili di tipo quantitativo;
- Tabella mista per lo studio delle relazioni tra una variabile qualitativa e una quantitativa (indipendentemente dell'ordine).
Indice di connessione (chi-quadro)
Indice che studia la relazione tra le variabili qualitative è il CHI-QUADRO = X2
Esempio:
Tabella Frequenze Empiriche
Tabella Frequenze Teoriche (che si calcola grazie alla prima tabella)
N.B. In questo caso si dice che c'è associazione tra le variabili dato che sono diverse. → M11/m1 = M12/m2 = M1./M
L'associazione è un concetto simmetrico che non dipende da legami di causazione in quanto una variabile non dipende dall'altra. Dalla formula precedente si ricava: (emp. con) Condizione di perfetta indipendenza statistica tutte le righe di tutte le colonne marginali di colonne in relazione. Non c'è distinzione dei gruppi, né per righe né per colonne. Da quest'equazione si possono estrarre le frequenze congiunte teoriche ovvero le frequenze che si dovranno osservare nel caso di perfetta indipendenza statistica.
Il valore minimo dell'indice è 0, nel caso di perfetta indipendenza statistica. Il valore massimo è dato da m · min(R-1, C-1) dove R è il numero della righe e C è il numero delle colonne. N.B. Il valore massimo ovviamente cambia da scenario a scenario. 27·(R · CminR-12-1)=27· 127, cioè il caso di massima commessione per questa tabella.
Tabella delle contingenze (continuazione dell'esempio): Le tabelle delle contingenze si ricava con sottraendo -1: valore teorico al valore osservato (valore osservato - valore teorico). N.B. La somma per riga e per colonna deve essere circa 0.
| M | F | ||
|---|---|---|---|
| B | (0,22) | 3-2,78 | 0 |
| C | 0,88 | -0,89 | 0 |
| R | -1,12 | 1,11 | 0 |
| 0 | 0 | 0 |
Il risultato consiglia di non diversificare tra M e F.
-
Riassunti di statistica descrittiva (1)
-
Riassunti Statistica
-
Riassunti statistica
-
Riassunti Statistica