Analisi dei dati
Osservazione
Il passaggio dalla tabella "unità x variabili" alle distribuzioni di frequenze ci permette di sintetizzare e evidenziare la struttura del collettivo rispetto alle caratteristiche osservate.
Dist. Unitaria → Dist. Frequenze ← Dist. Unitaria → Dist. Frequenze
Distribuzione di quantità
Ammontare dei protesti nel 1981 secondo il tipo del titolo di credito. Descrive come l’ammontare di un carattere si distribuisce rispetto alle modalità di un altro carattere.
| Tipo di titolo di credito | Ammontare dei titoli protestati (in migliaia di euro) |
|---|---|
| Cambiale ordinaria | 1458,24 |
| Tratta | 2396,30 |
| Assegno Bancario | 603,66 |
| Totale | 4458,20 |
| Tipo di titolo di credito | Numero dei titoli protestati |
|---|---|
| Cambiale ordinaria | 4094183 |
| Tratta | 4003460 |
| Assegno Bancario | 373513 |
| Totale | 8471156 |
Rappresentazioni grafiche
Obiettivo: illustrare mediante figure, linee o segmenti, superfici o aree, solidi, simboli convenzionali una distribuzione di frequenza o di intensità di un carattere in funzione delle sue modalità, in modo da rendere maggiormente evidenti le caratteristiche del carattere sul collettivo in esame. Per ogni distribuzione statistica e carattere statistico esiste il tipo di rappresentazione grafica adatta.
Grafici a torta (pie charts)
Qualsiasi tipo di carattere, in particolare mutabili sconnesse. Distribuzioni semplici di quantità o di frequenza utili per rappresentare la composizione di un aggregato. Forma: fetta (o spicchio) o settore circolare della torta → una modalità del carattere.
L'angolo al centro di uno spicchio è proporzionale alla frequenza con cui si realizza la modalità adesso associata.
Distribuzione degli studenti per lettura dei quotidiani
| Lettura quotidiani | nj | fj | pj |
|---|---|---|---|
| Sì | 150 | 0,530 | 53,0 |
| No | 133 | 0,470 | 47,0 |
| Totale | 283 | 1,000 | 100,0 |
Gli studenti e la lettura dei quotidiani: 53% Sì, 47% No.
Grafici a barre e a nastri
Mutabili sconnesse e ordinate. Distribuzioni semplici di quantità o di frequenza. Ogni frequenza (assoluta, relativa o percentuale) o intensità della distribuzione viene rappresentata da una barra o da un nastro.
Grafico a barre
Successione di rettangoli verticali equidistanti aventi la stessa base e le altezze proporzionali alle frequenze o alle quantità della modalità corrispondente. Adatto a mutabili ordinate.
Grafico a nastri
Rettangoli orizzontali sovrapposti aventi tutti la stessa altezza e le basi proporzionali alle frequenze o quantità della modalità corrispondente. Adatto a mutabili sconnesse.
Grafico a barre per la distribuzione degli studenti secondo la soddisfazione della scelta universitaria
| Soddisfazione | nj | fj | pj |
|---|---|---|---|
| Per nulla | 4 | 0,014 | 1,4 |
| Poco | 34 | 0,120 | 12,0 |
| Abbastanza | 185 | 0,654 | 65,4 |
| Pienamente | 60 | 0,212 | 21,2 |
| Totale | 283 | 1,000 | 100,0 |
La soddisfazione degli studenti: 1,4% Per nulla, 12% Poco, 65,4% Abbastanza, 21,2% Pienamente.
Grafico a nastri per la distribuzione degli studenti per corso di laurea
| CDL | nj | fj | pj |
|---|---|---|---|
| STC | 152 | 0,537 | 53,7 |
| SCPO | 124 | 0,438 | 43,8 |
| SCOSV | 7 | 0,025 | 2,5 |
| Totale | 283 | 1,000 | 100,0 |
Studenti per corso di laurea: 53,7% STC, 43,8% SCPO, 2,5% SCOSV.
Grafico a barre o a nastri multiplo
Mutabili sconnesse e ordinate. Rappresentazione contemporanea di più distribuzioni semplici di quantità o di frequenza dello stesso carattere osservato su collettivi diversi. Utilità: confronto per ciascuna modalità tra le diverse frequenze con cui tale modalità è stata osservata nei differenti collettivi.
Grafico a barre multiplo per la distribuzione degli occupati per settore di attività economico
| Settore attività economico | nj Rieti | pj Rieti | nj Lazio | pj Lazio | nj Centro | pj Centro | nj Italia | pj Italia |
|---|---|---|---|---|---|---|---|---|
| Agricoltura | 4259 | 7.7 | 61062 | 3.2 | 153751 | 3.6 | 1119939 | 5.3 |
| Industria | 11674 | 21.2 | 381062 | 19.9 | 1210506 | 28.5 | 6766928 | 32.1 |
| Altre Attività | 39239 | 71.7 | 1474073 | 76.9 | 2890296 | 67.9 | 13192918 | 62.6 |
| Totale | 55172 | 100.0 | 1916197 | 100.0 | 4254553 | 100.0 | 21079785 | 100.0 |
Totale occupati per settore di attività economica: Agricoltura, Industria, Altre Attività.
Grafico a barre cumulate
Mutabili sconnesse e ordinate. Rappresentazione contemporanea di più distribuzioni semplici di quantità o di frequenza dello stesso carattere osservato su collettivi diversi. Utilità: rappresentazione della composizione di un aggregato (soprattutto in termini di valori relativi o percentuali) e confronto di diversi aggregati rispetto a uno stesso carattere.
Grafico a barre cumulate per la distribuzione degli occupati per settore di attività economico
| Settore attività economico | nj Rieti | pj Rieti | nj Lazio | pj Lazio | nj Centro | pj Centro | nj Italia | pj Italia |
|---|---|---|---|---|---|---|---|---|
| Agricoltura | 4259 | 7.7 | 61062 | 3.2 | 153751 | 3.6 | 1119939 | 5.3 |
| Industria | 11674 | 21.2 | 381062 | 19.9 | 1210506 | 28.5 | 6766928 | 32.1 |
| Altre Attività | 39239 | 71.7 | 1474073 | 76.9 | 2890296 | 67.9 | 13192918 | 62.6 |
| Totale | 55172 | 100.0 | 1916197 | 100.0 | 4254553 | 100.0 | 21079785 | 100.0 |
Tot. Occupati per settore di attività economica: Rieti, Lazio, Centro, Italia.
Istogramma
Distribuzione di frequenza di caratteri quantitativi, in particolare variabili continue raggruppate in classi. Consiste nel riportare tanti rettangoli contigui quante sono le classi. Il rettangolo associato ad una generica classe ha base uguale (o proporzionale) all'ampiezza della classe corrispondente e area uguale o proporzionale alla frequenza (assoluta o relativa o percentuale) corrispondente.
Costruzione di un istogramma
Le classi di modalità possono avere ampiezza differente. Si consideri la generica j-esima classe. Il rettangolo che rappresenta tale classe ha:
- Base: ampiezza della classe = xj - xj-1
- Altezza: densità media di frequenza = nj / aj
- Area: frequenza (nj)
Esempio: Popolazione per classi di età nella provincia di Rieti (anno 2000)
| Classi di età | nj | fj | pj | aj | dj |
|---|---|---|---|---|---|
| (0, 14] | 20.451 | 0,13 | 13,5 | 14 | 0,010 |
| (14, 64] | 97.793 | 0,65 | 64,7 | 50 | 0,013 |
| 64 e oltre | 32.999 | 0,22 | 21,8 | 56 | 0,004 |
| Totale | 151.243 | 1,00 | 100,0 |
Diagramma a canne d'organo
Distribuzione di frequenza di caratteri quantitativi discreti non raggruppati in classi. Consiste nel riportare tanti segmenti distanziati quante sono le modalità numeriche. Il segmento associato a una generica modalità numerica è posizionato sull'asse delle ascisse in corrispondenza del numero osservato per la modalità a cui è associato, e ha altezza uguale o proporzionale alla frequenza (assoluta o relativa o percentuale) corrispondente.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Appunti di Analisi dati
-
Analisi dei dati - Prima parte
-
Analisi dei dati - Seconda parte
-
Analisi matematica 2