Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
per ogni classe si può calcolare il valore centrale (media estremi), utile per la
rappresentazione grafica
Frequenza relativa Frequenza percentuale
Frequenza assoluta / Numero delle classi frequenza assoluta*100
utile per confrontare due campioni di numerosità diversa
Frequenza percentuale cumulata
informazioni circa la percentuale di dati che risultino ≤ ad un certo valore
Estremo Valore Frequenza Frequenza Frequenza Frequenza
superiore centrale assoluta relativa percentuale cumulata
-10 -12.5 1 0.0044 0.44% 0.44% frequenza percentuale cumulata
-5 -7.5 0 0.0000 0.00% 0.44% cella precedente + frequenza
0 -2.5 0 0.0000 0.00% 0.44% percentuale riga corrente
5 2.5 6 0.0264 2.64% 3.08%
10 7.5 23 0.1013 10.13% 13.22% Es. 0,44% + 2,64%
15 12.5 104 0.4581 45.81% 59.03%
20 17.5 75 0.3304 33.04% 92.07%
25 22.5 12 0.0529 5.29% 97.36%
30 27.5 3 0.0132 1.32% 98.68%
35 32.5 3 0.0132 1.32% 100.00%
227 1 100.00%
Rappresentazione delle variabili quantitative (DCOVA) Ramo Foglia
4 9
5 589
Diagramma ramo-foglia 6 3558
Partendo dai dati numerici ordinati, si separano le cifre iniziali (rami) e le cifre finali 7 149
(foglie) 8 33
organizza i dati in gruppi (rami) in modo che i valori all’interno (foglie) si diramino 9 56
verso destra su ogni riga
Costo pranzo 4.9 5.5 5.8 5.9 6.3 6.5 6.5 6.8 7.1 7.4 7.9 8.3 8.3 9.5 9.6
Noto che la maggioranza di osservazioni sono assegnate al ramo 6
Istogramma Fondi growth
• Gli estremi della classe o i valori medi
vengono mostrati sull’asse delle ordinate 120
• L’asse verticale rappresenta la frequenza, assoluta 100
frequenza relativa o percentuale 80
• Non vi sono spazi tra una barra e l’altra, 60
Frequenza
sono adiacenti 40
20
0 -12.5 -7.5 -2.5 2.5 7.5 12.5 17.5 22.5 27.5 32.5
Valori medi
Poligono di frequenza
• OGIVA
Linea spezzata che unisce i punti (x, y)
• Le x corrispondono ai valori medi di 120.00%
ciascuna classe 100.00%
• Le y corrispondono alle frequenze di 80.00%
60.00%
ciascuna classe 40.00%
20.00%
Poligono delle frequenze cumulate (OGIVA) 0.00%
L’ascissa è data dalla frequenza -10 -5 0 5 10 15 20 25 30 35
percentuale cumulata di ciascuna classe % cumulate growth % cumulate value
Diagramma a dispersione (scatterplot) Diagramma a dispersione
• Per ogni unità statistica abbiamo un’ 1600
osservazione bivariata a cui si assegna 1400
un punto sul piano del grafico 1200
nuvola di osservazioni 1000
Esempio NBA Passamani/NBA Esempio.xlsx 800
600
Dal grafico si nota una relazione positiva, o 400
crescente, tra profitti e valore di ogni squadra 200
0 0 100 200 300 400
Profitti
Diagramma per le serie storiche Prezzo Gas
• Una delle due variabili è il tempo, sta
sull’asse delle ascisse 400
350
• Si osserva un avariabile e il suo 300
andamento nel tempo 250
Esempio prezzi Gas 200
Passamani/Prezzi gas 11-3- 150
21.xlsx 100
50
0 2003-1 2003-4 2003-7 2004-1 2004-4 2005-1 2005-4 2005-7 2006-1 2006-7 2007-1 2007-4 2007-7 2008-1 2008-4
2004-7 2006-4
2003-10 2004-10 2005-10 2006-10 2007-10
Tabelle di contingenza multiple (a doppia Conteggio di Numero Etichette di
fondo colonna
entrata) DCOVA Totale
• Riporta le frequenze congiunte, assolute Etichette di riga Alto Basso Medio complessivo
Growth 3.16% 45.25% 23.42% 71.84%
o percentuali, di tre o più variabili Grande 0.95% 28.48% 3.16% 32.59%
qualitative Media 0.00% 11.71% 11.08% 22.78%
Tabelle Pivot Piccola 2.22% 5.06% 9.18% 16.46%
Es. Fondi investimento Passamani/Fondi Value 0.95% 21.84% 5.38% 28.16%
investimento 11-3-21.xlsx Grande 0.32% 14.24% 1.27% 15.82%
Media 0.00% 4.75% 1.27% 6.01%
Piccola 0.63% 2.85% 2.85% 6.33%
Totale complessivo 4.11% 67.09% 28.80% 100.00%
Mostrare valori variabile numerica distinta Media di Rendimento 10
anni Etichette di colonna
per sottogruppi di più variabili qualitative Totale
Etichette di riga Alto Basso Medio complessivo
Growth 6.65 7.13 8.17 7.45
Grande 8.42 6.37 7.16 6.51
Media 8.36 8.65 8.50
Piccola 5.89 8.59 7.94 7.86
Value 6.22 6.69 8.11 6.95
Grande 4.03 5.81 7.01 5.87
Media 7.87 8.23 7.94
Piccola 7.32 9.15 8.55 8.70
Totale complessivo 6.55 6.99 8.16 7.31
Data Discovery (Drill-down o elenco a discesa)
Consentono di indagare i dati tramite tabelle riassuntive dei dati
Per:
• visualizzare meglio i dati;
• controllare meglio i dati per valori insoliti;
• evidenziare nei dati andamenti e relazioni nascoste.
Excel doppio click sul dato
Mappa ad albero
• Gerarchia a più livelli che
evidenzia dettagli
attraverso rettangoli
nidificati
Es. Variabili numeriche
(dimensione rettangoli) e per
la percentuale dei rendimenti
(colore)
Problematiche nell’organizzazione e rappresentazione delle variabili
Attenzione a:
• Riportare informazioni chiare e comprensibili
• Presentazioni che non nascondano info rilevanti
Rischi che si creino sintesi che offuscano informazioni e generano false impressioni
Es. offuscamento dovuto a sovraccarico di info
False impressioni
• Riassunto selettivo, presenta solo una parte dell’informazione scelta
• Grafici realizzati in modo improprio:
o Problemi diagramma a torta
o Assi non correttamente dimensionati
o L’asse Y che non inizia nell’origine o manca di valori medi
• Chartjunk (grafico spazzatura)
Come realizzare rappresentazioni corrette
• Usare la rappresentazione più semplice possibile.
• Includere un titolo.
• Etichettare tutti gli assi.
• Includere una scala per ciascun asse se il grafico contiene assi.
• La scala sull’asse delle ordinate deve iniziare nell’origine (altrimenti deve includere
serpentina)
• Usare una scala costante.
• Evitare, possibilmente, gli effetti 3D.
• Evitare la spazzatura grafica.
La statistica descrittiva: indici di posizione e di variabilità
Definizioni sintetiche (DCOVA)
• Tendenza centrale è il valore centrale (tipico) intorno a cui i valori di una variabile si
raggruppano
• Variabilità rappresenta la tendenza di una varabile ad assumere variabili differenti e
disperdersi attorno al valore centrale
• Forma rappresenta l’andamento delle frequenze di una distribuzione dal valore più
basso al più alto della variabile quantitativa (istogramma)
Misure di tendenza centrale Passamani/Tempi 12-3-21.xlsx Passamani/Produzione pneumatici 12-3-21.xlsx
Media campionaria X (media)
Baricentro di un insieme di dati somma valori / numero valori