Anteprima
Vedrai una selezione di 16 pagine su 73
Appunti elaborati relativi al corso "Analisi dei dati e statistica", tutte le lezioni Pag. 1 Appunti elaborati relativi al corso "Analisi dei dati e statistica", tutte le lezioni Pag. 2
Anteprima di 16 pagg. su 73.
Scarica il documento per vederlo tutto.
Appunti elaborati relativi al corso "Analisi dei dati e statistica", tutte le lezioni Pag. 6
Anteprima di 16 pagg. su 73.
Scarica il documento per vederlo tutto.
Appunti elaborati relativi al corso "Analisi dei dati e statistica", tutte le lezioni Pag. 11
Anteprima di 16 pagg. su 73.
Scarica il documento per vederlo tutto.
Appunti elaborati relativi al corso "Analisi dei dati e statistica", tutte le lezioni Pag. 16
Anteprima di 16 pagg. su 73.
Scarica il documento per vederlo tutto.
Appunti elaborati relativi al corso "Analisi dei dati e statistica", tutte le lezioni Pag. 21
Anteprima di 16 pagg. su 73.
Scarica il documento per vederlo tutto.
Appunti elaborati relativi al corso "Analisi dei dati e statistica", tutte le lezioni Pag. 26
Anteprima di 16 pagg. su 73.
Scarica il documento per vederlo tutto.
Appunti elaborati relativi al corso "Analisi dei dati e statistica", tutte le lezioni Pag. 31
Anteprima di 16 pagg. su 73.
Scarica il documento per vederlo tutto.
Appunti elaborati relativi al corso "Analisi dei dati e statistica", tutte le lezioni Pag. 36
Anteprima di 16 pagg. su 73.
Scarica il documento per vederlo tutto.
Appunti elaborati relativi al corso "Analisi dei dati e statistica", tutte le lezioni Pag. 41
Anteprima di 16 pagg. su 73.
Scarica il documento per vederlo tutto.
Appunti elaborati relativi al corso "Analisi dei dati e statistica", tutte le lezioni Pag. 46
Anteprima di 16 pagg. su 73.
Scarica il documento per vederlo tutto.
Appunti elaborati relativi al corso "Analisi dei dati e statistica", tutte le lezioni Pag. 51
Anteprima di 16 pagg. su 73.
Scarica il documento per vederlo tutto.
Appunti elaborati relativi al corso "Analisi dei dati e statistica", tutte le lezioni Pag. 56
Anteprima di 16 pagg. su 73.
Scarica il documento per vederlo tutto.
Appunti elaborati relativi al corso "Analisi dei dati e statistica", tutte le lezioni Pag. 61
Anteprima di 16 pagg. su 73.
Scarica il documento per vederlo tutto.
Appunti elaborati relativi al corso "Analisi dei dati e statistica", tutte le lezioni Pag. 66
Anteprima di 16 pagg. su 73.
Scarica il documento per vederlo tutto.
Appunti elaborati relativi al corso "Analisi dei dati e statistica", tutte le lezioni Pag. 71
1 su 73
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

per ogni classe si può calcolare il valore centrale (media estremi), utile per la

rappresentazione grafica

Frequenza relativa Frequenza percentuale

Frequenza assoluta / Numero delle classi frequenza assoluta*100

utile per confrontare due campioni di numerosità diversa

Frequenza percentuale cumulata

informazioni circa la percentuale di dati che risultino ≤ ad un certo valore

Estremo Valore Frequenza Frequenza Frequenza Frequenza

superiore centrale assoluta relativa percentuale cumulata

-10 -12.5 1 0.0044 0.44% 0.44% frequenza percentuale cumulata

-5 -7.5 0 0.0000 0.00% 0.44% cella precedente + frequenza

0 -2.5 0 0.0000 0.00% 0.44% percentuale riga corrente

5 2.5 6 0.0264 2.64% 3.08%

10 7.5 23 0.1013 10.13% 13.22% Es. 0,44% + 2,64%

15 12.5 104 0.4581 45.81% 59.03%

20 17.5 75 0.3304 33.04% 92.07%

25 22.5 12 0.0529 5.29% 97.36%

30 27.5 3 0.0132 1.32% 98.68%

35 32.5 3 0.0132 1.32% 100.00%

227 1 100.00%

Rappresentazione delle variabili quantitative (DCOVA) Ramo Foglia

4 9

5 589

Diagramma ramo-foglia 6 3558

Partendo dai dati numerici ordinati, si separano le cifre iniziali (rami) e le cifre finali 7 149

(foglie) 8 33

organizza i dati in gruppi (rami) in modo che i valori all’interno (foglie) si diramino 9 56

verso destra su ogni riga

Costo pranzo 4.9 5.5 5.8 5.9 6.3 6.5 6.5 6.8 7.1 7.4 7.9 8.3 8.3 9.5 9.6

Noto che la maggioranza di osservazioni sono assegnate al ramo 6

Istogramma Fondi growth

• Gli estremi della classe o i valori medi

vengono mostrati sull’asse delle ordinate 120

• L’asse verticale rappresenta la frequenza, assoluta 100

frequenza relativa o percentuale 80

• Non vi sono spazi tra una barra e l’altra, 60

Frequenza

sono adiacenti 40

20

0 -12.5 -7.5 -2.5 2.5 7.5 12.5 17.5 22.5 27.5 32.5

Valori medi

Poligono di frequenza

• OGIVA

Linea spezzata che unisce i punti (x, y)

• Le x corrispondono ai valori medi di 120.00%

ciascuna classe 100.00%

• Le y corrispondono alle frequenze di 80.00%

60.00%

ciascuna classe 40.00%

20.00%

Poligono delle frequenze cumulate (OGIVA) 0.00%

L’ascissa è data dalla frequenza -10 -5 0 5 10 15 20 25 30 35

percentuale cumulata di ciascuna classe % cumulate growth % cumulate value

Diagramma a dispersione (scatterplot) Diagramma a dispersione

• Per ogni unità statistica abbiamo un’ 1600

osservazione bivariata a cui si assegna 1400

un punto sul piano del grafico 1200

nuvola di osservazioni 1000

Esempio NBA Passamani/NBA Esempio.xlsx 800

600

Dal grafico si nota una relazione positiva, o 400

crescente, tra profitti e valore di ogni squadra 200

0 0 100 200 300 400

Profitti

Diagramma per le serie storiche Prezzo Gas

• Una delle due variabili è il tempo, sta

sull’asse delle ascisse 400

350

• Si osserva un avariabile e il suo 300

andamento nel tempo 250

Esempio prezzi Gas 200

Passamani/Prezzi gas 11-3- 150

21.xlsx 100

50

0 2003-1 2003-4 2003-7 2004-1 2004-4 2005-1 2005-4 2005-7 2006-1 2006-7 2007-1 2007-4 2007-7 2008-1 2008-4

2004-7 2006-4

2003-10 2004-10 2005-10 2006-10 2007-10

Tabelle di contingenza multiple (a doppia Conteggio di Numero Etichette di

fondo colonna

entrata) DCOVA Totale

• Riporta le frequenze congiunte, assolute Etichette di riga Alto Basso Medio complessivo

Growth 3.16% 45.25% 23.42% 71.84%

o percentuali, di tre o più variabili Grande 0.95% 28.48% 3.16% 32.59%

qualitative Media 0.00% 11.71% 11.08% 22.78%

Tabelle Pivot Piccola 2.22% 5.06% 9.18% 16.46%

Es. Fondi investimento Passamani/Fondi Value 0.95% 21.84% 5.38% 28.16%

investimento 11-3-21.xlsx Grande 0.32% 14.24% 1.27% 15.82%

Media 0.00% 4.75% 1.27% 6.01%

Piccola 0.63% 2.85% 2.85% 6.33%

Totale complessivo 4.11% 67.09% 28.80% 100.00%

Mostrare valori variabile numerica distinta Media di Rendimento 10

anni Etichette di colonna

per sottogruppi di più variabili qualitative Totale

Etichette di riga Alto Basso Medio complessivo

Growth 6.65 7.13 8.17 7.45

Grande 8.42 6.37 7.16 6.51

Media 8.36 8.65 8.50

Piccola 5.89 8.59 7.94 7.86

Value 6.22 6.69 8.11 6.95

Grande 4.03 5.81 7.01 5.87

Media 7.87 8.23 7.94

Piccola 7.32 9.15 8.55 8.70

Totale complessivo 6.55 6.99 8.16 7.31

Data Discovery (Drill-down o elenco a discesa)

Consentono di indagare i dati tramite tabelle riassuntive dei dati

Per:

• visualizzare meglio i dati;

• controllare meglio i dati per valori insoliti;

• evidenziare nei dati andamenti e relazioni nascoste.

Excel doppio click sul dato

Mappa ad albero

• Gerarchia a più livelli che

evidenzia dettagli

attraverso rettangoli

nidificati

Es. Variabili numeriche

(dimensione rettangoli) e per

la percentuale dei rendimenti

(colore)

Problematiche nell’organizzazione e rappresentazione delle variabili

Attenzione a:

• Riportare informazioni chiare e comprensibili

• Presentazioni che non nascondano info rilevanti

Rischi che si creino sintesi che offuscano informazioni e generano false impressioni

Es. offuscamento dovuto a sovraccarico di info

False impressioni

• Riassunto selettivo, presenta solo una parte dell’informazione scelta

• Grafici realizzati in modo improprio:

o Problemi diagramma a torta

o Assi non correttamente dimensionati

o L’asse Y che non inizia nell’origine o manca di valori medi

• Chartjunk (grafico spazzatura)

Come realizzare rappresentazioni corrette

• Usare la rappresentazione più semplice possibile.

• Includere un titolo.

• Etichettare tutti gli assi.

• Includere una scala per ciascun asse se il grafico contiene assi.

• La scala sull’asse delle ordinate deve iniziare nell’origine (altrimenti deve includere

serpentina)

• Usare una scala costante.

• Evitare, possibilmente, gli effetti 3D.

• Evitare la spazzatura grafica.

La statistica descrittiva: indici di posizione e di variabilità

Definizioni sintetiche (DCOVA)

• Tendenza centrale è il valore centrale (tipico) intorno a cui i valori di una variabile si

raggruppano

• Variabilità rappresenta la tendenza di una varabile ad assumere variabili differenti e

disperdersi attorno al valore centrale

• Forma rappresenta l’andamento delle frequenze di una distribuzione dal valore più

basso al più alto della variabile quantitativa (istogramma)

Misure di tendenza centrale Passamani/Tempi 12-3-21.xlsx Passamani/Produzione pneumatici 12-3-21.xlsx

Media campionaria X (media)

Baricentro di un insieme di dati somma valori / numero valori

Dettagli
Publisher
A.A. 2020-2021
73 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Silvia17.p di informazioni apprese con la frequenza delle lezioni di Analisi e statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Trento o del prof Passamani Giuliana.