Anteprima
Vedrai una selezione di 7 pagine su 29
Analisi dei dati - Seconda parte Pag. 1 Analisi dei dati - Seconda parte Pag. 2
Anteprima di 7 pagg. su 29.
Scarica il documento per vederlo tutto.
Analisi dei dati - Seconda parte Pag. 6
Anteprima di 7 pagg. su 29.
Scarica il documento per vederlo tutto.
Analisi dei dati - Seconda parte Pag. 11
Anteprima di 7 pagg. su 29.
Scarica il documento per vederlo tutto.
Analisi dei dati - Seconda parte Pag. 16
Anteprima di 7 pagg. su 29.
Scarica il documento per vederlo tutto.
Analisi dei dati - Seconda parte Pag. 21
Anteprima di 7 pagg. su 29.
Scarica il documento per vederlo tutto.
Analisi dei dati - Seconda parte Pag. 26
1 su 29
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Analisi dei Dati - a.a.2004/2005

N N N∑ ∑ ∑− = − ≤ −x Me min x Me x aj jj= = =1 j 1 j 1j3) E’ robusta cioè è poco sensibile ai cambiamenti chepossono avvenire sulle modalità estreme delladistribuzione del carattere

Analisi dei dati Quartili

Primo quartile Q : modalità che nella graduatoria1(crescente o decrescente) bipartisce il 50% delleosservazioni con modalità più piccole o al più ugualialla Me

Terzo quartile Q : modalità che nella graduatoria3(crescente o decrescente) bipartisce il 50% delleosservazioni con modalità più grandi o al più ugualialla Me

G I F B D L N M O H CU.S. A E P Q1 2 3 4 5 6 7 8 9 10 11 12 13 14 15x j Q QMe1 3

Analisi dei Dati - a.a.2004/2005 96

EsempioDistribuzione unitaria degli affitti settimanali in europagati da 11 studentiSenza ordine Ordine crescenteU.S. Affitto Posto U.S. Affitto Affitto Affitto Affitto Primo QuartileA 40 1 D 33 33B 43 2 C 35

35 è "36"C 35 363 G 36 38D 33 4 H 38 38E 45 5 L 38 La mediana èF 40 6 A 40 40 40 40G 36 7 F 40 "40"40H 38 8 I 42 42I 42 9 B 43 43L 38 10 E 45 45M 48 Terzo Quartile11 M 48 48+ = = = è "43"N 1 Me x x 40=N 11 += N 1 662 2+N 1 = = = = = =Q x x 36 Q x x 43= 3 + +3 91 N 1 3  N 14  34 4 Analisi dei Dati - a.a.2004/2005 97 2Analisi dei dati Medie AnaliticheMedia aritmeticaSi possono calcolare solo per caratteriquantitativi (variabili continue o discrete)Sono funzioni matematiche di tutti i datiosservatiCambiano se si cambia anche un solo¾datoSfruttano completamente l'informazione¾statistica disponibileAnalisi dei Dati - a.a.2004/2005 98Media Aritmetica: il calcolo1) Distribuzione unitaria semplice del carattere X, , ..., , x x x x1 2 j N N∑ x j+ + + + + +x x x x xL L N1=j j1 2 3 N 1 ∑= = =M x jN N N =j 1U.S. Voto Maturità =1 98 N 102 100 103 70 ∑ = + + + + + + + + +

=x 98 100 70 72 70 100 85 65 60 88 8084 72 j=5 70 1j6 100 + + + + + + + + +98 100 70 72 70 100 85 65 60 88 8087 85 = = =M 80,88 65 10 109 6010 88

Analisi dei Dati - a.a.2004/2005 99

3Analisi dei dati Media Aritmetica: il calcolo2) Distribuzione semplice di frequenze assolute delcarattere XFREQUENZECar. X + + + + + +x n x n x n x n x nL LASSOLUTE 1 1 2 2 3 3 K Kj j= =Mx n N1 1nx K2 2 ∑ x n… … j j K1=1j ∑= = x nx n j jj j N N =1j… …nx K KTotale N Analisi dei Dati - a.a.2004/2005 100

Esempio Num. CorsiDistribuzione degli studenti di n x nj j jFreq.SDC frequentanti la facoltà 1 15 1*15=15nell’a.a. 2001/2002 per Num. 2 43 2*43=86Corsi Frequentati 3 103 3*103=3094 80 4*80=3205 32 5*32=160= =N 283 K 7 6 8 6*8=487 2 7*2=14Totale 283 9527∑ = + + + + + + =x n 15 86 309 320 160 48 14 952j j=j 1 7∑ x nj j 952=1j= = = 3,36M 283 283Analisi dei Dati - a.a.2004/2005 101 4Analisi dei dati Esempio Voto n x nj j jMaturità60 1 60Distribuzione

degli studenti di SDC 62 2 124frequentanti la facoltà nell’a.a. 66 1 6667 3 2012001/2002 per Voto di Maturità 68 2 13670 2 14071 2 14272 1 72== K 24N 40 73 2 14674 1 7475 2 15024 76 1 76∑ = 79 1 79x n 3201j j 80 1 80= 81 1 81j 1 82 1 8283 1 8324∑ 86 1 86x nj j 87 1 873201= 90 2 180j 1= = = 80, 03M 92 3 27640 40 93 2 18694 1 94100 5 500Totale 40 3201

Analisi dei Dati - a.a.2004/2005 102

Media Aritmetica: il calcolo

3) Distribuzione semplice di frequenze assolute delcarattere raggruppato in classi

X Valori +x xn

Car. X −j 1 jcentralij =c j 2(x , x ] n c0 1 1 1(x , x ] n c + + + + +c n c n c n c nL L1 2 2 2 j j1 1 2 2 K K= =M… … … N(x , x ] n cj-1 j j j K∑ c n… … … j j K1=j 1 ∑(x , x ] n c = = c nK-1 K K K j jN N =j 1Totale N Analisi dei Dati - a.a.2004/2005 103 5

Analisi dei dati Esempio Voto n c c nDistribuzione degli studenti j j j jMaturitàdi SDC frequentanti la [60-70] 72 65,0 4680(70-80] 78 75,0

5850 facoltà nell'a.a. 2001/2002 (80-90] 65 85,0 5525 per Voto di Maturità (90-95] 18 92,5 1665 (95-100] 50 97,5 4875

K 5 N 283 Totale 283 22595

+

60 70 x x-j 1 j =

= c 65 = j 1 c 1j 225 ∑ = + + + + = c n 4680 5850 5525 2665 4875 22595 j j=j 1 5 ∑ c nj j 22595=j 1= = = 79,84 M 283 283

Analisi dei Dati - a.a.2004/2005 104 6

Analisi dei dati Proprietà della Media Aritmetica

1) Ha la stessa unità di misura dei dati

2) È sempre compresa tra il valore minimo e il valore massimo delle modalità numeriche del carattere

3) La somma degli scarti dalla media aritmetica è nulla N ∑ - (x - M) 0 j= 1 j

4) La somma dei quadrati degli scarti dalla media aritmetica è minima N ∑ (x - M) 2 ≤ − min x M x qj j j= = = j 1 j 1 j 1

Analisi dei Dati - a.a.2004/2005 105

Proprietà della Media Aritmetica → = + x y ax b

E' invariante per trasformazioni lineari j j j → =

M ( X ) M (Y ) aM( X ) bX=Temperatura in Gradi CentigradiY=Temperatura in Gradi FahrenheitTemperaturaTemperatura Trasformazione lineareGradi FahrenheitGradi CentigradiU.S. YX = +Y 1,8 X 3265,121983 18,4 62,241984 16,8 62,421985 16,9 == b 32a 1,863,861986 17,7 62,241987 16,886,6= =M ( X ) 17,325315,88 = × + == = M (Y ) (1,8 17,32) 32 63,18oppureM (Y ) 63,185

Analisi dei Dati - a.a.2004/2005 106 1Analisi dei dati FemmineEsempio VotoMaschi n x nj j jMaturità60 1 60Voto 62 2 124n x nj j j10 Maturità 66 1 66∑ x n 67 1 6767 2 134j j 68 1 68965 68 1 68=1j= = = 80, 42M 70 2 14072 1 72maschi n 12 71 2 14275 1 75maschi 73 2 14676 1 76 74 1 7480 1 80 75 1 7519 79 1 7983 1 83∑ x nj j 81 1 8187 1 872236=j 1 82 1 82= = = 90 1 9079,86M 86 1 86femmine 28n 100 2 200 90 1 90femmine Totale 12 965 92 3 27693 2 18694 1 94100 3 300Totale 28 2236≠ 24∑+ + x n80, 42 79,86M M j jmaschi femmine = = 320180,14 =j 1= = =voto medio 80 , 032 2 40n⋅ + ⋅ ⋅ + ⋅M n

M n 80, 42 12 79,86 28

maschi maschi femmine femmine

M 80, 03

TOT N 40

Analisi dei Dati - a.a.2004/2005 107

Variabilità o Dispersione

Definizione

Attitudine di un fenomeno ad assumere diverse modalità

Caratteri quantitativi: variabilità e dispersione

¾ Col. A: 5 5 5 5 5 M=Me=5

Col. B: 1 4 5 6 9 M=Me=5

Caratteri qualitativi: mutabilità

¾ Misure di sintesi

Medie

¾ Indici di variabilità/dispersione

¾ Indici di mutabilità

¾ Analisi dei Dati - a.a.2004/2005 108 2

Analisi dei dati Esempio

A B C C

A Bx n n n

j j j 2 e 43 3

Moda1 40 10 4 33 3

Me2 40 16 95 33 3

M3 40 148 24 40 16 95 0,56 1,112

Varianza5 40 10 4

Tot. 200 200 200

160

140

120

asslute 100

80

Frequenze 60

40

20

0

1 2 3 4 5

Carattere X A B C

Analisi dei Dati - a.a.2004/2005 109

Requisiti degli indici di variabilità e dispersione

Assume valore minimo quando tutte le u.s. presentano la stessa modalità

Positivo se c’è variabilità o dispersione

Aumenta

all'aumentare della diversità tra le modalità assunte dalle u.s.

Non cambia se le frequenze vengono moltiplicate per una costante positiva

Ha la stessa unità di misura del carattere

Analisi dei Dati - a.a.2004/2005 110 3

Analisi dei dati Indici di variabilità e dispersione

Indici di variabilità variabilità si misura considerando tutte¾ le differenze tra le modalità della distribuzione presentate dalle u.s. prese due a due → Differenze Medie

Indici di dispersione dispersione si misura con gli scarti tra¾ le modalità presentate dalle u.s. e un indice di dimensione della distribuzione (Mo Me)‘Varianza (scarto) quadratico medio‘Scostamento

Analisi dei Dati - a.a.2004/2005 111

Scarto quadratico medio e varianza

Distribuzione unitaria ( ) ( ) ( )2 2 2 Scostamento quadratico − + − + + −¾ x M x M x M Lσ 1 2 N=medio (deviazione standard) N Varianza (non ha la stessa¾ ( ) ( ) ( )2 2 2−

+ − + + −unità di misura del x M x M x ML1 2 N=Var X( )carattere) NDevianza ( ) ( ) ( )‘ 2 2 2= − + − + + −Dev ( X ) x M x M x ML1 2 NDistribuzione semplice difrequenze ( )

Dettagli
Publisher
A.A. 2011-2012
29 pagine
SSD Scienze economiche e statistiche SECS-S/05 Statistica sociale

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher flaviael di informazioni apprese con la frequenza delle lezioni di Analisi dei dati e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Roma La Sapienza o del prof Baragona Roberto.