Statistica - Appunti

Name: Statistica - Appunti
Brand: Skuola.net
Rating: 4 (2 reviews)

Aggiornato il 16/11/2022

di AngeloNELLAnebbia

Publisher

Vota 4,0/5 (2)

Contenuto verificato e approvato dal Team di Esperti di Skuola.net

Appunti di Statistica delle lezioni tenute dalla professoressa Bartoli. Esame superato con 30. Gli argomenti trattati sono i seguenti: elementi di base,sommatoria, proprietà indice …

Esame Statistica

Facoltà Scienze politiche

Dal corso del Prof. Bartoli Velia

Università Università degli Studi di Roma La Sapienza

A.A. 2009-2010

42 pagine

3 download

Appunto

Scarica

Estratto del documento

ESEMPIO.

46 famiglie classificate secondo il reddito annuale percepito da ciascuna di esse.

REDDITO AMPIEZZA

N° FAMIGLIE DENSITÀ

−

x x N d

+ i i

i i 1 i

2 – 4 8 2 4

4 – 6 10 2 5

6 – 10 12 4 3

10 – 14 10 4 2,5

14 – 20 6 6 1

Si usano le densità di frequenza e non le frequenze assolute per l’altezza dei rettangoli, per

eliminare l’influenza perturbatrice della diversa ampiezza della classe. Se usassimo le frequenze

assolute verrebbe una rappresentazione grafica distorta che non rappresenterebbe effettivamente

l’andamento del fenomeno. Ciò perché la somma delle aree dei singoli rettangoli deve dare la

frequenza assoluta totale. 16

LE MEDIE.

La media è un parametro, ossia un unico valore, che si usa quando si vuol rappresentare una

distribuzione con un unico valore. Dunque è un parametro di sintesi, in quanto sintetizza la

distribuzione e può essere utilizzato sia per caratteri qualitativi che per caratteri quantitativi.

Capita, però, che le distribuzioni risentano di valori estremi. Su 70 persone, tra cui 65 guadagnano

1200, 1400, 1500 ecc, e 5 persone che guadagnano 10 mln di euro, la media verrebbe un valore

altissimo che non rispecchierebbe il reddito medio della maggior parte delle persone. Per cui non

sono opportune da usare le medie di calcolo che risentono dei valori estremi, ma solo le medie di

posizione, altrimenti dette lasche.

Le medie di posizione sono quelle che si ottengono considerando soltanto alcuni valori della

distribuzione.

LA MODA.

La moda è una media di posizione che non risente dei valori estremi, in quanto rappresenta

l’intensità che ha la maggior frequenza nella distribuzione.

Definizione: −

data una variabile statistica, la moda è quel valore interno all’intervallo x x tale che la sua

i i 1

⟩

frequenza risponda alla seguente disuguaglianza: N N +

i i 1

⟩

N N −

i i 1

Quindi la moda è l’intensità o la modalità che ha la frequenza maggiore rispetto alla precedente e

alla successiva. GIUDIZI FREQUENZE

x N

Insufficiente 2

Sufficiente 3

Buono 2

Ottimo 1

Il giudizio modale è “Sufficiente” in quanto ha la frequenza maggiore della precedente e della

successiva. 17

In questo caso siamo di fronte ad una distribuzione bimodale in quanto

x N

i abbiamo due valori a rappresentare la moda della distribuzione. L’intensità

1 2 “3” e l’intensità “6”, le quali presentano, appunto, frequenze assolute

2 3 maggiori delle precedenti e delle successive.

3 7

4 6

5 5

6 9

7 5

8 4

Se ci si ritrova a lavorare su un carattere quantitativo continuo, quindi organizzato in classi di

intensità, ci si presentano due casi per calcolare il valore modale:

1. se le classi sono di diversa ampiezza, la moda sarà contenuta nella classe che ha densità di

frequenza maggiore della precedente e della successiva;

2. se le classi sono di uguale ampiezza, la moda sarà interna alla classe che ha frequenza

assoluta maggiore della precedente e della successiva.

REDDITO N d

i i

−

x x +

i i 1

2 – 4 8 4

4 – 6 10 5

6 – 10 12 3

10 – 14 10 2,5

14 – 20 6 1

In questo caso la moda è un valore interno alla classe 4 – 6, che prende il nome di classe modale,

perché presenta una densità di frequenza maggiore della precedente e della successiva. 18

LA MEDIANA o VALORE MEDIANO o SECONDO QUARTILE.

Definizione: ordinando le intensità in senso crescente, la mediana è l’intensità che bipartisce la

distribuzione.

Se le intensità sono dispari si ha una sola mediana a bipartire la distribuzione, mentre invece se le

intensità sono pari se ne hanno due. Quindi abbiamo due casi per determinare il posto della

mediana: + 1

N

1. Se N è dispari il posto della mediana sarà dato da: ;

P 2

N N

= = +

2. Se N è pari i posti delle mediane saranno dati da: e .

P P 1

1 2

2 2

ESEMPIO 1:

ho nove intensità: 2, 5, -1, 9, 6, 11, 4, -3, 1

Ordino le intensità in ordine crescente: -3, -1, 1, 2, 4, 5, 6, 9, 11

+ +

N 1 9 1

= = =

⇒ , quindi la mediana è

Il posto del valore che bipartisce la distribuzione è: P P 5

2 2

rappresentata dall’intensità “4”.

La moda invece è 0, quindi siamo di fronte ad una distribuzione zero modale, in quanto è a

frequenza unitaria.

ESEMPIO 2:

ho dieci intensità già ordinate in senso crescente: -3, -1, 1, 2, 4, 5, 6, 9, 11, 13

10 10

= = = + =

I posti delle mediane mi sono dati da: e

P 5 P 1 6

1 2

2 2

Quindi ho la mediana rappresentata dai valori “4” e “5”. Vado a calcolare la media tra i due valori:

4 5 = e questa, per convenzione, rappresenta la mediana della successione di intensità.

I QUARTILI.

Presupponiamo di avere una distribuzione rappresentata da una linea retta:

3 4

1 Q M

≡

2 e

4 2 Q

0 Q 1 3

4 19

I quartili sono tre: 1 4

1. Primo quartile, il quale, partendo da zero, lascia alla sua sinistra dei casi;

2 4

2. La mediana o secondo quartile, partendo da zero, lascia alla sua sinistra dei casi;

3 4

3. Il terzo quartile, partendo da zero, lascia alla sua sinistra i dei casi.

Data una distribuzione ordinata in senso crescente: -3 -1 1 2 4 5 6 9 11.

Si calcola il posto del primo quartile mediante l’equazione: , dove N sta ad indicare il

P 9 2,25 3.

Q1 4

numero dei casi della distribuzione; in tal caso Non esistendo il posto 2,25 per

convenzione si arrotonda al posto successivo. Di conseguenza il primo quartile risulta essere

1).

l’intensità 1 (

Per ottenere il posto del terzo quartile utilizzerò l’equazione ; nel nostro esempio

9 6,75 7. 6).

Per cui il terzo quartile risulta essere l’intensità 6 (

Nel caso in cui la distribuzione di frequenze si dispari ma non sia unitaria:

COMPONENTI

FAMIGLIE

1 7 7

2 10 17

3 9 26

4 6 32

5 3 35

Vogliamo determinare il primo, il secondo e il terzo quartile. 18,

Il posto della mediana o secondo quartile lo otteniamo in maniera seguente:

in quanto le famiglie, quindi le frequenze, sono di numero dispari.

Per individuare l’intensità che occupa il diciottesimo posto ricorro all’utilizzo delle frequenze

cumulate, altrimenti incorrerei in un percorso lungo, facinoroso e non sempre possibile.

Ad esempio, volendo utilizzare un metodo bizzarro, potrei rappresentare la distribuzione nel

seguente modo:

11111112222222222333333333444444555

In tal modo, contando i posti, arrivo alla conclusione che la mediana è rappresentata dal valore “3”,

che è la prima delle 9 frequenze di detta intensità. Non sempre questo metodo è però utilizzabile, in

quanto si può avere una distribuzione molto più corposa. 20

Mediante le frequenze cumulate, invece, noto subito che la seconda intensità ha frequenza cumulata

17, per cui, dovendo io individuare il diciottesimo posto, mi rendo conto immediatamente che

questo è occupato dalla prima intensità “3” delle 9 riscontrate nella distribuzione.

" 8,75 9.

Il primo quartile è calcolato nella stessa modalità: Il posto 9 ricade nelle

frequenze dell’intensità “2”, quindi 35 26,25 27.

Il posto del terzo quartile lo otteniamo nella medesima maniera: Il

posto 27 ricade nelle frequenze dell’intensità “4”, quindi

Nel caso in cui la distribuzione sia pari avremo:

COMPONENTI

FAMIGLIE

1 7 7

2 10 17

3 9 26

4 6 32

5 2 34

Per determinare il posto della mediana agisco nel seguente modo:

17; 2;

$1 18; 3;

# #

Il primo quartile si calcola:

1 8,5 9; 2;

4 4

Il terzo quartile sarà:

3 3 102

34 25,5 26; 3;

4 4 4

Qualora le intensità siano espresse in classi avremo:

REDDITO

2 – 4 8 8

4 – 6 10 18

6 – 10 12 30

10 – 14 10 40

14 – 20 6 46

46 21

Una volta determinata la classe mediana, per calcolare il valore mediano preciso all’interno di essa,

si usufruisce della seguente formula: , - /

( ) $ & .

*+ *+

Dove:

*+ sta ad indicare l’estremo inferiore della classe mediana;

, * sta ad indicare l’ampiezza della classe mediana;

* indica la frequenza assoluta della classe mediana;

è il posto della mediana all’interno della classe;

*+ sarebbe la frequenza cumulata precedente alla classe mediana.

Le frequenze sono 46, per cui pari, allora procediamo nel seguente modo:

23; $1 24;

I posti 23 e 24 si trovano nella classe che ha frequenza cumulata 30, quindi la classe mediana è 6 –

10.

Dunque avremo:

4 -23

( 6$ & 18/ 7,6

# 12

4 -24

( 6 $ & 28/ 7,8

MEDIE DI CALCOLO.

Le medie di calcolo, anch’esse, si utilizzano per rappresentare una distribuzione con un unico

parametro.

Definizione di Cauchy. ) & )

La media è qualsiasi valore interno all’intervallo :

) 3 )4 3 )

In realtà la media molto raramente coincide con i valori estremi, ma è sempre un valore centrale

rappresentante l’intera distribuzione.

Definizione di Chisini.

La media è quel valore unico che sostituito alle singole intensità lascia immutato il risultato di

alcune operazioni. In pratica la media è invariante rispetto a certe operazioni.

Esempio:

5 10 15 50 Somma: 80 Media: 20

Si nota che la media aritmetica è invariante rispetto alla somma. 22

Media aritmetica.

Se assumo come invariante distributivo la somma delle intensità, la media aritmetica è quell’unico

valore che sostituito a ciascuna intensità lascia invariata la somma delle intensità.

) $ ) $ 5 $ ) 6 $ 6 $ 5$ 6

7 ) :·6

89 ∑ )

189

6 8

Media quadratica.

Se assumo come invariante distributivo la somma dei quadrati delle intensità, la media quadratica è

quell’unico valore che sostituito a ciascuna intensità lascia invariata la somma dei quadrati delle

intensità.

) $ ) $ 5 $ ) $ $ 5$

7 ) :·

89 ∑ )

= 8

Anteprima

Vedrai una selezione di 10 pagine su 42