Appunti di Statistica

Appunti di statistica corso base, riguardante gli argomenti:
la statistica in generale, calcolo moda, media, mediana, indici di variabilità, probabilità, regressione lineare, la normale, bernoulli, intervalli di confidenza, test statistici. Scarica il file in formato PDF!

Esame Statistica base

Facoltà Economia

Dal corso del Prof. Polettini Silvia

Università Università degli Studi di Roma La Sapienza

Publisher sabrina95.

A.A. 2016-2017

67 pagine

4 download

Appunto

Vota 5,0 / 5 (1)

Scarica

Estratto del documento

K

1 ∑ ᶍᶇ

x́=

possiamo calcolare più velocemente la media aritmetica: oppure

n j=1

K

∑ ᶍᶂ ᶇ

x́= dove K è il numero di modalità assunte dal carattere, è la frequenza

j=1 ᶂ

assoluta della j-esima modalità e è la corrispondente frequenza relativa. Queste

ultime formule non possono essere utilizzate se il carattere quantitativo X è suddiviso

in classi. Un’approssimazione della media aritmetica può comunque essere ottenuta

considerando al posto della classe il suo valore centrale, ossia il valore che si ottiene

come semisomma degli estremi della classe. Si può approssimare la media aritmetica

K

1 ∑

x́= cjᶇ

del carattere con l’espressione dove K è il numero di classi nella

n j=1 ᶇ

distribuzione di frequenze, c è il valore centrale e è la frequenza assoluta. Tale

operazione porta ad un calcolo esatto della media se ogni valore centrale coincide con

la media dei valori interni alla medesima classe.

ESEMPIO

Un'automobile percorre 225 km, i primi 120 a 60 km/h, i restanti 105 a 105 km/h. Qual

è la velocità media? Possiamo considerare che l'automobile ha percorso i 225 km in un

tempo di 3 ore, per cui la velocità media

è 225/3=75 km/h. Il conto che abbiamo fatto è il seguente: (120/60 + 105/105)/

(120+105). Si tratta di una media armonica pesata, in cui abbiamo valutato la velocità

come spazio/tempo di percorrenza.

Se invece, nella stessa situazione ci interessassero i consumi e si avesse ad esempio

che l'auto consumi 7 lt /100 km quando viaggia a 60 km/h e 8.5 lt/100km quando

viaggia a 105 km/h, avremmo un consumo medio di carburante pari a

(7*120+9*105)/225=8.089 lt/km ossia un consumo medio di circa 8 litri per km. Si noti

che questa è una media aritmetica pesata.

In alcuni casi, nel calcolo della media aritmetica alle diverse osservazioni viene

attributo un peso, ossia un valore che ne esalti o ne diminuisca l’importanza. Si

introduce allora la media aritmetica ponderata. 9

La media aritmetica ponderata di un insieme di n valori osservati x₁,x₂,…,x di un

carattere quantitativo X con pesi p₁,p₂,…,p non negativi, è data da:

∑ ᵢ ᵢ

x p

₁ ₁+ ₂ ₂+

x p x p …+ xnpn i=1

x́ a= ₁+ ₂+…+ n

p p pn ∑ pᵢ

i=1

Proprietà della media

1. la somma dei valori x₁,x₂,..,x assunti da un insieme di n unità statistiche è

n n

∑ xᵢ=n x́ a

uguale al valore medio moltiplicato per il numero di unità: i=1 x́ a

2. la somma delle differenze tra i valori della xᵢ e la loro media aritmetica è

∑ ( ) =0

xᵢ− x́ a

pari a zero: i=1

3. la somma degli scarti al quadrato dei valori xᵢ da una costante c è minima

∑ 2

( ) x́ a

xᵢ−c

quando c è uguale alla media aritmetica: è minimo per c=

i=1

4. se un collettivo di n unità statistiche viene suddiviso in L sottoinsiemi disgiunti

L

∑ nh=n

di numerosità n₁,n₂,.., n tali che con media rispettivamente

L h=1

( ) ( )

x́ a 1 , x́ a 2 , … , x́ a( L) x́ a

allora la media aritmetica generale si può

ottenere come media ponderata delle medie dei sottoinsimi con pesi uguali alle

L

1 ∑ n

x́ a= x́ a(h)

loro numerosità: h

n h=1

5. la media aritmetica di un carattere Y, ottenuto attraverso un carattere lineare

x́ a ý a=α x́ a+ β

Y=αX+β di un carattere X di media è uguale a:

La media geometrica

La media geometrica è una media analitica utilizzata nel caso in cui l’insieme dei dati

è costituito da valori positivi generati da rapporti. La media geometrica di un insieme

di n valori positivi x₁,x₂,..,x di un carattere quantitativo X è pari alla radice n-esima del

n √

prodotto dei singoli valori: ₁∗x ₂…

x́ g= x xn

Anche per la media geometrica vi è una formulazione più sintetica se si dispone della

√

n n 1 n 2 nk

∗x ∗…∗x

distribuzione di frequenze del carattere X: oppure

x́ g= x 1 2 K

f 1 f 2 fk ᶇ

∗x ∗… dove K è la modalità assunta dal carattere, è la frequenza

x́ g=x x

1 2 K ᶂ

assoluta della j-esima modalità e è la corrispondente frequenza relativa.

ESEMPIO Tipico l'esempio dei tassi di variazione annui, in cui la variazione complessiva

del valore dal tempo iniziale a quello finale si ottiene moltiplicando successivamente i

tassi annuali.

Proprietà della media geometrica

1. il prodotto dei valori x₁,x₂,..,x assunti da un insieme di unità statistiche è uguale

n x́ g

alla potenza n-esima della media geometrica: x₁*x₂*..x = [

n n

¿ ¿

2. il logaritmo della media geometrica è uguale alla media aritmetica dei logaritmi:

1 ∑ )

log x́ g= log(xᵢ

n i=1

La trimmed mean

La media aritmetica è un valore caratteristico intorno al quale si posizionano i valori

della distribuzione. Tuttavia il maggior difetto della media aritmetica è che essa risente

fortemente dei valori estremi, cosicché può accadere che il suo valore non sia ben

rappresentativo dell’insieme dei valori osservati. Un modo che consente di diminuire

l’effetto dei valori estremi nol calcolo della media è quello di effettuare il calcolo solo

sui valori centrali. La media così ottenuta viene detta trimmed mean. La trimmed

mean al 50% di un carattere quantitativo è la media aritmetica del 50% dei valori più

centrali di un insieme di osservazioni. In pratica nel calcolo della media aritmetica non

vengono considerati il 25% dei valori più piccoli e il 25% dei valori più grandi.

ESEMPIO Otto valori: 3,5,5,6,8,8,9,150 la media aritmetica è 24,25; per calcolare la

trimmed mean al 50% si escludono i due valori più piccoli e i due valori più grandi,

ossia: 5+6+8+8/4= 6,75

La trimmed mean può essere calcolata anche in riferimento a percentuali diverse dal

50%. Più grande è la percentuale e minore è il numero di valori estremi da escludere.

La mediana

Una media più robusta della media aritmetica, cioè meno sensibile hai valori estremi,

è la mediana. Questa può essere calcolata solo se il carattere è almeno ordinabile,

cioè deve essere possibile ordinare in modo crescente o decrescente le modalità del

carattere. M

La mediana, indicata con , di un insieme di unità ordinate, è la modalità

presentata dall’unità centrale, dove per ogni unità centrale si intende quell’unità che

divide il collettivo in due parti di uguale numerosità: una parte formata dalle unità che

presentano una modalità precedente o uguale a quella dell’unità centrale e una parte

formata dalle unità che presentano una modalità successiva o uguale a quella

dell’unità centrale.

Per calcolare la mediana occorre:

1. ordinare le n uità in senso crescente rispetto alle modalità del carattere;

2. individuare la posizione in graduatoria dell’unità centrale; se n è dispari, la

(n+1) n

posizione è ; se n è pari si hanno due unità centrali con posizione 2

( )

n +1

e ;

3. osservare la modalità presentata dall’unità centrale: se n è dispari la mediana

M ; se n è pari abbiamo due modalità corrispondenti alle due unità

(n+1)

e 2 +1

centrali: e ; quando le unità del collettivo sono numerose, accade

( )

n n

2 2

che le due modalità coincidono, cosicché anche in questo caso la mediana è

identificata da una sola modalità. In ogni caso, se il carattere è quantitativo,

possiamo considerare come mediana la semisomma dei valori delle due unità

1 ( )

= +

M x x

centrali: e n n

2 +1

2 2

Se abbiamo un carattere qualitativo e la corrispondente distribuzione di frequenze, per

calcolare la mediana occorre anche qui determinare l’unità centrale o le unità centrali.

Quando i dati vengono presentati mediante una dstribuzione di frequenze di un

carattere quantitativo suddiviso in classi non è possibile individuare esattamente la

mediana. In questo caso è possibile ottenere una sua approssimazione attraverso la

( )

0,5−F m−1

M ≈ I ∆

formula: dove:

e m m

−F

F −1

m m

I è l’estremo inferiore della classe modale (la classe che contiene l’unità centrale);

F è la frequenza relativa cumulata fino alla classe precedente a quella mediana;

−1

F è la frequenza relativa cumulata fino alla classe mediana;

D o ∆ è l’ampiezza della classe mediana.

m m 11

Per applicare l’ultima formula scritta bisogna innanzitutto calcolare la distribuzione

delle frequenze relative cumulate e poi l’ampiezza della classe mediana.

Proprietà della mediana

Per un carattere quantitativo X, la somma degli scarti in valore assoluto dei valori xᵢ da

∑ | |

−c

xᵢ

una costante c è minima quando c è uguale alla mediana: è minimo per

i=1

M

c= e

La mediana è più robusta della media. Media e mediana a confronto: La media e la

mediana di una distribuzione simmetrica sono molto vicine. Se la distribuzione è

esattamente simmetrica media e

mediana coincidono. In una distribuzione asimmetrica, la media si trova più all’esterno

(sulla coda lunga della distribuzione) rispetto alla mediana.

La moda

La moda è una media di posizione che può essere calcolata per qualsiasi tipo di

carattere. Essa è la modalità della distribuzione che si presenta con la massima

frequenza (assoluta,relativa o percentuale).

Se la distribuzione è costituita da pochi termini è abbastanza probabile che si verifichi

uno dei casi seguenti:

1. tutte le modalità si presentano con frequenza pari a 1; in tal caso la moda non

esiste (è indeterminata)

2. due o più modalità si possono presentare con la medesima frequenza massima;

in tal caso la distribuzione si dice plurimodale.

La moda è di nuovo indeterminata nel caso di distribuzione in classi. Per le

distribuzioni in classi si determina la classe modale. La classe modale non

Anteprima

Vedrai una selezione di 15 pagine su 67