Anteprima
Vedrai una selezione di 6 pagine su 21
Statistica 1 - primo parziale Pag. 1 Statistica 1 - primo parziale Pag. 2
Anteprima di 6 pagg. su 21.
Scarica il documento per vederlo tutto.
Statistica 1 - primo parziale Pag. 6
Anteprima di 6 pagg. su 21.
Scarica il documento per vederlo tutto.
Statistica 1 - primo parziale Pag. 11
Anteprima di 6 pagg. su 21.
Scarica il documento per vederlo tutto.
Statistica 1 - primo parziale Pag. 16
Anteprima di 6 pagg. su 21.
Scarica il documento per vederlo tutto.
Statistica 1 - primo parziale Pag. 21
1 su 21
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

X

! cumulativa cumulativa cumulativa

! x N F P

1 1 1 1

!

! x N F P

2 2 2 2

! … … … …

!

! x N F = 1 P = 100

k k k k

!

!

!

Serie storica e serie territoriale

!

Quando si misura uno stesso fenomeno nel tempo, registrandolo in determinati istanti, la

successione dei valori misurati da origine a una rappresentazione tabellare denominata serie storica

o temporale.

Ne sono esempi la popolazione residente in un Paese ai censimenti oppure il consumo trimestrale di

elettricità di una città.

!

Quando invece si misura un fenomeno di carattere geografico, le cui modalità rappresentano

nazioni, regioni, città, ecc., la distribuzione viene detta serie territoriale o spaziale.

!

!

! Serie temporale o storica

Anno Occupati

! 2001 21.965

! 2002 22.240

! Serie territoriale o spaziale

2003 22.289

!

! 2004 22.404 Area geografica Occupati

! 2005 22.563 Nord 11925

! 2006 22.988 Centro 4826

!

! 2007 23.222 Mezzogiorno 6216

!

!

!

!

!

Rappresentazione grafica

!

Per rendere più evidenti e di facile lettura le caratteristiche della distribuzione della variabile sul

collettivo preso in esimente vengono utilizzate delle immagine grafiche, rappresentazioni, che

possono variare a seconda dei tipi di dati a disposizione.

!

Grafici a barre o a nastri

!

Per le rappresentazioni grafiche delle distribuzioni di frequenze sono solitamente utilizzati i grafici

a barre (verticali) o a nastri (orizzontali). Essi sono costituiti da una successione di rettangoli che

hanno la stessa base (o altezza) e l’altezza (o la base) proporzionale alla frequenza. Se il carattere è

qualitativo ordinato o quantitativo, è preferibile utilizzare il grafico a barre poiché consente una

migliore visualizzazione dell’ordinamento delle modalità.

!

! 100

! aprile

! 75

maggio

! 50

!

giugno

! 25

! luglio

! 0 aprile maggio giugno luglio

! 0 25 50 75 100

!

Grafici a torta

!

I grafici a torta vengono utilizzati per rappresentare la composizioni di un certo carattere in base

alle modalità. La torta viene ripartita in K settori, a seconda della K modalità, proporzionali alle

frequenze relative.

!

! aprile giugno settembre

!

!

! 13%

!

!

!

! 20%

!

! 66%

!

!

!

!

!

!

!

!

Istogrammi

!

Gli istogrammi sono costituiti da barre non distanziate simili ai grafici a barre ma con la base dei

rettangoli proporzionale all’ampiezza (b = w ) e l’altezza proporzionale alla densità di frequenza

i

(h = n / w ), dunque con un area corrispondente alla frequenza (A = b*h = > n ).

i i i i

!

! 70

!

! 52,5

!

! 35

!

! 17,5

!

! 0

! aprile maggio giugno luglio

Cartogrammi

!

I cartogrammi servono per rappresentare le serie territoriali. In questi grafici la base è una mappa e

l’intensità del colore è proporzionale alla frequenza

!

!

!

!

!

!

!

!

!

!

!

!

Diagrammi cartesiani

!

I diagrammi cartesiani vengono utilizzati per rappresentare le serie storiche. Tali grafici si

presentano come successioni di punti che forniscono l’idea temporale dell’andamento del

fenomeno. Nell’asse delle x viene indicato lo scorrere del tempo mentre, nell’asse delle y, il valore

osservato.

!

!

!

!

!

!

!

!

!

! Il simbolo di sommatoria

!

La sommatoria è un simbolo, ∑ , che abbrevia la somma di un certo numero di addendi, i quali

dipendono da un indice intero che varia fra due estremi indicizzati.

n

∑ a

!! j

j = 1

Il numero sotto indica il numero di partenza dell’intervallo indicizzato mentre, il numero sopra

indica l’estremo massimo dell’intervallo.

!

Tale simbolo gode di diverse proprietà:

Sommatoria con un termine costante

1. n

∑ c = c + c + + c = n c

… *

! j = 1 n volte

La sommatoria di una costante equivale a moltiplicare la costante per l’ampiezza dell’intervallo

(n).

Sommatoria di prodotto per una costante

2.

! n

n

∑ ca = ca + ca + + ca = c (a + a +…+a ) = c ∑ a

!! j

j 1 2 n 1 2 n

j = 1 j = 1

Siccome c è una costante può essere raccolta a fattor comune.

Somma di sommatorie

3.

! n n

n

∑ a + ∑ b = ∑ (a + b )

j j j j

! j = 1

j = 1 j = 1

Se le sommatorie hanno lo stesso indice ed intervallo si possono unire.

Scomposizione di una sommatoria

4. n m n + m

∑ a + ∑ a = ∑ aj

j j j = 1

j = 1 j = 1

Il quadrato di una sommatoria NON è uguale alla sommatoria dei quadrati.

5.

! n n

2 2

(∑ a ) ≠ ∑ a

j j

j = 1 j = 1

La sommatoria dei rapporti NON è uguale ai rapporti delle sommatorie.

6. n

∑ a

n j

a

j

∑ = ≠ j = 1

! b n

j

j = 1 ∑ b j

j = 1

La sommatoria di prodotti non è uguale al prodotto della sommatoria.

7.

! n

n n

∑ (a b ) ≠ (∑ a ) (∑ b )

* *

j j j j

! j = 1

j = 1 j = 1

Le medie

!

Per avere un’ulteriore sintesi delle caratteristiche essenziali delle modalità osservate si usano le

medie. Vi sono due categorie di medie:

le medie analitiche, calcolate attraverso operazioni algebriche sui valori del carattere, che dovrà

• essere, quindi, quantitativo.

le medie di posizione, ovvero valori che non richiedono alcun tipo di operazioni sulle modalità.

!

Le medie di posizione

!

La moda

!

La moda è una caratteristica che può essere calcolata per qualsiasi tipo di carattere. Essa

rappresenta la modalità più frequente nel collettivo osservato. Quindi, in altri termini, è la modalità

del carattere che si presenta con la massima frequenza. Può accadere che la moda non possa essere

identificata in un solo carattere e, in questo caso, si parla di pluri-modali.

Il principale difetto della moda, che la rende inutilizzabile in numerose occasioni, si presenta

quando le frequenze delle modalità sono tutte molto simili poiché, in tal caso, si otterrebbe un

valore poco significativo.

Per rendere meno critico questo aspetto è possibile dividere in classi il carattere, approssimando,

però, le informazioni sul collettivo. In questo caso, al posto della moda, abbiamo la classe modale

che è definita come la classe alla quale corrisponde la densità di frequenza più alta. Se all’interno di

essa vogliamo individuare un unico valore, si può prendere il valore centrale della classe.

Va precisato, che qualora la distribuzione possieda classi di diversa ampiezza, occorre dividere le

frequenze delle classi per la loro ampiezza e confrontare tali quozienti.

!

Esempio. X P W h = P /W

i i i i i

!

! 10 |–– 15 5 5 1

! 15 |–– 20 15 5 3

!

! 20 |–– 30 20 10 2

! 30 |–– 50 30 20 1,5

!

! 50 |–– 75 15 25 0,6

! ≥ 75 15 25 0,6

(max 100)

!

! 100

!

Dunque, in conclusione, la moda fornisce informazioni su una qualsiasi modalità del carattere, non

risente di valori estremi del carattere e dipende dalla frequenza o dalla densità.

!

La mediana

!

La mediana (M ), calcolabile sono se il carattere è almeno ordinabile, è la modalità presentata

e

dall’unità centrale, dove per unità centrale si intende quell’unità che divide il collettivo in due parti

di uguale numerosità (50% prima e 50% dopo): una parte formata dalle unità che presentano una

modalità ≤ e una parte formata dalle unità che presentano una modalità ≥ .

Per calcolare la mediana di un protocollo elementare è necessario effettuare diversi passaggi:

ordinare le n unità statistiche in senso crescente rispetto alle modalità del carattere

1. individuare la posizione centrale, che varia a seconda di n

2. se è dispari sarà: (n +1)

2

mentre se è pari, vi saranno due posizioni mediane: n e n + 1

2 2

!

infine, osservare le modalità presentate in posizione centrale e, nel caso n fosse pari, è possibile

3. delineare una sola posizione centrale facendo la media aritmetica.

!

Quando i dati vengono rappresentati in distribuzioni di frequenze, per determinare la mediana,

occorre guardare le frequenze cumulate.

!

Quando i dati vengo rappresentati con una distribuzione di frequenze di un carattere quantitativo

distribuito in classi non è possibile individuare esattamente la mediana ma solo la classe mediana.

Tuttavia, è possibile ottenere una sua approssimazione attraverso la seguente formula:

! 0,5 - F

i-1

M ≈ X + (x -x )

*

e i - 1 i i-1

! F - F

i i-1

Dove:

X , è l’estremo inferiore della classe mediana.

i - 1

F , è la frequenza relativa cumulata fino alla classe precedente a quella mediana.

i-1

F , è la frequenza relativa cumulata fino alla classe mediana.

i

(x -x ), è l’ampiezza della classe mediana.

i i-1

!

!

Esempio. X n N F

i i i

!

! 1 |–– 3 7 7 0,23

! 3 |–– 6 14 21 0,7

! 6 |–– 11 9 30 1

!

! 30

!

La classe mediana, essendo n un numero pari, è in due posizioni, ovvero 30/2 = 15 e (30/2)+1 = 16

quindi, si presta nella classe 3 6. Se vogliamo determinare, in modo approssimato un valore più

|––

preciso occorre utilizzare la formula sopra espressa, e sarà:

! 0,5 - 0,23

Me = 3 + * 3 = 3 + 1,72 = 4,72

! 0,7 - 0,23

Dunque, il 50% delle unità statistiche osservate ha una modalità ≤ a 4,72 mentre, il restante 50%

ha una modalità ≥ .

!

Una particolare proprietà della mediana è che per un carattere quantitativo X, la somma degli scarti

in valore assoluto dei valori x da una costante c, è minima quando c è uguale alla mediana.

i

! n

∑ |x - c| è minimo quando c = M

j e

j = 1

I percentili

!

I percentili sono quei valori che dividono la distribuzione in 100 parti con medesima ampiezza. Ne

consegue che, da tale definizione, è possibile considerare la mediana come il 50-esimo percentile.

In realtà i percentili più utilizzati sono il 25-esimo

Dettagli
Publisher
A.A. 2016-2017
21 pagine
SSD Scienze matematiche e informatiche MAT/06 Probabilità e statistica matematica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher cate5 di informazioni apprese con la frequenza delle lezioni di Statistica descrittiva e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Bologna o del prof Anderlucci Laura.