Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
X
! cumulativa cumulativa cumulativa
! x N F P
1 1 1 1
!
! x N F P
2 2 2 2
! … … … …
!
! x N F = 1 P = 100
k k k k
!
!
!
Serie storica e serie territoriale
!
Quando si misura uno stesso fenomeno nel tempo, registrandolo in determinati istanti, la
successione dei valori misurati da origine a una rappresentazione tabellare denominata serie storica
o temporale.
Ne sono esempi la popolazione residente in un Paese ai censimenti oppure il consumo trimestrale di
elettricità di una città.
!
Quando invece si misura un fenomeno di carattere geografico, le cui modalità rappresentano
nazioni, regioni, città, ecc., la distribuzione viene detta serie territoriale o spaziale.
!
!
! Serie temporale o storica
Anno Occupati
! 2001 21.965
! 2002 22.240
! Serie territoriale o spaziale
2003 22.289
!
! 2004 22.404 Area geografica Occupati
! 2005 22.563 Nord 11925
! 2006 22.988 Centro 4826
!
! 2007 23.222 Mezzogiorno 6216
!
!
!
!
!
Rappresentazione grafica
!
Per rendere più evidenti e di facile lettura le caratteristiche della distribuzione della variabile sul
collettivo preso in esimente vengono utilizzate delle immagine grafiche, rappresentazioni, che
possono variare a seconda dei tipi di dati a disposizione.
!
Grafici a barre o a nastri
!
Per le rappresentazioni grafiche delle distribuzioni di frequenze sono solitamente utilizzati i grafici
a barre (verticali) o a nastri (orizzontali). Essi sono costituiti da una successione di rettangoli che
hanno la stessa base (o altezza) e l’altezza (o la base) proporzionale alla frequenza. Se il carattere è
qualitativo ordinato o quantitativo, è preferibile utilizzare il grafico a barre poiché consente una
migliore visualizzazione dell’ordinamento delle modalità.
!
! 100
! aprile
! 75
maggio
! 50
!
giugno
! 25
! luglio
! 0 aprile maggio giugno luglio
! 0 25 50 75 100
!
Grafici a torta
!
I grafici a torta vengono utilizzati per rappresentare la composizioni di un certo carattere in base
alle modalità. La torta viene ripartita in K settori, a seconda della K modalità, proporzionali alle
frequenze relative.
!
! aprile giugno settembre
!
!
! 13%
!
!
!
! 20%
!
! 66%
!
!
!
!
!
!
!
!
Istogrammi
!
Gli istogrammi sono costituiti da barre non distanziate simili ai grafici a barre ma con la base dei
rettangoli proporzionale all’ampiezza (b = w ) e l’altezza proporzionale alla densità di frequenza
i
(h = n / w ), dunque con un area corrispondente alla frequenza (A = b*h = > n ).
i i i i
!
! 70
!
! 52,5
!
! 35
!
! 17,5
!
! 0
! aprile maggio giugno luglio
Cartogrammi
!
I cartogrammi servono per rappresentare le serie territoriali. In questi grafici la base è una mappa e
l’intensità del colore è proporzionale alla frequenza
!
!
!
!
!
!
!
!
!
!
!
!
Diagrammi cartesiani
!
I diagrammi cartesiani vengono utilizzati per rappresentare le serie storiche. Tali grafici si
presentano come successioni di punti che forniscono l’idea temporale dell’andamento del
fenomeno. Nell’asse delle x viene indicato lo scorrere del tempo mentre, nell’asse delle y, il valore
osservato.
!
!
!
!
!
!
!
!
!
! Il simbolo di sommatoria
!
La sommatoria è un simbolo, ∑ , che abbrevia la somma di un certo numero di addendi, i quali
dipendono da un indice intero che varia fra due estremi indicizzati.
n
∑ a
!! j
j = 1
Il numero sotto indica il numero di partenza dell’intervallo indicizzato mentre, il numero sopra
indica l’estremo massimo dell’intervallo.
!
Tale simbolo gode di diverse proprietà:
Sommatoria con un termine costante
1. n
∑ c = c + c + + c = n c
… *
! j = 1 n volte
La sommatoria di una costante equivale a moltiplicare la costante per l’ampiezza dell’intervallo
(n).
Sommatoria di prodotto per una costante
2.
! n
n
∑ ca = ca + ca + + ca = c (a + a +…+a ) = c ∑ a
…
!! j
j 1 2 n 1 2 n
j = 1 j = 1
Siccome c è una costante può essere raccolta a fattor comune.
Somma di sommatorie
3.
! n n
n
∑ a + ∑ b = ∑ (a + b )
j j j j
! j = 1
j = 1 j = 1
Se le sommatorie hanno lo stesso indice ed intervallo si possono unire.
Scomposizione di una sommatoria
4. n m n + m
∑ a + ∑ a = ∑ aj
j j j = 1
j = 1 j = 1
Il quadrato di una sommatoria NON è uguale alla sommatoria dei quadrati.
5.
! n n
2 2
(∑ a ) ≠ ∑ a
j j
j = 1 j = 1
La sommatoria dei rapporti NON è uguale ai rapporti delle sommatorie.
6. n
∑ a
n j
a
j
∑ = ≠ j = 1
! b n
j
j = 1 ∑ b j
j = 1
La sommatoria di prodotti non è uguale al prodotto della sommatoria.
7.
! n
n n
∑ (a b ) ≠ (∑ a ) (∑ b )
* *
j j j j
! j = 1
j = 1 j = 1
Le medie
!
Per avere un’ulteriore sintesi delle caratteristiche essenziali delle modalità osservate si usano le
medie. Vi sono due categorie di medie:
le medie analitiche, calcolate attraverso operazioni algebriche sui valori del carattere, che dovrà
• essere, quindi, quantitativo.
le medie di posizione, ovvero valori che non richiedono alcun tipo di operazioni sulle modalità.
•
!
Le medie di posizione
!
La moda
!
La moda è una caratteristica che può essere calcolata per qualsiasi tipo di carattere. Essa
rappresenta la modalità più frequente nel collettivo osservato. Quindi, in altri termini, è la modalità
del carattere che si presenta con la massima frequenza. Può accadere che la moda non possa essere
identificata in un solo carattere e, in questo caso, si parla di pluri-modali.
Il principale difetto della moda, che la rende inutilizzabile in numerose occasioni, si presenta
quando le frequenze delle modalità sono tutte molto simili poiché, in tal caso, si otterrebbe un
valore poco significativo.
Per rendere meno critico questo aspetto è possibile dividere in classi il carattere, approssimando,
però, le informazioni sul collettivo. In questo caso, al posto della moda, abbiamo la classe modale
che è definita come la classe alla quale corrisponde la densità di frequenza più alta. Se all’interno di
essa vogliamo individuare un unico valore, si può prendere il valore centrale della classe.
Va precisato, che qualora la distribuzione possieda classi di diversa ampiezza, occorre dividere le
frequenze delle classi per la loro ampiezza e confrontare tali quozienti.
!
Esempio. X P W h = P /W
i i i i i
!
! 10 |–– 15 5 5 1
! 15 |–– 20 15 5 3
!
! 20 |–– 30 20 10 2
! 30 |–– 50 30 20 1,5
!
! 50 |–– 75 15 25 0,6
! ≥ 75 15 25 0,6
(max 100)
!
! 100
!
Dunque, in conclusione, la moda fornisce informazioni su una qualsiasi modalità del carattere, non
risente di valori estremi del carattere e dipende dalla frequenza o dalla densità.
!
La mediana
!
La mediana (M ), calcolabile sono se il carattere è almeno ordinabile, è la modalità presentata
e
dall’unità centrale, dove per unità centrale si intende quell’unità che divide il collettivo in due parti
di uguale numerosità (50% prima e 50% dopo): una parte formata dalle unità che presentano una
modalità ≤ e una parte formata dalle unità che presentano una modalità ≥ .
Per calcolare la mediana di un protocollo elementare è necessario effettuare diversi passaggi:
ordinare le n unità statistiche in senso crescente rispetto alle modalità del carattere
1. individuare la posizione centrale, che varia a seconda di n
2. se è dispari sarà: (n +1)
2
mentre se è pari, vi saranno due posizioni mediane: n e n + 1
2 2
!
infine, osservare le modalità presentate in posizione centrale e, nel caso n fosse pari, è possibile
3. delineare una sola posizione centrale facendo la media aritmetica.
!
Quando i dati vengono rappresentati in distribuzioni di frequenze, per determinare la mediana,
occorre guardare le frequenze cumulate.
!
Quando i dati vengo rappresentati con una distribuzione di frequenze di un carattere quantitativo
distribuito in classi non è possibile individuare esattamente la mediana ma solo la classe mediana.
Tuttavia, è possibile ottenere una sua approssimazione attraverso la seguente formula:
! 0,5 - F
i-1
M ≈ X + (x -x )
*
e i - 1 i i-1
! F - F
i i-1
Dove:
X , è l’estremo inferiore della classe mediana.
i - 1
F , è la frequenza relativa cumulata fino alla classe precedente a quella mediana.
i-1
F , è la frequenza relativa cumulata fino alla classe mediana.
i
(x -x ), è l’ampiezza della classe mediana.
i i-1
!
!
Esempio. X n N F
i i i
!
! 1 |–– 3 7 7 0,23
! 3 |–– 6 14 21 0,7
! 6 |–– 11 9 30 1
!
! 30
!
La classe mediana, essendo n un numero pari, è in due posizioni, ovvero 30/2 = 15 e (30/2)+1 = 16
quindi, si presta nella classe 3 6. Se vogliamo determinare, in modo approssimato un valore più
|––
preciso occorre utilizzare la formula sopra espressa, e sarà:
! 0,5 - 0,23
Me = 3 + * 3 = 3 + 1,72 = 4,72
! 0,7 - 0,23
Dunque, il 50% delle unità statistiche osservate ha una modalità ≤ a 4,72 mentre, il restante 50%
ha una modalità ≥ .
!
Una particolare proprietà della mediana è che per un carattere quantitativo X, la somma degli scarti
in valore assoluto dei valori x da una costante c, è minima quando c è uguale alla mediana.
i
! n
∑ |x - c| è minimo quando c = M
j e
j = 1
I percentili
!
I percentili sono quei valori che dividono la distribuzione in 100 parti con medesima ampiezza. Ne
consegue che, da tale definizione, è possibile considerare la mediana come il 50-esimo percentile.
In realtà i percentili più utilizzati sono il 25-esimo