Statistica 1 - primo parziale

Appunti di statistica descrittiva sul primo parziale fatti molto bene basati su appunti personali del publisher presi alle lezioni della prof.ssa Anderlucci dell’università degli …

Esame Statistica descrittiva

Facoltà Economia

Dal corso del Prof. Anderlucci Laura

Università Università degli Studi di Bologna

Publisher cate5

A.A. 2016-2017

21 pagine

Appunto

Vota 4,0 / 5 (1)

Scarica

Estratto del documento

X

! cumulativa cumulativa cumulativa

! x N F P

1 1 1 1

! x N F P

2 2 2 2

! … … … …

! x N F = 1 P = 100

k k k k

Serie storica e serie territoriale

Quando si misura uno stesso fenomeno nel tempo, registrandolo in determinati istanti, la

successione dei valori misurati da origine a una rappresentazione tabellare denominata serie storica

o temporale.

Ne sono esempi la popolazione residente in un Paese ai censimenti oppure il consumo trimestrale di

elettricità di una città.

Quando invece si misura un fenomeno di carattere geografico, le cui modalità rappresentano

nazioni, regioni, città, ecc., la distribuzione viene detta serie territoriale o spaziale.

! Serie temporale o storica

Anno Occupati

! 2001 21.965

! 2002 22.240

! Serie territoriale o spaziale

2003 22.289

! 2004 22.404 Area geografica Occupati

! 2005 22.563 Nord 11925

! 2006 22.988 Centro 4826

! 2007 23.222 Mezzogiorno 6216

Rappresentazione grafica

Per rendere più evidenti e di facile lettura le caratteristiche della distribuzione della variabile sul

collettivo preso in esimente vengono utilizzate delle immagine grafiche, rappresentazioni, che

possono variare a seconda dei tipi di dati a disposizione.

Grafici a barre o a nastri

Per le rappresentazioni grafiche delle distribuzioni di frequenze sono solitamente utilizzati i grafici

a barre (verticali) o a nastri (orizzontali). Essi sono costituiti da una successione di rettangoli che

hanno la stessa base (o altezza) e l’altezza (o la base) proporzionale alla frequenza. Se il carattere è

qualitativo ordinato o quantitativo, è preferibile utilizzare il grafico a barre poiché consente una

migliore visualizzazione dell’ordinamento delle modalità.

! 100

! aprile

! 75

maggio

! 50

giugno

! 25

! luglio

! 0 aprile maggio giugno luglio

! 0 25 50 75 100

Grafici a torta

I grafici a torta vengono utilizzati per rappresentare la composizioni di un certo carattere in base

alle modalità. La torta viene ripartita in K settori, a seconda della K modalità, proporzionali alle

frequenze relative.

! aprile giugno settembre

! 13%

! 20%

! 66%

Istogrammi

Gli istogrammi sono costituiti da barre non distanziate simili ai grafici a barre ma con la base dei

rettangoli proporzionale all’ampiezza (b = w ) e l’altezza proporzionale alla densità di frequenza

(h = n / w ), dunque con un area corrispondente alla frequenza (A = b*h = > n ).

i i i i

! 70

! 52,5

! 35

! 17,5

! 0

! aprile maggio giugno luglio

Cartogrammi

I cartogrammi servono per rappresentare le serie territoriali. In questi grafici la base è una mappa e

l’intensità del colore è proporzionale alla frequenza

Diagrammi cartesiani

I diagrammi cartesiani vengono utilizzati per rappresentare le serie storiche. Tali grafici si

presentano come successioni di punti che forniscono l’idea temporale dell’andamento del

fenomeno. Nell’asse delle x viene indicato lo scorrere del tempo mentre, nell’asse delle y, il valore

osservato.

! Il simbolo di sommatoria

La sommatoria è un simbolo, ∑ , che abbrevia la somma di un certo numero di addendi, i quali

dipendono da un indice intero che varia fra due estremi indicizzati.

∑ a

!! j

j = 1

Il numero sotto indica il numero di partenza dell’intervallo indicizzato mentre, il numero sopra

indica l’estremo massimo dell’intervallo.

Tale simbolo gode di diverse proprietà:

Sommatoria con un termine costante

1. n

∑ c = c + c + + c = n c

… *

! j = 1 n volte

La sommatoria di una costante equivale a moltiplicare la costante per l’ampiezza dell’intervallo

(n).

Sommatoria di prodotto per una costante

! n

∑ ca = ca + ca + + ca = c (a + a +…+a ) = c ∑ a

…

!! j

j 1 2 n 1 2 n

j = 1 j = 1

Siccome c è una costante può essere raccolta a fattor comune.

Somma di sommatorie

! n n

∑ a + ∑ b = ∑ (a + b )

j j j j

! j = 1

j = 1 j = 1

Se le sommatorie hanno lo stesso indice ed intervallo si possono unire.

Scomposizione di una sommatoria

4. n m n + m

∑ a + ∑ a = ∑ aj

j j j = 1

j = 1 j = 1

Il quadrato di una sommatoria NON è uguale alla sommatoria dei quadrati.

! n n

2 2

(∑ a ) ≠ ∑ a

j j

j = 1 j = 1

La sommatoria dei rapporti NON è uguale ai rapporti delle sommatorie.

6. n

∑ a

n j

∑ = ≠ j = 1

! b n

j = 1 ∑ b j

j = 1

La sommatoria di prodotti non è uguale al prodotto della sommatoria.

! n

n n

∑ (a b ) ≠ (∑ a ) (∑ b )

* *

j j j j

! j = 1

j = 1 j = 1

Le medie

Per avere un’ulteriore sintesi delle caratteristiche essenziali delle modalità osservate si usano le

medie. Vi sono due categorie di medie:

le medie analitiche, calcolate attraverso operazioni algebriche sui valori del carattere, che dovrà

• essere, quindi, quantitativo.

le medie di posizione, ovvero valori che non richiedono alcun tipo di operazioni sulle modalità.

•

Le medie di posizione

La moda

La moda è una caratteristica che può essere calcolata per qualsiasi tipo di carattere. Essa

rappresenta la modalità più frequente nel collettivo osservato. Quindi, in altri termini, è la modalità

del carattere che si presenta con la massima frequenza. Può accadere che la moda non possa essere

identificata in un solo carattere e, in questo caso, si parla di pluri-modali.

Il principale difetto della moda, che la rende inutilizzabile in numerose occasioni, si presenta

quando le frequenze delle modalità sono tutte molto simili poiché, in tal caso, si otterrebbe un

valore poco significativo.

Per rendere meno critico questo aspetto è possibile dividere in classi il carattere, approssimando,

però, le informazioni sul collettivo. In questo caso, al posto della moda, abbiamo la classe modale

che è definita come la classe alla quale corrisponde la densità di frequenza più alta. Se all’interno di

essa vogliamo individuare un unico valore, si può prendere il valore centrale della classe.

Va precisato, che qualora la distribuzione possieda classi di diversa ampiezza, occorre dividere le

frequenze delle classi per la loro ampiezza e confrontare tali quozienti.

Esempio. X P W h = P /W

i i i i i

! 10 |–– 15 5 5 1

! 15 |–– 20 15 5 3

! 20 |–– 30 20 10 2

! 30 |–– 50 30 20 1,5

! 50 |–– 75 15 25 0,6

! ≥ 75 15 25 0,6

(max 100)

! 100

Dunque, in conclusione, la moda fornisce informazioni su una qualsiasi modalità del carattere, non

risente di valori estremi del carattere e dipende dalla frequenza o dalla densità.

La mediana

La mediana (M ), calcolabile sono se il carattere è almeno ordinabile, è la modalità presentata

dall’unità centrale, dove per unità centrale si intende quell’unità che divide il collettivo in due parti

di uguale numerosità (50% prima e 50% dopo): una parte formata dalle unità che presentano una

modalità ≤ e una parte formata dalle unità che presentano una modalità ≥ .

Per calcolare la mediana di un protocollo elementare è necessario effettuare diversi passaggi:

ordinare le n unità statistiche in senso crescente rispetto alle modalità del carattere

1. individuare la posizione centrale, che varia a seconda di n

2. se è dispari sarà: (n +1)

mentre se è pari, vi saranno due posizioni mediane: n e n + 1

2 2

infine, osservare le modalità presentate in posizione centrale e, nel caso n fosse pari, è possibile

3. delineare una sola posizione centrale facendo la media aritmetica.

Quando i dati vengono rappresentati in distribuzioni di frequenze, per determinare la mediana,

occorre guardare le frequenze cumulate.

Quando i dati vengo rappresentati con una distribuzione di frequenze di un carattere quantitativo

distribuito in classi non è possibile individuare esattamente la mediana ma solo la classe mediana.

Tuttavia, è possibile ottenere una sua approssimazione attraverso la seguente formula:

! 0,5 - F

i-1

M ≈ X + (x -x )

e i - 1 i i-1

! F - F

i i-1

Dove:

X , è l’estremo inferiore della classe mediana.

i - 1

F , è la frequenza relativa cumulata fino alla classe precedente a quella mediana.

i-1

F , è la frequenza relativa cumulata fino alla classe mediana.

(x -x ), è l’ampiezza della classe mediana.

i i-1

Esempio. X n N F

i i i

! 1 |–– 3 7 7 0,23

! 3 |–– 6 14 21 0,7

! 6 |–– 11 9 30 1

! 30

La classe mediana, essendo n un numero pari, è in due posizioni, ovvero 30/2 = 15 e (30/2)+1 = 16

quindi, si presta nella classe 3 6. Se vogliamo determinare, in modo approssimato un valore più

|––

preciso occorre utilizzare la formula sopra espressa, e sarà:

! 0,5 - 0,23

Me = 3 + * 3 = 3 + 1,72 = 4,72

! 0,7 - 0,23

Dunque, il 50% delle unità statistiche osservate ha una modalità ≤ a 4,72 mentre, il restante 50%

ha una modalità ≥ .

Una particolare proprietà della mediana è che per un carattere quantitativo X, la somma degli scarti

in valore assoluto dei valori x da una costante c, è minima quando c è uguale alla mediana.

! n

∑ |x - c| è minimo quando c = M

j e

j = 1

I percentili

I percentili sono quei valori che dividono la distribuzione in 100 parti con medesima ampiezza. Ne

consegue che, da tale definizione, è possibile considerare la mediana come il 50-esimo percentile.

In realtà i percentili più utilizzati sono il 25-esimo

Anteprima

Vedrai una selezione di 6 pagine su 21

Anteprima di 6 pagg. su 21.
Scarica il documento per vederlo tutto.

Scarica

Anteprima di 6 pagg. su 21.
Scarica il documento per vederlo tutto.

Scarica

Anteprima di 6 pagg. su 21.
Scarica il documento per vederlo tutto.

Scarica

Anteprima di 6 pagg. su 21.
Scarica il documento per vederlo tutto.

Scarica

Acquista con carta o PayPal

Scarica i documenti tutte le volte che vuoi

Dettagli

SSD

Scienze matematiche e informatiche MAT/06 Probabilità e statistica matematica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher cate5 di informazioni apprese con la frequenza delle lezioni di Statistica descrittiva e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Bologna o del prof Anderlucci Laura.

Appunti correlati

Invia appunti e guadagna

Recensioni

4/5

1 recensione

5 stelle

4 stelle

3 stelle

2 stelle

1 stella

Ti è piaciuto questo appunto?

Maozinha

23 Aprile 2023

Statistica 1 - primo parziale

X

Recensioni

Domande e risposte

I migliori insegnanti di Matematica

Salvatore F.

Daniele P.

Matteo S.