vuoi
o PayPal
tutte le volte che vuoi
COGNOME SESSO SODDISFAZIO
NE
TIZIO F MEDIO
CAIO M ALTO
SEMPRONIO F MEDIO
DISTRIBUZIONE DI FREQUENZA ASSOLUTA
SESSO (x) FREQUENZE
ASSOLUTE (n )
i
M = x 1 = n
1 1
F = x x 2 = n
2 … k 2 …ecc
TOTALE= 3 = n
SODDISFAZI FREQUENZE
ONE ASSOLUTE (n )
i
MEDIO 2
ALTO 1
TOTALE= 3
LEGGENDA:
X= carattere osservato - X1,x2…xk= modalita assunte dal carattere x
Xi modalita generica , xk modalita ultima - N= numero u u.s. che compongono
il collettivo
N1,n2..ni…nk= freque. Assol. Associate alle k modalità - N1+n2…+ ni ..+ nk=
n
FREQUENZA RELATIVA (f ) E PRECENTUALE (p )
i = Spesso nei dati statistici
i
non si riportano frequenze assolute, bensì vengono espressi in frequenza relativa e
percentuale.
1. FREQUENZE RELATIVE f = n / n sono le frequenze assolute diviso il totale.
i i
La somma delle frequenze relative è sempre pari a 1.
2. FREQUENZE PERCENTUALI f x 100 stessa cosa delle relative ma per
i
leggerla meglio. La somma delle frequenze percentuali è sempre pari a 100.
SESSO n f p (%)
i i i
F 3 3/5 = 0,6 0,6 x 100=
60
M 2 2/5= 0,4 0,4 x 100=
40
TOT= 5 1 100
NB= Le percentuali sono un rapporto che ci servono per confrontare i collettivi di
diversa dimensione. Posso avere un collettivo di 5 persone o di 300. In tal caso per
capire dove ci sono più donne non basta la frequenza assoluta e relativa ma devo
aggiungere quella percentuale perché potrebbero essere presenti nella stessa
percentuale anche se in numero minore. Le percentuali sono utili ma insidiose. Sotto
stesse percentuali possono esserci numeri molto diversi quantità effettiva. NB = le
2
percentuali come ogni manipolazione del dato, mi implicano una perdita di
informazione. Potrei scordarmi che sto lavorando con 5 o 300 persone. Non fidiamoci
delle percentuali se non sappiamo n e quindi la base su cui sono costruite. (?)
Chiedersi sempre quale è il numero dei casi per ragionare.
Quando si calcolano le frequenze relative è opportuno mantenere almeno 4 cifre
decimali per avere almeno 2. L’arrotondamento si effettua per eccesso se la
cifra decimale è almeno pari a 5; per difetto se è inferiore a 5. Arrotondare in
base alla 5 cifra dopo la virgola.
CONDIZIONE FREQUENZE FREQUENZE FREQUENZE
OCCUPAZIONALE ASSOLUTE RELATIVE PERCENTUALI
Si, lavora 9 0.3462 34.62
Non lavora e cerca 4 0.1538 15.38
Non lavora e non 13 0.5000 50.00
cerca
TOTALE= 26 1.0000 100.00
SI LEGGE IL 35% DEI LAUREATI IN COMUNICAZIONE 2003/2004 LAVORA
FREQUENZE CUMULATE (N )= hanno senso solo se il carattere in esame è
i
almeno un carattere qualitativo ordinale. Somma delle frequenze associate ad una
modalità e a quelle che la precedono. La frequenza cumulata ha senso se le modalità
sono ordinate altrimenti NO. La frequenza cumulata associata alla modalità Xi del
carattere, rappresenta il numero di unità statistiche che presentano una modalità non
superiore (inferiore o uguale) a X .
i
ETA n N
i i
19 1 1
23 1 1+1= 2
28 1 2+1= 3
52 2 3+2= 5
TOTALE= 5 11
NB= Possiamo cumulare anche le frequenze relative o percentuali allo stesso modo.
LIVELLO n N p P
i i i i
SODD.
Molto basso 60 60 25 25
Basso 70 60+70= 29.17 25+29.17=
130 54.17
Medio 20 130+20= 8.33 54.17+8.33=
150 62.5
Alto 60 150+60= 25 62.5+25=
210 87.5
Medio alto 30 210+30= 12.5 87.5+12.5=
240 100
TOTALE= 240 100
Lettura del dato 54,17 percento del collettivo ha un livello di soddisfazione inferiore
o uguale a basso.
In quale dei due campioni si registra una percentuale più elevata di
studenti che usano i social media meno 4 volte a settimana?
COSTRUISCO LE DUE DIVERSE PERCENTUALI E LE CONFRONTO, FARE LE
PERCENTUALI CUMULATE. Studenti in base alla frequenza di upload di contenuti sui
Social Media LICEO A ISTITUTO TECNICO B
Mai 16 13
Qualche volta al mese 24 20
1-3 volte a settimana 53 44
4-6 volte a settimana 32 28
Tutti i giorni 40 48
TOTALE= 165 153
Questa è una variabile qualitativa ordinabile, ci sono due collettivi unitari, due tabelle
di frequenza Non posso confrontare i collettivi se hanno una numerosità diversa
LICE ISTITU A (Pi) B (Pi)
O A TO B
(Ni) (Ni)
Mai 16 13 16/165x100= 13/153x100=
9,70 8,50
Qualche volta 40 33 40/165x100= 33/153x100=
24,24 21,57
1-3 volte 93 77 93/165x100= 77/153x100=
56,36 50,33
4-6 volte 125 105 125/165x100= 105/153x100=
75,76 68,62
Tutti i giorni 165 153 165/165x100= 153/153x100=
100 100
TOTALE= 165 153
MENO DI 4 VOLTE A SETTIMANA, IL DATO SOPRA E QUINDI LA RISPOSTA E’ LA A
LETTURA ULTIMO DATO 165 studenti caricano sui social con una frequenza pari o
inferiore a tutti i giorni.
ESERCIZIO
PAESE PERCENTUALE DIFFUSION
DI.. E
BELGIO 60 Medio-Alta
BULGARIA 29 Medio-
Bassa
REP. CECA 60 Medio-Alta
DANIMARCA 79 Alta
GERMANIA 68 Medio-
Bassa
ESTONIA 60 Alta
IRLANDA 48 Alta
GRECIA 48 Medio-
Bassa
SPAGNA 55 Medio-Alta
FRANCIA 57 Bassa
CROAZIA 48 Bassa
CIPRO 50 Alta
PASSARE DA DISTRIBUZIONE UNITARIA A DISTRIBUZIONE DI
FREQUENZA. CI SONO DUE MODALITA’ E QUINDI CREEREMO DUE
DISTRIBUZIONI DI FREQUENZA
DIFFUSIONE= distribuzione unitaria multipla, qualitativa ordinabile (mettere in
ordine)
DIFFUSIONE n f p
i i i
(Xi)
Bassa 2 2/12 2/12x100=
16,67%
Medio-Bassa 3 3/12 3/12x100=
25%
Medio-Alta 3 3/12 3/12x100=25%
Alta 4 4/12 4/12x100=
33%
TOTALE= 12
PERCENTUALE DI= distribuzione quantitativa ordinabile, a scala di rapporti (perché
lo 0 ha valore)
PERCENTUALE n f p
i i i
DI…
29 1 1/12 1/12x100=
8,33%
48 3 3/12 3/12x100=
25%
50 1 1/12 1/12x100=
8,33%
55 1 1/12 1/12x100=
8,33%
57 1 1/12 1/12x100=
8,33%
60 3 3/12 3/12x100=
25%
68 1 1/12 1/12x100=
8,33%
79 1 1/12 1/12x100=
8,33%
TOTALE= 12
(1?) QUANTI PAESI IN PERCENTUALE DI.. SONO SUPERIORI A 50? Prendo in
considerazione i dati evidenziati che corrispondono a 7 paesi (55,57,60,68,69) 7/12
X 100= 58,33. OPPURE PROPORZIONE 7: X = 12 : 100 (POSSO FARLO COME VOGLIO
IL CALCOLO).
(2?) QUANTI INFERIORI A MEDIO ALTA? Prendo in considerazione la categoria
sopra e cioè medio bassa, quindi la risposta è il 25%.
SINTESI DELLA DISTRIBUZIONE: GLI INDICI MEDI
Ci permettono di sintetizzare con un solo valore
TIPO VARIABILE ESEMPI INDICI MEDI DI SINTESI
Qualitativa sconnessa Sesso, nazionalità, MODA
professione (..)
Qualitativa ordinale Titolo di studio, frequenza MODA
di acquisto (..) MEDIANA
Quantitativa Età, numero prodotti MODA
consumati, spese MEDIANA
effettuate (..) MEDIA ARTIMETICA
MEDIE
1. Deve essere un valore omogeneo con i dati osservati (una quantità o una
qualità a seconda di come è espresso il valore).
2. Deve essere un valore compreso tra le modalità minime e massime se si è in
presenza di una mutabile ordinale o di una variabile secondo il principio di
Cauchy.
3. Ci sono medie di posizione (modalità,non si calcolano ma si individuano e
basta), e le medie analitiche
MEDIE DI POSIZIONE
MODA per tutti i tipi di variabili. E’ la modalità che ha la massima frequenza
(relativa, assoluta o percentuale) e cioè quella più diffusa. Essa può non essere
unica (bimodale, trimodale ecc..)
CORSO DI n i
LAUREA
STF 48
SCPO 71
COOP 6
TOT= 125
La moda del carattere Corso di Laurea è SCPO perché ha la frequenza più elevata
NB= la moda non è 71.
NUMERO CORSI %
1 15
2 43
3 103
4 100
TOT= 261
La moda del carattere Numero di Corsi è 3 NB= non è 103, ma 3.
CLASSE MODALE se il carattere è suddiviso in classi, allora va presa in
considerazione la classe modale che è la classe di modalità a cui corrisponde la
massima densità media di frequenza .
Classi individuare la DENSITA’ MEDIA DI FREQUENZA
1. Calcolo l’AMPIEZZA CLASSE (a ) limite massimo meno limite minimo
i
2. Calcolo la DENSITA’ MEDIA (d ) rapporto tra frequenza della classe e
i
l’ampiezza calcolata prima
PUNTEGGIO= n AMPIEZZA DENSITA’M
i= (a ) EDIA (d )
VOTO STUDENTI i i
(87-98] 18 98-87= 11 18/11= 1,64
voti
(98-102] 27 102-98= 4 27/4= 6,75
voti
(102-105] 25 105-102= 3 25/3= 8,33
voti
(105-109] 35 109-105= 4 35/4= 8,75
voti
(109-111] 25 111-109= 2 25/2= 12,50
voti
TOTALE= 130
La classe modale è 25 // NB SE LE CLASSI ERANO DI STESSE
MEDIANA valore (non è una unità) della distribuzione che divide il collettivo in
due parti uguali: costituiti da modalità inferiori e superiori alla mediana stessa. 1)
ordinare in senso crescente le u.s. rispetto alle modalità su di esse osservate del
carattere in esame. E’ sempre compresa tra la modalità minima x e la modalità
i
massima x . La mediana è robusta cioè poco sensibile ai cambiamento che possono
K
avvenire sulle modalità (..vedi pp). Me= x
Formula n dispari il posto centrale è dato da n+1 /2 n+1/2
Me=
Formula n pari ci sono due posti centrali è dato da n/2 e n/2+1 o
x(n/2)
= X
Me n/2+1
Nb= Se il carattere è quantitativo allora la mediana è la semisomma delle due
modalità individuate cioè due valori centrali diviso 2. Se è qualitativo NO.
Se c’è una distribuzione di frequenza possiamo evitare l’ordinamento poiché
dovrebbe già esserlo. Quindi la procedura è faccio le frequenze cumulate e
trovo il posto di mezzo, oppure le percentuali cumulate per trovare dove sta il
60% che divide in due a destra e a sinistra il gruppo.
ES. DISTRIBUZIONE UNITARIA A 5 UNITA
U.S MODALITA’
Alice Basso
Marco Basso
Elisa Medio
MEDIANA
Lucia Medio
Fabio alto
“MEDIO” MEDIANA= modalità che bipartisce la graduatoria (crescente o
decrescente) delle osservazioni, la distribuzione unitaria va prima ordinata sulla base
delle modalità delle diverse unità per poi trovare la mediana (unità statistica di mezzo)
QUARTILI dividono la distribuzione in quattro parti. Ordinare la distribuzione se è
unitaria. 1. Primo quartile