Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Densità di frequenza per la distribuzione
Si determinino le densità di frequenza per la seguente distribuzione:
5frequenza della i-esima classe = 2.5h =h = D1.i 2.0ampiezza della i-esima classe 17 = 8.5h =2 2.0... 6 = 3.0h =7 2.0si consideri la classe c - c con frequenza n e ampiezza d = c - ci-1 i i i i i-1 dsi suddivida la classe in n intervalli della stessa ampiezza iiD niPer DISTRIBUZIONE UNIFORME DELLE UNITÀ NELLE CLASSI si intendequesta particolare disposizione delle n unità nella classeiconseguenza = prendendo un sotto intervallo di ampiezza δ nella classe i-esima, il numero di unità, n(δ;i), appartenenti ad esso è proporzionale a δ, n •con coefficiente di proporzionalità pari alla densità di frequenza della classe in(δ;i) = δd i le x si dispongano sullascolonna, mentre le ycostruzione di una distribuzione doppia di frequenza tx , x ,…, x = modalità distinte di X1 2 s sulla riga in modo dapartendo da una serie
doppia di osservazioni (x ; y ),… (x ;y )1 1 n n D y , y ,…, y = modalità distinte di Y1 2 t avere una tabella s • tcaselle
Il conteggio avviene idealmente esaminando la singola coppia(x ;y ) della serie doppia di osservazioni e inserendo una lineettai iverticale nell'apposita casella di una tabella di spoglio doppio
ESEMPIO: si costruisca la distribuzione doppia di frequenza per le coppiedi osservazioni contenute nella seconda e terza colonna:
classi = 4.5 - 10.5; 10.5 - 15.5; 15.5 - 20.5; 20.5 - 25.5 f
La distribuzione doppia di frequenza è denominata anche TABELLA DI CONTINGENZAi2 tipologie speciali di dati = serie storiche e serie territoriali
SERIE STORICA: sequenza ordinata delle modalità di una variabile quantitativa osservati a intervalli ditempo equidistanti (tempo = intervallo temporale o preciso istante)
ESEMPIO 1: intervallo temporale
ESEMPIO 2: preciso istante
SERIE TERRITORIALE: quando le modalità della variabile
d’interesse sono riferite a entità territoriali. ESEMPIO: si supponga di aver osservato p variabili, X , X ,… X , su un insieme di n unità statistiche1 2 p allora la matrice dei dati ha: • le righe rappresentano le n unità statistiche dimensioni n • p e i suoi • le colonne rappresentano le p variabili osservate elementi sono caratterizzati: 1. generico elemento x (i = 1, 2,…n; l = 1, 2,….p)il 2. elementi della generica riga i-esima rappresentano le modalità delle p variabili osservate sulla stessa i-esima unità (riga intera = intero corredo informativo della i-esima unità) 3. elementi della generica colonna l-esima rappresentano le modalità della variabile l-esima osservate su tutte le n unità 2 tipi di dati mancanti = MANCATE RISPOSTE TOTALI e MANCATE RISPOSTE PARZIALI = problema comune a tutte le prime si hanno quando sono assenti tutte le informazioni riguardanti una o più unità lerilevazioni statistiche (nella matrice di dati vi sono una o più righe in meno rispetto al numero di unità statistiche rilevate) può succedere che l'insieme dei rispondenti non sia rappresentativo della popolazione di riferimento. Le seconde si hanno quando uno o più intervistati non rispondono a qualche domanda (i dati mancanti sono sparpagliati nella matrice di dati).
SOLUZIONE = vengono utilizzati criteri di pulitura dei dati standard, che restituiscono una matrice senza lacune (meccanismo casuale o basato su criteri di similarità).
DATI ANOMALI = sono rappresentati da quelle modalità che differiscono sensibilmente dalle restanti = possono essere causati da un'elevata variabilità intrinseca del fenomeno al quale ci si riferisce, da errori di rilevazione/registrazione,...
SOLUZIONE: se è causato a un errore di rilevazione non correggibile, si elimina e si tratta come dato mancante; se è causato dalla variabilità
intrinseca della variabile, si conserva e si attua una trasformazione per attenuarne l'effetto sull'elaborazione dei dati
ERRORI DI MISURA = sono definiti come le differenze tra le modalità reali assunte dalle variabili e quelle rilevate dalla singola unità statistica = possono essere causati dal rispondente/rilevatore, durante il trattamento ed elaborazione del dati,...
Gli errori di misura possono essere irriconoscibili o produrre dati inammissibili/anomali (quelli inammissibili vengono cancellati e trattati come mancanti)
i dati mancanti e gli errori di misura sono qualificati come errori non campionari, in modo da differenziarli dai cosiddetti errori campionari che tra l'altro si riferiscono all'interno campione
I grafici hanno la capacità di rappresentare in modo sintetico ed efficace i dati:
- visibili le caratteristiche essenziali dei dati, facilitando l'interpretazione dei fenomeni;
- semplificano la complessità dei
dati;• consentono il confronto fra due o più insiemi di dati.
DISTRIBUZIONI DI FREQUENZA DI VARIABILI DISCRETE
distribuzione di frequenza di una variabile discreta
GRAFICO A PUNTI: dove la modalità x viene rappresentata con un punto se il numero n delle unità non è grande, una rappresentazione semplice è il grafico a punti ripetuto tante volte quant'è la sua
ESEMPIO: grafico e punti della distribuzione di frequenza della variabile esame frequenze n i (punti disposti in colonna)
GRAFICO DELLA FUNZIONE DI FREQUENZA: per descrivere la relazione tra frequenza e modalità in una distribuzione di frequenza di rappresentazione grafica una variabile discreta, si può definire la funzione di frequenza consiste nel riportare i valori della variabile sull'asse x, se x = x, i = 1, 2,..., ki in(x) = orizzontale, le frequenze 0, altrove
ESEMPIO: sull'asse verticale e disegnare per ogni x una linea verticale idistribuzione del numero di
Esami superati nel 1° anno di altezza nel corso di economia si ottiene il GRAFICO AD ASTEGRAFICO A NASTRI: le linee verticali associate alle modalità della distribuzione possono essere sostituite con nastri di altezze/lunghezze corrispondenti alle frequenze = GRAFICO A NASTRIESEMPIO: distribuzione percentuale delle famiglie per dimensione in Italia, Francia e Germania nel 2018GRAFICO DELLA FUNZIONE DI RIPARTIZIONE: data una distribuzione di frequenza della variabile discreta X, la funzione di ripartizione, F(x), è la funzione che associa a ogni numero reale x la frequenza relativa delle unità in cui X < xESEMPIO: distribuzione di frequenza ipotetica del numero di figli in un campione di 50 famiglieF = frequenza relativa cumulata per x = x (x = 0, x = 1, x = 2)i i 1 2 3{ è la frequenza delle unità che presentano una modalità minore di x (più piccola)0, se x < x 1 non ci sono unità che presentano modalità maggiore
di x e minore di xF , se x < x < x , i = 1, 2,… k-1F(x) = i i+1i i i+1 tutte le unità presentano una modalità minore o uguale a x (più grande)1, se x > x kkè una funzione costante a tratti che presenta del salti pari a f , f ,... f nei punti x , x ,...x1 2 k 1 2 k
ESEMPIO:funzione di ripartizione della distribuzione di frequenza della tabella del numero diesami superati nel 1º anno di corso della facoltà di economia.
Le frequenze relative cumulate delle modalità: 0, 1, 2, 3, 4, 5 sono: 0.044, 0.175, 0.438, 0.806, 0.984, 1.000
funzione di ripartizione = funzione costante a tratti che assumevalore 0.044 nell' intervallo [0;1), 0.17 nell'intervallo [1;2) e così via
DISTRIBUZIONI DI FREQUENZA IN CLASSIGRAFICO A PUNTI:può essere utilizzato anche per rappresentare una serie di osservazioni di una variabile continua(prima che queste siano raggruppate in classi) n osservazioni1della classe c - c ,0 1n
osservazioni distribuzione di frequenza in classi: 2 della classe c - c ,1 2 e così via
l'istogramma di frequenza rappresenta una distribuzione di frequenza in classi. Per la sua costruzione si riportano gli estremi di classe sull'asse orizzontale, le densità di frequenza sull'asse verticale; si disegna poi sopra ogni classe un rettangolo di altezza pari alla densità di frequenza e di larghezza pari alla frequenza di classe = h
ESEMPIO:
il grafico può essere usato anche per le frequenze relative = sull'asse verticale si pongono le densità delle frequenze relative f / di i
GRAFICO DELLA FUNZIONE DI RIPARTIZIONE:
data una distribuzione di frequenza in classi, nell'ipotesi di uniforme distribuzione delle unità nelle classi, la funzione di ripartizione F(x) assume la forma
{ 0, se x < c
01 nF(x) = i se c < x < c , i = 1, 2,… k
(x - c )F + • i-1 ii-1i-1 n d i
1, se x > ck
la pendenza di questa retta
è determinata dalla densità di frequenza della classe c - ci-1 i• il grafico si costruisce individuando i punti di coordinate (c , 0), (c , F ),0 1 1(c , F ),… (c , 1)2 2 k
ESEMPIO:funzione di ripartizione della distribuzione di frequenza in classi =funzione di ripartizione mette in luce il ritmo di accrescimento delle frequenzecumulate delle varie classi (segmenti con pendenza maggiore sono quelli associatialla 3º, 4° e 5º classe che sono le classi con densità di frequenza maggiore)
DISTRIBUZIONI DI FREQUENZA DI VARIABILI QUALITATIVEsono rappresentate con grafici a nastri, in cui la singola modalità è rappresentata da un rettangolodi altezza/lunghezza uguale alla frequenza della modalità
ESEMPIO:il grafico a nastri rappresenta la distribuzione di frequenzapercentuale della popolazione francese per religione
Un'alternativa al grafico a nastri è il GRAFICO A TORTA, in cui un cerchio è suddiviso in settori
circolari di dimensioni proporzionali alle frequenze delle singole modalità (settori circolari colorati diversamente per tenere distinte le modalità)
ESEMPIO: rappresentazione in un grafico a torta per la distribuzione della popolazione francese in base alla religione
- bidimensionale
- tridimensionale
Una distribuzione di frequenza di una variabile qualitativa con k modalità può essere rappresentata ponendo uno sopra l'altro i k nastri, ciascuno avente altezza pari alla frequenza della singola modalità. Si ottiene così un grafico a nastri sovrapposti (utile per confrontare divergenze).