Estratto del documento

Costruire un'adeguata distribuzione di frequenze

Costruire un'adeguata distribuzione di frequenze è un'arte, bisogna saper scegliere quella che ci sembra sintetizzare nel miglior modo possibile le osservazioni disponibili. Dobbiamo considerare che un numero esiguo di classi crea un effetto affollamento dei dati, mentre un numero elevato di classi origina un effetto dispersione che limita, se non addirittura impedisce, l'identificazione di possibili raggruppamenti (o pattern) delle osservazioni. L'obbiettivo quando si costruisce una distribuzione di frequenze è identificare particolari ed interessanti caratteristiche dei dati. Per questo motivo quando si costruisce una distribuzione di frequenze assolute si cerca di avere un numero di classi compreso tra 5 e 20. Non esiste una distribuzione di frequenza esatta, ma esistono distribuzioni di frequenze sbagliate. Linee guida per la determinazione del limite inferiore della prima classe e dell'ampiezza di classe:

  • Scegliamo la più piccola

osservazione presente nel dataset, oppure, se risulta più comodo, un numero leggermente inferiore ad essa;

- Decidiamo il numero di classi (k), che dovrebbe andare da un minimo di 5 ad un massimo di 20 (più piccolo è il dataset di partenza, meno classi saranno create);

- Determiniamo l'ampiezza di classe calcolando ed in seguito arrotondando per eccesso

Ampiezza della classe = (Valore più elevato - Valore più piccolo) / Numero delle classi range / k;

Dopo aver correttamente organizzato le informazioni grezze in tabella ed aver ottenuto una distribuzione di frequenze assolute, possiamo procedere con la rappresentazione grafica. I grafici ci permettono di visualizzare i dati, in quanto hanno un maggiore impatto informativo e rappresentano una forma primordiale di comunicazione. Le rappresentazioni grafiche hanno lo scopo di descrivere una distribuzione, di frequenze o di intensità, in funzione delle modalità, qualitative o quantitative.

variabili qualitative sconnesse. Per le variabili qualitative sconnesse, possiamo utilizzare il grafico a torta o il grafico a barre orizzontali/nastri. Nel grafico a torta, ogni categoria viene rappresentata da una fetta di torta proporzionale alla sua frequenza. Nel grafico a barre orizzontali/nastri, ogni categoria viene rappresentata da una barra orizzontale o un nastro, la cui lunghezza è proporzionale alla sua frequenza. Per le variabili qualitative ordinali, possiamo utilizzare il grafico a barre verticali. In questo tipo di grafico, le categorie vengono rappresentate da barre verticali, la cui altezza è proporzionale alla frequenza. Per le variabili quantitative discrete, possiamo utilizzare i bastoncini o le barre verticali. I bastoncini sono rappresentazioni grafiche simili alle barre verticali, ma vengono utilizzati quando le categorie sono numeri interi. Le barre verticali vengono utilizzate quando le categorie sono numeri decimali. Per le variabili quantitative continue e discrete in classi, possiamo utilizzare l'istogramma. L'istogramma è un grafico a barre verticali in cui le categorie sono intervalli di valori. La larghezza delle barre rappresenta l'ampiezza dell'intervallo e l'altezza rappresenta la frequenza. Per le serie storiche, possiamo utilizzare il grafico a linee. In questo tipo di grafico, i dati vengono rappresentati da punti collegati da linee, che mostrano l'andamento nel tempo. In conclusione, la scelta della rappresentazione grafica dipende dalla tipologia di variabile e dal tipo di dati che si desidera visualizzare.variabili quantitative discrete; mentre quelli a barre orizzontali (o a nastri) per variabili qualitative sconnesse. Grafico a barre verticali:
Grafico a barre verticali
Frequenze Assolute:

14121086420

Schiena Polso Gomito Anca Spalla Ginocchio Mano Inguine Collo

I grafici possono risultare molto utili per confrontare due insiemi di dati. Quando si confrontano differenti insiemi di dati conviene utilizzare le frequenze relative. Finora abbiamo considerato solamente i grafici a barre verticali, ma esistono anche i grafici a barre orizzontali, ai quali si ricorre quando i nomi delle categorie sono molto lunghi. Grafico a barre orizzontali:
Grafico a barre orizzontali
Scuole secondarie di secondo grado Scuole secondarie di primo grado Scuole primarie Scuole dell'infanzia

0 500000 1000000 1500000 2000000 2500000 3000000

Frequenza assoluta:

I grafici a torta sono solitamente utilizzati per presentare le frequenze relative di un carattere qualitativo, che può essere di tipo nominale o ordinale. I grafici a torta possono essere creati solo se tutte le

modalità della variabile considerata sono rappresentate. Grafico a torta Scuola dell'infanzia Scuola primaria Scuola secondaria di primo grado Scuola secondaria di secondo grado I grafici a torta sono utili per mostrare tutti i possibili valori di una variabile qualitativa attraverso la rappresentazione di tutte le sue parti, o settori; ma anche per rappresentare la composizione di un aggregato. In un grafico a torta si enfatizza il confronto delle differenti parti rispetto all'intero, non è infatti utile per confrontare fra loro due valori specifici della variabile considerata. I grafici a barre sono utili per comparare le differenti parti di una variabile, non necessariamente rispetto all'intero. L'ampiezza dei settori circolari (angoli al centro) per una modalità i è proporzionale alla frequenza relativa: Alpha = 360° x (n / N)i i Dove N è il totale osservato, 360° è l'intera superficie circolare, n è lafrequenza della classe divisa per l'ampiezza della classe. Un istogramma è particolarmente utileper visualizzare la distribuzione dei dati e individuare eventuali pattern o tendenze.

La densità di frequenza della classe è data dalla formula: Area rettangolo (base x altezza) n = a x d, dove d è la densità di frequenza, n è la frequenza associata alla modalità i e a è l'ampiezza della classe.

Un istogramma è un grafico a barre che rappresenta la distribuzione di una variabile quantitativa. Le barre sono disposte su una retta orizzontale e indicano le osservazioni del carattere quantitativo in ordine crescente. Un punto viene posto sopra ogni barra per rappresentare la frequenza assoluta dei dati.

Un grafico a punti si ottiene indicando su una retta orizzontale le osservazioni del carattere quantitativo in ordine crescente e ponendo un puntino sopra di esse ogni volta che nei dati si riscontra una frequenza assoluta. Non può essere utilizzato per rappresentare velocemente i dati.

Quando si vuole descrivere una variabile, un modo possibile è quello di descrivere la forma della sua distribuzione. Le forme distributive sono tipicamente classificabili in simmetriche, asimmetriche negative e asimmetriche positive. Le distribuzioni si definiscono simmetriche quando il lato

sinistro è l'immagine speculare del lato destro e viceversa. Si ha una distribuzione uniforme quando la frequenza relativa per ciascun valore della variabile è distribuita uniformemente tra i valori della variabile stessa.

Distribuzione uniforme

Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6
Categoria 1 Categoria 2 Categoria 3 Categoria 4

Si ha una distribuzione a campana quando la frequenza relativa più elevata si riscontra nel mezzo della distribuzione, per poi diminuire in modo simmetrico nelle code di sinistra e di destra.

Distribuzione a campana

Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6
Categoria 1 Categoria 2 Categoria 3 Categoria 4 Categoria 5

Si ha una distribuzione asimmetrica positiva (o asimmetrica destra) quando la forma del grafico è caratterizzata da una coda allungata verso destra.

Asimmetrica destra

Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6
Categoria 1 Categoria 2 Categoria 3 Categoria 4 Categoria 5 Categoria 6

Si ha una distribuzione asimmetrica negativa (o asimmetrica sinistra) quando

La forma del grafico è caratterizzata da una coda allungata verso sinistra. Asimmetrica sinistra

Serie 1 Serie 2 Serie 3

5 4 3 2 1 0

Categoria 1 Categoria 2 Categoria 3 Categoria 4 Categoria 5 Categoria 6

Se i valori della variabile oggetto di studio misurano differenti punti nel tempo, i dati vengono indicati come serie storica. Un grafico di una serie storica si ottiene indicando sull'asse orizzontale il tempo in cui la variabile è misurata e sull'asse verticale il corrispondente valore della variabile, rilevato a quella data. Poi si uniscono i punti tramite segmenti rettilinei. Rappresentare graficamente una serie storica è molto utile per identificare l'andamento o tendenza di fondo (trend) dei dati nel tempo. Una serie storica rappresenta l'andamento di un fenomeno nel tempo; i dati vengono riportati in una tabella dove la prima colonna è occupata dalla data e la seconda dall'intensità associata a ciascuna data. Viene rappresentata

Con un diagramma cartesiano a linea in base ad un sistema dimetrico:

- Asse delle ascisse tempo

- Asse delle ordinate variabile osservata

Grafico a serie storica

54,54

3,53

2,52

1,51

0,50

Categoria 1

Categoria 2

Categoria 3

Categoria 4

Serie 1

Un cartogramma è una carta geografica sulla quale sono rappresentati dati statistici riferiti ad un fenomeno osservato rispetto ad un territorio.

Spesso la statistica viene accusata di avere l'abilità di poter manipolare i dati per supportare ogni posizione scelta. Un modo per distorcere la verità è l'uso dei grafici; poiché hanno una grande importanza bisogna porre molta attenzione nel costruirli e nell'interpretare i messaggi che essi veicolano. Ci sono occasioni in cui i grafici possono risultare fuorvianti, cioè fornire un'impressione errata dei dati in modo intenzionale, o ingannevoli, cioè tentano appositamente di fornire un'idea sbagliata dei dati.

Un' impressione errata può provocare conseguenze serie. Ci sono molti modi e diverse tecniche per creare un grafico corretto: - I titoli dei grafici e le etichette degli assi orizzontali e verticali devono essere chiari, non dobbiamo dimenticarci di inserire le unità di misura e la fonte dei dati; - Le distorsioni sono da evitare assolutamente, non si può mentire riguardo ai dati; - Lo spazio bianco nel grafico è da ridurre il più possibile, dobbiamo utilizzare lo spazio disponibile per far risaltare i dati; - Evitare di sovraffollare i dati; - Evitare la tridimensionalità. I grafici tridimensionali possono sembrare più carini ma distraggono il lettore e spesso inducono in errore.
Anteprima
Vedrai una selezione di 6 pagine su 22
Riassunto esame Statistica sociale, Prof. Petrucci Alessandra, libro consigliato Statistica sociale, Petrucci Pag. 1 Riassunto esame Statistica sociale, Prof. Petrucci Alessandra, libro consigliato Statistica sociale, Petrucci Pag. 2
Anteprima di 6 pagg. su 22.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica sociale, Prof. Petrucci Alessandra, libro consigliato Statistica sociale, Petrucci Pag. 6
Anteprima di 6 pagg. su 22.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica sociale, Prof. Petrucci Alessandra, libro consigliato Statistica sociale, Petrucci Pag. 11
Anteprima di 6 pagg. su 22.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica sociale, Prof. Petrucci Alessandra, libro consigliato Statistica sociale, Petrucci Pag. 16
Anteprima di 6 pagg. su 22.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica sociale, Prof. Petrucci Alessandra, libro consigliato Statistica sociale, Petrucci Pag. 21
1 su 22
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/05 Statistica sociale

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher ilariabrandolini di informazioni apprese con la frequenza delle lezioni di Statistica sociale e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Firenze o del prof Petrucci Alessandra.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community