Costruire un'adeguata distribuzione di frequenze
Costruire un'adeguata distribuzione di frequenze è un'arte, bisogna saper scegliere quella che ci sembra sintetizzare nel miglior modo possibile le osservazioni disponibili. Dobbiamo considerare che un numero esiguo di classi crea un effetto affollamento dei dati, mentre un numero elevato di classi origina un effetto dispersione che limita, se non addirittura impedisce, l'identificazione di possibili raggruppamenti (o pattern) delle osservazioni. L'obbiettivo quando si costruisce una distribuzione di frequenze è identificare particolari ed interessanti caratteristiche dei dati. Per questo motivo quando si costruisce una distribuzione di frequenze assolute si cerca di avere un numero di classi compreso tra 5 e 20. Non esiste una distribuzione di frequenza esatta, ma esistono distribuzioni di frequenze sbagliate. Linee guida per la determinazione del limite inferiore della prima classe e dell'ampiezza di classe:
- Scegliamo la più piccola
osservazione presente nel dataset, oppure, se risulta più comodo, un numero leggermente inferiore ad essa;
- Decidiamo il numero di classi (k), che dovrebbe andare da un minimo di 5 ad un massimo di 20 (più piccolo è il dataset di partenza, meno classi saranno create);
- Determiniamo l'ampiezza di classe calcolando ed in seguito arrotondando per eccesso
Ampiezza della classe = (Valore più elevato - Valore più piccolo) / Numero delle classi range / k;
Dopo aver correttamente organizzato le informazioni grezze in tabella ed aver ottenuto una distribuzione di frequenze assolute, possiamo procedere con la rappresentazione grafica. I grafici ci permettono di visualizzare i dati, in quanto hanno un maggiore impatto informativo e rappresentano una forma primordiale di comunicazione. Le rappresentazioni grafiche hanno lo scopo di descrivere una distribuzione, di frequenze o di intensità, in funzione delle modalità, qualitative o quantitative.
variabili qualitative sconnesse. Per le variabili qualitative sconnesse, possiamo utilizzare il grafico a torta o il grafico a barre orizzontali/nastri. Nel grafico a torta, ogni categoria viene rappresentata da una fetta di torta proporzionale alla sua frequenza. Nel grafico a barre orizzontali/nastri, ogni categoria viene rappresentata da una barra orizzontale o un nastro, la cui lunghezza è proporzionale alla sua frequenza. Per le variabili qualitative ordinali, possiamo utilizzare il grafico a barre verticali. In questo tipo di grafico, le categorie vengono rappresentate da barre verticali, la cui altezza è proporzionale alla frequenza. Per le variabili quantitative discrete, possiamo utilizzare i bastoncini o le barre verticali. I bastoncini sono rappresentazioni grafiche simili alle barre verticali, ma vengono utilizzati quando le categorie sono numeri interi. Le barre verticali vengono utilizzate quando le categorie sono numeri decimali. Per le variabili quantitative continue e discrete in classi, possiamo utilizzare l'istogramma. L'istogramma è un grafico a barre verticali in cui le categorie sono intervalli di valori. La larghezza delle barre rappresenta l'ampiezza dell'intervallo e l'altezza rappresenta la frequenza. Per le serie storiche, possiamo utilizzare il grafico a linee. In questo tipo di grafico, i dati vengono rappresentati da punti collegati da linee, che mostrano l'andamento nel tempo. In conclusione, la scelta della rappresentazione grafica dipende dalla tipologia di variabile e dal tipo di dati che si desidera visualizzare.variabili quantitative discrete; mentre quelli a barre orizzontali (o a nastri) per variabili qualitative sconnesse. Grafico a barre verticali:
14121086420
Schiena Polso Gomito Anca Spalla Ginocchio Mano Inguine Collo

0 500000 1000000 1500000 2000000 2500000 3000000
I grafici a torta sono solitamente utilizzati per presentare le frequenze relative di un carattere qualitativo, che può essere di tipo nominale o ordinale. I grafici a torta possono essere creati solo se tutte le
La densità di frequenza della classe è data dalla formula: Area rettangolo (base x altezza) n = a x d, dove d è la densità di frequenza, n è la frequenza associata alla modalità i e a è l'ampiezza della classe.
Un istogramma è un grafico a barre che rappresenta la distribuzione di una variabile quantitativa. Le barre sono disposte su una retta orizzontale e indicano le osservazioni del carattere quantitativo in ordine crescente. Un punto viene posto sopra ogni barra per rappresentare la frequenza assoluta dei dati.
Un grafico a punti si ottiene indicando su una retta orizzontale le osservazioni del carattere quantitativo in ordine crescente e ponendo un puntino sopra di esse ogni volta che nei dati si riscontra una frequenza assoluta. Non può essere utilizzato per rappresentare velocemente i dati.
Quando si vuole descrivere una variabile, un modo possibile è quello di descrivere la forma della sua distribuzione. Le forme distributive sono tipicamente classificabili in simmetriche, asimmetriche negative e asimmetriche positive. Le distribuzioni si definiscono simmetriche quando il lato
sinistro è l'immagine speculare del lato destro e viceversa. Si ha una distribuzione uniforme quando la frequenza relativa per ciascun valore della variabile è distribuita uniformemente tra i valori della variabile stessa.
Distribuzione uniforme
Serie 1 | Serie 2 | Serie 3 | Serie 4 | Serie 5 | Serie 6 |
---|---|---|---|---|---|
Categoria 1 | Categoria 2 | Categoria 3 | Categoria 4 |
Si ha una distribuzione a campana quando la frequenza relativa più elevata si riscontra nel mezzo della distribuzione, per poi diminuire in modo simmetrico nelle code di sinistra e di destra.
Distribuzione a campana
Serie 1 | Serie 2 | Serie 3 | Serie 4 | Serie 5 | Serie 6 |
---|---|---|---|---|---|
Categoria 1 | Categoria 2 | Categoria 3 | Categoria 4 | Categoria 5 |
Si ha una distribuzione asimmetrica positiva (o asimmetrica destra) quando la forma del grafico è caratterizzata da una coda allungata verso destra.
Asimmetrica destra
Serie 1 | Serie 2 | Serie 3 | Serie 4 | Serie 5 | Serie 6 |
---|---|---|---|---|---|
Categoria 1 | Categoria 2 | Categoria 3 | Categoria 4 | Categoria 5 | Categoria 6 |
Si ha una distribuzione asimmetrica negativa (o asimmetrica sinistra) quando
La forma del grafico è caratterizzata da una coda allungata verso sinistra. Asimmetrica sinistra
Serie 1 Serie 2 Serie 3
5 4 3 2 1 0
Categoria 1 Categoria 2 Categoria 3 Categoria 4 Categoria 5 Categoria 6
Se i valori della variabile oggetto di studio misurano differenti punti nel tempo, i dati vengono indicati come serie storica. Un grafico di una serie storica si ottiene indicando sull'asse orizzontale il tempo in cui la variabile è misurata e sull'asse verticale il corrispondente valore della variabile, rilevato a quella data. Poi si uniscono i punti tramite segmenti rettilinei. Rappresentare graficamente una serie storica è molto utile per identificare l'andamento o tendenza di fondo (trend) dei dati nel tempo. Una serie storica rappresenta l'andamento di un fenomeno nel tempo; i dati vengono riportati in una tabella dove la prima colonna è occupata dalla data e la seconda dall'intensità associata a ciascuna data. Viene rappresentata
Con un diagramma cartesiano a linea in base ad un sistema dimetrico:
- Asse delle ascisse tempo
- Asse delle ordinate variabile osservata
Grafico a serie storica
54,54
3,53
2,52
1,51
0,50
Categoria 1
Categoria 2
Categoria 3
Categoria 4
Serie 1
Un cartogramma è una carta geografica sulla quale sono rappresentati dati statistici riferiti ad un fenomeno osservato rispetto ad un territorio.
Spesso la statistica viene accusata di avere l'abilità di poter manipolare i dati per supportare ogni posizione scelta. Un modo per distorcere la verità è l'uso dei grafici; poiché hanno una grande importanza bisogna porre molta attenzione nel costruirli e nell'interpretare i messaggi che essi veicolano. Ci sono occasioni in cui i grafici possono risultare fuorvianti, cioè fornire un'impressione errata dei dati in modo intenzionale, o ingannevoli, cioè tentano appositamente di fornire un'idea sbagliata dei dati.
Un' impressione errata può provocare conseguenze serie. Ci sono molti modi e diverse tecniche per creare un grafico corretto: - I titoli dei grafici e le etichette degli assi orizzontali e verticali devono essere chiari, non dobbiamo dimenticarci di inserire le unità di misura e la fonte dei dati; - Le distorsioni sono da evitare assolutamente, non si può mentire riguardo ai dati; - Lo spazio bianco nel grafico è da ridurre il più possibile, dobbiamo utilizzare lo spazio disponibile per far risaltare i dati; - Evitare di sovraffollare i dati; - Evitare la tridimensionalità. I grafici tridimensionali possono sembrare più carini ma distraggono il lettore e spesso inducono in errore.Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Riassunto esame istituzioni di diritto romano, prof. Petrucci, libro consigliato Manuale di diritto privato romano,…
-
Riassunto esame Statistica, prof. Bove, libro consigliato Statistica per la ricerca sociale, Corbetta, Gasperoni, P…
-
Riassunto esame Statistica, Prof. Likavec Silvia, libro consigliato Statistica per la ricerca sociale, Albano, Test…
-
Riassunto esame di Statistica sociale, prof. Parroco, libro consigliato Statistica. L'arte e la scienza di imparare…