Variabilità
Il nostro intento, quindi, è quello di quantificare la capacità del fenomeno studiato di assumere modalità diverse attraverso un indicatore che, pertanto, dovrà presentare le seguenti caratteristiche:• non essere negativo, quindi dovrà partire dal valore 0 (la variabilità può essere presente o assente);
• essere nullo se e solo se le unità presentano tutte la stessa modalità (situazione ideale);
• essere sensibile alle variazioni del fenomeno che stiamo studiando, quindi aumentare all’aumentare della diversità tra le unità e non se a variare saranno le condizioni al contorno.
La variabilità può essere definita/studiata in due modi:
• in termini di diseguaglianza, cercando di capire quanto ciascun individuo si allontana dagli altri, mettendo quindi le varie modalità a confronto e tenendo in considerazione che più individui sono distanti fra loro, maggiore sarà la variabilità del fenomeno;
• in termini di dispersione, ovvero, assumendo un baricentro e verificando come le osservazioni si allontanano rispetto ad esso.
Indicatori che possiamo usare per studiare la variabilità sono:
• Varianza, è un indicatore di dispersione che utilizza la media aritmetica come valore di riferimento (baricentro μ) e si basa sulle distanze di ciascuna osservazione dal centro assunto come riferimento. Il nostro compito sarà quello di calcolare la differenza tra i valori individuali e la media, ovvero gli scarti della media, e dovendo ottenere una sintesi, dovremmo sommare i dati ottenuti. Come sappiamo, la media degli scarti è pari a 0 (considerando i segni algebrici delle singole modalità).
Rappresentazioni grafiche per variabili quantitative
Come per le variabili qualitative che come argomento sono precedenti a questo che stiamo affondando, anche per quelle quantitative è necessario ricorrere alla loro rappresentazione grafica con metodi differenti:• Istogramma, si può dire che generalmente in statistica si utilizza per le rappresentazioni di variabili quantitative continue ed è un grafico simile al diagramma a barre, con la differenza che l’asse delle ascisse sarà un asse metrico e, quindi, parteciperà alla rappresentazione dei dati. In altre parole, l’ampiezza delle barre dovrà essere accuratamente calibrata, non potendoci essere spazi a piacere, e dovranno essere disposte secondo l’ordine delle classi. Sull’asse delle ordinate, invece, se riportassimo le frequenze relative, otterremo dei dati falsati, soprattutto se le classi riportate sull’ascissa presentassero ampiezze diverse. Per tale motivo, si riporterà la densità di frequenza che ci dirà quanto dense sono le classi in termini di frequenza.
Così facendo noi facciamo in modo semplicemente che l’informazione riguardante le frequenze relative non sarà persa, perché essa corrisponderà all’area di ciascuna barra e, pertanto, la somma delle aree delle singole classi dovrà essere uguale a 1.