Estratto del documento

La sintesi dei dati

Serie di dati e distribuzioni di frequenze

Una distribuzione di frequenze consente di avere una rappresentazione più compatta e più informativa rispetto alla serie di dati osservati e tanto più quanto più la serie è numerosa. In particolare consente di:

  • Disporre dell’elenco di tutte le modalità (valori) distinte/i;
  • Individuare le modalità (valori) più frequenti;
  • Determinare l’intervallo di variazione, se si dispone di valori, della serie originaria;
  • Ipotizzare particolari modelli teorici, atti a descrivere l’andamento delle frequenze.

Le “frequenze assoluteni indicano il numero di volte con cui ciascuna modalità (valore) si presenta nella serie. Oltre alle frequenze assolute possono essere calcolate le “frequenze relative” fi, date dal rapporto fra ciascuna frequenza assoluta e il totale delle osservazioni ed esprimibili anche in termini percentuali. Le frequenze relative consentono di confrontare due variabili rilevate su collettivi di numerosità diversa. Si pensi ad esempio di voler confrontare il peso di un gruppo di soggetti di sesso maschile con il peso di un gruppo di soggetti di sesso femminile.

A partire da una variabile qualitativa ordinabile, per costruire una distribuzione di frequenze, è necessario anzitutto disporre le modalità/valori in ordine crescente. Ha senso, in tal caso, calcolare anche le “frequenze cumulate”, assolute Ni, date dalla somma di ciascuna frequenza assoluta, o relativa, con le relative Fi precedenti.

I valori di una variabile quantitativa discreta, se numerosi, possono essere raggruppati in classi; tuttavia, in questo caso, le classi non hanno lo stesso significato che hanno per la descrizione di un fenomeno continuo e necessariamente l’estremo superiore di una classe non coincide con l’estremo inferiore della classe successiva. La descrizione in classi per i fenomeni quantitativi continui ha appunto lo scopo di recuperare la natura continua del carattere, che al momento della rilevazione viene a cadere, a causa degli arrotondamenti.

Se il carattere è di tipo continuo, le distribuzioni di frequenze per valori singoli possono risultare poco utili o addirittura inutili per suggerire l’eventuale modello teorico atto a descrivere il fenomeno. Si rende pertanto necessario raggruppare i valori osservati in opportune classi di ampiezza costante o variabile. Il criterio di raggruppamento in classi comporta sempre una perdita di informazioni rispetto alla serie originaria e tanto più quanto più sono ampie le classi. La perdita di informazioni influisce sulla correttezza delle costanti sintetiche calcolate sulla distribuzione di frequenze.

Purtroppo, le procedure con cui le classi possono essere formate sono assolutamente arbitrarie e possono condurre a distribuzioni di frequenze sensibilmente diverse, sebbene determinate sulla stessa serie di dati. Si auspica, pertanto, che vengano rispettate le seguenti regole generali:

  • Gli estremi delle classi siano arrotondati all'intero più prossimo o abbiano almeno il minor numero possibile di cifre decimali;
  • Le ampiezze delle classi siano costanti e piccole (l’ampiezza determina il numero delle classi e viceversa);
  • L’estremo inferiore della prima classe e l’estremo superiore dell’ultima differiscano il meno possibile, rispettivamente, dal valore più piccolo e dal valore più grande osservato;
  • Nessuna classe abbia frequenza nulla;
  • Ci sia un solo massimo o al più due;
  • L’andamento sia crescente e poi decrescente o comunque monotono;
  • Scegliendo intervalli aperti (chiusi) sia a destra che a sinistra, si inseriscano, se è possibile, casi uguali in egual numero nelle classi contigue.

Rappresentazioni grafiche

Da una tabella di frequenze possono dedurre informazioni solo gli esperti del settore, o comunque chi ha un minimo di conoscenze statistiche, mentre un grafico è immediatamente interpretabile da chiunque. Ciò perché la mente umana percepisce e memorizza con maggiore rapidità figure piuttosto che cifre. Un grafico, d’altra parte, rappresenta una fonte d’informazione meno ricca, in quanto non consente di evidenziare piccole differenze tra frequenze. Grafico e tabella, dunque, vanno utilizzati entrambi, cioè sono complementari.

Tuttavia, una rappresentazione grafica deve essere autonoma dalla tabella, ovvero deve contenere tutte le informazioni necessarie per la sua interpretazione: va riportata la fonte da cui sono ricavati i dati, vanno specificate le variabili rilevate e le modalità o i valori assunti, vanno indicate le unità di misura. Le indicazioni devono essere leggibili e il grafico non deve apparire confuso se si rappresentano più fenomeni. È necessario, inoltre, scegliere la rappresentazione più semplice, se vi è la possibilità di una gamma di alternative.

Esempi

Anteprima
Vedrai una selezione di 4 pagine su 14
Statistica - Appunti Pag. 1 Statistica - Appunti Pag. 2
Anteprima di 4 pagg. su 14.
Scarica il documento per vederlo tutto.
Statistica - Appunti Pag. 6
Anteprima di 4 pagg. su 14.
Scarica il documento per vederlo tutto.
Statistica - Appunti Pag. 11
1 su 14
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher miltrex di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Palermo o del prof Ruggieri Maria Antonietta.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community