Sissi1993
Ominide
6 min. di lettura
Vota 4 / 5
Statistica - Nozioni basilari

Distinguimo due metodi di ragionamento secondo i diversi sistemi logici:
1) logica del certo;
2) logica del probabile.
La prima si basa su quei fenomeni per i quali è sufficiente l’osservazione di un solo caso per studiarlo e descriverlo.
La seconda si basa su fenomeni non misurati con certezza.
La statistica studia i fenomeni che appartengono alla logica del probabile e ogni songolo fenomeno si chiama unità probabile.
L’argomento delle tabelle si chiama carattere statistica e può essere quantitativo e qualitativo.
È quantitativo quando le sue modalità sono espresse da numeri, mentre è qualitativo quando la sua modalità sono espresse da attributi.
Si definisce frequenza di un dato statistica il n° che indica quante volte si ripete quel dato (f = frequenza).
Si definisce frequenza relativa di un dato il rapporto tra la frequanza di quel dato e la somma di tutte le frequenze.
Si definisce frequenza percentuale, il prodotto relativo per 100.

Errori
Una delle caratteristiche dei fenonemi collettivi è la variabilità con la quale si presentano i dati.
Una causa di questa variabilità è data dagli errori che possono essere accidentali o sistematici.
I primi sono errori non eliminabili dovuti a diverse condizioni di temperatura, pressione o umidità o errori di lettura da parte dell’operatore.
I secondi sono dovuti ad errata taratura dello strumento, e poiché agiscono sempre nello stesso senso sono eliminabili.

Variabili continue e discrete
Quando il carattere può assumere solo valori interi si dice che la variabile è discreta, se può assumere tutti i valori numerici reali compresi in un certo intervallo si dice che la variabile è continua.

Rappresentazione dei dati
Oltre alle tabelle si possono avere delle rappresentazioni grafiche dei dati.

Non sono precise ma permettono di visualizzare immediatamente il fenomeno.
Le rapressentazione più comuni sono:
1) ortogramma;
2) istogramma;
3) areogramma;
4) cartogramma;
5) ideogramma.

Ortogramma
L’ortogramma è una rappresentazione sul piano cartesiano che utilizza solo il primo quadrante.
È formato da rettangoli paralleli non necessariamente adiacenti che devono avare tutti la stesse base, mentre l’altezza sarà proporzionale alla frequenza del carattere.

Istogramma
L’istogramma è la rappresentazione più adatta per rappresentare le classi. Le classi sono raggruppamenti di dati che vengono effettuati quando il n° di dati è elevato.
L’istogramma è una rappresentazione molto simile all’ortogramma, ma in questo caso i rettangoli devono essere adiacenti perché rappresentano delle classi nelle quali vanno indicati il valore minimo e il valore massimo.
Tali valori vanno messi al confine tra un rettangolo e l’altro.

Areogramma o diagramma a torta
L’areogramma (o diagramma a torta) è formato da un cerchio suddiviso in settori, il cui angolo al centro è proporzionato alla frequenza del carattere.
Per determinare l’angolo al centro si deve risolvere una proporzione; se l’angolo non risulta un numero intero si utilizza un’altra proporzione per trasformare la parte decimale in sessagesimale.

Cartogramma
I cartogrammi sono grafici utilizzati per rappresentare dati relativi ad aree geografiche.
Per costruire un cartogramma si usa una carta geografica del territorio e si marcano le varie aree con segni convezionali o colori diversi.

Ideogramma
L’ideogramma utilizza figure che richiamano il contenuto del fenomeno e che servono a darne una visione immediata.
Le figure hanno dimensioni diverse, proporzionali ai dati che rappresentano.

Analisi dei dati
Quando si hanno delle tabelle che rappresentano un qualunque fenomeno è importante analizzare i dati.
Nell’analisi dei dati ci sono tre grandezze caratteristiche:
1) moda;
2) mediana;
3) media.
La moda è il valore del carattere cui corrisponde la frequenza più alta.
La mediana è il valroe che occupa la posizione centrale di N valori disposti in ordine crescente o decrescente. Se N è dispari la mediana è il valore centrale. Se N è pari per trovare la mediana si esegue la semisonna dei dati centrali. Il valore della mediana può non essere inserito nell’insieme dei dati.
La media aritmetica si trova somando tutti i dati disponibili e dividendo per il numero dei dati. Se i numeri si ripetono più volte si ha una tabella di frequenza, la media si chiama media ponderata e si trova calcolando la somma di ogni dato per la sua frequenza diviso la somma delle frequenze.

Metodo rapido per calcolare la mediana:
1) si scrivono le modalità in ordine crescente;
2) si calcola per ogni modalità la somma della frequenza della modalità stessa e di tutte quelle che la precedono (somma parziale);
3) si calcola la semisomma del totale delle frequenze;
4) la mediana è la modalità alla quale corrisponde la prima somma parziale della frequenza che supera la semissoma.

Indici di dispersione
A volte l’analisi dei dati non è sufficiente per conoscere la distribuzione dei dati; si usano allora gli indici di disperzione o di variabilità che sono quattro:
1) campo o intervallo di variazione d;
2) scarto o scostamento semplice s;
3) variazioni;
4) scarto.
Lo scostamento medio semplice è definito come la media degli scarti. Lo scostamento medio semplice con valore maggiore corrisponde ad una maggiore dispersione dei dati attorno alla media.
Per calcolare la varianza si completano le tabelle con gli scarti al quadrato.

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community