La statistica e i suoi rami principali
La statistica è una scienza complementare ad altre scienze e ha lo scopo di raccogliere, elaborare e valutare i dati statistici che riguardano fenomeni collettivi, quindi riguarda masse di dati. La statistica si divide in due grandi rami: Statistica Descrittiva e Statistica Inferenziale.
Statistica descrittiva
La statistica descrittiva si occupa della raccolta, elaborazione e valutazione di dati raccolti sull’intera popolazione oggetto di studio.
Statistica inferenziale
La statistica inferenziale utilizza lo stesso metodo, ma la raccolta dei dati è riferita a un campione estratto dalla popolazione collettiva. Tale campione non viene scelto a caso, ma deve rispettare dei criteri per rappresentare l’universo collettivo dal quale è estratto. In tal modo, è possibile stabilire schemi probabilistici per estendere i risultati riguardanti il campione all’intero universo collettivo. L’indagine campionaria è più veloce e meno costosa, quindi è generalmente la più utilizzata. L’istituto che si occupa delle indagini statistiche a livello nazionale è principalmente l’ISTAT.
Elementi fondamentali della statistica
Elemento principale della statistica è l’indagine statistica, che è l’insieme della metodologia che porta all’acquisizione dei dati statistici direttamente dall’unità statistica oggetto del nostro studio. L’indagine statistica si sostanzia in fasi:
- Definizione degli obiettivi: Questa fase va vista in termini di spazio e tempo. In termini di spazio, questo deve essere circoscritto e definito a priori. In termini di tempo, l’indagine deve rappresentare un flash, perché le condizioni di partenza possono cambiare rapidamente.
- Rilevazione dei dati: Può essere completa o parziale: completa se si intervista l’intero collettivo, parziale se si intervista un campione dell’universo collettivo.
- Elaborazione dei dati
- Rappresentazione dei dati attraverso tabelle e grafici.
Una fase ulteriore potrebbe essere l’applicazione degli esiti delle indagini. Esistono vari rami della statistica: giudiziaria, economica, sociale, etc. In ragione di ciò, la statistica ha implicazioni in altre scienze.
Caratteri statistici
Elemento fondamentale della statistica è l’acquisizione del dato statistico, che si sostanzia in caratteri statistici. Il carattere statistico è la caratteristica che fa differire un’unità statistica da un’altra. Ci sono vari tipi di caratteri statistici, principalmente due tipi: caratteri qualitativi o mutabili statistiche e caratteri quantitativi.
Caratteri qualitativi
I cosiddetti caratteri qualitativi o mutabili statistiche sono degli aggettivi e non valori numerici, per questo motivo non hanno molta importanza nell’indagine statistica. Tali dati presentano due caratteristiche: non sono soggetti a elaborazioni matematiche e non sono ordinabili, salvo eccezioni.
Caratteri quantitativi
I caratteri quantitativi sono valori numerici e si distinguono in due gruppi: caratteri quantitativi discreti o discontinui e caratteri quantitativi continui. I caratteri quantitativi discreti o discontinui sono valori numerici che differiscono tra loro per quantità finite (0,1,2,...). Ad esempio: numero di figli per coppia, numero di matrimoni, etc. I caratteri quantitativi continui sono valori numerici che differiscono tra loro per quantità infinitesimali. Ad esempio: il reddito, l’età, il peso, etc.
Modalità e intensità del carattere
Legato al carattere c’è il concetto di modalità. Per quanto riguarda il carattere qualitativo, la modalità è il modo di manifestarsi del carattere. Ad esempio: le modalità del carattere nazionalità saranno italiano, francese, etc. Se il carattere è di tipo quantitativo, che sia discontinuo o continuo, il modo di manifestarsi del carattere è soprannominato intensità. L’intensità è, dunque, il risultato di misurazione del carattere.
Frequenza
Legato al concetto di carattere esiste anche il concetto di frequenza, che è il numero di volte in cui si manifesta quel carattere, quelle modalità o intensità del carattere. Se il carattere è nazionalità, la frequenza sarà, ad esempio, dieci italiani, quindici francesi.
Rappresentazione dei dati
Una volta elaborati i dati forniti dalla rilevazione statistica, si producono le tabelle statistiche per rappresentarli in maniera razionale. In base alle tabelle, lo statistico procede a molte altre elaborazioni.
Per indicare i dati presenti in una tabella ci sono delle convenzioni:
- Intensità (carattere quantitativo) - X
- Frequenza - N
- Mutabile statistica (carattere qualitativo) - Z
- Densità di frequenza - d
- Frequenza relativa - FR
- Frequenza cumulata - C
- Frequenza cumulata relativa - CR
- Ampiezza della classe di intensità - α
Esempio di tabelle statistiche
Schema di una tabella della distribuzione di frequenze di un carattere discontinuo o discreto:
| X (generica intensità) | N (generica frequenza) |
|---|---|
| X1 | N1 |
| X2 | N2 |
| ... | ... |
| Xk | Nk |
| TOT | N (totale frequenze) |
Schema di una tabella della distribuzione di frequenze di una mutabile statistica (carattere qualitativo):
| Z (generica modalità) | N (generica frequenza) |
|---|---|
| A | N1 |
| B | N2 |
| C | N3 |
| ... | ... |
| Zk | Nk |
| TOT | TOT |
Schema di una tabella di carattere quantitativo continuo:
| Xi – Xi+1 | Ni |
|---|---|
| X1 – X2 | N1 |
| X3 – X4 | N2 |
| ... | ... |
| Xk – Xk+1 | Nk |
| TOT | N (totale) |
Nota bene: il carattere quantitativo continuo viene opportunamente organizzato in classi di intensità. Ad esempio, reddito Xi – Xi+1 e Ni.
Elaborazioni statistiche
Esempio: Perdo delle informazioni nel raggruppare l’intensità in classi, dunque mi è impossibile calcolare il reddito medio senza sostituire alle classi di intensità il loro valore centrale, che corrisponde alla media degli estremi della classe d’intensità.
Un’altra elaborazione possibile quando si hanno valori organizzati in classi è l’ampiezza della classe di intensità che altro non è che la differenza degli estremi della classe. Ad esempio: 1000 – 500 = 500 (Ampiezza della classe).
Un’ulteriore elaborazione è la densità di frequenza, che è il rapporto fra la frequenza assoluta di ciascuna classe e l’ampiezza di ciascuna classe d’intensità.
La frequenza relativa serve quando vogliamo sapere la frazione dei casi presi in considerazione, che presentano una determinata intensità o modalità del carattere. In pratica, si tratta del rapporto tra frequenza assoluta e totale delle frequenze.
Frequenze cumulative
Le frequenze cumulate si usano quando si vuole sapere il numero delle frequenze fino a un certo Xi (Ci). In genere, sono indicate con il simbolo Ci e rappresentano la frequenza fino a Xi.
Le frequenze cumulate possono essere rese relative e percentuali. Frequenze cumulate relative (CR): esprimono la frazione dei casi fino ad Xi.
Esempio di tabella di frequenza di un isolato
Esempio: Ho un isolato di 33 famiglie classificate secondo il numero di componenti.
| Xi | Ni | Ci | CR | C% | FR | F% |
|---|---|---|---|---|---|---|
| 2 | 2 | 2 | 0.06 | 6% | 0.06 | 6% |
| 2 | 6 | 9 | 0.27 | 27.2% | 0.21 | 21.2% |
| 3 | 9 | 18 | 0.54 | 54.5% | 0.27 | 27.2% |
| 4 | 9 | 27 | 0.81 | 81.8% | 0.27 | 27.2% |
| 5 | 4 | 31 | 0.94 | 93.9% | 0.12 | 12.1% |
| 6 | 2 | 33 | 1.00 | 100% | 0.06 | 6% |
Tabella a doppia entrata
Quando si procede a un’indagine statistica si rilevano più caratteri simultaneamente, quindi ho delle informazioni multiple ed è perciò impensabile costruire una tabella per ogni carattere. Presupponiamo di avere una tabella di questo genere:
| Xi | Yi | Zi |
|---|---|---|
| X1 | Y1 | Z1 |
| X2 | Y2 | Z2 |
| ... | ... | ... |
| Xk | Yk | Zk |
| TOT | TOT | TOT |
Ad esempio: sesso, età, peso, reddito. M 50 75 1500 F 39 55 1200 M 35 72 1000 M 35 73 1000 ...
Procedendo in tal modo, avrei una tabella improponibile. Per organizzare questi dati in maniera razionale e chiara, ci si serve di una tabella multipla dalla quale poi si può ricavare una tabella nella quale andiamo ad analizzare due o tre caratteri per volta, la cosiddetta tabella a doppia entrata. In una tabella multipla ci ritroviamo di fronte a dati statistici a frequenza unitaria, al contrario, nella tabella a doppia entrata ritroveremo dati con frequenza non unitaria, potendo associare più caratteri qualora ricorrano più volte.
Schema di una tabella a doppia entrata
| TESTATA | X1 | X2 | ... | Xi | ... | XR |
|---|---|---|---|---|---|---|
| Yi | N1,1 | N2,1 | ... | Ni,1 | ... | NR,1 |
| Y2 | N1,2 | N2,2 | ... | Ni,2 | ... | NR,2 |
| ... | ... | ... | ... | ... | ... | ... |
| Ys | N1,s | N2,s | ... | Ni,s | ... | NR,s |
| N.,. | N1,. | N2,. | ... | Ni,. | ... | NR,. |
L’associazione dei due o tre caratteri non segue nessuno schema, dunque è possibile associare caratteri quantitativi a caratteri qualitativi senza incontrare alcun ostacolo. Le frequenze marginali di riga e di colonna rappresentano la somma delle frequenze rappresentate in ogni colonna ed in ogni riga. La frequenza che cambia lungo la riga o la colonna viene sostituita da un punto (.), mentre quella che resta invariata viene indicata col suo indice. La frequenza N.,. sta a rappresentare la frequenza totale di quelle rappresentate nell’intera tabella.
Esempio di una tabella a doppia entrata
Di seguito un esempio di una tabella a doppia entrata di 739 abitazioni distinte secondo il numero di stanze e il numero dei componenti:
| Numero di stanze (Xi) | 1 | 2 | 3 | 4 e + | |
|---|---|---|---|---|---|
| Componenti Yi | 55 | 110 | 80 | 10 | 255 |
| 2 | 40 | 130 | 50 | 15 | 235 |
| 3 | 20 | 120 | 30 | 20 | 190 |
| 4 e + | 9 | 8 | 20 | 22 | 59 |
| 124 | 368 | 180 | 67 | 739 |
Simbolo di sommatoria
Il simbolo di sommatoria è indicato come Σ e si utilizza per esprimere la somma di una serie di numeri. Ecco come si struttura:
n ∑i=1 ai
Dove:
- ai rappresenta l’indice di sommazione, cioè i valori interi consecutivi dal primo all’ultimo valore della sommatoria;
- n rappresenta l’ultimo valore della sommatoria;
- i=1 rappresenta il primo valore della sommatoria.
Esempio:
4 ∑i=1 = a1 + a2 + a3 + a4 = 10
Alcuni esempi
Se ai = i, allora:
4 ∑i=1 i = 1 + 2 + 3 + 4 = 10
Se ai = i2, allora:
4 ∑i=1 i2 = 12 + 22 + 32 + 42 = 30
Se ai = 1/i, allora:
4 ∑i=1 1/i = 1 + 1/2 + 1/3 + 1/4 = 2.0833
Se ai = i + 1, allora:
4 ∑i=1 (i + 1) = (1 + 1) + (2 + 1) + (3 + 1) + (4 + 1) = 3 + 4 + 5 + 6 = 18
Proprietà dell’indice di sommatoria
- La sommatoria applicata alla somma algebrica di due o più termini si scinde nelle sommatorie dei singoli termini:
- La sommatoria di una costante (K), che non dipende dall’indice di sommazione (i), viene addizionata n volte nello sviluppo della sommatoria:
- La sommatoria applicata alla somma algebrica di una lettera che dipende dall’indice di sommazione (i) e di una costante, che dunque non dipende da (i), darà come risultato la sommatoria della lettera che dipende da (i) più n volte la costante:
- La sommatoria applicata al prodotto di una lettera che dipende dall’indice di sommazione (i) e di una costante, dà come risultato che la costante si pone davanti all’indice di sommatoria, ossia si mette in evidenza:
n ∑i=1 (ai + bi) = n ∑i=1 ai + n ∑i=1 bi
n ∑i=1 K = nK
n ∑i=1 (ai + K) = n ∑i=1 ai + nK
n ∑i=1 (ai × K) = K n ∑i=1 ai
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.