Concetti Chiave
- La distribuzione normale standardizzata, o gaussiana, è fondamentale per l'analisi statistica e rappresenta una curva a campana centrata sulla media.
- La distribuzione normale standardizzata ha media zero e deviazione standard uno, semplificando il calcolo delle probabilità tramite una tavola.
- La tavola della distribuzione normale standardizzata aiuta a calcolare l'area sottesa alla curva tra due valori, essenziale per la stima delle probabilità.
- Per utilizzare la tavola, si converte un valore in Z-score sottraendo la media e dividendo per la deviazione standard.
- Nell'esempio pratico, si calcola la percentuale di auto che superano una certa velocità utilizzando la tavola per trovare l'area relativa al valore Z.
In questo appunto viene analizzata la tavola della distribuzione normale standardizzata, descrivendo le sue funzioni e riportando le maggiori caratteristiche.
Indice
La distribuzione normale standardizzata: cos’è e quando viene utilizzata
La distribuzione normale ha un ruolo fondamentale nell’analisi statistica e nel calcolo delle probabilità.
Rappresenta la principale distribuzione di probabilità continua di un fenomeno statistico, attorno a una media. È nota anche col nome di “distribuzione gaussiana”, in onore al matematico Gauss che la formulò per la prima volta nel XIX secolo.
Nella pratica, la distribuzione normale delle probabilità viene rappresentata sul piano cartesiano da una curva a campana, chiamata curva gaussiana o curva Normale, che mostra l’andamento di una serie di valori.
Tale curva riesce a rappresentare al meglio gran parte dei fenomeni naturali: le probabilità di un fenomeno (rappresentate sull’asse delle y) sono più elevate attorno a un valore medio (x = 0) e si riducono allontanandosi da tale valore verso la destra o la sinistra.
Su tale curva possono essere individuati due valori di riferimento:
- La media (µ)
- Lo scarto, chiamato anche deviazione standard (σ)
La media corrisponde all'asse centrale di simmetria della curva, mentre la deviazione standard è data dalla distanza tra la media (l'asse centrale) e il punto di flesso della curva (il punto in cui la curva cambia la sua curvatura). L’area sottesa alla curva è calcolabile con un integrale.
La distribuzione normale standardizzata delle probabilità è un caso specifico, in cui il valore medio è zero (µ=0) e la deviazione standard è uno (σ = 1). In questo caso, perciò, la curva di distribuzione è centrata attorno allo zero del piano cartesiano. Questo caso particolare permette di calcolare l'area sottesa alla curva gaussiana, tra due estremi X1 e X2, tramite una tabella di conversione (senza ricorrere ad un calcolo integrale).
Da quanto appena detto, è possibile affermare che la distribuzione normale standardizzata funziona da tavola grafica per i calcoli della stima statistica delle probabilità.
Per ulteriori approfondimenti sulla distribuzione normale vedi qui
Tavola della distribuzione normale standardizzata: come si legge
Leggi fino in fondo questo articolo e scoprirai come leggere una tavola di distribuzione normale standardizzata.
Saper leggere la tavola ti permetterà di osservare una variabile (ad esempio il punteggio ottenuto dagli atleti ad una gara) attraverso il calcolo dell’area sottesa alla curva gaussiana, compresa tra due valori X1 e X2.
La tavola riporta infatti le aree sottese alla curva f(z) in corrispondenza di diversi valori z. Può essere presa in considerazione:
- L’area compresa tra 0 e un punto Z posto a destra dell’origine: intervallo [0;z] e F(z) = P(0
- Tutta l’area che si trova tra l’estremo sinistro della curva e il punto z (è chiamata probabilità cumulata): intervallo ]−∞;z[ e F(z) = P(−∞
Vediamo nel dettaglio come è fatta la tavola della distribuzione normale standardizzata.
Nella prima colonna della tabella è presente la cifra intera del valore z, fino alla prima cifra decimale. La seconda cifra decimale (da 0,00 a 0,09) deve essere letta sulla prima riga della tabella.
Le caselle interne, corrispondenti alla riga e alla colonna del valore z, contengono il valore dell’area sottesa alla curva per quel determinato z.
Per ulteriori approfondimenti sulla tavola della distribuzione normale standardizzata vedi qui
Tavola della distribuzione normale standardizzata: esempio pratico per calcoli di probabilità
Per poter confrontare diversi valori tra loro, nell’analisi probabilistica, è necessario usare valori standardizzati, così da avvalersi della distribuzione normale standardizzata.
Bisogna prima effettuare:
- Una sottrazione tra il singolo valore scelto (z) e la media (µ)
- Una divisione tra il numero risultante e la deviazione standard (σ)
Quello che si ottiene è il punteggio X (Z-score). Se esso è positivo, significa che quella osservazione per quella variabile ha un valore più elevato della media generale. Al contrario, se è negativo significa che quella osservazione per quella variabile ha un valore meno elevato della media generale. Se è nullo, quella osservazione per quella variabile ha un valore uguale alla media generale.
Per capire in quale range di probabilità è il valore osservato, è necessario ricorrere alla tavola della distribuzione normale standardizzata.
Ecco un esempio pratico.
La velocità delle auto rilevata dall’autovelox si distribuisce normalmente sui 74 km/h, con un comporto di circa 8 km/h. Quante auto (in percentuale) superano il limite di velocità di 70 km/h?
Come prima cosa bisogna standardizzare il valore z per i 70 km/h (come spiegato nelle righe precedenti):
z = (70 – 74) / 8 = -0,500
Bisogna quindi cercare sulla tavola della distribuzione normale standardizzata il valore dell’area sottesa alla curva tra 0 e 0,500 (in quanto corrisponde all’area compresa tra -0,500 e 0).
Sulla colonna di sinistra della tavola, bisogna cercare 0,5.
Sulla prima riga troviamo invece il valore 0,00.
Incrociando, individuiamo la casella dell’area sottesa alla curva nel nostro punto z: 0,1915.
Bisogna ora aggiungere l’area a destra del valore medio, del valore di 0,5, che non abbiamo considerato con la tabella:
0,1915 + 0.5 = 0,1965
Dunque, il 19,65% delle macchine in transito superano il limite di velocità.
Domande da interrogazione
- Cos'è la distribuzione normale standardizzata e quando viene utilizzata?
- Come si legge la tavola della distribuzione normale standardizzata?
- Qual è il processo per calcolare il punteggio Z (Z-score)?
- Come si utilizza la tavola per calcolare la probabilità di un evento?
- Come si applica la distribuzione normale standardizzata in un esempio pratico?
La distribuzione normale standardizzata è una distribuzione di probabilità continua centrata attorno a una media di zero e una deviazione standard di uno. Viene utilizzata per calcolare l'area sottesa alla curva gaussiana tra due estremi senza ricorrere a calcoli integrali.
La tavola si legge individuando il valore z nella prima colonna e la seconda cifra decimale nella prima riga. Le caselle interne contengono il valore dell'area sottesa alla curva per quel determinato z.
Il punteggio Z si calcola sottraendo la media dal valore scelto e dividendo il risultato per la deviazione standard. Questo punteggio indica quanto un'osservazione si discosta dalla media.
Si utilizza la tavola per trovare l'area sottesa alla curva tra 0 e il valore z calcolato. Questa area rappresenta la probabilità cumulata fino a quel punto.
Nell'esempio della velocità delle auto, si calcola il punteggio Z per 70 km/h, si trova l'area corrispondente nella tavola, e si somma l'area a destra del valore medio per determinare la percentuale di auto che superano il limite di velocità.