Caso della proporzione

Il parametro che si esamina dopo la media è generalmente definito in ambito matematico e economico come la proporzione, in questo secondo caso non ci interessa sapere in media quanti individui hanno una specifica caratteristica ma ci interessa sapere quanti individui la possiedono rispetto al totale (ad esempio: persone con diagnosi di ipercolesterolemia rispetto al totale). Dunque, quando la variabile X non è numerica ma è dicotomica -la caratteristica è presente o assente- si utilizza la proporzione (non mi interessa fare una media).
Il parametro proporzione generalmente si indica con π. Se si vuole fare inferenza su una proporzione, la prima cosa da fare è in maniera piuttosto semplice e scontata stimarla e per farlo si utilizza il principio della stima naturale. Se vogliamo sapere qual è la prevalenza di ipercolesterolemia nella popolazione noi possiamo fare un passaggio che può sembrare ad alcuni scontato ma in effetti non è proprio un passaggio logico:
scegliamo un campione a caso,
contiamo i soggetti con ipercolesterolemia;
dividiamo per la numerosità del campione;
otteniamo p, che è la stima puntuale del parametro π.
Esattamente come μ aveva in m la sua stima, π ha in p la sua stima.
Anche nel caso della proporzione, per poter fare inferenza abbiamo bisogno di conoscere le caratteristiche del modello che ha generato la stima: il modello che ha generato p è lo stimatore proporzione campionaria P, il quale è lo strumento che ci consente di descrivere il processo che ha portato un singolo campione a quel particolare valore di stima; ci mostra quali sono i possibili valori di p osservabili avendo idealmente a disposizione infiniti campioni, qual è la variabilità degli infiniti valori che può assumere p (quali sono i valori di p più probabili e quali i meno probabili), su quale valore sono centrati. Avremmo dunque un numero variabile di stime, alcune più probabili ed altre meno probabili; dunque si può parlare di distribuzione campionaria delle stime. In particolare, essendo una variabile casuale, devo studiare la funzione di densità, il suo valore atteso e la sua varianza.

Stimatore proporzione campionaria

Lo stimatore proporzione campionaria, come lo stimatore media campionaria, è uno stimatore corretto come si dice in gergo.
Dire che lo stimatore proporzione campionaria è corretto significa dire che in media riproduce il parametro: se idealmente si potesse calcolare il suo valore atteso, estraendo idealmente infiniti campioni e calcolando poi la media di tutte le infinite proporzioni campionarie p, troveremmo che esso coincide con π: E(P) = π.
Immaginando di considerare un’aula numerosa come popolazione, con una proporzione di donne uguale a 0,48 (π = 0,48), se idealmente estraessimo dalla popolazione infiniti campioni e calcolassimo la media di tutte le infinite proporzioni campionarie, quest’ultima sarebbe uguale a 0,48 perché lo stimatore proporzione campionaria è corretto.

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community