Indice
Parametro e stima
A questo punto del percorso è stato necessario introdurre il concetto di variabile casuale, dalla descrizione in termini generali di un processo inferenziale che prevede due livelli fondamentali: il livello della popolazione, di cui interessa conoscere il valore che assume un parametro che descrive sinteticamente una o più variabili, come la media, un coefficiente di correlazione, e il livello del campione, che attraverso la stima puntuale del parametro fotografa quello che il campione mostra rispetto al valore del parametro stesso.La stima puntuale è stata descritta utilizzando il principio della stima naturale, che suggerisce come metodo di stima per il parametro ciò che verrebbe in mente di fare, ossia replicare nel campione la sintesi matematica che descrive il parametro a livello di popolazione, per cui stimare una media di una popolazione equivale a calcolare la media all’interno del campione. Inoltre, ogni stima è associata al campione da cui proviene e dal momento che da una popolazione ne posso estrarre infiniti campioni, infinite saranno le stime con cui confrontarsi. Questa caratteristica descrive un fenomeno fondamentale nell’inferenza, che è la variabilità campionaria, cioè che, al di là della stima che si ottiene nel campione, le possibili stime che si possono affrontare sono diverse. L’unico modo disponibile per colmare il divario che si determina quindi tra il livello del campione e quello della popolazione è ragionare su tutte le possibili stime che si possono osservare, ovverosia ragionare sulla variabile casuale che descrive le singole stime che a seconda del campione estratto si possono ottenere. Il concetto di variabilità campionaria, di queste infinite stime con cui confrontarsi, trova una naturale traduzione in termini di variabile casuale.
Bisogna ora affrontare e approfondire quello che è ritenuto il livello intermedio tra il campione e la popolazione, considerando che questo è necessario a risalire dalla stima al parametro tramite un processo di inferenza statistica. Questo livello intermedio è quello che ha a che vedere con le distribuzioni campionarie anche dette stimatori.
Immaginiamo di studiare una variabile numerica, la riduzione del colesterolo nel sangue in una popolazione sottoposta ad un certo trattamento. Dalla statistica descrittiva sappiamo che per descrivere in modo sintetico una variabile numerica il modo migliore è calcolare la media. A seguito della somministrazione del farmaco per alcuni soggetti la riduzione del colesterolo ci sarà stata, per altri no, per alcuni di più, per altri meno.
Riduzione media
Se voglio avere un valore che immediatamente mi faccia percepire se ha senso o meno questo trattamento, calcolo la riduzione media. Se tale media la immaginiamo riferita all’intera popolazione (una popolazione infinita di soggetti con colesterolo alto che potrebbero essere trattati con questo farmaco) la chiamiamo μ (valore medio assunto da una variabile numerica in una popolazione); se riuscissimo a sapere il valore di μ saremmo tutti contenti perché potremmo capire senza ombra di dubbio se varia o meno l’effetto con la somministrazione di questo farmaco:• se il valore di μ fosse positivo significherebbe che il colesterolo aumenta → il farmaco non fa effetto;
• se il valore di μ fosse negativo significherebbe che il colesterolo diminuisce → il farmaco fa effetto.
Nonostante i vari valori numerici che X può assumere, conoscendo μ non avremmo dubbi di interpretazione, ci potrebbero essere semmai delle speculazioni sull’utilità clinica perché una riduzione di -1 interessa di meno rispetto ad una riduzione di -15. In entrambi i casi non avrei alcun dubbio sull’efficacia del trattamento, ma tale livello di sicurezza è irraggiungibile perché si riferisce ad una popolazione.