vuoi
o PayPal
tutte le volte che vuoi
P(AUB)= P(A)+ P(B)
Il principio delle probabilità totali per eventi incompatibili può essere esteso a più di
due eventi.
La probabilità condizionata
Uno dei concetti più importanti del calcolo delle probabilità è la probabilità
condizionata ,ossia quando siamo interessati alla probabilità di un evento il cui
risultato è influenzato dal verificarsi di un altro evento.
Con P(A∩B)=P(A)P(B)
Indichiamo il principio delle probabilità composte per eventi indipendenti. Diremo che
due eventi A e B entrambi appartenenti allo spazio Ω sono stocasticamente
indipendenti se per essi vale il principio delle probabilità composte per eventi
indipendenti.
Il teorema di bayes
Un evento A di Ω si può esprimere, come :
A = A∩ Ω = A∩(U U U U,….,UU )
1 2 N
In definitiva la formula di Bayes sarà P U i P( A∨Ui)
( )
∑n
P(U|A)= P Ui P
( ) (A∨Ui)
i=1
Le variabili casuali
Il concetto di variabile casuale è una variabile quantitativa che associa a ogni
elemento W dello spazio Ω un numero reale.
i
Le variabili sono classificate in due grosse categorie:
- Discrete cioè costituite da un numero finito o infinità numerabile di valori
- Continue ovvero costituite da un numero infinito di valori compresi in un
intervallo di ampiezza finita o infinita.
Vengono definiti momenti ci permettono di definire dei parametri di una distribuzione
di probabilità.
La curtosi è la valutazione del comportamento della distribuzione di probabilità alle
code. Si avrà un valore alto della curtosi quanto più i valori nelle code distanti dalla
media hanno probabilità di verificarsi elevata.
Le scale di misura
Nominale, rappresenta un modo di categorizzare, la scala ditomica ha due soli valori, 1
e 0;mentre quella politomica vi sono più modalità
Ordinale, graduatorie d’ordine, relazioni di minoranza o maggioranza
Ad intervalli, stesse caratteristiche di una scala ordinale ma l’intervallo fra i valore
distribuiti rimane costante per tutta la sua estensione
Di rapporti partendo da 0 ci consente di determinare se una quantità è multipla di
un’altra.
Rilevazioni campionarie o parziali
La popolazione obiettivo di un indagine statistica è necessaria verificare la
disponibilità di base di campionamento che le corrisponda perfettamente.
La lista è un insieme ordinato di contrassegni delle unità delle popolazioni.
Un campione è casuale se tutte le unità della popolazione hanno probabilità non nulla
di essere incluse nel campione(probabilità di inclusione)
Campionamento probabilistico quando è possibile definire l’insieme C i tuti i campioni
distinti estraibili dalla popolazione ed a ciascun membro c(campione ) di tale insieme è
possibile assegnare a proori una probabilità di selezioni indicata con p(c).
Campioni non ragionati sono formati senza alcun ricorso a meccanismi di
casualizzazione
Campioni fortuiti formati da volontari o unità che transitano da passaggi obbligati
come frontiere.
Probabilità d’inclusione = campioni che includono l’i-esima unità ai quali si estende la
sommatoria probabilità semplice (o del primo ordine). Riferite alle coppie è definita
probabilità d’inclusione congiunta (o del 2° ordine) cioè che 2(i e j) siano inclusi nel
campione.
Approccio parametrico
Con approccio parametrico indichiamo l’attitudine a stimare i parametri sulla base dei
dati empirici osservati, in questo il modello teorico viene stabilito a priori seguendo
una predefinita ipotesi del comportamento del fenomeno reale, mentre con approccio
non parametrico la regolarità del fenomeno reale viene stabilita da una
approssimazione della distribuzione empirica utilizzando funzioni generiche o più in
generale curve che non rispondono a un ipotesi di comportamento.
Da un punto di vista formale le distribuzioni teoriche possono essere classificate in
diversi tipi
La distribuzione teorica è esplicitata da una funzione matematica del tipo y=f(x) e
dove il domino in cui è stato misurato il fenomeno reale tale che sia possibile
esprimere una legge che associa ad ogni valore del dominio, un valore reale in genere
espresso da una frequenza assoluta o relativa. Il dominio è espresso da una
successione infinita numerabile di modalità di misura a cui fa corrispondere un’altra
successione di valori reali.
Momenti di una distribuzione teorica
I momenti definiscono grandezze caratteristiche della distribuzione teorica e hanno la
capacità di riassumere in modo immediato e sintetico l’informazione relativa alla
distribuzione oggetto di studio.
Modello di Bernulli
Lo spazio di 2 misure è ripartibile tra due modalità successo e insuccesso
Assumendo che 0 sia la frequenza relativa del successo ovvero del verificarsi della
modalità A è immediato ricavare che 1-0 è la frequenza relativa dell’insuccesso, ossia
del verificarsi della modalità B. Una variabile quantitativa che rappresenti questo
schema può essere banalmente indicata:
X = x se si verifica l’evento A; x se si verifica l’evento B
i 1 2
La distribuzione teorica associata a questa variabile è:
xi 1-xi
f = 0 (1-0)
i
il cui unico parametro d’interesse è 0. Il modello bernoulliano lo indicheremo
x≈B(0).
La distribuzione binomiale
La distribuzione binomiale vfa’ riferimento ad uno schema teorico dove si deve
immaginare il fenomeno reale diviso in due gruppi,il primo misurabile con la
modalità A, il cui numero di unità è pari a ₥ , mentre l’altro misurabile con la
A
modalità B il cui numero di unità è pari a ₥ . Naturalmente la somma
B
rappresenta il complesso del fenomeno reale che è composto da un numero
finito di misure.
Distribuzione di Poisson(legge degli eventi rari)
Il fenomeno reale schematizzato dalla distribuzione binomiale dipende dalla
numerosità delle ripetizioni indipendenti indicato con ₥ e dalla frequenza
relativa 0 dei successi della misura di cui si vuole conoscere il numero degli
esiti favorevoli. La legge di poisson schematizza una variabile di fondamentale
importanza ed è utile per determinare il numero di volte in cui una misura
qualitativa d’interesse poco frequente si verifica in un dato intervallo di
tempo(o spazio).
Distribuzione normale o di Gauss
Il moello teorica più famoso per le moltelplici applicazioni sia a fenomeni reali è
il modello normale o curva di Gauss. Da un lato può essere utilizato come un
modello che pprossima molto verosimilmente una moltitudine di casi reali. La
maggior parte delle misure antropometriche si suppongono distribuirsi secondo
questo modello. Dall’altro suddetto modello assume un’importanza
fondamentale nell’ambito della teoria dell’inferenza statistica.
Variabile normale standardizzata
Quando si opera con il modello binomiale ci si accorge che il calcolo del
coefficiente binomiale è intrattabile da un punto di vista computazionale. Per
risolvere questo problema si ricorre ad un risultato asintotico dovuto a De
Monrvre che afferma quando P≈0,5 la distribuzione della binomiale è
simmetrica rispetto alla media.
Approccio inferenziale
L’approccio inferenziale assume che il fenomeno reale si costituito da un
numero finito, infinito o illimitato di repliche. In termini essenziali, l’approccio
inferenziale si articola in due parti:
Stima puntuale che rappresenta la procedura implementata per ottenere
- un valore rappresentativo di un parametro della popolazione
Stima intervallare che rappresenta la procedura con cui il ricercatore,
- ricava un intervallo di valori in cui si può ritenere sia contenuto il
parametro della popolazione.
Lo stimatore rappresenta un singolo valore, è una variabile casuale descritta da
una specifica distribuzione di probabilità.
La stima diretta è la media campionaria ,ossia la media della variabile casuale
doppia.
Proprietà degli stimatori
Abbiamo detto che la procedura di stima deve essere valutata per stabilire la
sua attendibilità. Una fase necessaria per raggiungere questo obiettivo è la
verifica delle proprietà auspicabili di un stimatore. In generale, le proprietà di
uno stimatore sono ricavate dalle caratteristiche della rispettiva distribuzione e
, dallo studio della sua sintesi e delle sue variabilità e forma.
Correttezza, ossia valutare il valore medio, cioè se la media della
- distribuzione coincide con il parametro della popolazione.
Consistenza, proprietà asintottica, deve verificare al crescere della
- numerosità campionaria. Si dice consistente se al crescere di
n(numerosità del campione) la distorsione diventa sempre più piccola e
tende a zero.
Efficienza, misura della variabilità della distribuzione di probabilità dello
- stimatore. Il prerequisito della correttezza di uno stimatore, è essenziale
in quanto si intuisce che uno stimatore con una bassissima variabilità
implica che la stragrande maggioranza dei campioni fornisce una stima
diversa dal reale parametro incognito della popolazione.
Stimatori con minimo errore quadratico medio
Un’utile prprietà di uno stimatore è quella dell’errore quadratico medio minimo.
Questa proprietà è utilizzata per valutare stimatori di parametri ottenuti
attraverso processi simulativi ossia quando si vuole tener conto sia della
variabilità dello stimatore(efficienza) sia del suo valor medio(correttezza).
Sufficienza, uno stimatore è sufficiente per 0 se esso riassume tutte le
informazioni presenti nella variabile n-pla campionaria.
Inferenza classica
L’inerenza classica è anche detta inferenza basata sulla verosimiglianza. Si
basa sul principio della stima dei parametri,ossia sul procedimento con cui da
campione osservato si traggono informazioni per assegnare a 0(0 ,0 ,0 …)un
1 2 3
insieme di valori. Si distinguono due casi, nel primo di parlerà di stima
puntuale, intendendo con essa il passaggio da un punto dello spazio
campionario ad un punto dello spazio parametrico.
Proprietà degli stimatori di massima verosimiglianza
Il metodo di stima di massima verosimiglianza fornisce uno stimatore puntuale
del parametro del modello decisionale studiato. Al variare dei possibili campioni
definendo a sua volta una distribuzione di probabilità. In questo contesto e per
la trattazione degli argomenti che seguino è necessario introdurre la funzi