X
La VARIANZA di X, indicata con σ ^2 , è definita come il valore atteso del quadrato degli scarti della
X
variabile dalla sua media, (X - μ )^2:
X
La trasformazione lineare è analoga; Sia W = a + bX , dove X ha media μ e varianza σ ^2 , e a e b
X X
sono costanti. Allora la media di W è
la varianza e deviazione std di W sono:
Distribuzione uniforme
La distribuzione continua Uniforme è la distribuzione di probabilità che assegna la stessa
probabilità a tutti gli intervalli della stessa ampiezza. la funzione è costante nel supporto (intervallo).
30
In un intervallo delimitato di valori (a, b). sarà proporzionale l’ampiezza all’altezza e come le calcolo?
Estremi dell’intervallo/ b-a
Distribuzione Normale
È la distribuzione più usata perché descrive bene molti fenomeni, ha proprietà matematiche
convenienti, il teorema del limite centrale a erma che asintoticamente (= al crescere del numero di
osservazioni) la distribuzione della media campionaria tende ad una Normale, qualunque sia la
distribuzione di probabilità delle osservazioni. È quella che si torva più spesso in natura.
di densità con ‘Forma campanulare’
funzione
Simmetrica
Mediana e Moda coincidono (parametri che ci indicano con quale lavoriamo)
Media,
Lo spazio parametrico della media è tutto l’asse reale e la varianza > 0.
La tendenza centrale è determinata dal parametro μ (media), La variabilità è determinata dal
parametro σ (deviazione std), La variabile aleatoria ha un campo di variazione teoricamente infinito:
da − ∞ a + ∞. Famiglia parametrica di distribuzioni continue su supporto (−∞ , +∞) X ~ N (µ, σ^2),
(conoscendo media e varianza possiamo definire la distribuzione) µ (−∞ , +∞), σ^2 [0, +∞). Quindi la
formula della densità sarà (noi non la useremo mai):
*
Ha media: E(x)= varianza: Var(x)= − =
[( )^2] ^2
Cambiando σ aumenta o diminuisce la dispersione; Cambiando µ la distribuzione si sposta verso
sinistra o destra. Media e varianza sono scollegati tra loro (nella binomiale entrambe dipendevano da
n x p: al crescere di n cresceva la varianza e la media): potrebbe esserci una variabilità molto alta e
una media bassissima. 31
L’ area totale sottesa alla curva è pari a 1, e la curva è simmetrica; quindi, metà è al di sopra della
media e metà è al di sotto. P(−∞ < X < +∞) = 1.
Per ogni coppia (µ ,σ ) la f. di densità Normale ha le seguenti caratteristiche:
2
È positiva per ogni x reale Proprietà di ogni densità
L’area sottesa alla curva è 1 Proprietà di ogni densità
La media (valore atteso) coincide con il parametro µ (il simbolo del parametro non è stato scelto a
caso!)
È simmetrica unimodale, per cui µ non è solo la media, ma anche la mediana (µ lascia a sinistra
e a destra un’area pari a 0.5) la moda (x = µ è il punto in cui la curva ha la massima altezza)
La varianza coincide con il parametro σ e quindi la deviazione standard è σ (anche qui il simbolo
2
del parametro non è stato scelto a caso!)
La curva ha due punti di flesso (cambia la concavità) in µ ± σ
Quando x→ −∞ o x→ +∞ la curva tende a zero (senza mai diventare esattamente zero: l’asse delle
ascisse è un asintoto della curva).
Come calcolare le PROBABILITÀ ?
Si calcola la probabilità di certi intervalli, non dei singoli valori. È espressa come di erenza tra la
funzione di ripartizione ((0) = ≤ )) calcolata negli estremi dell’intervallo. Ma la funzione di
( 0
RIPARTIZIONE della Normale è un integrale senza soluzione analitica non esiste una formula per
calcolare le probabilità cumulate! (* formula). Va quindi risolto in maniera numerica:
approssimazione numerica.
Qualunque probabilità relativa di un intervallo può essere ottenuta ricorrendo alla funzione di
ripartizione; tuttavia, risulta di icile calcolare tale probabilità per una qualunque variabile normale,
con media e varianza assegnate. La soluzione a ciò è ricondurre una qualsiasi distribuzione Norm alla
DISTRIBUZIONE NORMALE STANDARD.
Prima vediamo il calcolo tramite approssimazione numerica per la Normale Standard (ovvero il
membro della famiglia con media 0 e dev.std.: varianza 1) uso delle tavole (riportano valori di
≤ ). Poi a rontiamo il problema per una Normale generica (ovvero con media e dev.std.
()=( )
qualunque) la soluzione si basa sulla standardizzazione (si tratta di riformulare il problema in
termini di Normale Standard).
Data la simmetria della curva normale, intervalli simmetrici intorno alla media definiscono la stessa
area sotto la curva. Quindi per esempio dato un numero a > 0 vale:
P(μ-a < X < μ) = P(μ < X < μ+a)
P(X < μ-a) = P(X > μ+a)
P(X < μ-a) = 1- P(X < μ+a) 32
Z var. aleatoria normale, che segue la distribuz. Norm std: NORMALE STANDARD Z, il membro con
media=0 e varianza=1, funge da “rappresentante” della famiglia: ) Z ~ N(0,1).
Per un dato valore a di Z, la tavola fornisce F(a) (l’area sottesa alla curva da meno infinito al valore a)
nella tabella si parte da Z=0 che corrisponde alla media.
Standardizzazione e Calcolo delle probabilità per variabili aleatorie
La tavola mi dice i valori direttamente della standard, ma per le altre no. Data una qualunque v.a. X
con media µ e deviazione standard σ , si definisce standardizzata la v.a. Z
X X
Per costruzione, si ha µ = 0 e σ = 1 (si dimostra usando le proprietà delle
Z Z
trasformazioni lineari di v.a.). La trasformazione INVERSA è
Caso speciale: Se X N(µ ,σ ^2), allora Z N(0,1).
∼ ∼
X X
Calcolo per una Normale generica
Si e ettua una standardizzazione per trasformare P(a≤ X
≤b) con X N(µ, σ^2) in P(a ≤ Z ≤ b ) con Z N(0,1).
∼ ∼
Z Z
Problema diretto : dato un valore di z determinare la probabilità cumulata Φ(z) [in termini geometrici:
dato un punto z sulle ascisse determinare l’area sottesa alla densità φ alla sinistra di z]. parto da un
quantile (valore o soglia) di cui sono interessata a calcolare la P di essere più grande o piccola di quel
valore (z) e calcolo il suo Fi.
Problema inverso : dato un valore p della probabilità cumulata, determinare il valore Zp
corrispondente, cioè Zp tale che Φ(Zp) = p [in termini geometrici: determinare il punto Zp per il quale
alla sua sinistra l’area sottesa alla densità φ è pari ad un certo valore specificato]. Viene dato il valore
della tavola e viene chiesto di trovare z.
È utile per capire la soglia corrispondente ad un valore fissato. 33
Come trovare il valore di corrispondente alla probabilità cumulata
?
Per trovare il quantile usiamo le tavole della Normale standard.
Come cambia se la variabile non è standard (da zp diventa xp) : ( ≤ =
)
quindi devo e ettuare due passaggi: trovare il valore di Z corrispondente alla probabilità data.
Convertire nelle unità di X usando l’inversa della standardizzazione, cioè:
Quando il problema è di tipo inverso si parte dalla Normale standard per ottenere il valore z
desiderato; z è in scala standard non ha unità di misura. Poi si applica la trasformazione inversa
della standardizzazione, che reintroduce la media µX e la deviazione standard σX originali; x è nella
scala originale (kg, cm, secondi, C°,…). X lettura inversa (parto dalla probabilità)
Perché la regola empirica?
Si basa sulla probabilità Normale. Molti fenomeni sono ben approssimati dalla Normale e quindi la
proporzione di osservazioni in un intervallo del tipo µ + kσ è ben approssimata dalla corrispondente
probabilità per la Normale
In una distribuzione Normale, un valore viene considerato anomalo se è fuori dall’intervallo µ ± kσ ,
x x
dove di solito si prende k=2 le distanze vengono misurate a partire da µ e sono in unità di σ un
x x
valore non è anomalo in senso assoluto, ma solo relativamente ad una certa distribuzione.
il criterio dell’intervallo µ ± kσ per giudicare l’anomalia non ha senso se la distribuzione è molto
x x
diversa dalla Normale (in particolare, se è discreta con poche modalità).
Approssimare la Binomiale con la Normale
Determiniamo il modo in cui la distribuzione Normale può essere utilizzata per approssimare la
distribuzione Binomiale. Ricordiamo che la variabile binomiale X può essere riscritta come la somma
di n variabili bernoulliane indipendenti. La Binomiale discreta, variabile con supporto discreto che 34
modella il numero di successi in N, un conteggio, la P che la binomiale fosse uguale ad un certo
valore fosse:
n prove indipendenti
probabilità di successo in ogni prova n è p
Valore atteso e varianza:
> 9
Quando la Normale è una BUONA APPROSSIMAZINE per la binomiale (la binomiale
(1– )
converge ad una normale). è molto simile a quella della v.a. −
∼(, ) ∼(,(1 )).
Allora si sfrutta l’approssimazione dati i grandi numeri.
Variabile aleatoria proporzione o frequenza relativa
In molti problemi applicativi si deve calcolare le probabilità associate a frequenze relative e a
percentuali. Ciò è possibile usando un’estensione diretta dell’approssimazione normale alla
distribuzione binomiale. La variabile aleatoria proporzione, P’ , può essere calcolata dividendo il
numero di successi, X, per la dimensione del campione, n. P’ =/ . Usando la trasformazione lineare
di variabili aleatorie, la media e la varianza di P possono essere calcolate come:
= p e = / .
^2 (1−)
Distribuzione congiunta di due variabili aleatorie continue
Verrà dimostrato che molti concetti e risultati validi per le variabili aleatorie discrete continuano a
essere validi anche nel caso di variabili aleatorie continue. Così come per le variabili aleatorie
discrete abbiamo
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.