vuoi
o PayPal
tutte le volte che vuoi
n XY X Y Y X
= = - = -
b a b Y b
X
( )
å å 2
-
2
n X X n n
Metodo dei minimi quadrati:
2
n ( )
å
= - =
ˆ
D y y min!
i i
=
i 1 2
n ( )
å
= - - × =
D y a b x min!
i i
=
i 1
Il problema di minimo si risolve derivando D rispetto al parametro a e rispetto al parametro b e uguagliando a 0 le
derivate parziali. Il sistema che si ottiene è un sistema lineare in due equazioni in due incognite, ha un’unica
soluzione. å ( )( )
n - -
x x y y
i i
=
i 1
= =
b , a y - bx .
å ( )
à n 2
-
x x
i
=
i 1
Retta dei minimi quadrati (proprieta’)
Passa sempre per il punto di coordinate x,y (barincentro dei dati)
n n
å å
= ˆ
y y
E’ tale che (somma dei valori osservati=somma dei valori stimati)
i i
= =
i 1 i 1
n n
å å
- = =
ˆ
( y y ) e 0
Ovvero (somma dei residui = zero)
i i i
= =
i 1 i 1
Usi della retta dei minimi quadrati
L’interpolazione si usa per predire i valori di Y servendosi dei valori di X che si trovano all’interno
• dell’intervallo dei dati.
Risultati soddisfacenti quando la retta ben si adatta ai dati
–
L’estrapolazione si usa per predire i valori di Y attraverso i valori di X che si trovano al di fuori dell’intervallo
• dei dati.
Procedura pericolosa. Non si conoscono le relazioni esistenti al di fuori dell’intervallo.
–
CAPITOLO 5
Che cos’è la probabilità?
La probabilità è una misura di quanto è verosimile il verificarsi di un evento.
• Un esperimento (casuale) è qualsiasi azione che ha come risultato un insieme di dati registrabili.
•
Quando effettuiamo un esperimento:
Lo spazio campionario, S, è l’insieme di tutti gli esiti elementari possibili di un esperimento.
• Spazio campionario finito (numero finito di esiti)
• Spazio campionario infinito (numero infinito di esiti)
•
Eventi casuali: Un evento casuale è un qualsiasi sottoinsieme dello spazio campionario S.
Evento complementare: Il complemento di un evento A è l’insieme di tutti gli esiti dello spazio A A
campionario S che non appartengono ad A e si denota con A’ o Ā, che si può leggere «non A»
Eventi
Quando siamo interessati ad indagare più di un evento
È
L’evento unione A o B (A B) indica che o A o B o entrambi possono verificarsi. Contiene tutti gli esiti
• elementari di S che appartengono ad A o a B (o a entrambi).
Ç
L’evento intersezione A e B (A B) indica che sia A sia B si verificano. Contiene tutti gli esiti elementari di S
• che appartengono sia ad A che a B.
Due eventi A e B sono detti mutuamente esclusivi o incompatibili se non hanno casi in comune, cioè AÇB=Ø
•
Eventi incompatibili: A S B
Gli eventi in probabilità
La probabilità di un evento casuale A, P(A), è una misura di quanto sia verosimile che accada l’evento A. Cioè
• è un numero associato a A che ne quantifica a priori la possibilità di realizzazione.
Se ogni esito elementare dello spazio campionario ha la stessa probabilità di verificarsi, allora definiamo la
• numero di casi " favorevoli
"
probabilità di A (definizione «classica») numero di casi in cui A si può verificare =
P ( A
)
=
P ( A
) numero di casi " possibili"
numero totale di esiti elementari in S
Definizione di probabilità:
Definizione classica: numero di casi favorevoli ad A/numero totale di casi (solo se i casi sono equiprobabili). Le
probabilità che andremo a calcolare soddisferanno le condizioni previste della definizione assiomatica (la probabilità
non viene definita in modo operativo ma deve soddisfare alcune condizioni (assiomi):
≥ ∀ ⊆
1. P(A) 0 A S
2. P(S) = 1
∩ ∅ ∪
3. A B = P(A B) = P(A) + P(B)
à ≤ ≤
La probabilità di un evento A è un numero compreso tra 0 e 1. 0 P(A) 1
La probabilità dell’intero spazio campionario è 1:
P(S) = 1
P(A) = 1 se A si presenta necessariamente (evento quasi certo) A A
P(A) = 0 se A non può verificarci (evento quasi impossibile) 1-P(A)
Evento complementare: P(A) = 1-P(A)
Eventi incompatibili
Si usa: È
Regola semplice della somma: P(A B) = P(A)+P(B)
altrimenti: È Ç
Regola generale della somma: P(A B) = P(A)+P(B)-P(A B) Ç
P ( A B )
( ) =
P A B
Probabilità condizionata: è la probabilità che si verifichi A dato che si è verificato B. P ( B )
P(B)¹0
• Due eventi A e B sono indipendenti se la probabilità che un evento si verifichi non è modificata dal verificarsi
- =
P ( A | B ) P ( A
)
dell’altro evento: oppure
Due eventi sono indipendenti se la probabilità della loro intersezione è uguale al prodotto delle loro probabilità:
- Ç = × Ç
P ( A B ) P ( A
) P ( B ) infatti: P ( A B )
= = Û Ç = ×
P ( A | B ) P ( A
) P ( A B ) P ( A
) P ( B )
P ( B )
Riepilogo:
Ā (A’) è l’evento complementare di A, P(Ā)=1-P(Ā)
AÇB è l’evento intersezione tra gli eventi A e B
AÈB è l’evento unione tra gli eventi A e B
Due eventi A e B sono incompatibili se AÇB=Æ, e quindi P(AÇB)=0
Due eventi A e B sono indipendenti se P(AÇB)=P(A)*P(B)
P(A|B)= P(AÇB)/P(B) è la probabilità condizionata di A dato B
Se A e B sono eventi indipendenti, allora P(A|B)=P(A) e P(B|A)=P(B)
Probabilità dell’unione di due eventi (caso generale):
P(AÈB) = P(A)+P(B)-P(AÇB)
Probabilità dell’unione di due eventi incompatibili:
P(AÈB) = P(A)+P(B)
CAPITOLO 6
Variabili casuali
Una variabile casuale X è una variabile quantitativa i cui valori sono determinati dai risultati di un esperimento
• casuale
Le variabili casuali possono essere discrete o continue.
• Discreta se assume un numero finito o al più numerabile di valori
• Continua se può assumere tutti i valori appartenenti ad un intervallo reale
• L’insieme di tutti i possibili valori che X può assumere è detto supporto
• T 1
S S
ℝ C 0
Una v.c è una funzione definita su uno spazio campionario S a valori reali (ℝ).
Variabili casuali discrete: Funzione di probabilità
La distribuzione o funzione di probabilità p(x) di una variabile casuale X è la funzione che associa ad ogni
• possibile valore di X la probabilità che X assuma tale valore: å
£ £
= = 0 p ( x ) 1
p ( x ) P ( X x ) =
p(x) 1
supporto
Valore atteso e varianza å
= ×
E ( X ) x p ( x )
Il valore atteso di una v.c. discreta X con funzione di probabilità p(x) è definito come
• supporto
å
La varianza di una v.c. X è definita come
• = - ×
2
V ( X ) [ x E ( X )] p ( x )
supporto
Variabile casuale Variabile osservata su una popolazione
å
= ×
E ( X ) x p ( x ) P P
1 å å
µ = × = ×
x f x rf
i i i i
supporto N = =
i 1 i 1
å
= - ×
2
V ( X ) [ x E ( X )] p ( x ) P P
1 å å
s µ µ
= - × = - ×
2 2 2
( x ) f ( x ) rf
i i i i
supporto N = =
i 1 i 1
Notare l’analogia tra
valore atteso di una v.c. e media aritmetica di una variabile statistica
– Varianza di una v.c. e varianza di una variabile statistica
–
Variabile casuale di Bernoulli (o bernoulliana)
Si consideri un esperimento che può portare a due soli esiti: A (successo) e A’ (insuccesso), con probabilità
rispettivamente p e 1-p
P(A)=p
P(A’)=1-P(A)=1-p
La variabile casuale discreta X che associa all’evento A il numero 1 e all’evento A’ il numero 0 è una v.c. di Bernoulli
di parametro 0<p<1.
La sua funzione di probabilità è quindi P(X=0)=1-p e P(X=1)=p
Variabile casuale binomiale
Si consideri un esperimento che può portare a due soli esiti: A (successo) e A’ (insuccesso), con probabilità
rispettivamente p e 1-p
P(A)=p
P(A’)=1-P(A)=1-p
Si supponga inoltre
di ripetere l’esperimento n volte (n prove)
• che le n prove siano indipendenti
• che la probabilità p di successo sia costante per ogni prova
•
La v.c. che descrive il numero di successi in queste n prove (cioè il numero di volte che si verifica l’evento A) è detta
X ~ Binom ( n
, p )
Binomiale con parametri n e p
I valori che questa variabile può assumere sono tutti gli interi da 0 a n: 0, 1, …, n
Cioè il suo supporto è S={0, 1, 2,…, n}
Funzione di probabilità della Binomiale: æ ö
n n
!
ç ÷ = Coefficiente binomiale
æ ö
n ç ÷
-
ç ÷
= = - = -
x n x
P ( X x ) p (
1 p ) , x 0
, 1
, 2
, ..., n x ( n x )! x
!
è ø
ç ÷
x
è ø
= × - × - × × ×
n
! n ( n 1
) ( n 2
) ... 2 1 Fattoriale
Variabile casuale binomiale
Media e varianza della Binomiale: X~Binom(n, p)
E(X)=np
V(X)=np(1-p)
Variabili casuali continue
Assumono valori in un intervallo di numeri reali
• Sono caratterizzate da una funzione di densità di probabilità f(x)
• La probabilità che una v.c. assuma un determinato valore è sempre 0!
• f(x)
Funzione di densità di probabilità per una variabile casuale continua f(x)>0
Rappresentazione grafica della probabilità
P(x <X<x ) L’area totale sottesa dalla curva è pari a 1, cioè
1 2 valori di X
+¥
ò =
f ( x ) dx 1
f(x) - ¥
Probabilità rappresentata dall’area sottesa dalla curva in (x ,x )
1 2
x 2
ò f ( x ) dx
x
1
x
x x
1 2
Intervallo di valori
Analogia con variabili continue in statistica descrittiva
Istogramma Area del rettangolo pari a rf (frequenza relativa della terza classe)
3
Densit&ag