vuoi
o PayPal
tutte le volte che vuoi
Ogni evento ha probabilità sempre maggiore o uguale a 0, quindi P(A)0
La probabilità dello spazio campionario è pari a 1 P(S)=1
La probabilità dell’unione di eventi incompatibili deve essere pari alla somma delle
probabilità dei due eventi. P(AB)=P(A)+P(B) se AB=0. L’unione di due eventi incompatibili
è la somma delle probabilità dei due eventi.
Dai postulati ne risulta che la probabilità è sempre compresa tra 0 e 1. Quindi 0P(A)1, poi
P(Ā)=1-P(A)
La misura delle probabilità: la probabilità del verificarsi di un evento A è data dal rapporto tra il
numero di casi favorevoli all’evento e il numero di casi possibili purché sia tutti ugualmente
possibili.
Due eventi sono indipendenti quando il verificarsi dell’uno non ha nessuna influenza sul verificarsi
dell’altro. Quindi P(AB)=P(A)xP(B)
LEZIONE 8
Variabili casuali
La variabile casuale indica una quantità il cui valore è determinato da un esperimento aleatorio.
È una funzione X che associa a ciascun risultato di un esperimento aleatorio un numero secondo
una determinata regola.
Le variabili casuali possono essere discrete o continue.
La variabie aleatoria discreta è tale perché definita su uno spazio discreto.
Distribuzione di probabilità: di una variabile casuale discreta X associa ad ogni valore possibile x i
la corrispondente probabilità P(X=x )= P(X )
i i
È la somma delle probabilità dei 3 eventi: si calcola rapportando il numero di probabilità di uno
stesso numero rispetto al totale delle possibilità.
Per rappresentare la distribuzione di probabilità si usa il diagramma a bastoncini.
Esperimento: lanciamo due dati
I possibili esiti dello spazio campionario sono:
1,1
1,2-2,1
1,3-3,1-2,2
1,4-4,1-2,3-3,2
1,5-5,1-3,3-2,4-4,2
1,6-6,1-2,5-5,2-3,4-4,3
le possibili coppie da osservare sono 36 (6 facce per un dado x 6 del secondo dado)
costruirsi una tabella dove nella prima riga si mettono i valori che la variabile assume
x 2 P(X) 1/36
x 3 P(x) 1/18
indipendenti quando il verificarsi dell’uno non influenza il verificarsi dell’altro
incompatibili quando il verificarsi dell’uno esclude per forza il verificarsi dell’altro
Media o valore atteso di una variabile aleatoria
bisogna fare una media dei possibili valori che la variabile piò assumere però pesando la
possibilità che avvenga.
Es: se x1=0 x2=1 x3=2 x4=3
1/8 3/8 3/8 1/8
La media è: 0x1/8+1x3/8+2x3/8+3x1/8
Quindi 0+3/8+3/4+3/8= 3/2
Distribuzione binomiale
urna con 10 palline: 6 bianche e 4 nere
esperimento: estrazione di 1 pallina
l’evento può essere bianco successo o nero insuccesso
la possibilità p si osservare un successo è 6/10 ovvero 3/5
la possibilità p si osservare un insuccesso è 4/10 ovvero 2/5
La variabile aleatoria di bernoulli dice che
x 1-x
P (X=x)= p (1-p)
Variabile aleatoria binomiale ci va a contare i successi che si verificano in un numero n di eventi
indipendenti
variabile di bernoulli assume valore 1 in caso di successo quindi nel nostro caso la possibilità che
esca 1 è 3/5
assume valore 0 in caso di insuccesso quindi la possibilità è 1-2/5
adesso se io prendo 5 palline voglio sapere quale possibilità ho di estrarne 2 bianche
qual è la possibilità che su 5 palline ne escano 2 bianche e 3 nere BBNNN.
Essendo eventi indipendenti, perché c’è il reinserimento, bisogna moltiplicarli tutti (se fosse
dipendenti invece?? )
le probabilità quindi sono pB x pB xpN x pN x pN
1 2 1 2 3
6/10x6/10x4/10x4/10x4/10
2 3
ovvero 6/10 x 4/10 2 3
quindi la probabilità è P=(X=2)= 5 6/10 x 4/10
2
in più, ho le combinazioni di 5 elementi in classe 2 (5) (2)
questa terminologia diventa 5!
2! X 3!
si legge ! fattoriale ovvero 5x4x3x2x1
2x1x3x2x1
risultato 10 2 3
quindi la probabilità è P=(X=2)= 10 x 6/10 x 4/10
LEZIONE 9
Adesso si introduce Variabile aleatoria binomiale si distribuisce come una binomiale con due valori
n e p
XBin(n,p). la variabile binomiale X conta il numero di successi che ottengo in n prove
indipendenti. x
P (X=x) la probabilità p elevata per il numero di successi per 1-p elevato al numero di insuccessi
n-x per le combinazioni di n elementi in classe x
p è la probabilità di successo
n è il numero di prove
su 70 lavatrici, qual’è la probabilità che 5 richiedano un intervento con probabilità 0,06
la variabile X assume valore 1 in caso di successo (intervento) e valore 0 in caso di insuccesso
i
(non intervento)
quindi p=0,06, 1-p=0,94
successo 5/70
insuccesso 65/70
5 65
P=(X=5)= 0,06 x 0,94 x 70 5
dbinom in R per trovare
dbinom (numero successo, totale prove, probabilità di successo)
choose (n,x) per calcolare la combinazione di n elementi in classe x
Il valore medio atteso di una variabile aleatoria binomiale XBin(n,p) è sempre E(X)=np
La varianza mi da un idea di quanto sono dispersi i valori della variabile. Var(X)=np(1-p)
es
100 nati vivi
49/100 femmine, successo p
51/100 maschi, insuccesso 1-p
- su 6 donne, possibilità che nascono 3 maschi e 3 femmine
n=6, p=51/100 3 3
P=(X=3)= 49/100 x 51/100 x 6 3
- su 6 donne, possibilità che i maschi siano meno delle femmine
sia ha quando nascono 6f oppure 5 f, oppure 4 f
P=(6fU5fU4f)
P=(6f)U P=(5f) U P=(4f) somma delle 3 probabilità
4 2
P=(X=4)= 49/100 x 51/100 x 6 4
5 1
P=(X=5)= 49/100 x 51/100 x 6 5
6 0
P=(X=6)= 49/100 x 51/100 x 6 6
sommo i 3 risultati
ES
70 lavatrici
p= 0,06
successo: richiesta garanzia p= 0,06
insuccesso: non richiesta di garanzia p= 0.94
probabilità che almeno 2 lavatrici non chiedano intervento in garanzia
P(ameno 2 insuccessi)
P (2 insuccessi) + P (3 insuccessi) + ….fino a 70
Procedimento troppo complicato quindi si fa il contrario
1- P (0 insuccessi) – P (1 insuccesso)
Attenzione: 1= spazio campionario
LEZIONE 10
Variabile aleatoria continua: assume un valore infinito sull’asse preso in considerazione
Esempio di variabile aleatoria continua: altezza delle persone, raggruppate per classi
La distribuzione di probabilità è rappresentata da un istogramma: a ciascun punto interno alla
singola classe è assegnato un valore costante, la densità.
Funzione di densità: è sempre non negativa
L’aere sottostante alla funzione di densità è sempre uguale a 1
Partendo dalla funzione di densità sono in grado di calcolarmi i valori della variabile aleatoria
continua
La proporzione tra probabilità e area vale per qualsiasi sia la suddivisione in classi
Si chiama funzione di densità della variabile continua X la funzione f(x) per cui l’area sottesa alla
funzione corrisponde ad un intervallo [a,b] è uguale alla probabilità che X assuma valore in
quell’intervallo.
Con le variabili aleatorie continue, la probabilità di calcolare un punto preciso è pari a 0 2
La variabile aleatoria continua più usata è la variabile continua normale indicata con XN(, )
Questi due parametri mi servono per disegnare la forma che avrà un asse centrale medio, +/- 3
volte la deviazione standard.
è la media della variabile
2
è la varianza
La normale standardizzata è una variabile normale con dei valori particolari perché ha valore
medio 0 e varianza pari a 1 quindi XN(0,1). È una variabile simmetrica
Quando troviamo una variabile normale standardizzata la probabilità si calcola con delle tavole
Z è la variabile
4 casi con XN(0,1)
Pr (z<di 1,3) cerco il numero 1,3 sulla tavole e guardo il valore rispettivo
Pr (z>di 1,3) trovo il valore e poi faccio 1-il valore
Pr (z<di -1,3) si sfrutta la simmetria quindi 1- valore
Pr (z>di -1,3) si sfrutta la simmetria quindi si trova il valore e basta
Quando non si hanno variabili normali standardizzate ma semplicemente normali, si può
ugualmente trasformare in normale standardizzata e usare la tabella. Come?
2
Operazione di standardizzazione: data la variabile normale XN(, ), prendiamo la variabile X,
2
sottraiamo la media e dividiamo per la deviazione standard che è la radice della varianza
Z=X-/
Es:
XN(0,4) con Pr (x< di 1,3)
Essendo una disuguaglianza, si può sottrarre da entrambe le parti e dividere per
Quindi Pr (X-/<1,3-/)
Pr (Z<1,3-0/1) quindi Z
Per le variabili binomiali
Trovo E(x) e var(x)
Che sono la mia m e s di una nuova variabile simile che chiamo Y
Pr di Y è la stessa Pr della binomiale….poi standardizzo e tutto è ok
LEZIONE 11
Statistica inferenziale:
come usare gli strumenti visti finora per fare inferenza ovvero estendere le ricerche all’intera
popolazione.
Elementi di inferenza statistica:
Popolazione di riferimento
Campione casuale
Raccolta di informazioni
Tecnica inferenziale per giungere dal risultato parziale alla popolazione di riferimento.
Giudizio sulla validità statistica della procedura utilizzata.
Campione casuale: si dice campione casuale di ampiezza n la variabile aleatoria multipla (X X
1, 2,
X ) le cui componenti X X X che sono associate alle varie osservazioni fatte x x x , sono
…. n 1, 2,…. n , 1, 2,…. n
indipendenti ed identicamente distribuite.
X maiuscola perché sono variabile aleatorie di bernoulli
In corrispondenza di ciascuna unità x abbiamo una variabile X che può avere risultato soddisfatto o
insoddisfatto (si o no).
Statistica: modo per riassumere tutte le informazioni che possediamo. La statistica è una qualsiasi
funzione del campione casuale indicata con T.
Es: prendendo un campione casuale (X X X ) in cui n è la dimensione del campione e X è il
1, 2,…. n
reddito.
Come faccio a capire quale sia il reddito medio della popolazione?
Se io prendessi le unità x e facessi la media tra tutte, otterrei una media che però non è il reddito
medio. Quella trovata è la media campionaria ma io voglio trovare la media di tutta la popolazione.
Quindi serve la statistica media campionaria
Statistica media campionaria: 2 2
sia (X X X ) un campione casuale, con media e varianza , XN(, ), la statistica media
1, 2,…. n 2
campionaria avrà una distribuzione pari a XN(, /n).
Quantile della variabile aleatoria continua Z 0.95
Pr (Z<