Martina contestabile Ingegneria informatica - comune a-l A.a. 2020/21
PROBABILITA’ E STATISTICA
Lunedì 22 Febbraio 2021
Introduzione l’arte di apprendere dai dati.
La statistica è L’utilizzo dei metodi statistici comporta la
raccolta di informazioni o dati scienti ci, pratica usata da più di 1000 anni. Tuttavia, esiste
una profonda di erenza tra la raccolta di informazioni e la statistica inferenziale che ha
portato alla de nizione di un ampio gruppo di metodi statistici per contribuire al processo
decisionale in ambito scienti co di fronte ad incertezza e variabilità, al ne di capire dove
possano essere apportate delle modi che per migliorare la qualità.
illustrare e sintetizzare i dati statistica
La parte della statistica che si occupa di è detta
descrittiva : il suo scopo è quello di ridurre il volume dei dati osservati esprimendo
l’informazione rilevante in essi contenuta attraverso indicatori numerici (media, moda,
mediana, deviazione standard) e gra ci (istogrammi, gra ci ramo-foglia, box-plot).
trarre conclusioni dai dati raccolti e dedurre
La parte della statistica che si occupa di
enunciati formalmente validi la statistica inferenziale
è appunto . L’informazione è
raccolta attraverso dei campioni, cioè un insieme di osservazioni.
campioni
I sono sottoinsiemi della popolazione che rappresenta tutti gli individui o gli
oggetti di una particolare tipologia.
La base di partenza per comprendere la statistica inferenziale è lo studio dei concetti
fondamentali del calcolo delle probabilità. casualità.
L’elemento fondamentale da prendere in considerazione è la sono all’origine
Fenomeni casuali o aleatori, cioè non completamente prevedibili a priori,
di variazioni. Pertanto, per trarre delle conclusioni pienamente giusti cate, è necessario
fare assunzioni sulla probabilità che i dati da misurare assumano diversi valori possibili.
Questo signi ca costruire un modello probabilistico.
I principi del calcolo delle probabilità ci permettono di giusti care la forza delle nostre
conclusioni. Il calcolo delle probabilità permette dunque il passaggio dalla statistica
descrittiva alla statistica inferenziale. Attraverso il calcolo delle probabilità è possibile
formulare una trattazione matematica dell’incertezza. Pagina 1
fi fi ff fi fi fi fi fi fi fi fi
Martina contestabile Ingegneria informatica - comune a-l A.a. 2020/21
Perché un manager deve conoscere la statistica?
A. Come presentare e descrivere in modo appropriato le informazioni in suo possesso.
B. Come trarne conclusioni riferite a intere popolazioni sulla base delle informazioni
ottenute dai campioni.
C. Migliorare i processi aziendali.
D. Come ottenere previsioni a dabili.
In quali ambiti si possono utilizzare i metodi statistici?
A. Ad esempio, nelle diverse aree funzionali di una azienda:
B. Nella contabilità industriale: per selezionare i campioni utilizzati per l’auditing (veri ca
contabile) e per individuare le determinanti principali dei costi (cost driver).
C. Nell’area nanziaria: per scegliere tra portafogli alternativi e per tracciare i trend delle
misure nanziarie nel tempo.
D. Nell’area produzione: per migliorare la qualità dei beni prodotti o dei servizi forniti
dall’azienda.
E. Nell’area marketing: per stimare le proporzioni dei clienti che preferisce un prodotto
ad un altro ed il motivo sotteso a tale preferenza, o per trarre delle conclusioni su
quale strategia pubblicitaria sia più e cace nell’aumentare le vendite di un prodotto.
Martedì 23 Febbraio 2021
Calcolo delle probabilità
Il concetto di probabilità nasce nel Rinascimento con lo studio dei codici segreti e si
sviluppa in modo sistematico nel XVII secolo con i giochi d’azzardo.
Il calcolo delle probabilità è lo studio delle proprietà quantitative (come la frequenza) che
possono essere osservate per quegli eventi il cui veri carsi o meno (in seguito ad
osservazioni o prove) non è prevedibile in modo deterministico.
Tali eventi vengono detti casuali o aleatori. Matematicamente la probabilità viene descritta
mediante una quantità scalare che caratterizza la frequenza di ricorrenza di un dato
evento al ripetersi delle prove.
Teoria classica o a “priori”
Se l’esito delle prove può essere descritto da un numero nito n di casi possibili, allora la
probabilità p di uno di tali casi viene de nita “a priori” come:
f
p = ∈ [0,1]
n
dove f rappresenta il numero dei casi favorevoli. Questa `e essenzialmente la de nizione
di Laplace: “La probabilità di un evento `e il rapporto tra il numero di casi favorevoli ed il
numero di casi possibili, quando questi sono tutti equiprobabili”.
f ≤ n ⇒ 0 ≤ p ≤ 1 e questo vale sempre. Pagina 2
fi fi ffi ffi fi fi fi fi fi
Martina contestabile Ingegneria informatica - comune a-l A.a. 2020/21
Esercizio - La probabilità che lanciando sei volte una moneta si ottengano 3 teste e 3
20 5
= = 31,25 %
croci è pari a? .
64 16
Bisogna introdurre una tecnica di calcolo che renda il tutto veloce e preciso. Ciò è
possibile grazie al calcolo combinatorio.
Difetti del metodo “a priori”
Occorre supporre che gli eventi possibili siano in numero nito.
Occorre supporre che gli eventi siano mutuamente esclusivi o incompatibili.
Occorre supporre che gli eventi siano tutti ugualmente probabili (equiprobabili).
Il primo problema si supera introducendo la de nizione di probabilità geometrica,
che rappresenta un’estensione di quella classica.
Il secondo e il terzo possono essere superati solo cambiando teoria, passando alla
teoria empirica o frequentista. Pagina 3
fi fi
Martina contestabile Ingegneria informatica - comune a-l A.a. 2020/21
Teoria geometrica
La de nizione secondo la teoria classica non si applica al
gioco del franccaéreau: lancio di una moneta di diametro d
che cade su un pavimento a piastrelle quadrate di lato c. Si
scommette se la moneta cada all’interno di una piastrella
oppure a cavallo di una o più piastrelle.
I. I casi favorevoli sono tutti quelli in cui la moneta ha il
centro che cade internamente al quadrato di lato c−d: il
centro non può uscire dal quadrato di lato c−d.
II. I casi possibili sono quelli in cui la moneta ha il centro che
cade in un qualunque punto della piastrella.
Si noti che sia il numero di casi favorevoli che il numero di casi possibili sono in niti.
Non è possibile contarli, ma si possono misurare utilizzando l’area occupata dai punti-
evento (punti in cui cade il centro). La probabilità di fare
franccaéreau è quindi 2
(c − d )
p = c 2
La probabilità di non fare franccaéreau è
q =1 − p
Se vogliamo che il gioco sia equo dovremmo avere
1
q = p = , e cioè
2
2
(c − d ) 1 c
= ⇒ =2+ 2 ∼ 3,4142 .
c 2 d
2
Bu on: il lato della piastrella deve essere circa 3 volte e
mezza più grande del diametro della moneta a nché il gioco sia equo.
l
Ago di Bu on: si lancia un ago lungo su un pavimento a parquet, a listelli paralleli posti a
d > l
distanza . Calcolare la probabilità che, cadendo, l’ago intersechi una delle
scanalature. Non è su ciente conoscere la distanza del punto medio dell’ago dalla
θ
scanalatura, ma bisogna conoscere anche la sua inclinazione rispetto alla medesima.
l
0 ≤ x ≤ sin θ
θ
Poiché l’ago deve intersecare la scanalatura, ssato , si ha: .
2
Casi favorevoli: area della regione che soddisfa . Pagina 4
ff fi ff ffi fi ffi ◼︎ fi
Martina contestabile Ingegneria informatica - comune a-l A.a. 2020/21
l 2l
2 =
Casi possibili: area del rettangolo .
πd
π d
⋅
2 2
l = d ⇒ p = 2π
Se .
Con il computer è possibile simulare una serie di lanci dell’ago e tale metodo, detto di
π
Montecarlo, può essere usato per dare una misura approssimata di .
Poiché le regole e i metodi di calcolo nelle diverse teorie che abbiamo esaminato non
di eriscono tra loro, è possibile seguire l’impostazione dovuta ad A.N. Kolmogorov
Teoria Assiomatica
(1933), fondatore della della probabilità.
Il linguaggio utilizzato è quello della teoria degli insiemi.
Ragionamento che fece Barbier:
Se l’ago interseca la listella, lo fa una volta sola.
Se l’ago è lungo il doppio:
• Se non faceva intersezioni, continua a non farle.
( p → 2p)
• Se faceva intersezioni, ora ne fa due .
Se l’ago è lungo il triplo:
• Se non faceva intersezioni, continua a non farle.
( p → 3p)
• Se faceva intersezioni, ora ne fa tre . |
α ∈ ℕ p = αl
Il numero di intersezioni è proporzionale alla lunghezza, ovvero esiste un .
d
Ponendo la circonferenza con diametro pari a , si ottiene
2 2l
2 = απd ⇒ α = ⇒ p = .
πd πd
Teoria empirica o frequentista
È necessario concepire una serie di esperimenti o prove che avvengano tutte in
condizioni “abbastanza” uniformi. In tal caso è possibile postulare l’esistenza di un
numero p, detto probabilità dell’evento, e approssimarlo con la frequenza relativa con la
quale le prove ripetute soddisfano l’evento.
La probabilità di un evento viene de nita come il limite a cui tende la frequenza relativa di
successo all’aumentare del numero delle prove: n
A
p = lim n
n→∞
n n A
dove è il numero delle prove, è il numero delle volte che si veri ca un certo evento .
A
Si noti che in questo caso non bisogna speci care né l’equiprobabilità né l’incompatibilità`
degli eventi.
Difetti della teoria frequentista n → ∞
Si applica ad esperimenti ripetibili per i quali il limite per abbia senso. Pagina 5
ff fi fi fi
Martina contestabile Ingegneria informatica - comune a-l A.a. 2020/21
Lunedì 1 Marzo 2021
Richiami di teoria degli insiemi
Ω
: spazio, insieme universale, collezione di oggetti.
w ∈ Ω : punto o elemento.
A ⊂ Ω Ω
: insieme di punti di .
Sottoinsieme A B ⇒ A ⊂ B ∨ B ⊂ A
Se ogni elemento di è anche elemento di .
Insiemi uguali A B A ⊂ B ∧ B ⊂ A ⇒ A = B
Dati due insiemi e , se .
Insieme vuoto
A ⇒ A = ∅
Se l’insieme non contiene punti
A Ω
Insieme complementare (di rispetto ad ) C
Ω A ⇒ Ā = A = Ω − A
È l’insieme di tutti i punti di che non sono in .
Insieme di erenza
A B A B ⇒ A − B
Dati due insiemi e , i punti di che non stanno in .
Unione A B ⇒ A ∪ B
Insieme dei punti di o di .
Intersezione A B ⇒ A ∩ B
Insieme dei punti di e di .
Leggi A ∪ B = B ∪ A
Commutative A ∩ B = B ∩ A
A ∪ (B ∪ C ) = (A ∪ B) ∪ B
Associative A ∩ (B ∩ C ) = (A ∩ B) ∩ C
A ∩ (B ∪ C ) = (A ∩ B) ∪ (B ∩ C )
Distributive A ∪ (B ∩ C ) = (A ∪ B) ∩ (B ∪ C )
Teoremi
( Ā) = A
1. A ∩ Ω = A ∧ A ∪Ω = Ω
2. A ∩ ∅ = ∅∧ A ∪∅ = A
3. A ∩ A = A ∧ A ∪ A = A
(A ∪ B) = B̄ ∩ Ā
4. LEGGI DI
(A ∩ B) = B̄ ∪ Ā DE MORGAN
A − B = A ∩ B̄
5. Pagina 6
ff
Martina contestabile Ingegneria informatica - comune a-l A.a. 2020/21
{A } Ω
Se è una famiglia di sottoinsiemi di
i
∪ A {A }
unione di
i i i
∩ A {A }
intersezione di
i i i
n n
⋃ ⋂
i = 1,...,n ⇒ A , A
Se rappresentano rispettivamente una unione e intersezione
i i
i=1 i
{A }
nita di .
i
Teoremi di De Morgan
⋃ ⋂
( A ) = Ā
i i
i i
⋃
⋂
( A ) = Ā
i i
i i
Insiemi disgiunti
A B A ∩ B = ∅
se e sono disgiunti .
{A } Ω
Generalizzando, sottoinsiemi di si dicono a 2 a 2 disgiunti se
i
|
A ∩ A = ∅ ∀i, j i ≠ j
.
i j {
A = (A ∩ B) ∪ (A ∩ B̄)
A, B ⊂Ω⇒
7. ∅ = (A ∩ B) ∩ (A ∩ B̄)
{ A ∩ B = A
A ⊂ B ⇒
8. A ∪ B = B Pagina 7
fi Martina contestabile Ingegneria informatica - comune a-l A.a. 2020/21
Spazio campione ed eventi Ω
Lo spazio campione, indicato con , è la totalità di tutti i possibili risultati di un
esperimento concettuale.
Se lo spazio campione ha un numero nito di elementi, tali elementi si possono elencare
separati da una virgola e racchiudere tra parentesi gra e { , }. Se lo spazio campione ha
un numero in nito di elementi, può essere descritto tramite un’a ermazione o una regola.
2 2
|
Ω = {(x, y) + y ≤ 1}
Ad esempio, .
Un evento è un sottoinsieme dello spazio campione e si indica con le lettere maiuscole
A, B, C . . .
Ω è detto evento certo.
∅ è detto evento impossibile. A Ω Ω
Il complementare di un evento rispetto ad è il sottoinsieme di tutti gli elementi di
A Ā
che non sono contenuti in e viene indicato con .
Esempi sul lancio di un dado
Ω = {1,2,3,4,5,6}
card(Ω) = n = 6 → A = {2,4,6}
Un possibile evento è “esce un numero pari”
Esempi sul lancio di tre monete
Ω = {T T T, T TC, TCT, CT T, TCC, CTC, CCT, CCC}
→ A = {T TC, CTC, CT T}
“Escono due teste e una croce” è un possibile evento
Esempi sul tempo di vita di una lampadina
|
Ω = {t t ≥ 0} t
, con ad esempio misurato in ore. |
→ A = {t 0 ≤ t < 300}
“La lampadina si brucia prima di 300 ore è un evento”
Operazioni con gli eventi
A, B ⊂ Ω A B
Se sono due eventi dello stesso spazio campione, l’intersezione di e ,
A ∩ B A B
, è l’evento che contiene tutti gli elementi comuni sia ad che a .
A, B ⊂ Ω
Se sono due eventi dello stesso spazio campione che non hanno elementi in
A ∩ B = ∅ A B
comune, cioè , i due eventi e si dicono disgiunti o mutuamente esclusivi
o incompatibili.
A, B ⊂ Ω A B A ∪ B
Se sono due eventi dello stesso spazio campione, l’unione di e , , è
A B
l’evento che contiene tutti gli elementi che appartengono ad o a .
La relazione tra gli eventi e il corrispondente spazio campione può essere illustrata
Ω
Diagrammi di Venn,
gra camente attraverso i dove è rappresentato da un rettangolo e
Ω
gli eventi da curve chiuse in .
In molti casi, per risolvere un problema di calcolo delle probabilità, è su ciente contare il
numero dei punti o di elementi nello spazio campione, senza doverli elencare uno ad uno.
Il principio fondamentale dell’enumerazione o conteggio, spesso indicato come regola
moltiplicativa, così come la conoscenza dello spazio campione che contiene tutti i
permutazioni,
possibili ordinamenti di un gruppo di oggetti, detti oppure la conoscenza
Pagina 8
fi fi fi ff ff ffi
Martina contestabile Ingegneria informatica - comune a-l A.a. 2020/21
del numero dei possibili sottoinsiemi o classi in cui è possibile suddividere l’insieme
combinazioni,
originale, considerando l’ordine non rilevante, chiamate sono argomenti
calcolo combinatorio.
del Martedì 2 Marzo 2021
Probabilità di un evento
Non siamo interessati agli eventi, ma alla probabilità che uno di questi eventi si veri chi o
σ
meno. L’impostazione assiomatica parte dal concetto di -algebra o classe additiva.
La probabilità viene vista come una misura, cioè come una funzione che associa ad ogni
Ω
sottoinsieme di un numero reale non negativo, tale che la somma delle probabilità di
Ω card(Ω) = n
tutti gli eventi sia uguale ad 1. Se la cardinalità di è nita, diciamo ,
n
2
l’insieme di tutti i suoi sottoinsiemi, detto insieme delle parti, ha cardinalità .
Ω = {a , a , . . . . , a }
1 2 n
k n
elementi fra
n!
C =
n,k k!(n − k)! k
In quanti modi possibili posso scegliere
C
elementi? Ce lo dice .
n,k
n
∑ C . si usa il triangolo di tartaglia.
n,k
k=0 n
n n−k k
∑
(a + b) = C a b .
n,k
k=0 2
2 2−k k 2 2
∑
(a + b) = C a b = C a + C 2ab + C b
Infatti, C.V.D.
2,k 2,0 2,1 2,2
k=0
Ω
Se ha la cardinalità del continuo, il suo insieme delle parti è “troppo grande” perché su
di esso si possa de nire una misura. Ω A
Si considerano perciò i soli sottoinsiemi di che costituiscono un insieme non vuoto
(classe additiva) tale che:
A ∈ → Ā ∈
I. .
∀i ∈ ℕ, A ∈ → ∪ A ∈
II. .
i i∈ℕ i Ω
Una classe additiva è quindi un sottoinsieme dell’insieme delle parti di che risulta
chiuso rispetto alle operazioni di complemento e di unione numerabile. Inoltre, per le leggi
⋃
⋂
∀i ∈ ℕ, A ∈ → A = ( Ā ) ∈
di De Morgan .
i i i
i∈ℕ i∈ℕ
Assiomi della probabilità Ω σ A Ω
Dati uno spazio campione e una classe additiva ( -algebra) di eventi su , una
P : → [0,1]
funzione è detta funzione di probabilità, se valgono i seguenti assiomi:
∀A &isi
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.