Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Probabilità e Statistica per l'Ingegneria
23/02/2022
Incertezza
- (legata a un fenomeno, sistema complesso)
- Modelli (di stampo matematico)
- Dati
Fenomeno ↔ Aleatorio (non deterministico)Esperimento ↔ Aleatorio
Modello (matematico) ↔ deterministico es. x = x₀ + v₀t
- t
- conosciuto
es. fenomeno deterministico ~ conosco il risultato prima
- canonica
es. lanciare una moneta
- fenomeno canonica ~ non posso conoscere il risultato a priori
Statistica
- Probabilità ↔ Reali
- Dati (Statistiche) ↔ Univariato
- Prodotto industriale ⟹ Metodo statistico
EX 1
- produzione di lotti di prodotti ⟹ si cerca la dimuita
- su lotti di prodotti variabili ⟹ e variazioni nel loro interno
- dimuita "target" ⟹ so che avviciniamo a questa dimuita raccogliendo i dati
- l'immagine il modello per i difetti ⟹ dati (osservazioni campionatorie)
- Uso della statistica
EX 2
- Annasabio di Zolfo = ~ nei dati giornalieri
- 2 fonti di VARIABILITÀ =
- Rispetto a quelli osservati
- con lo strumento che ho a disposizione
- Dati ⟹ misurazione "target"
EX 3
- Farmaco efficace @ 85%
- testato su un campione ⟹ prendo i dati
- prima un farmaco veniva ora efficace all'80%
- in curamati con. però devo tenere conto degli effetti collaterali
Statistica
disciplina che si occupa di sintetizzare i dati e analizzare i dati stessi per poi prendere decisioni in condizioni di incertezza.
Raccolta Sintesi e Analisi dati
Fasi di indagine
campione (rappresenta del fenomeno che stiamo studiando) → sottoinsieme di individui
raccogliere presentare e sintetizzare dati → statistica descrittiva
voglio trovare conclusioni generali sulla popolazione di riferimento → inferenza statistica
Osservazioni sulle fasi di indagine
Campione rappresentativo della popolazione di riferimento → campione casuale
Inferenza Statistica → dati generati da un modello probabilistico → si vuol arrivare a scoprire il vero modello (probabilità)
Probabilità (fenomeno)
Popolazione → Statistica → Campione (dati)
EX:
ci sono 50 file, 1 file è infettato con probabilità 0,2 calcolare la probabilità che un attacco infetta più di 15 file (tipico di probabilità)
descrittivo
EX:
50 file, il virus infetta 1 file con probabilità p stimare p dopo avere osservato che dopo un attacco 20 file sono stati infettati (tipico di statistica)
induttivo
EX:
wi = peso
- w1 = 42,5
- w2 = 54,28
- w3 = 50,2
- w30 = 85,98
dati discreti di natura continua
ho troppi dati presi da natura continua rischio di avere frequenze relative molto simili
⇒ Raggruppo in classi: [xi, xi+1) ⇒ xi, xi+1
w ni fi 40-50 3 0,15 50-58 5 0,25 58-70 5 0,25 70-95 7 0,35tutte le classi hanno grandezze diverse
ISTOGRAMMA
serve a rappresentare dati continui raggruppati in classi
la lunghezza alla base indica la lunghezza della classe
come scelgo l’altezza?
base * altezza = frequenza
ai: di: ni:
di = ni / ai
densità di frequenza
dall’esempio precedente
- d1 = 3 / 10 = 0,3
- d2 = 5 / 8 = 0,625
- d3 = 5 / 12 = 0,42
- d4 = 7 / 25 = 0,28
avvo l’ampiezza più grande ma ho ottenuto l’altezza minore
poligono di frequenze
4/03/22
Calcolo di Q1:
- n = numerosità del campione
- ordino i dati
- se n⋅0,25 →
non è intero → Q1 = al valore che occupa la posizione successiva, cioè intero approssimato per eccesso a ⌈n⋅0,25⌉ + 1 premendo la parte intera
è intero → Q1 = media aritmetica dei valori in (n⋅0,25) e (n⋅0,25) + 1
Calcolo di Q3:
- n = numerosità del campione
- ordino i dati
- se n⋅0,75 →
non è intero ...
è intero ...
oss. n⋅0,25 è la posizione che dovrebbe occupare il quartile
Box-Plot (Scatola a Baffi)
x(1) min = xmin = Q1 - 1,5(Q3 - Q1)
x(n) = xmax = Q3 + 1,5(Q3 - Q1)
- x(1) > Q1 - 1,5(Q3 - Q1) e x(n) ≤ Q3 + 1,5(Q3 - Q1)
- inversa si ha
dati campionari rimasti fuori [DATI ANOMALI]
Il box-plot mi da informazioni sulla forma della distribuzione campionaria
Simmetria
← se la linea è proprio a metà della scatola la distribuzione è simmetrica
DATI
INDICE QUAL. NOM. QUAL. ORD. QUANT. Moda SÌ SÌ SÌ Mediana NO SÌ SÌ Quartili NO NO SÌ Box-Plot NO NO SÌ Media NO NO SÌ Varianza NO NO SÌXi, Yj sono fenomeni quantitativi
(Xi, Yj) = osservo contemporaneamente il fenomeno; ho dati ordinabili, bivariati
(X1, Y1)...(Xn, Yn) = campione bivariato
Variabilità?Dispersione?Relazione tra X e Y?
GRAFICO DI DISPERSIONE
-> dispersione rispetto a chi? -> valuto il baricentro facendo la media campionaria di X e Y { ottengo il Baricentro (X, Y) }
Varianza Bivariata?
9/03/22
EX:
Rilevamento temperatura in 20 giorni (gradi)n = 20 -> X1, X2, ..., X20
- 0.9, 4.3, 4.8, 2.5, 2.9, 4.2, 2.8, 3.6, 4.1, 4.2, 4.95
- 4.3, 4.2, 4.6, 4.6, 4.1, 4.65, 4.7, 4.8, 4.9, 4.9, 5
è fenomeno quantitativo, continuo
- temperatura media?
-> Media campionaria: \[\overline{X} = \frac{\sum x}{n} = \frac{1}{20}(0.9 + 4.3 + 1.8 + ... + 5) = 3.825\]
Pxy = 0 → nessuna retta
Oss: se Pxy = 0 → non c'è dipendenza tra i dati
se y = x2 → ho dipendenza parabolica
y _
ma _ una retta interpolante
Pxy = 0 si riferisce
x0 solo alla dipendenza lineare
11/03/22
Probabilità:
scienza della matematica che si occupa di studiare fenomeni aleatori (assiomatica)
Misura il grado di incertezza di un fenomeno (fisico, economico, sociale) aleatorio, cioè il cui risultato non sia determinabile con certezza a priori
Supponiamo però di poter elencare tutti i risultati possibili della prova
(Oss: abbiamo un modello iniziale su cui dobbiamo concordare )
SPAZIO CAMPIONARIO:
insieme dei risultati possibili della prova
Se il singolo risultato della prova lo chiamiamo "punto campionario"
indichiamo lo spazio campionario con Ω
{punto campionario con ω}
ex :
- Prova = lancio di una moneta → Ω = { T, C }
- Prova = lancio del dado → Ω = { 1,2,3,4,5,6 }
- Prova = lancio 1 moneta 2 volte → Ω = { TT, TC, CT, CC }
- Urna con palline numerate da 1 a 50: n.1 estraggo una → Ω = {1, ... 50}
- Un blocco di informazioni sono trasmesse su un canale soggetto a disturbo, fino a quando il segnale arriva senza disturbo → Ω = N
- Estrazione a caso di un numero compreso tra 0 e 1 → Ω = { x∈R 0 < x ≤1 }
- Tempo di vita di uno chip → Ω = [0, ∞)
- Tempo per la richiesta di pagine web → Ω = [0, 2] ∪ [∞)
- 2 numeri estratti tra 0 e 1 → Ω = (x, y) ∈ R 2 0 ≤ x ≤1, 0 ≤ y ≤1
- Estrazione di numero a caso tra 0 e 1 → x1 e poi estrazione di 1 numero tra 0 e x1 → Ω = { (x,y) ∈ R2 0 ≤ y ≤ x ≤1 }
y=x