Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
CSZ
Condizioni chiave sono l'indipendenza e il fatto che p sia lo stesso. Se p non è lo stesso per i due
non viene una binomiale.
Distribuzione di Poisson
Discreta
Il modello di poisson viene utilizzato per il conteggio di eventi rari. Applicazioni tipiche sono
incidenti automobilistici che avvengono in un tratto di strada, numero di clienti che entrano in un
negozio. Raro= eventi necessariamente staccati uno dall’altro, deve esserci un minimo tempo tra
l’uno e l’altro. Numero di chiamate in un centro di telefonia.
Una cosa rilevante della distribuzione di poisson è che approssima bene una binomiale con n
molto grande e p inversamente proporzionale ad n. In questi casi np rimane grossomodo
costante, λ=np. Diventa una binomiale con n molto grande e p molto piccolo, conta i successi,
eventi rari ma tante prove, se il prodotto tra p e n rimane costante allora la poisson approssima
bene questo tipo di fenomeni. 25
CSZ 26
CSZ
Distribuzione geometrica
Quelle che vanno a misurare il tempo di attesa di un successo in una serie di prove.
Distribuzione ipergeometrica
Distribuzione uniforme discreta
Lancio di un dado, posso avere diversi valori discreti separati uno dall’altro, tutti con la stessa
probabilità.
Distribuzione uniforme assolutamente continua
È la più semplice tra le assolutamente continue, fare inferenza però su questo è più difficile
rispetto ad altre.
Distribuzione esponenziale
Si usa quando si modellano situazioni in cui vi è mancanza di memoria.
Se compro una macchina nuova questa funziona da zero a trentamila km
con una probabilità alta. Se compro una macchina usata con tanti km, la
probabilità che sopravviva altri 30mila km è inferiore. La macchina ha
memoria, queste cose non sono valide per una lampadina, perché non vi
è usura. In questi casi quindi vi è mancanza di memoria. La probabilità di
sopravvivenza non cambia nel tempo. Questa probabilità di
sopravvivenza viene generalizzata così:
27
CSZ
Cenni sul processo di poisson
Un processo stocastico o aleatorio è una famiglia di variabili aleatorie indicizzate da un parametro
(ad esempio il tempo t). Significa che per un valore fissato di t è una variabile aleatoria, con t
variabile è un processo. Il processo di poisson generalmente considera una serie di eventi che
possono capitare in un arco di tempo.
Ad esempio si usa per modellare il numero di chiamate che arrivano ad un centralino.
28
CSZ
Nell’istante zero h, molto piccolo, ho un evento con probabilità λ e più di un evento con
probabilità zero. Queste due vogliono dire che non ho più arrivi simultanei, quando l'intervallo di
tempo si ristringe posso avere uno e non più di un evento. La quinta condizione ormai da molti
anni è obsoleta. Fra zero e h mi aspetto un evento con una certa probabilità λ, alitri con prob zero.
Il discorso vale lo stesso anche per altri intervalli, quello che conta è l’ampiezza degli intervalli.
Quindi comincio a contare da zero, indio tra le cose che succedono in intervalli disgiunti. Il numero
degli eventi dipende dall’ampiezza non da dove è posizionato. In intervalli infinitesimi mi posso
aspettare una probabilità λ, il resto zero. Sotto queste condizioni si può dimostrare che:
Numero di eventi nell'intervallo (5;7], cioè quante chiamate possono arrivare tra le 5 e le 7 ore da
quando è attivo il centralino, è una variabile aleatoria, può essere qualsiasi numero.
Tutti i tempi di attesa sono esponenziali.
Dalle condizioni di prima siamo riusciti a trovare le distribuzioni dei tempi di attesa.
29
CSZ
Distribuzione gamma
X ha distribuzione gamma se ha densità di probabilità come scritta sotto (la fx)
Il primo pezzo è zero perché quando X va a più infinito l’esponenziale va a zero, è più forte di tutte
le altre, per X che va a zero e alla meno X va a zero, quindi è zero meno zero, questo per alfa
maggiore uguale di 1.
Si può dimostrare facilmente che gamma di 1 è uguale a 1: Quindi sappiamo calcolare gamma su
tutti gli interi e gamma su tutti i dispari
fratto 2.
30
CSZ
Casi particolari della distribuzione gamma
Lezione 6: 9 marzo 2017
Ancora sulla distribuzione gamma
Proprietà delle distribuzioni gamma: 31
CSZ
Distribuzione normale
Fu proposta da gauss per approssimare le distribuzioni binomiali con numero di prove molto molto
grandi, più tardi fu generalizzato col teorema del limite centrale. Il teorema del limite centrale di
fatto da una giustificazione teorica al fatto che molti fenomeni casuali hanno modello normale.
32
CSZ
Ora siano:
Perché la normale standard è importante? Della distribuzione normale non sappiamo scrivere la
funzione di ripartizione è quindi non sappiamo calcolare le probabilità. Ma i valori della funzione di
ripartizione della normale standard sono stati calcolati e sono valori tabellati.
Quindi se ho la normale standard, in fondo al libro c'è la funzione di ripartizione della normale
standard calcolata nel generico Z, da ora in poi la chiameremo di maiuscolo di zeta (funzione di
ripartizione della normale calcolata in zeta)
Le tavole di cui parliamo sono nel libro a pagina 610, portarle il giorno dell’esame fotocopiate,
all’esame si può portare un formulario, un foglio A4 con le formule sopra.
Esempio sul quaderno pagina 1, 5.5.1* 33
CSZ 1. Utilizzando le funzioni generatrici dei momenti dimostrare che se X1 ha distribuzione
normale di parametri μ1 e σ^2, X2 ha distribuzione normale μ2 e σ^22 allora X1+X2 avrà
anche lei distribuzione normale, di parametri somma dei μ e somma delle σ. Quindi si fa la
funzione generatrice della somma e si vede che è dello stesso tipo.
2. Come conseguenza del punto 1, e del fatto che abbiamo visto la trasformazione lineare
a+bX, se io ho somme per i che va da 1 a n così:
34
CSZ
Lezione 7: 14 marzo 2017
Altro paio di cose sulla distribuzione χ^2
A pagina 611 del libro, c'è la tabella, c'è scritto i valori assunti da χ^2 :
αn
35
CSZ
In generale se abbiamo una distribuzione T con n gradi di libertà chiamaeremo t il valore tale
α,n
che la funzione di ripartizione calcolata in quel punto è 1-α
Distribuzione T e distribuzione F
Motivo per cui sono strane: F viene chiamata L distribuzione di Snedecor (perché poi servirà per
fare l’eq di fisher)
La distribuzione T è la distribuzione di Student
Non ci interessa come sono fatte.
Ci interessa solo:
1. In che occasioni vengono fuori
2. Esistono le tavole e quindi sappiamo calcolarne i quantili
Quando viene fuori la T:
Se ho una var aleatoria Z normale standard è una var aleat C
36
CSZ
Della F che useremo solo per un argomento a fine corso:
A questo punto possiamo dichiarare concluso il capitolo 5
Di questo capitolo possiamo saltare le sezioni 5.3, 5.9, esempio 5.4.4
Inferenza statistica
Introduciamo con un esempio:
Io sono un dirigente di una fabbrica che produce pasta, c'è scritto il peso, i pacchi possono avere
qualche grammo in più o in meno. Consideriamo “buoni” i pacchi con peso compreso tra 475-
525g. Quelli che sono più alti o più bassi li devo scartare. Io che controllo la qualità devo vedere
quanti pacchi sono difettosi, mi serve la proporzione di pacchi difettosi.
Mi interessa il numero di pacchi difettosi su numero di pacchi prodotti, su tutta la produzione.
Per farmi un’idea della proporzione invece di esaminare tutti i pacchi prodotti ne seleziono un
campione, da questo cerco di risalire al numero.
Ci occuperemo di problemi di questo tipo.
Concetti chiave:
Situazione tipica:
Stiamo studiando un insieme molto grande, potenzialmente infinito, questo è detto popolazione,
insieme molto grande di oggetti a cui sono associate delle quantità misurabili. Selezioniamo un
37
CSZ
sottoinsieme ridotto di oggetti detto campione e lo analizziamo cercando di trarre conclusioni
valide per l’intera popolazione.
Esiste una F che è la distribuzione nella popolazione di questa quantità misurabile. Nell’esempio
dei pacchi di pasta ogni pacco di pasta può essere:
• 1=difettoso con una certa probabilità θ
• 0=buono con probabilità 1-θ.
Questa distribuzione è una bernoulliana.
La distribuzione F è incognita, perché non so quanto vale θ. Quello che cerco di individuare è F.
Non tutti i campioni sono buoni. Il campione va selezionatoin modo casuale.
Il primo elemento “estratto” avrà la stessa distribuzione di tutta la popolazione.
Faccio il campionamento così: pesco analizzo e rimetto dentro, magari ripesco, tutti gli elementi
saranno indipendenti e con la stessa distribuzione, selezione con ripetizione. Il testo lo chiama
campione casuale. Campioni tutti estratti dalla popolazione F.
Esempio delle misurazioni:
Ho una misura che può assumere diversi valori con una certa probabilità
Si dice che X=d + ε
Cioè la misura è la distanza vera più un certo errore.
La ε ha una distribuzione normale N(0,σ^2)
F=Funzione di ripartizione di una normale N(d,σ^2)
Problemi di inferenza parametrica
Cioè la F incognita è in corrispondenza con uno o più parametri reali. Noti i parametri diventa nota
anche F. Noi faremo solo inferenza parametrica.
Inferenza non parametrica potrebbe essere ad esempio se non posso ipotizzare ε con
distribuzione qualsiasi non normale allora non è parametrica.
Nei casi di inferenza parametrica la F incognita dipende da qualche parametro θ, useremo
campioni casuali tutti con la stessa distribuzione.
Oggetti di interesse diventa θ. Devo individuare un numero non una intera funzione F. θ è il
parametro.
Cercheremo info su θ mediante le informazioni dai campionari.
T = g(X1, x2…xn) prende il nome di statistica. Una statistica è una funzione dei dati campionari m
non da parametri ignoti. X1-d non è una statistica.
Ancora l’esempio dei pacchi di pasta, campione di 3 pacchi di pasta
X1 è il 74esimo pacco prodotto
X2 il 95esimo
X3 il 172esimo
Sono variabili aleatorie, ci sono le varialbili aleatorie campionarie, questi tre sono 1 o 0. Esempio
X1 difettoso
X2 difettoso
X3 buono
Abbiamo il campione e l’osservazione
Il valore grande è il vettore campione, x minuscoli poi sono i valori osservati.
- Risolvere un problema di matematica
- Riassumere un testo
- Tradurre una frase
- E molto altro ancora...
Per termini, condizioni e privacy, visita la relativa pagina.