Anteprima
Vedrai una selezione di 20 pagine su 94
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 1 Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 2
Anteprima di 20 pagg. su 94.
Scarica il documento per vederlo tutto.
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 6
Anteprima di 20 pagg. su 94.
Scarica il documento per vederlo tutto.
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 11
Anteprima di 20 pagg. su 94.
Scarica il documento per vederlo tutto.
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 16
Anteprima di 20 pagg. su 94.
Scarica il documento per vederlo tutto.
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 21
Anteprima di 20 pagg. su 94.
Scarica il documento per vederlo tutto.
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 26
Anteprima di 20 pagg. su 94.
Scarica il documento per vederlo tutto.
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 31
Anteprima di 20 pagg. su 94.
Scarica il documento per vederlo tutto.
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 36
Anteprima di 20 pagg. su 94.
Scarica il documento per vederlo tutto.
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 41
Anteprima di 20 pagg. su 94.
Scarica il documento per vederlo tutto.
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 46
Anteprima di 20 pagg. su 94.
Scarica il documento per vederlo tutto.
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 51
Anteprima di 20 pagg. su 94.
Scarica il documento per vederlo tutto.
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 56
Anteprima di 20 pagg. su 94.
Scarica il documento per vederlo tutto.
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 61
Anteprima di 20 pagg. su 94.
Scarica il documento per vederlo tutto.
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 66
Anteprima di 20 pagg. su 94.
Scarica il documento per vederlo tutto.
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 71
Anteprima di 20 pagg. su 94.
Scarica il documento per vederlo tutto.
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 76
Anteprima di 20 pagg. su 94.
Scarica il documento per vederlo tutto.
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 81
Anteprima di 20 pagg. su 94.
Scarica il documento per vederlo tutto.
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 86
Anteprima di 20 pagg. su 94.
Scarica il documento per vederlo tutto.
Appunti delle lezioni - Statistica, Marco Perone Pacifico Pag. 91
1 su 94
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

CSZ

Condizioni chiave sono l'indipendenza e il fatto che p sia lo stesso. Se p non è lo stesso per i due

non viene una binomiale.

Distribuzione di Poisson

Discreta

Il modello di poisson viene utilizzato per il conteggio di eventi rari. Applicazioni tipiche sono

incidenti automobilistici che avvengono in un tratto di strada, numero di clienti che entrano in un

negozio. Raro= eventi necessariamente staccati uno dall’altro, deve esserci un minimo tempo tra

l’uno e l’altro. Numero di chiamate in un centro di telefonia.

Una cosa rilevante della distribuzione di poisson è che approssima bene una binomiale con n

molto grande e p inversamente proporzionale ad n. In questi casi np rimane grossomodo

costante, λ=np. Diventa una binomiale con n molto grande e p molto piccolo, conta i successi,

eventi rari ma tante prove, se il prodotto tra p e n rimane costante allora la poisson approssima

bene questo tipo di fenomeni. 25

CSZ 26

CSZ

Distribuzione geometrica

Quelle che vanno a misurare il tempo di attesa di un successo in una serie di prove.

Distribuzione ipergeometrica

Distribuzione uniforme discreta

Lancio di un dado, posso avere diversi valori discreti separati uno dall’altro, tutti con la stessa

probabilità.

Distribuzione uniforme assolutamente continua

È la più semplice tra le assolutamente continue, fare inferenza però su questo è più difficile

rispetto ad altre.

Distribuzione esponenziale

Si usa quando si modellano situazioni in cui vi è mancanza di memoria.

Se compro una macchina nuova questa funziona da zero a trentamila km

con una probabilità alta. Se compro una macchina usata con tanti km, la

probabilità che sopravviva altri 30mila km è inferiore. La macchina ha

memoria, queste cose non sono valide per una lampadina, perché non vi

è usura. In questi casi quindi vi è mancanza di memoria. La probabilità di

sopravvivenza non cambia nel tempo. Questa probabilità di

sopravvivenza viene generalizzata così:

27

CSZ

Cenni sul processo di poisson

Un processo stocastico o aleatorio è una famiglia di variabili aleatorie indicizzate da un parametro

(ad esempio il tempo t). Significa che per un valore fissato di t è una variabile aleatoria, con t

variabile è un processo. Il processo di poisson generalmente considera una serie di eventi che

possono capitare in un arco di tempo.

Ad esempio si usa per modellare il numero di chiamate che arrivano ad un centralino.

28

CSZ

Nell’istante zero h, molto piccolo, ho un evento con probabilità λ e più di un evento con

probabilità zero. Queste due vogliono dire che non ho più arrivi simultanei, quando l'intervallo di

tempo si ristringe posso avere uno e non più di un evento. La quinta condizione ormai da molti

anni è obsoleta. Fra zero e h mi aspetto un evento con una certa probabilità λ, alitri con prob zero.

Il discorso vale lo stesso anche per altri intervalli, quello che conta è l’ampiezza degli intervalli.

Quindi comincio a contare da zero, indio tra le cose che succedono in intervalli disgiunti. Il numero

degli eventi dipende dall’ampiezza non da dove è posizionato. In intervalli infinitesimi mi posso

aspettare una probabilità λ, il resto zero. Sotto queste condizioni si può dimostrare che:

Numero di eventi nell'intervallo (5;7], cioè quante chiamate possono arrivare tra le 5 e le 7 ore da

quando è attivo il centralino, è una variabile aleatoria, può essere qualsiasi numero.

Tutti i tempi di attesa sono esponenziali.

Dalle condizioni di prima siamo riusciti a trovare le distribuzioni dei tempi di attesa.

29

CSZ

Distribuzione gamma

X ha distribuzione gamma se ha densità di probabilità come scritta sotto (la fx)

Il primo pezzo è zero perché quando X va a più infinito l’esponenziale va a zero, è più forte di tutte

le altre, per X che va a zero e alla meno X va a zero, quindi è zero meno zero, questo per alfa

maggiore uguale di 1.

Si può dimostrare facilmente che gamma di 1 è uguale a 1: Quindi sappiamo calcolare gamma su

tutti gli interi e gamma su tutti i dispari

fratto 2.

30

CSZ

Casi particolari della distribuzione gamma

Lezione 6: 9 marzo 2017

Ancora sulla distribuzione gamma

Proprietà delle distribuzioni gamma: 31

CSZ

Distribuzione normale

Fu proposta da gauss per approssimare le distribuzioni binomiali con numero di prove molto molto

grandi, più tardi fu generalizzato col teorema del limite centrale. Il teorema del limite centrale di

fatto da una giustificazione teorica al fatto che molti fenomeni casuali hanno modello normale.

32

CSZ

Ora siano:

Perché la normale standard è importante? Della distribuzione normale non sappiamo scrivere la

funzione di ripartizione è quindi non sappiamo calcolare le probabilità. Ma i valori della funzione di

ripartizione della normale standard sono stati calcolati e sono valori tabellati.

Quindi se ho la normale standard, in fondo al libro c'è la funzione di ripartizione della normale

standard calcolata nel generico Z, da ora in poi la chiameremo di maiuscolo di zeta (funzione di

ripartizione della normale calcolata in zeta)

Le tavole di cui parliamo sono nel libro a pagina 610, portarle il giorno dell’esame fotocopiate,

all’esame si può portare un formulario, un foglio A4 con le formule sopra.

Esempio sul quaderno pagina 1, 5.5.1* 33

CSZ 1. Utilizzando le funzioni generatrici dei momenti dimostrare che se X1 ha distribuzione

normale di parametri μ1 e σ^2, X2 ha distribuzione normale μ2 e σ^22 allora X1+X2 avrà

anche lei distribuzione normale, di parametri somma dei μ e somma delle σ. Quindi si fa la

funzione generatrice della somma e si vede che è dello stesso tipo.

2. Come conseguenza del punto 1, e del fatto che abbiamo visto la trasformazione lineare

a+bX, se io ho somme per i che va da 1 a n così:

34

CSZ

Lezione 7: 14 marzo 2017

Altro paio di cose sulla distribuzione χ^2

A pagina 611 del libro, c'è la tabella, c'è scritto i valori assunti da χ^2 :

αn

35

CSZ

In generale se abbiamo una distribuzione T con n gradi di libertà chiamaeremo t il valore tale

α,n

che la funzione di ripartizione calcolata in quel punto è 1-α

Distribuzione T e distribuzione F

Motivo per cui sono strane: F viene chiamata L distribuzione di Snedecor (perché poi servirà per

fare l’eq di fisher)

La distribuzione T è la distribuzione di Student

Non ci interessa come sono fatte.

Ci interessa solo:

1. In che occasioni vengono fuori

2. Esistono le tavole e quindi sappiamo calcolarne i quantili

Quando viene fuori la T:

Se ho una var aleatoria Z normale standard è una var aleat C

36

CSZ

Della F che useremo solo per un argomento a fine corso:

A questo punto possiamo dichiarare concluso il capitolo 5

Di questo capitolo possiamo saltare le sezioni 5.3, 5.9, esempio 5.4.4

Inferenza statistica

Introduciamo con un esempio:

Io sono un dirigente di una fabbrica che produce pasta, c'è scritto il peso, i pacchi possono avere

qualche grammo in più o in meno. Consideriamo “buoni” i pacchi con peso compreso tra 475-

525g. Quelli che sono più alti o più bassi li devo scartare. Io che controllo la qualità devo vedere

quanti pacchi sono difettosi, mi serve la proporzione di pacchi difettosi.

Mi interessa il numero di pacchi difettosi su numero di pacchi prodotti, su tutta la produzione.

Per farmi un’idea della proporzione invece di esaminare tutti i pacchi prodotti ne seleziono un

campione, da questo cerco di risalire al numero.

Ci occuperemo di problemi di questo tipo.

Concetti chiave:

Situazione tipica:

Stiamo studiando un insieme molto grande, potenzialmente infinito, questo è detto popolazione,

insieme molto grande di oggetti a cui sono associate delle quantità misurabili. Selezioniamo un

37

CSZ

sottoinsieme ridotto di oggetti detto campione e lo analizziamo cercando di trarre conclusioni

valide per l’intera popolazione.

Esiste una F che è la distribuzione nella popolazione di questa quantità misurabile. Nell’esempio

dei pacchi di pasta ogni pacco di pasta può essere:

• 1=difettoso con una certa probabilità θ

• 0=buono con probabilità 1-θ.

Questa distribuzione è una bernoulliana.

La distribuzione F è incognita, perché non so quanto vale θ. Quello che cerco di individuare è F.

Non tutti i campioni sono buoni. Il campione va selezionatoin modo casuale.

Il primo elemento “estratto” avrà la stessa distribuzione di tutta la popolazione.

Faccio il campionamento così: pesco analizzo e rimetto dentro, magari ripesco, tutti gli elementi

saranno indipendenti e con la stessa distribuzione, selezione con ripetizione. Il testo lo chiama

campione casuale. Campioni tutti estratti dalla popolazione F.

Esempio delle misurazioni:

Ho una misura che può assumere diversi valori con una certa probabilità

Si dice che X=d + ε

Cioè la misura è la distanza vera più un certo errore.

La ε ha una distribuzione normale N(0,σ^2)

F=Funzione di ripartizione di una normale N(d,σ^2)

Problemi di inferenza parametrica

Cioè la F incognita è in corrispondenza con uno o più parametri reali. Noti i parametri diventa nota

anche F. Noi faremo solo inferenza parametrica.

Inferenza non parametrica potrebbe essere ad esempio se non posso ipotizzare ε con

distribuzione qualsiasi non normale allora non è parametrica.

Nei casi di inferenza parametrica la F incognita dipende da qualche parametro θ, useremo

campioni casuali tutti con la stessa distribuzione.

Oggetti di interesse diventa θ. Devo individuare un numero non una intera funzione F. θ è il

parametro.

Cercheremo info su θ mediante le informazioni dai campionari.

T = g(X1, x2…xn) prende il nome di statistica. Una statistica è una funzione dei dati campionari m

non da parametri ignoti. X1-d non è una statistica.

Ancora l’esempio dei pacchi di pasta, campione di 3 pacchi di pasta

X1 è il 74esimo pacco prodotto

X2 il 95esimo

X3 il 172esimo

Sono variabili aleatorie, ci sono le varialbili aleatorie campionarie, questi tre sono 1 o 0. Esempio

X1 difettoso

X2 difettoso

X3 buono

Abbiamo il campione e l’osservazione

Il valore grande è il vettore campione, x minuscoli poi sono i valori osservati.

Dettagli
Publisher
A.A. 2016-2017
94 pagine
5 download
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher CSY di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Roma La Sapienza o del prof Perone Pacifico Marco.