Appunti Statistica 1

Gli appunti sono esaustivi e toccano tutti I punti fondamentali della materia. Comprendono anche esercitazioni svolte a lezione (commentate parola per parola) e sono basati su appunti personali …

Esame Statistica economica

Facoltà Economia

Dal corso del Prof. Corrado Lagazio

Università Università degli studi di Genova

Publisher paola.larosa

A.A. 2020-2021

134 pagine

1 download

Appunto

Vota 4,0 / 5 (2)

Scarica

Estratto del documento

Modelli probabilistici per il conteggio degli eventi

NUMERO DI CLIENTI IN ARRIVO ALLE CASSE DI UN SUPERMERCATO IN UN MINUTO

NUMERO DI NUOVI CASI DI COVID PER 1000 ABITANTI

Sono tutte situazioni in cui contiamo il numero di eventi osservati. Come possiamo notare tutti i casi che abbiamo nominato hanno un limite temporale, piuttosto che territoriale.

In questo caso si possono usare tanti modelli probabilistici. Il modello più semplice è la variabile casuale di Poisson.

λ è la lettera greca LANDA e rappresenta il parametro che caratterizza la variabile casuale di Poisson.

La funzione di probabilità di una variabile casuale di Poisson è fatta in questo modo:

P(X = k) = (e^(-λ) * λ^k) / k!

Il parametro λ è il valore atteso della variabile casuale di Poisson. Anche la varianza è uguale a λ.

Supponiamo di avere una città nella quale sappiamo che avvengono in media 0,2 furti d'auto all'ora.

Ci possiamo chiedere qual è la probabilità che la variabile casuale X sia uguale a k, cioè P(X = k).

Allo stesso modo possiamo calcolare la probabilità che ci sia esattamente 1 furto.

Possiamo calcolare la probabilità che x=2, oppure x=3, e così via.

Se prendiamo i primi 3 eventi (x=1, x=2, x=3) e calcoliamo la probabilità che x sia minore o uguale a 2, avremo che:

P(x ≤ 2) = P(x=1) + P(x=2) = 0,0025 + 0,0062 = 0,0087.

Quindi la probabilità che x assuma un valore maggiore di 2 sarà pari a:

P(x > 2) = 1 - P(x ≤ 2) = 1 - 0,0087 = 0,9913.

Di questi 0,0013 sappiamo che 0,0011 saranno attribuiti alla probabilità che i furti siano pari a 3 e il resto sarà da distribuire tra le altre che risulteranno praticamente trascurabili.

Supponiamo di definire una nuova variabile casuale y che è il numero di furti d’auto in un giorno.

Com’è legata la y alla x calcolata prima?

La variabile casuale di Poisson è una variabile casuale additiva, ovvero se sommo le varie variabili casuali di Poisson ottengo ancora una variabile casuale di Poisson pari alla somma delle variabili di Poisson.

A questo punto posso calcolare la

probabilità che y sia pari a 0.

Se calcolo le probabilità per valori successivi avrò:

Quando abbiamo un esercizio con una variabile casuale di Poisson dobbiamo guardare a quale intervallo si riferisce la variabile (temporale).

Variabili casuali continue Le variabili casuali continue hanno una caratteristica fondamentalmente diversa da quelle discrete, ovvero assumono valori all’interno di intervalli di numeri reali.

I valori che la variabile assume non sono numerabili e questo ha una conseguenza importante. Se assumo che la variabile X=x, la probabilità che questa assuma esattamente quel valore è pari a 0. Ciò che siamo in grado di probabilizzare sono intervalli di valori.

Questo ci ricorda cosa accadeva in statistica descrittiva con le variabili continue, dove le frequenze erano definite all’interno di classi di valori.

Per le variabili casuali continue per caratterizzarle si usa la funzione di densità di probabilità.di ampiezza

infinitesimale diviso l'ampiezza stessa. È la probabilità associata ad un intervallo

Il concetto è sostanzialmente analogo a quello della densità di frequenza.

La densità di probabilità ci consente di calcolare le probabilità associate agli intervalli.

Supponiamo di avere una variabile casuale fatta in questo modo

Questa rappresentata è una variabile casuale uniforme continua. La sua funzione di densità di probabilità sarà pari a

La funzione di densità di probabilità deve avere 2 caratteristiche:

Se prendo tutta l'area al di sotto della funzione di densità, questa deve essere uguale a 1
associata all'intervallo.

Perché area sotto la funzione di densità mi dà proprio la probabilità

Al di fuori dell'intervallo la funzione di densità è pari a 0.

In generale, l'area sotto la funzione di densità consente di calcolare la

probabilità associata ad un intervallo ab. una variabile casuale uniforme così fatta, in questo caso l'altezza. Se per esempio supponiamo della densità è uguale a 1. Posso ad esempio chiedermi qual è la probabilità che x sia compreso tra 0,2 e 0,4. Si può costruire un'altra funzione: Oltre alla funzione di densità di probabilità, la funzione di ripartizione. È definita allo stesso modo che per le variabili casuali discrete: è la probabilità che la variabile casuale continua sia minore o uguale del valore x. Le caratteristiche sono esattamente uguali a quelle precedentemente dette per le variabili casuali discrete. La funzione di ripartizione è l'elemento unificante di variabili casuali discrete e variabili casuali continue. Tipicamente una funzione di ripartizione ha un andamento di tipo sigmoide, ovvero sono fatte più o meno in questo modo. Per la variabile casuale uniforme che abbiamo visto prima,La funzione di ripartizione è fatta così. Come per le variabili causali discrete, anche per quelle continue è possibile definire: - Valore atteso - Varianza Tra i modelli probabilistici per variabili casuali continue, ce n'è uno che gioca un ruolo fondamentale. Parliamo della variabile aleatoria normale o gaussiana. Che caratteristiche ha? Assume qualsiasi valore all'interno dell'insieme dei numeri reali, talvolta si dice che il supporto è dato dall'insieme dei numeri reali. La funzione di densità di probabilità della gaussiana è fatta in questo modo. Questa forma è detta campanulare simmetrica, rispetto ad un valore che indichiamo con la lettera greca mi. La funzione di questa funzione di densità è: Dipende da due parametri incogniti: Il pi greco che appare nella formula non è un parametro, ma il vero pi greco pari a 3,1415… Cosa rappresentano i due parametri? Il parametro

è il valore atteso

Il secondo parametro sigma quadro è la varianza della variabile casuale

Come influiscono sulla forma della funzione di distribuzione?

Vediamo prima il parametro

Abbiamo due funzioni di densità della variabile gaussiana, il cui valore atteso è paria . Come possiamo notare il valore

La distribuzione gaussiana è centrata sul valore atteso che è l’asse di simmetria.

Per la funzione di distribuzione gaussiana la media e la mediana coincidono.

L’area a destra di e l’area a sinistra di sono esattamente uguali.

influenza la posizione della curva che esprime la funzione di densità. Il valore atteso è equiparabile alla media e come sappiamo la media è un indice di posizione.

Se prendiamo in considerazione l’altro parametro abbiamo una cosa di questo tipo

Abbiamo due curve che sono centrate sullo stesso valore atteso, sulla stessa media, ma corrispondo a due diverse varianze. In particolare la curva

più stretta, che nella parte centrale è più alta è caratterizzata da una varianza più piccola. L'altra è più piatta quindi avremo valori più lontani dal valore centrale. Quando si disegna la gaussiana le cose si troncano, ma dobbiamo avere presente che la variabile nell'insieme dei numeri reali, quindi tende asintoticamente a 0. La variabile casuale gaussiana assume valori sia a destra che a sinistra. Il problema della variabile gaussiana generica è calcolare le probabilità, perché la probabilità è l'area al di sotto della curva. Quindi in linea teorica la la dovremo calcolare come. Per la distribuzione gaussiana però questo integrale non è risolvibile analiticamente. Come risolvere questo problema? Qual è la strada alternativa? Prima di risolvere questo problema ci sono due cose importanti da dire: 1. Quando abbiamo una variabile casuale continua possiamo omettere o aggiungere.

L'uguale sull'estremo dell'intervallo senza cambiare il valore della probabilità. Ma essendo nell'ambito delle variabili continue, la probabilità che la variabile sia esattamente uguale ad a o esattamente uguale a b è pari a 0. Quindi mettere o togliere gli uguali è la stessa cosa, conduce allo stesso risultato.

2. Esiste una proprietà importante della gaussiana che bisogna sottolineare. Partendo da a, prendiamo un intervallo che va da a, ovvero un intervallo centrato in . Se prendiamo questo intervallo e calcoliamo l'area corrispondente otteniamo che la circa 2/3 (0,67) del totale dell'area. La probabilità che x sia compreso in questo intervallo è .

Se prendiamo come variabile casuale x l'altezza di soggetti italiani maschi adulti. Possiamo assumere ragionevolmente che l'altezza assume una distribuzione normale. Supponiamo che questa sia la gaussiana che descrive la popolazione maschile italiana in termini di.

altezza. Quindi la è circa 0,67.

Se allarghiamo l’intervallo precedente, considerando quindi l’intervallo compreso tra, l’area corrispondente alla probabilità che x assuma valori compresi tra questi due valori sarà pari circa a 0,95.

Continuando con il nostro esempio, laQuesto 0,95 mi dice che se il modello che sto usando è adeguato, mi aspetto che su 100 soggetti che osservo 95 abbiamo un’altezza compresa nel valore in questione e solo 5 non abbiano un’altezza superiore o inferiore.

Se allarghiamo ancora l’intervallo a dall’altra. Se mi chiedoda una parte e qual è laQuindi.

Un esempio tipico di applicazione di questi intervalli è il controllo statistico della qualità.

Il controllo statistico della qualità tiene sotto controllo ciò che esce da un processo produttivo. Se produciamo viti con determinate caratteristiche in uscita dal processo ci aspettiamo viti tutte uguali. In realtà non.

esempio la lunghezza delle viti, si misurano un certo numero di pezzi e si calcola la media e la deviazione standard di queste misure. Questi valori ci permettono di stabilire i limiti di controllo, che rappresentano la soglia oltre la quale consideriamo un pezzo non conforme. Per fare ciò, utilizziamo una carta di controllo, che è un grafico con due linee orizzontali rappresentanti i limiti di controllo superiore e inferiore. Ogni volta che misuriamo la lunghezza di una vite, segniamo il valore sulla carta di controllo. Se il valore si trova all'interno dei limiti di controllo, il pezzo è considerato conforme. Se invece il valore supera uno dei limiti, il pezzo è considerato non conforme e il processo produttivo deve essere fermato per una verifica. È importante sottolineare che la presenza di valori al di fuori dei limiti di controllo non significa necessariamente che il processo produttivo sia difettoso. Potrebbe trattarsi di una variabilità normale del processo o di un caso isolato. Tuttavia, se osserviamo una tendenza di valori al di fuori dei limiti, potrebbe essere necessario intervenire per correggere il processo produttivo. In conclusione, il controllo statistico della qualità ci permette di monitorare la variabilità del processo produttivo e di intervenire quando necessario per garantire la conformità dei pezzi prodotti.

Anteprima

Vedrai una selezione di 20 pagine su 134