Anteprima
Vedrai una selezione di 4 pagine su 11
Appunti del corso Sistemi di servizio e simulazione, prof Massimo Roma, Parte simulazione Pag. 1 Appunti del corso Sistemi di servizio e simulazione, prof Massimo Roma, Parte simulazione Pag. 2
Anteprima di 4 pagg. su 11.
Scarica il documento per vederlo tutto.
Appunti del corso Sistemi di servizio e simulazione, prof Massimo Roma, Parte simulazione Pag. 6
Anteprima di 4 pagg. su 11.
Scarica il documento per vederlo tutto.
Appunti del corso Sistemi di servizio e simulazione, prof Massimo Roma, Parte simulazione Pag. 11
1 su 11
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Analisi dell’input

Per effettuare una simulazione risulta necessario specificare le distribuzioni di probabilità che regolano i

processi che caratterizzano i sistemi, nel caso in cui stiamo parlando di un sistema che presenta elementi

stocastici. Se risulta possibile raccogliere dati reali sulle variabili aleatorie di interesse, essi possono essere

utilizzati per determinare queste distribuzioni facendo uso di tecniche di inferenza statistica. La simulazione

procede generando valori casuali da queste distribuzioni.

Richiami

Viene fatta l’assunzione che esiste una distribuzione di probabilità della popolazione, nel senso che se da

essa vengono estratti casualmente alcuni elementi, ad essi sono associate variabili aleatorie indipendenti ed

identicamente distribuite secondo tale distribuzione. Supponiamo che un insieme di variabili aleatorie X ,

1

…,X sia un insieme di variabili aleatorie indipendenti ed identicamente distribuite: tale insieme si dice

n

campione sei questa distribuzione. Si consideri formalmente un campione estratto da una popolazione e si

2

consideri μ ed σ , rispettivamente media e varianza. Definiamo:

Scelta delle distribuzioni di input

I dati reali che si possono raccogliere possono essere utilizzati per determinare una distribuzione di

probabilità che meglio li rappresenta mediante 3 metodi:

1. I dati sono usati direttamente nella simulazione: tale primo approccio, poiché rappresenta il passato,

si usa raramente.

2. I dati sono raccolti per generare una distribuzione empirica che successivamente sarà utilizzata per

generare l’input della simulazione: per le distribuzioni continue tale metodo fa sì che vengano

prodotti valori che sono compresi tra minimo e massimo osservati: questo vuol dire che non si

potranno generare valori al di fuori del range di valori osservati; inoltre le distribuzioni empiriche

possono avere irregolarità. Se ci sono n dati disponibili si necessita di 2n valori per rappresentarli.

3. I dati sono raccolti e sono utilizzati per definire una distribuzione teorica: tali distribuzioni sono più

“smooth”. Tale metodo fornisce un modo più compatto di rappresentazione dei dati.

Distribuzioni empiriche

Supponiamo di avere a disposizione n osservazioni X …, X di una variabile aleatoria e di voler costruire, a

1, n

partire da esse, una distribuzione continua. Supponiamo inoltre di averle ordinato in modo crescente.

Scriviamo ora la distribuzione empirica che risulta essere una distribuzione lineare a tratti

Uno svantaggio nell’utilizzare una distribuzione empirica è che le variabili aleatorie generate da essa durante

una simulazione non possono essere mai più piccole di X o più grandi di X

(1) (n).

Distribuzioni teoriche

 Distribuzioni continue:

Distribuzione uniforme

o Distribuzione normale

o Distribuzione gamma

o Distribuzione di Weibull

o Distribuzione beta

o Distribuzione tringolare

o

Parliamo spesso di famiglie di distribuzioni poiché sono presenti uno o più parametri che possono

essere classificati in

Parametro di posizione, che specifica un punto del range della distribuzione e una

 sua variazione provoca solamente una traslazione

Parametro di scala, che specifica l’unita di misura dei valori

 Parametro di forma: specifica l’andamento della distribuzione

 Distribuzioni discrete:

Distribuzione di Bernoulli

o Distribuzione uniforme

o Distribuzione binomiale

o Distribuzione geometrica

o Distribuzione di Poisson

o Distribuzione binomiale negativa

o

Scelta di una distribuzione teorica

Occorre determinare quale distribuzione teorica è adatta a rappresentare dei dati. Quello che si fa è

individuare una o più famiglie di distribuzioni candidate, stimandone successivamente i parametri. Occorre

alla fine fare una verifica della rappresentatività dei dati reali da parte della distribuzione scelta; se tale passo

non ha successo occorre rideterminare una nuova distribuzione da cui stimare i parametri. Il processo cosi

descritto continua fino a quando non vi è il soddisfacimento della verifica.

- In primo luogo occorre necessario verificare l’indipendenza delle osservazioni. Un modo formale per

avere una stima dell’indipendenza tra variabili è la valutazione della correlazione fra diverse

osservazioni. Sia la formula seguente la formula che descrive il coefficiente di correlazione p di due

j

osservazioni distanti. Se risulta che il coefficiente di relazione è pari a 0, allora questo vuol dire che

le osservazioni sono indipendenti. Anche se tale parametro assume un valore possiamo allo zero si fa

questa assunzione. Ma se risulta diverso da zero in maniera significativa, allora le osservazioni non

sono indipendenti.

Vi sono due modi grafici per vedere se le X sono variabili aleatorie indipendenti:

i

1. Il grafico di p cappello al variare di j

j

2. Il diagramma di dispersione delle osservazioni: in caso di osservazioni indipendenti i punti

dovrebbero essere distribuiti esponenzialmente, mentre in presenza di correzioni saranno

concentrati intorno a rette

Individuazione di una famiglia di distribuzioni

Il passo successivo alla verifica dell’indipendenza è l’individuazione di una distribuzione da scegliere come

input della simulazione che sia rappresentativa della variabile aleatoria in ingresso alla simulazione. Se esiste

una conoscenza a priori del fenomeno che la variabile aleatoria rappresenta, essa può essere utilizzata per

ottenere la distribuzione; in altri casi questo non accade, e la conoscenza a priori permette solo di escludere

alcune possibili distribuzioni. Si ricorre frequentemente in questa fase a:

 Statistiche riassuntive delle osservazioni:

Ad esempio un confronto tra media e mediana può farci capire se la distribuzione è simmetrica o no

 Grafici dell’andamento delle osservazioni: un istogramma può essere considerato un “stima grafica”

del grafico della densità di probabilità corrispondente alla distribuzione dei dati. Per costruirlo si

suddivide l’intervallo formato dal minimo e dal massimo dei valori assunti dai dati, in k intervalli

disgiunti adiacenti di uguale ampiezza. Si definisce h il numero delle osservazioni che cadono nel j-

j

esimo intervallo diviso il numero totale delle osservazioni, ovvero la porzione delle X contenute nel

i

j-esimo intervallo.

Il grafico che viene fuori è costante a tratti e può fornire una buona indicazione sul tipo di

distribuzione che ha la variabile aleatoria in questione.

Stima dei parametri

È necessario successivamente determinare i parametri delle distribuzioni scelte, in modo tale da essere

completamente definite e utilizzabili in ingresso alla simulazione

Verifica della rappresentatività della distribuzione di probabilità

Occorre verificare i relativi parametri, in modo tale da determinare se tali distribuzioni di probabilità

approssimano bene i dati osservati. Come procedure per fare ciò consideriamo:

Procedure grafiche, in cui si confronta l’istogramma dei dati con il grafico della densità di

 probabilità della distribuzione, per il caso continuo mentre per il caso discreto si confronta

l’istogramma con la funzione p(x) della distribuzione ipotizzata

Test statistici

Scelta delle distribuzioni di input in assenza di dati

Se non sono disponibili i dati da utilizzare per selezionare una distrazione in input ad una simulazione, non

sono applicabili le tecniche fino ad ora viste. Sarà necessario fare ricorso ad euristiche che si basano sulla

natura del sistema

Generazione di osservazioni casuali

Determinata la distribuzione in input, la simulazione dovrà generare durante ogni esecuzione osservazioni

casuali di variabile aleatorie distribuite secondo particolari distribuzioni di probabilità. Ogni metodo per

generare osservazioni casuali da distribuzioni fissate utilizza variabili indipendenti identicamente distribuite

secondo la distribuzione uniforme in [0,1). Questo vuol dire che costruisce le osservazioni casuali desiderate

a partire da numeri casuali generati uniformemente in [0,1) attraverso opportune trasformazioni.

Generazioni di numeri pseudocasuali con distribuzione uniforme

Per generare successioni di numeri casuali si ricorre attualmente all’uso del calcolatore. Quello che si fa è la

generazione deterministica di successioni di numeri aventi proprietà statistiche approssimano molto bene

quelle di successioni veramente casuali. Tali numeri sono detti numeri pseudocasuali. Per generarli è

possibile ricorrere a diversi metodi, ma il più utilizzato è il metodo dei generatori congruenziali lineari. In

questo metodo una successione di numeri interi Z viene definita nella seguente maniera: Z = aZ + c, dove a

i i+1 i

si chiama moltiplicatore e c viene detto incremento. Il termine Z viene detto seme. Se risulta c=0 il

0

generatore viene detto moltiplicativo; vengono generate al più m numeri interi Z distinti con 0<=Z <= m-1.

i i

Per ottenere numeri casuali U in [0,1) è sufficiente definir U = Z /m. Si noti che la successione che verrà

i i i

generata sarà periodica di periodo al più pari a m. Se il periodo della successione è m, ovvero è massimo,

allora si dice che il generatore ha periodo pieno; in tale caso ogni scelta del seme porterà alla generazione

dell’intero ciclo di valori da 0 a m-1. Altrimenti se questo non accade, in un generatore senza periodo pieno il

ciclo potrà dipendere dal valore del seme.

Teorema: un generatore congruenziale lineare ha periodo pieno se è solo se sono soddisfatte le seguenti

condizioni:

a. m e c sono primi tra di loro

b. Se q è un numero primo che divide m, allora q divide a-1

c. Se 4 divide m, allora 4 divide a-1

In tale situazione si osservi che effettivamente le Z che si vengono a determinare non sono del tutto causali,

i

ma sono legate ai parametri a,c,m e Z . Nei linguaggi di programmazione sono di solito disponibili

0

generatori di numeri pseudocasuali ed esistono metodi statistici per valutarne la qualità.

Generazione di osservazioni casuali da una distribuzione di probabilità

Considereremo due delle tecniche più utilizzare per generare osservazioni da una fissata distribuzione di

probabilità.

Metodo della trasformazione inversa

Tale metodo si basa sul seguente risultato teorico: sia U una variabile aleatoria uniforme in [0,1). Allora per

-1

ogni funzione di distribuzione continua F, la variabile aleatoria X=F (U) ha funzione di distribuzione F.

Quindi data questo risultato sappiamo che data una distribuzione di probabilità con funzione di distribuzione

F, a partire dalla distribuzione uniforme in [0,1) possiamo costruire una variabile aleatoria l

Dettagli
Publisher
A.A. 2017-2018
11 pagine
SSD Scienze matematiche e informatiche INF/01 Informatica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher dianarsl di informazioni apprese con la frequenza delle lezioni di Sistemi di servizio e simulazione e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Roma La Sapienza o del prof Roma Massimo.