vuoi
o PayPal
tutte le volte che vuoi
C N
C c, c 0, d
GIOCATORE 1 N d, 0 n, n
I giocatori possono:
- C: cooperare
- N: non cooperare
Questo è un ‘dilemma del prigioniero’ se i payoff soddisfano la condizioni
0 < n < c < d
Ogni giocatore ha una strategia dominante che è N (non cooperare), quindi la soluzione del gioco è che nessuno
coopera.
La cooperazione sarebbe un esito superiore da un punto di vista paretiano, infatti se i giocatori cooperassero
otterrebbero entrambi un payoff maggiore.
Tuttavia, la cooperazione non è neppure un equilibrio di Nash e dunque non può mai essere una soluzione del
gioco costituente.
Vedremo che se il gioco viene ripetuto indefinitamente dagli stessi giocatori, la cooperazione in ogni stadio può
emergere come soluzione del gioco ripetuto.
NOTAZIONE:
s
it
: strategia del gioco costituente al tempo t per il giocatore i
s
it ∈ {C, N}
r : strategia del gioco ripetuto per il giocatore i
i r s , s s s
i0 i1 i2 it
= ( , , … , )
i
In ogni periodo i due giocatori hanno informazioni su come si è svolto il gioco nei periodi precedenti, cioè
conoscono la storia passata.
Un giocatore può condizionare la propria mossa in un periodo alla storia del gioco fino a quel punto.
Ad esempio, il giocatore i può adottare una strategia tit – for - tat (occhio per occhio)
O una trigger strategy
Payoff
Il giocatore i può decidere di giocare N in ogni periodo, cioè la strategia non cooperativa
^
r i = (N, N, N, ...)
I payoff dei giocatori sono dati dal valore attuale dei payoff del gioco costituente.
Il fattore di sconto è indicato con δ.
δ è un numero compreso tra o e 1 e può dipendere dal tasso di interesse, dalla probabilità di proseguire il gioco,
dalla frequenza delle interazioni.
Ad esempio, se indichiamo con ρ il tasso di interesse e con α la probabilità che il gioco continui nel periodo
successivo, il fattore di sconto è dato da: δ = α (1 / 1 + ρ)
Se: - α = 50%
- ρ = 10%
Il fattore di sconto è δ = α (1 / 1 + ρ) = 0.5 × (1 / 1.1) ≈ 0.45
Un basso valore di δ si ha quando vi è:
1. Un alto tasso di interesse
2. Una bassa probabilità che il gioco prosegua in futuro
3. Una bassa frequenza di interazione
Torniamo ai payoff del gioco ripetuto. ^
Calcoliamo il payoff del giocatore i se entrambi i giocatori scelgono la strategia non cooperativa, r i.
^ ^
Vi ( r 1, r 2) = n + δ n + δ n + ··· + δ n + ··· =
2 t
(1 + δ + δ + ···) n =
2
(1 / 1−δ) n
EQUILIBRI DI NASH ^ ^
Il gioco ripetuto ha molti equilibri di Nash. Uno di questi è l’esito non cooperativo, cioè il profilo ( r 1, r 2).
^ ^
Mostriamo che r 1 è una risposta ottima a r 2.
Indichiamo una generica strategia del giocatore 1 con Gioco costituente
- - - -
r 1 = (
s , s , s , … )
10 11 12
Poiché s = N per ogni t, il payoff del giocatore 1 in ogni gioco costituente è:
2t -
- n se s = N
1t
-
- 0 se s = C
1t
Perciò, in ogni periodo t -
v1 ( s , N) ≤ n
1t
Il payoff del gioco ripetuto è: ^ ^
Analogamente si mostra che r 2 è una risposta ottima a r 1, quindi l’esito non cooperativo è un equilibrio di
Nash del gioco ripetuto.
EQUILIBRIO COOPERATIVO
Vogliamo stabilire se un esito cooperativo in ogni gioco costituente, cioè il profilo (C, C) in ogni periodo, è una
possibile soluzione del gioco ripetuto.
A quali condizioni l’esito cooperativo è un equilibrio di Nash del gioco ripetuto?
Consideriamo il profilo di strategie in cui ogni giocatore gioca la sua ‘trigger strategy’, cioè il profilo (τ1, τ2).
Trigger Strategy
Se ognuno segue la propria trigger strategy, gioca C in ogni periodo e l’esito di ogni gioco costituente è quello
cooperativo, (C, C).
Verifichiamo se il profilo (τ1, τ2) è un equilibrio di Nash del gioco ripetuto.
Verifichiamo se τ1 è una risposta ottima a τ2
Se ogni giocatore segue la sua trigger strategy ottiene in ogni periodo un payoff pari a C, quindi il payoff del
gioco ripetuto per il giocatore 1 è: V1(τ1, τ2) = c + δ c + δ c + ··· =
2
[c / (1 – δ)]
Supponiamo che il giocatore 1 devi dalla trigger strategy al tempo 0 e giochi N.
Il giocatore 2 in base alla sua trigger strategy gioca C e l’esito del gioco costituente al tempo 0 è (N, C).
Dal quel punto in poi il giocatore 1 continuerà a giocare N, dato che il giocatore 2 giocherà N in base alla sua
trigger strategy.
Quindi, se il giocatore 1 devia da τ1 giocherà la strategia non cooperativa
^
r 1 = (N, N, N, ...)
I payoff che il giocatore 1 ottiene dalla deviazione sono
^
V1( r 1, τ2) = d + δ n + δ n + δ n +··· =
2 3
d + n δ (1 + δ + δ + ···) =
2
d + [δ / (1 – δ)] n
La strategia τ1 è una risposta ottima a τ2 se ^
V1(τ1, τ2) > V1( r 1, τ2)
Cioè se vale la condizione [c / (1−δ)] > d + [δ n / (1 – δ)]
Da cui si ricava δ > [(d – c) / (d – n)]
Questa condizione è soddisfatta se il fattore di sconto è sufficientemente elevato.
Lo stesso ragionamento si può fare anche per il giocatore 2.
Quindi, quando la condizione sopra indicata è soddisfatta il profilo (τ1, τ2) è un equilibrio di Nash del gioco
ripetuto, cioè l’esito cooperativo è una possibile soluzione del gioco.
Questo si verifica quando:
1. I tassi di interesse sono bassi
2. La probabilità che il gioco continui è alta
3. La frequenza delle interazioni è alta
Vediamo un esempio numerico.
È segnato zero per semplicità dei calcoli. Nella realtà sarebbe una cifra inferiore a 100.
ESEMPI:
Mercati in cui è meno probabile la collusione
- Prodotti con rapida obsolescenza tecnologica
La probabilità di continuazione è bassa. Esempi di Apple e Samsung che devono continuamente
aggiornare il loro prodotto.
- Mercati in cui c’è più facilità di entrata e uscita
Servizi di trasporto aereo. Ogni tratta è un mercato in cui le compagnie aeree possono entrare o uscire.
Mercati in cui è più probabile la collusione
- Mercati in cui l’interazione tra imprese è più frequente
I benzinai fissano i prezzi ogni giorno.
- Mercati in cui vi sono condizioni stabili di domanda e di costo
Contatori dell’acqua, il cemento.
GIOCHI SEQUENZIALI O A PIÙ STADI
Vi sono molti contesti strategici in cui gli agenti prendono le loro decisioni in momenti diversi del tempo
avendo a disposizione informazioni sulle decisioni degli altri soggetti.
Esempio:
Competizione di prodotto tra due imprese produttrici di cereali per la prima colazione
- Impresa 1, Leader, Deve decidere quale varietà produrre: Friabili o Dolci
- Impresa 2, Dopo aver osservato la decisione dell’impresa 1 deve decidere quale varietà produrre:
Friabili o Dolci
I profitti delle due imprese dipendono dalle scelte di entrambe.
La competizione di prodotto è un esempio di gioco sequenziale.
Per descrivere un gioco sequenziale occorre specificare:
- Ordine in cui i giocatori sono chiamati a scegliere
- Mosse o azioni a disposizione di ogni giocatore quando è il suo turno di gioco
- Informazioni a disposizione di ogni giocatore quando è il suo turno di gioco
- I payoff
Il gioco delle due imprese può essere rappresentato con un grafico con nodi e frecce.
I giochi sequenziali sono descritti in forma estesa (la forma normale riguarda invece la matrice vista
precedentemente), cioè mediante due elementi:
1. Albero del gioco
2. Insiemi informativi ALBERO DEL GIOCO
L’albero del gioco è un grafico composto da frecce e nodi:
- I NODI indicano una posizione del gioco e appartiene ad un solo giocatore
- UNA FRECCIA indica un’azione o mossa di un giocatore a cui appartiene il nodo
GIOCO 1: Vi sono 2 giocatori, A e B.
Convenzione grafica:
- I nodi e le azioni del giocatore A sono indicate con lettere maiuscole
- I nodi e le azioni del giocatore B sono indicate con lettere minuscole
Il primo nodo è quello assegnato al giocatore A. Da esso si diramano due frecce che indicano le due possibili
azioni del giocatore A. Una volta che A ha scelto, si arriva al nodo del giocatore B. In base alla scelta di A, ha due
possibili azioni a disposizione. Ogni coppia di scelta origina i differenti payoff.
Osservazioni
Ogni nodo appartiene ad un solo giocatore
Le frecce che escono da un nodo indicano le azioni a disposizione del giocatore
I ‘nodi finali’ indicano la fine del gioco e le rispettive vincite
REGOLE DELL’ALBERO DEL GIOCO
Un albero del gioco deve soddisfare le seguenti regole:
1. Ogni freccia collega due nodi
2. C’è un solo nodo non raggiunto da alcuna freccia, il nodo iniziale
3. Tutti i nodi, tranne il nodo iniziale, sono raggiunti da una sola freccia
4. Vi sono nodi da cui non parte nessuna freccia, i nodi finali
SENTIERO DI GIOCO
Le regole garantiscono che ogni nodo finale sia collegato al nodo iniziale mediante un unico sentiero di gioco.
Sentiero di gioco: sequenza di frecce che collega il nodo iniziale ad un nodo finale
Gioco 1
- Il sentiero [L, r] collega il nodo iniziale al nodo finale (3, 2)
- Il sentiero [R, n] collega il nodo iniziale al nodo finale (8, 4)
INSIEMI INFORMATIVI
Un insieme informativo di un giocatore è un sottoinsieme dei suoi nodi decisionali.
Un insieme informativo indica l’informazione del giocatore sulla storia passata del gioco.
Gioco 1
Supponiamo che il giocatore B abbia il seguente insieme informativo:
h = {b1, b2}
Il giocatore sa che si trova in h, ma non sa in quale dei due nodi si trova cioè, non sa se il giocatore A ha giocato
L oppure R.
Più numeroso è l’insieme informativo, minore è l’informazione a disposizione del giocatore.
Per indicare gli insiemi informativi sull’albero del gioco si segue questa convenzione grafica:
- I nodi di uno stesso insieme informativo sono collegati da una linea tratteggiata
- I nodi non collegati da una linea tratteggiata sono insiemi informativi a sé stanti (singoletti)
Un insieme informativo soddisfa le seguenti regole:
1. I nodi dell’insieme informativo non sono collegati tra loro da frecce
<