Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
MIA 2022
Titolare:
- Francesco Vaccarino
- Lamberto Rondoni
- Andrea Tosin
- Francesco Della Santa (Post Doc)
Ricevimento su appuntamento
3 ore lunedì in presenza
3 ore martedì, online sino alle vacanze pasquali, dopo misto (fino al 17 maggio)
- 24 - 31 maggio Rondoni in aula 10 D
- 7 giugno Vaccarino online
Il lunedì: Della Santa e poi Tosin fino al 04/04
- Della Santa - Della Santa il 11/04
- Della Santa - Rondoni dal 2/05
Vaccarino Tosin Rondoni
- AI/ML
- CBO
- Rapporto tra learning e sistemi dinamici
35 h 10 h 75 h
Della Santa
Esercizi + lab con uso di Python 20 h
ESAME
Tesina (ita/ing)
TI VOGLIO BENE
Il termine λ(min - xin)
esprime un rilassamento di xin verso min
- ηin è una variabile aleatoria di media nulla: ⟨ηin⟩ = 0
- e varianza strettamente positiva: ⟨(ηin)2⟩ > 0 che
rappresenta una fluttuazione stocastica
Nota: ogni particella ad ogni iterazione ha una variabile aleatoria ad essa associata che é indipendente rispetto alle variabili aleatorie associate alle altre particelle e alle variabili aleatorie dei passi precedenti (tutto é indipendente)
Supponiamo ηin i.i.d e varianza unitaria: ⟨(ηin)2⟩ = 1
L'algoritmo
si chiama CBO = Consensus-Based Optimisation
Analisi di base dell'algoritmo CBO
Hp: Supponiamo che ω: ℝn → ℝ goda delle seguenti proprietà:
- ∃ c, C > 0 con c < C tali che c ≤ ω(x) ≤ C ∀ x ∈ ℝn
ω é sempre strettamente positiva
- x → ω(x), x → xω(x) sono lipschitziane su ℝn cioè:
|ω(y) - ω(x)| ≤ Lω|y - x| ∀ x, y ∈ ℝn
|y ω(y) - x ω(x)| ≤ Lxω|y - x| ∀ x, y ∈ ℝn
dove Lω, Lxω > 0 sono due costanti.
≔ M < + ∞
∬ |ω(y) - ω(x₁)| dy(x, y) +
≤ G/c² [ ∬ |y - x₁| dy(x, y) + Lω ∬ |x - y| dy(x, y)]
Per l'arbitrarietà di y ε Γ (fN R, fR) questa disuguaglianza vale anche passando al min su y
⇒ |m [fR] - m L ≤ G/c² [MLω + Lxω] ∀N (ue N - fe) → N → 0
Se supponiamo N molto grande possiamo riscrivere l'algoritmo CBO come:
xi k+1 = xi k + λ (m [fe] - xi k) + θ (m [fe] - xi R)ηi R
Chiamiamo:
- fe la distribuzione teorica delle particule nel limite N → ∞ ;
- m [fe] la posizione media pesata teorica delle particule
= λ∫Rn (m[f*] - x) φ(x,t) dx
= λ (m[f*]∫Rn φ(x,t) dx - ∫Rn x φ(x,t) dx)
=>
dM(t)/dt = λ (m[f*] - M(t))
(*) Hp. Supponiamo che per tempi lunghi la distribuzione f(x,t) converga ad una distribuzione fp∞(x). Più precisamente:
fp∞ ∈ B1(R), lim W1(f(·,t), fp∞) = 0
t → ∞
Prop. Si ha:
m[f](t) = ∫R xω(x)φ(x,t) dx / ∫R ω(x)φ(x,t) dx → t →
∫R xω(x)fp∞(x) dx / ∫R ω(x)fp∞(x) dx
Dimostrazione: Il risultato dipende dall'ipotesi (*) usando la stessa tecnica già vista nella dimostrazione del fatto che m∞ = m[f*]
Hp. Supponiamo che f( ·,t) →t → fp∞ in B1(R) in maniera esponenzialmente veloce cioè:
∃ a,b > 0: W1(f( ·,t), fp∞) ≤ ae-bt
2λ - λ² - θ² > 0
perché é presente al denominatore (≠0) e non voglio che abbia influenza nei segni ( >0)
Sotto questa condizione verifichiamo che:
(i) G tende ad un limite G∞ per t → ∞:
limt G(t) =
λ² + θ² m² [fp∞] + 2λ - 2λ² - 2θ² m² [fp∞]
2λ - θ² - λ2
= m² [fp∞]
(ii) G tende al valore m² [fp∞] in modo esponenzialmente veloce:
|G(t) - m² [fp∞]| =
(λ² + θ²) m² [f] + (2λ - 2λ² - 2θ²) m² [fp∞] M - m² [fp∞]
(2λ - λ² - θ²)
=
(λ² + θ²) m² [f] - m² [fp∞]
2λ - λ² - θ²
< λ² + θ² |m² [f] - m² [fp∞]|
2λ - λ² - θ² + 2λ - 2λ² - 2θ² [m² [G]M - m² [fp∞]]
Osserviamo che:
(ii: a) | m² [f] - m² [fp∞] | = |m [f]| m [fp∞] | - |m [fp∞]|
<= |m [f]| + |m [fp∞]| limitata
Scegliamo: \( \omega(x) = e^{-aF(x)} \), \( a > 0 \)
Verifichiamo che questa \( \omega \) soddisfa le ipotesi previste dalla teoria:
- \( 0 < F \leq \overline{F}(x) \leq \overline{\overline{F}} < +\infty \quad \forall x \in \mathbb{R} \)
\( \Rightarrow \omega(x) = e^{-a\overline{F}(x)} \geq e^{-a\overline{\overline{F}}} =: c > 0 \)
\( \omega(x) = e^{-aF(x)} \leq e^{-aF} =: C \gt 0 \)
Quindi \( c \leq \omega(x) \leq C \quad \forall x \in \mathbb{R} \)
(ii) Lipschitzianità di \( \omega(x) \):
\( |\omega(y) - \omega(x)| = |e^{-aF(y)} - e^{-aF(x)}| \leq |-a[F(y) - (-aF(x))]| \)
\( = a |F(y) - F(x)| \)
\( \leq aL_F |y-x| \)
Quindi \( \omega \) è lipschitziana su \(\mathbb{R}\) con \( L = aL_F \)
(iii) Lipschitzianità di \( x \omega(x) \):
Condizione sufficiente: limitatezza di \( \frac{d}{dx} (x\omega(x)) = \omega(x) + x \omega'(x) \)
\( = e^{-aF(x)} + x(-aF'(x) e^{-aF(x)}) \)
\( = e^{-aF(x)} (1 - a x F'(x)) \)
Come condizione sufficiente possiamo chiedere che \( F'(x) \longrightarrow 0 \) per \(|x| \longrightarrow +\infty\) abbastanza velocemente (almeno come \( \frac{1}{x} \))
Bontà dell'approssimazione fornita dal CBO
Supponiamo che F abbia un unico punto di minimo globale ̄ ∈ ℝ
Vediamo come accertare se il punto ̃ (punto di consenso delle particelle prodotto dal CBO) è una buona approssimazione di ̄
Teorema
Supponiamo che esista > 0 tale che
\(\int_{\mathbb{R}} \omega(x) f_0(x) \, dx < \int_{\mathbb{R}} \omega(x) f(x,t) \, dx \quad \forall t \geq 0\)
Allora ̃ si può rendere vicino a piacere a ̄
Dimostrazione
Per la monotonia del logaritmo, abbiamo:
- \(\frac{1}{2} \log \left( \int_{\mathbb{R}} \omega(x) f_0(x) \, dx \right) \leq \frac{1}{2} \log \left( \int_{\mathbb{R}} \omega(x) f(x,t) \, dx \right)\)
\(-\frac{1}{2} \log \left( \int_{\mathbb{R}} \omega(x) f_0(x) \, dx \right) \geq -\frac{1}{2} \log \left( \int_{\mathbb{R}} \omega(x) f(x,t) \, dx \right)\)
\(\delta(x - \bar{x}) \in \mathcal{G}_1(\mathbb{R}), \Theta_1(\mathbb{R})\)