C×Ache: informazioni sul sistema osservabile attraverso le misure
Quindi posso scrivere: y = O x(0)
Questo sistema è l'accumulazione di tutte e sole le informazioni che posso avere ("sole e tutte" perché vale il teorema di Hamilton-Kelly): qual è la possibilità che oggi risolvere il problema per x(0)? Sarà quella di trovare all'interno di questa matrice un numero di righe n linearmente indipendenti.
Quindi il problema si riduce a trovare un numero di righe pari ad n che siano linearmente indipendenti perché significa che ho trovato n equazioni linearmente indipendenti che mi permettono di risolvere il problema. Siccome ho una matrice gigante con un blocco l'uno sotto l'altro, come posso dire, in maniera sintetica, che O contiene n righe linearmente indipendenti? Utilizzo il rango della matrice e dico: rango(O) = n il sistema è risolvibile.
Se il rango della matrice O è proprio n...
Allora il sistema di eq. è risolvibile: posso calcolare la x(0) in maniera univoca. Quindi conosco la x(0), se la soluzione è unica e quindi conosco tutti gli x negli istanti successivi ho risolto il problema.
Allora posso dire a priori che il rango della matrice O è n. La matrice O è detta matrice di osservabilità ed esprime la capacità di ricostruire lo stato a partire dalle misure.
Per conoscere la x(0) ci vuole un po' di tempo. Immaginiamo di fare il controllo ottimo, io non conosco x(0) ma devo produrre la u(0): u(0)=-Gx(0)
Ma io in 0 conosco solo la y(0), che però non mi da la possibilità di conoscere la x(0). Metto una x qualunque o la migliore delle stime che posso fare e inserisco questa x.
Aspetto un altro istante di tempo e mi chiedo: è aumentato il rango di O sino ad n? Se si ho risolto il problema altrimenti devo aspettare ancora e so che la mia attesa durerà fino a d n passi (perché da 0 ad n-1 sono n passi).
Allora se il mio sistema era osservabile lo so che la mia cecità di prendere decisioni durerà soltanto n passi. Ma dopo il passo n-esimo conosco lo stato e posso quindi prendere una decisione ottimale (parliamo sempre del caso deterministico).
Come si degrada la mia politica ottimale? Si degrada in relazione a questa incertezza che riguarda i primi istanti di queste mie prime decisioni. Le prime decisioni saranno sicuramente sbagliate, però dopo la qualità improvvisamente migliora quando si accumulano sufficienti informazioni, a quel punto non si sbaglia più; quindi la politica di decisione non sarà quella ottima perché mi mancano le prime decisioni che non sono ottime!
Non possiamo fare una mediazione? Vorremmo costruire un dispositivo che mi dia una stima anche nell'istante 0 dello stato, perché in quest'istante non abbiamo nemmeno una stima della x(0), cioè vorrei un dispositivo che mi fornisca la stima di x(0).
x(1)… x(n)e che queste stime convergano al valore vero; vogliamo quindirinunciare ad avere dopo n passi un valore vero e accontentarci di un valoreapprossimato purché sia asintotico ad andare verso il valore vero; in questo modoavremmo anche una stima del valore x(0).
Per fare ciò si utilizza un algoritmo chiamato osservatore dello stato che è unastruttura che utilizzeremo anche in campo non deterministico. Nella seguente formasi distinguerà il sistema il cui stato voglio stimare dal mio stimatore.
Immaginiamo un impianto di cui voglio stimare la realtà, perché è proprio dallarealtà che provengono le misure, che viene catturata da un modello supponiamo adesempio sia lineare (questo discorso ha una sua validità solo in ambito lineare).
Costruisco un osservatore che mi fornisce:
∑ x(k+1|k) = x(k) + L(y(k) - y(k|k-1))
dove:
(k+1|k) è la stima
All'istante k+1 sulla base delle misure che mi pervengono fino all'istante k. Quella scritta è la struttura di questo osservatore e si compone di 2 parti:
- La prima parte non è altro che la replica dell'impianto con: −A x ( k | k 1) stima dello stato che è un aggiornamento della stima precedente; Bu(k) lo stato successivo dipende anche dall'ingresso all'istante precedente;
- La seconda parte: se mi fermassi alla prima parte, non utilizzerei le informazioni che mi pervengono all'istante k, cioè la y(k), quindi vi è un altro termine che chiamo termine di correzione dato da L, che è una matrice (una matrice dei guadagni), moltiplicata per una differenza: −L ( y ( k ) y ( k | k 1)) dove: y(k) è una quantità misurata ovvero la misura pervenuta dall'impianto y(k|k-1) è una stima dell'uscita all'istante k.
Ma perché stimare l'uscita?
Perché se abbiamo stimato la x possiamo stimare anche la y secondo la seguente formula:
y(k) = y(k-1) + Cx(k|k-1) - y(k|k-1)
Abbiamo quella differenza, che è detta innovazione, perché mi dà una misura della bontà della mia stima. Se la stima è buona, e quindi lo stimatore ha avuto la vera x, quella differenza è nulla e significa che è possibile determinare deterministicamente lo stato successivo attraverso la stima precedente; se invece quella quantità è leggermente disallineata, allora ho necessità di correggere la mia stima. Come la correggiamo? Attraverso L, che è la correzione che facciamo proporzionalmente all'errore commesso sull'uscita. Non posso fare l'errore dello stato perché significherebbe fare il confronto tra quello che stimo e quello che vorrei ma lo stato non lo conosco, ma posso fare un confronto sugli effetti di questa stima e tali.
effetti sono proprio le uscite y. Dunque questo disallineamento su questa previsione delle uscite è una misura della qualità della mia stima che poi viene utilizzata per aggiornare, modificare, alterare la stima dell'istante successivo (se ho sottostimato allora vado a fare una stima un po' più grande, se ho sovrastimato faccio una stima più piccola); quindi faccio quest'operazione di aggiornamento e continuo quest'operazione.
Si può dimostrare che questa struttura algoritmica è asintoticamente convergente (algoritmica perché quello visto è un algoritmo: prendi la stima e aggiornala con le uscite ottenute).
Resta però da stimare, cioè da assegnare (0): per adesso posso dire che, x qualunque valore metto nell'istante 0 come c.i., questo dispositivo è convergente, significa, nella nostra logica, che se io considero la quantità:
Φ = Σ e(k) x(k) x(k | k-1)
chiamo errore di stima (NB vi sono 2 errori di stima: uno dello stato e uno delle uscite), posso dimostrare che se quest' impianto si comporta come il mio modello (è un' assunzione forte), cioè se il mio modello cattura esattamente la realtà, se siamo in un ambito perfettamente deterministico e ben descritto dal mio modello, allora qualunque sia la c.i. che utilizzo per avviare l' osservatore, l' errore di stima dello stato convergerà asintoticamente a zero; se l' errore converge a zero significa che l' stima dello stato converge al valore vero!
Come faccio questa dimostrazione?
La quantità e(k+1) è una quantità immateriale perché non si può calcolare perché non si conosce x(k). Quindi ho scritto delle equazioni e(k) che non si potranno mai verificare:
∧ - l' ho fatta io ma la x(k) non la conosco.
x ( k | k 1)
In realtà poi il problema in ambito deterministico è sempre
legato alla x(0) perché se conoscessi anche solo la x(0) potrei dire che conosco tutte le x(k)! Se scrivo le equazioni e anche se non posso andarle a verificare sul campo, cioè non posso vedere i valori veri, la struttura di tali eq. mi può dire qualcosa sulla stabilità delle soluzioni. Quest'ultima, infatti, è legata al fatto che qualunque sia la c.i. da cui parte x(0), se dico che il sistema è asintoticamente stabile, vuol dire che io so che la struttura delle mie eq. è tale per cui, se è garantita la asintotica stabilità, il mio sistema è destinato ad andare a zero, cioè è strutturalmente fatto in maniera da andare a zero; sicché indipendentemente dalla c.i. da cui parto se le mie eq. mi dicono che il sistema è asintoticamente stabile io so che il mio errore andrà a zero anche se non conosco il valore dell'errore; il valore iniziale dell'errore è proprio quello.che vorrei conoscere e che non conosco, ma conoscendo la proprietà dell'equazione posso dire che qualunque sia la c.i. l'errore è destinato ad andare a zero e quindi vado ad indagare la stabilità dell'eq. non la stabilità di quella particolare traiettoria che si va a formare. La stabilità è una proprietà strutturale: significa che non dipende dalla c.i. ma dipende dalla struttura della matrice A. Ricordiamo la definizione di asintotica stabilità per un sistema discreto: è una definizione che riguarda gli autovalori della matrice che devono essere tutti quanti contenuti in un cerchio di raggio unitario nel piano complesso. Mi interessa conoscere, adesso, come si propaga l'errore, ovvero l'eq. di evoluzione dell'errore, quindi quanto vale e(k+1) in relazione all'errore all'istante precedente. Indagando la stabilità dell'eq. di propagazione posso dire se questo errore tende azero indipendentemente dalla c.i., quindi dallo stato del mio impianto che effettivamente assume! L'espressione di e(k+1) sarà uguale:∀+ = + − +e( k 1) x ( k 1) x ( k 1 | k )∀ +x ( k 1 | k )
Posso sfruttare di sapere quanto vale noto che sia x(k) anche se poi, in realtà, non lo conosco; ma posso scrivere che quell'espressione è:
∀ ∀= + − − − − + −Ax ( k ) Bu ( k ) A x ( k | k 1) Bu ( k ) LCx ( k ) LC x ( k | k 1)∀+ +x ( k 1) x ( k 1 | k )
dove:
Bu(k) sparisce e finisce di non avere nessun ruolo;
Poi vi è il termine di correzione nel modello dell'osservatore che era in funzione diy, ma stiamo cercando l'eq. di evoluzione dell'errore (dello stato) quindi la y mi da fastidio a
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Appunti Stima e Identificazione
-
Appunti ISM - Identificazione e stima dei modelli (ex IMCO - Identificazione e Metodi di Controllo Ottimo) + Domand…
-
Appunti di Identificazione dei Modelli e Analisi dei Dati parte B
-
Appunti di Identificazione dei Modelli e Analisi dei Dati parte A