Elaborazione delle immagini
1 Introduzione alla percezione visiva
Le tecniche di elaborazione delle immagini (Digital Image Processing) mirano a ricavare informazione dall'interpretazione di
immagini originali. Tali immagini sono ripartite (segmentate) nelle regioni corrispondenti agli oggetti della scena, secondo
metodi di elaborazione che riproducono, sostanzialmente, il processo di percezione visiva.
Per questa ragione, l'elaborazione delle immagini richiede la conoscenza del sistema visivo (umano), il cui compito
fondamentale consiste, appunto, nel ricavare dall'ambiente le informazioni utili all'individuo per interagire con esso.
Approccio ecologico - Approccio allo studio del processo di percezione visiva, proposto dallo psicologo americano
J. J. Gibson, secondo il quale la comprensione di questo complesso sistema richiede l'analisi dell'ambiente in cui
l'animale (l'uomo) vive.
NOTA - Secondo Gibson, la visione naturale si ha quando un organismo è libero di muoversi nel suo ambiente, di
modificare il proprio punto di vista per trarre un'informazione più ricca su ciò che lo circonda.
Ambiente - Realtà circostante l'uomo (e ogni altro animale), considerata nelle modalità ("ecologiche") in cui
l'uomo la percepisce; non secondo la fisica, che attraverso il ragionamento rileva caratteristiche impercettibili (ma
comprensibili) come il tempo, la conservazione dell'energia, i cambiamenti di stato della materia.
NOTA - Pertiene allo studio della visione la percezione diretta dell'ambiente e di tutto quello che esiste al livello
dell'ambiente. La percezione indiretta, di ciò che è invisibile perché microscopico (es. gli atomi) o macroscopico
(es. le galassie), si deve al ragionamento e non è rilevante.
[A ] L'ambiente può essere descritto nei termini delle sostanze, dei mezzi e delle superfici che lo
SSIOMA ONTOLOGICO
compongono e dall'interazione tra questi elementi.
Sostanze - Elementi naturali essenzialmente eterogenei, dotati di forma solida, semisolida, liquida o gassosa.
Mezzi (medium) - Particolari sostanze omogenee capaci di trasportare gli stimoli che danno luogo alla percezione,
visiva e non solo (es. l'aria e l'acqua).
NOTA - I mezzi sono le sole sostanze trasparenti, in grado di trasportare perfettamente la luce.
Superfici - Interfacce tra due sostanze in diversa forma. Sono il luogo presso cui si verifica la maggior parte delle
interazioni di interesse tra le sostanze e gli esseri viventi. Hanno particolari proprietà (leggi ecologiche delle
superfici) che informano sulla loro natura:
si configurano nello spazio secondo una particolare disposizione e forma;
esibiscono una tessitura (texture) caratteristica, dipendente dalla loro composizione e morfologia;
assorbono la luce che le raggiunge in quantità variabile;
riflettono la luce che le raggiunge in quantità variabile;
reagiscono diversamente alle lunghezze d'onda che costituiscono la luce, il che ne determina il colore.
NOTA - Geometricamente, i mezzi sono assimilati al concetto di spazio, le superfici al piano.
Le superfici e le loro proprietà informano l’osservatore sulle caratteristiche delle sostanze che compongono l’ambiente. Tale
informazione è disponibile attraverso la luce ambientale, emessa da alcuni corpi, riflessa, trasmessa o assorbita da altri.
La luce specifica l’ambiente perché è strutturata dall’ambiente stesso: la sua intensità varia secondo la direzione e il punto
di osservazione, in conseguenza dei fenomeni che la modellano presso le superfici (in particolare, appunto, la diffusione, la
riflessione, l’assorbimento).
Vettore ottico ambientale - Modello geometrico della luce ambientale in quanto dotata di struttura. Rappresenta
la capacità della luce stessa di specificare l’ambiente, cioè di fornire a un osservatore l’informazione che lo
descrive.
NOTA - L’esistenza del vettore ottico ambientale è precondizione fondamentale al processo di visione: se lo
stimolo luminoso non fosse strutturato e non presentasse, perciò, differenze, la luce sarebbe percepibile ma priva
di significato.
Processo di visione - Inferenza sull’ambiente attraverso la struttura del vettore ottico ambientale, che informa
l’osservatore (in base alla sua posizione) sulle caratteristiche delle superfici responsabili della strutturazione del
vettore stesso. 1
NOTA - Studiare il processo visivo significa comprendere le modalità, efficienti e corrette, che consentono di
ottenere informazioni sul mondo, a partire da immagini che lo rappresentano. Secondo la proposta del neurologo
inglese David Marr, il problema si configura in un procedimento di elaborazione dell’informazione.
2 Formazione delle immagini
Generalmente, le immagini sono la rappresentazione piana di scene tridimensionali. Si ricavano attraverso la proiezione su
un piano (il piano immagine) della radiazione elettromagnetica (in particolare della luce) riflessa dagli oggetti della scena.
Pinhole camera model - Modello ragionevolmente accurato del processo di formazione geometrica delle
immagini, così come è realizzato dalla maggior parte dei sistemi di acquisizione reali (macchine fotografiche,
sensori CCD, etc.). La luce emessa (o riflessa) dalla scena 3D è proiettata punto per punto sul piano immagine,
attraverso uno schermo forato al centro ("foro di spillo").
NOTA 1 - I punti della scena 3D propagano la luce in tutte le direzioni. Perché l'immagine proiettata dalla pinhole
camera non appaia sfuocata, questa dev'essere tanto minuscola da consentire il passaggio di un solo raggio,
perciò è fisicamente irrealizzabile.
NOTA 2 - L'immagine della scena 3D proiettata sul piano attraverso la pinhole camera appare invertita.
2.1 Proiezioni prospettiche
La formazione geometrica delle immagini attraverso una pinhole camera avviene secondo le regole delle proiezioni
prospettiche di scene tridimensionali sul piano.
Proiezione - Funzione matematica tra spazi, stabilisce la corrispondenza tra un sistema di coordinate a
dimensioni e un sistema con un numero di dimensioni inferiore.
La proiezione di un oggetto tridimensionale è definita dai raggi che, a partire da un punto detto centro di proiezione,
attraversano l'oggetto e intersecano il piano su cui esso è rappresentato (il piano di proiezione).
Proiezione prospettica - Proiezione caratterizzata da raggi convergenti, quindi da una distanza finita tra il centro e
il piano di proiezione.
Proiezione parallela - Caso particolare di proiezione prospettica, caratterizzato da raggi paralleli, quindi da una
distanza infinita tra il centro e il piano di proiezione.
Per semplicità, si considera il piano di proiezione frapposto al centro di proiezione (la posizione di un ipotetico
osservatore) e alla scena rappresentata. L'immagine del generico punto della scena è individuata dall'intersezione tra il
piano e la retta secante il punto e il centro di osservazione. 2 ̅̅̅̅ ̅̅̅̅ ̅̅̅̅
NOTA - I segmenti della scena giacenti su piani paralleli al piano di proiezione (es. , , ) formano con il
centro di proiezione triangoli simili a quelli definiti, con quest'ultimo, dalle rispettive immagini (es. il triangolo
è simile al triangolo , il triangolo a , a ). La relazione non vale per i segmenti che
̅̅̅̅ ̅̅̅̅
giacciono su piani orientati diversamente (es. i segmenti o ). Per questo motivo le proiezioni prospettiche
deformano le proporzioni delle scene originali che rappresentano (es. le facce quadrate di un cubo sono
rappresentate da quadrilateri irregolari).
Sono particolarmente notevoli sul piano le proiezioni dei punti all'infinito e (cioè e ), definiti, secondo i principi
della geometria proiettiva (che generalizza la geometria euclidea), come il punto di incontro tra rette parallele.
Punto all'infinito - Secondo la geometria proiettiva, unico punto comune a due (o più) rette parallele,
corrispondente alla direzione che esse identificano.
Punto di fuga - Immagine (finita) sul piano di proiezione di un punto all'infinito. Risulta dall'intersezione tra il
piano e la sola retta secante il centro di proiezione orientata seconda la direzione che corrisponde al punto.
NOTA - Le rette parallele che, nella scena 3D, definiscono un punto all'infinito (es. le rette parallele ai segmenti
̅̅̅̅ ̅̅̅̅
e ) sono rappresentate, attraverso la proiezione sul piano, da rette che parallele non sono e il cui punto di
incontro è il punto di fuga corrispondente a . (Fanno eccezione le rette parallele al piano di proiezione.)
I punti di fuga per una qualsiasi scena rappresentata sono infiniti (tanti quante sono le direzioni delle rette). Tuttavia si
considerano, principalmente, i tre punti corrispondenti agli assi che definiscono la particolare scena 3D.
Punti di fuga principali - Punti di fuga corrispondenti alla direzione degli assi cartesiani che definiscono la scena
3D e intersecano il piano di proiezione.
NOTA - Spesso, per semplicità, l'asse verticale del sistema di coordinate reali si considera parallelo al piano di
proiezione (verticale come la maggior parte dei sistemi di percezione visiva), perciò il punto all'infinito
corrispondente è identificato dall'orientamento del piano stesso (nell'esempio ).
Retta di orizzonte - Retta individuata dall'intersezione tra il piano e il piano definito dal centro di proiezione e
dai punti di fuga corrispondenti alle direzioni orizzontali (nell'esempio , e ).
NOTA - Tutti i punti giacenti sul piano orizzontale sono proiettati lungo la retta di orizzonte (nell'esempio la retta
secante i punti , ).
Asse ottico (o asse principale) - Retta secante il centro di proiezione e perpendicolare al piano .
( )
[R ] Si ricerca la relazione tra il punto e la corrispondente
ELAZIONE TRA COORDINATE SPAZIALI E COORDINATE IMMAGINE
immagine sul piano di proiezione, supponendo note le coordinate del sistema di formazione delle immagini considerato.
3
L'asse , perpendicolare al piano di proiezione, coincide con l'asse ottico della camera. Il piano corrisponde al piano di
( ).
proiezione e interseca l'asse in . Perciò il punto immagine ha coordinata , ossia
̅̅̅̅
I triangoli e sono simili (il segmento è parallelo al piano di proiezione), così come i triangoli e .
̅̅̅̅ ̅̅̅̅ ̅̅̅̅ ̅̅̅̅ ̅̅̅̅ ̅̅̅̅ ̅̅̅̅ ̅̅̅̅
⁄ ⁄ ⁄ ⁄
̅̅̅̅ ̅̅̅̅ ̅̅̅̅ ̅̅̅̅ ̅̅̅̅ ̅̅̅̅
Poiché , , , , e , si ricavano le relazioni seguenti, da cui derivano le
equazioni (non lineari) che mettono in relazione le coordinate spaziali e le coordinate immagine.
⁄ ⁄ ⁄ ⁄
( ) ( )
NOTA - Riscrivendo le relazioni rispetto alle coordinate spaziali e si dimostra che non è possibili ricavare le coordinate
del punto a partire dalla sua immagine , a meno di conoscere la terza coordinata originale . Infatti, al punto immagine
corrispondono, nello spazio, tutti i punti della retta secante il centro di proiezione e stesso.
2.2 Ricostruzione 3D
Il processo di formazione delle immagini comporta la perdita dell'informazione di profondità che determina la distanza
relativa degli oggetti dal punto di osservazione considerato. Tuttavia, tale informazione può essere recuperata attraverso un
metodo simile alla visione binoculare umana, considerando la stessa scena da due prospettive diverse (due punti di vista di
coordinate e orientamento noti). In particolare, la ricostruzione 3D comporta due problemi.
Problema di corrispondenza - Date due immagini della stessa scena e selezionato un punto della prima immagine,
problema di stabilite quale punto della seconda immagine corrisponde ad esso, cioè è immagine dello stesso
punto nello spazio.
Problema di ricostruzione - Date due immagini della stessa scena e stabilita la corrispondenza tra i punti
immagine di uno stesso punto nello spazio, problema di ritrovare le coordinate di quest'ultimo.
NOTA - La ricostruzione 3D è comunque impossibile quando il raggio sul quale giace il punto considerato nello
spazio interseca più punti della superficie rappresentata, ossia quando quest'ultima è disposta esattamente
secondo la direzione di osservazione (fenomeno di occlusione).
Supponendo risolto il problema di corrispondenza, si considera il semplice caso in cui i due piani immagine sono allineati. Si
( ) ( ) ( ),
definiscono i sistemi di coordinate e di entrambi i piani e il sistema di riferimento spaziale con
origine equidistante alle origini di questi ultimi. Le coordinate e corrispondono alle posizioni delle pinhole camera
considerate. ( ) ( )
Disparità (orizzontale) - Date le immagini e di uno stesso punto nello spazio,
| |
modulo della differenza corrispondente allo spiazzamento orizzontale relativo dei punti immagine nei
rispettivi piani. ( ),
[R ] Si considera il punto di coordinate rappresentato dai punti immagine
ELAZIONE TRA DISPARITÀ E DISTANZA
( ) ( )
e attraverso due pinhole camera e , poste a distanza l'una dall'altra.
4
L'asse del sistema di riferimento della scena interseca i centri ottici delle camere; l'asse incrocia l'asse a metà del
̅̅̅̅̅̅
segmento , dove le coordinate e sono ugualmente nulle; l'asse verticale non è rappresentato.
I triangoli e sono simili, così come i triangoli e .
̅̅̅̅̅̅ ̅̅̅̅̅̅
̅̅̅̅̅̅̅ ̅̅̅̅̅̅̅
̅̅̅̅̅ ̅̅̅̅̅
̅̅̅̅̅̅ ̅̅̅̅̅̅
Poiché (rispetto al sistema di riferimento globale):
̅̅̅̅̅̅̅ (la coordinata orizzontale del punto immagine );
̅̅̅̅̅̅ (la distanza focale delle camere dai piani immagine);
̅̅̅̅̅̅ ⁄
( ) ;
̅̅̅̅̅ (la distanza tra il punto e il piano delle camere);
̅̅̅̅̅̅̅ (la coordinata orizzontale del punto immagine );
̅̅̅̅̅̅ ;
̅̅̅̅̅̅ ⁄
( ) ; ⁄ ⁄
( ) ( )
La relazione tra la distanza del punto rappresentato ( ) e la disparità delle sue immagini ( ) si ricava sommando
membro a membro le due equazioni ottenute. ⁄ ⁄
( ) ( )
Al crescere della distanza del punto, diminuisce la disparità. La differenza è pari a quando M è all'infinito.
2.3 Modello della lente sottile
I dispositivi per l’acquisizione di immagini utilizzano, spesso, un sistema di lenti in grado di modificare la direzione dei raggi
incidenti le lenti stesse.
Lente sottile - Lente ideale priva di spessore e, perciò, estranea all’effetto ottico che lo spessore comporterebbe
nella relazione tra raggi incidenti e trasmessi.
[M ] Si considera una lente sottile sferica dal comportamento simmetrico, tale per cui i raggi
ODELLO DELLA LENTE SOTTILE SFERICA
paralleli al suo asse ottico convergono in direzione del fuoco, ad uguale distanza focale in entrambe le direzioni.
5
Dato un punto (oggetto) posto a distanza dal fuoco anteriore della lente ( ), si tracciano i raggi seguenti:
- un raggio parallelo all’asse ottico, che incide la lente in un punto e, in quanto tale, converge verso il fuoco posteriore ;
- un raggio diretto al centro ottico della lente che, in quanto tale, non subisce deviazioni;
- un raggio diretto al fuoco anteriore , che incide la lente nel punto ed è deviato parallelamente all’asse ottico.
I tre raggi identificano l’immagine del punto (il punto ) posta a distanza dal fuoco posteriore della lente.
Considerati anche i punti e , corrispondenti alle proiezioni sull’asse ottico del punto e della sua immagine , si
osservano le coppie di triangoli simili , e , , da cui derivano le relazioni:
̅̅̅̅ ̅̅̅ ̅̅̅
̅̅̅̅
̅̅̅̅ ̅̅̅ ̅̅̅
̅̅̅̅
̅̅̅̅ ̅̅̅̅
Poiché i segmenti e sono identici, tali relazioni possono essere combinate nella legge che descrive il comportamento
della lente sottile. ( ) ( ) ( )
( )
̅̅̅̅
⁄
̅̅̅
NOTA 1 - Il rapporto delle distanze che separano il punto immagine e il “punto oggetto” dall’asse ottico della lente
quantifica l’ingrandimento prodotto da quest’ultima. Il segno negativo indica, evidentemente, che l’immagine è rovesciata
verticalmente rispetto all’oggetto originale.
NOTA 2 - Il comportamento della lente sottile è completamente descritto dalla distanza focale e dalla distanza che separa
l’oggetto dalla lente stessa (o, conoscendo , dal punto focale anteriore).
3 Sistema visivo umano
Molto spesso le immagini sono elaborate al fine di migliorarne la visualizzazione da parte di un osservatore umano, perciò è
utile definire e conoscere le caratteristiche del sistema visivo formato dall'occhio e dal sistema nervoso centrale, del
processo che, dalla percezione visiva, conduce all'interpretazione di ciò che vediamo.
Occhio - Organo complesso di forma approssimativamente sferica, deputato alla formazione di immagini
destinate alla percezione visiva. È costituito da:
un sistema ottico, per la formazione delle immagini;
un sistema sensoriale, per l'acquisizione delle immagini formate (la retina).
3.1 Sistema ottico
Cornea - Strato più esterno dell'occhio, trasparente e di forma convessa, costituisce l'interfaccia tra due mezzi con
diverso indice di rifrazione (l'aria e l'umor acqueo) e svolge il compito di deviare la luce in direzione del cristallino.
Cristallino - Lente biconvessa a curvatura variabile, controllata dai muscoli ciliari per mettere a fuoco
opportunamente (sulla retina) gli oggetti situati a diversa distanza dall'occhio.
6
NOTA 1 - Nelle macchine fotografiche la messa a fuoco è determinata dalla distanza tra la pellicola e la lente.
NOTA 2 - La quantità di luce che raggiunge il cristallino è regolata dall'apertura della pupilla. Nelle fotocamere, un
compito analogo è realizzato dal diaframma dell'obiettivo.
Umor acqueo - Liquido chiaro simile all'acqua, riempie lo spazio anteriore dell'occhio, tra la cornea e il cristallino.
Costantemente rigenerato, mantiene la pressione intraoculare a un'intensità tale da preservare l'integrità
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Elaborazione delle immagini - Algoritmi
-
Elaborazione delle immagini
-
Elaborazione delle immagini
-
Appunti Elaborazione delle Immagini