Anteprima
Vedrai una selezione di 7 pagine su 30
Appunti Elaborazione delle Immagini Pag. 1 Appunti Elaborazione delle Immagini Pag. 2
Anteprima di 7 pagg. su 30.
Scarica il documento per vederlo tutto.
Appunti Elaborazione delle Immagini Pag. 6
Anteprima di 7 pagg. su 30.
Scarica il documento per vederlo tutto.
Appunti Elaborazione delle Immagini Pag. 11
Anteprima di 7 pagg. su 30.
Scarica il documento per vederlo tutto.
Appunti Elaborazione delle Immagini Pag. 16
Anteprima di 7 pagg. su 30.
Scarica il documento per vederlo tutto.
Appunti Elaborazione delle Immagini Pag. 21
Anteprima di 7 pagg. su 30.
Scarica il documento per vederlo tutto.
Appunti Elaborazione delle Immagini Pag. 26
1 su 30
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Camera di Pinhole

La camera di Pinhole o modello prospettico, è il modello geometrico più semplice per l'acquisizione di un'immagine.

Essa consiste in una scatola che presenta su un lato (interno) il piano immagine, generalmente costituito da carta fotografica o sensore, e sul lato opposto un foro, detto centro ottico, avente diametro pari a quello di un raggio di luce.

Lo scopo del foro è quello di convogliare la luce emessa da un oggetto sulla scena verso un unico punto sul piano immagine per evitare sfocature. Lo svantaggio della Pinhole è dato proprio dal foro in quanto consente solo ad una piccola quantità di luce di entrare all'interno della scatola.

Ciò implica che affinché l'immagine venga impressa sul piano immagine è necessario che la carta fotografica sia costituita da un materiale molto sensibile e poiché ad oggi tale materiale non è stato ancora inventato, è necessario attendere un certo tempo affinché l'immagine venga impressa con successo.

La distanza che intercorre tra il centro ottico e il piano immagine è detta distanza focale f. La retta immaginaria che passa per il centro ottico e che è ortogonale al piano immagine è detta asse ottico.

Il sistema di riferimento mondo (X,Y,Z) è centrato nel centro ottico e l'asse Z coincide con l'asse ottico. Tale sistema è il sistema di riferimento della camera mentre il sistema (u,v) centrato nel punto in cui l'asse ottico interseca il piano immagine è il sistema di riferimento del piano immagine.

Utilizzando una camera Pinhole, per passare da un punto 3d ad uno 2d consideriamo un punto M = [x y z]T della scena e la sua proiezione sul piano immagine.

Tramite rototraslazione data da una matrice R e un vettore T, scriviamo il punto M nel sistema di riferimento camere come Ŷ (M, T).

Detta f la distanza fra il piano immagine e il pinhole, mediante considerazioni dei triangoli è possibile scrivere la seguente equazione:

f/z = -u/x  - v/y 

da cui segue l'equazione fondamentale di trasformazione prospettica:

  • u = -fx/z
  • v = -fy/z

Tale trasformazioni è non lineare, cioè non possiamo passare da un 2d ad uno 3d perché verrebbe a mancare l'informazione sulla z.

Tale trasformazione diventa lineare mediante utilizzo delle coordinate omogenee.

In coordinate omogenee un punto 2d viene scritto con una terna (x1, x2, x3) dove (x = x1/x3, y = x2/x3 ; x3 ! = 0)

facendo sussistere una relazione 1 a molti tra coordinate omogenee e cartesiane. Dunque, scritto M = [X,Y,Z,1]T e m = [u,v,1]T l'equazione di proiezione prospettica diviene:

  • [-f 0 0 0]
  • [ 0 -f 0 0] * M
  • [ 0 0 -f 0]

Definita P la matrice, essa rappresenta il modello geometrico della camera e prende il nome di matrice di proiezione prospettica MPP.

Camera Digitale

Le camere digitali sono formate da un’ottica, che possiamo approssimare con una lente sottile, e da un piano immagine costituito da una matrice n*m di elementi fotosensibili. Scopo di questi elementi consiste nel trasformare l’intensità luminosa con la quale vengono colpiti in un potenziale elettrico.

Le lenti sottili consistono in un materiale trasparente leggermente convesso ai lati e hanno la caratteristica di convogliare tutti i raggi di luce con la quale vengono colpiti su un specifico punto sul piano immagine.

Ortogonale al centro ottico della lente c’è una retta immaginaria, detta asse ottico, sulla quale giace un punto (esterno alla lente) detto fuoco.

Le lenti inoltre godono di due proprietà fondamentali:

  • I raggi che passano dal centro ottico escono dall’altro lato senza deviazione.
  • I raggi che sono paralleli all’asse ottico subiscono una deviazione verso il fuoco.

Sfruttando queste due proprietà e osservando i triangoli che si vengono a formare con l’intersezione tra i raggi di luce e l’asse ottico, si ricava l’equazione fondamentale della lente:

1/z + 1/z' = 1/f

Dove: Z è la distanza che intercorre tra l’oggetto presente sulla scena e il centro ottico. z è la distanza che intercorre tra il centro ottico e la proiezione del punto sul piano immagine f è la distanza focale ovvero la distanza che intercorre tra il centro ottico e il fuoco.

Tutti i punti che rispettano questa equazione risultano a fuoco. Se si tende a modificare Z o z allora il punto non è più a fuoco. Modificare Z o z significa avvicinarsi o allontanarsi dal punto per cui la messa a fuoco precedente non è più valida.

Questo comporta la creazione dei cosiddetti cerchi di confusione e poiché il piano immagine è costituito da elementi fotosensibili di dimensione ridotta ma finita, se il cerchio di confusione non supera mai tale dimensione il punto risulta sempre a fuoco.

Dunque tra i vantaggi delle lenti sottili c’è sicuramente la possibilità di poter far passare più luce e quindi la possibilità di ridurre i tempi di acquisizione dell’immagine però c’è lo svantaggio che tendono a introdurre distorsione.

La matrice CCD viene poi tradotta in una nuova matrice M*N detta matrice dei pixel. Tale matrice sarà la vera e propria foto.

Le dimensioni delle due matrici però non sempre è uguale e quindi anche il centro della CCD può non coincidere con quello della matrice dei pixel. In generale ad un pixel corrisponde un area ettagonale della CCD per cui la posizione di un punto sul piano immagine è diversa dalla posizione che ha sulla matrice dei pixel.

STEREOPSI

La stereopsi si occupa di numerare la trasformazione di una scena dalle 2 immagini catturate da un sistema stereo.

Ciò è possibile grazie al calcolo delle corrispondenze e alla triangolazione. Il calcolo delle corrispondenze consiste nell'individuare i punti omologhi.

Dalla geometria epipolare.

In generale, i parametri di un sistema stereo sono ci:

  • P1 coodinate nello spazio del punto X vista dalla camera di dx
  • P2 R matrice di rotazione della camera di riferimento
  • T vettore indicante la posizione della camera

Tali parametri godono della proprietà che:

(P2-T)T(P1 x T) = 0 poiché complanari

Quindi, parametri esterni possono essere P2 in funzione di P1:

P2 = R(P1+T) che sostituendo e semplificando si ha che (RT P2)T*[(P1 x T)] = 0 poiche il prodotto vettoriale può essere espresso come prodotto di matrici. Trasformando T in una matrice S

per cui si ha che: (RT P2)T * S

R* S = la matrice essenziale che indica la selezione che intercetta tra i omologhi dello stesso punto della scena

R*S*P1 = 0 indica l'equazione della retta epipolare nella camera di dx sulla quale giace il coniugato nel punto di P2 giuide saranno detti.

NB Qualora si volesse conoscere l'equazione della camera di sx si ricompria su Pe.

Filtraggio

Il filtraggio spaziale consente di migliorare la comprensibilità di un'immagine aumentando ed esaltando le sue caratteristiche e a eliminare o ridurre difetti.

Fondamentalmente il filtraggio è una funzione che si assume ad un pixel di valore che è frutto di elaborazione dei dati dei pixel del suo intorno.

I vari operatori di filtro spaziale si somo due tipi di filtro:

Smoothing

  • Consente di attenuare bruschi e calcolati di rumore.
  • Media: l'idea è sostituire il valore di un pixel con la media dei valori dei pixel del suo intorno.
  • Ciò consente di ridurre le transizioni di intensità brusche ma comporta sfuocature e introduzione di bordi nuovi.
  • Mediano: consente di eliminare il rumore sale e pepe. Fondamentalmente, sostituisce il valore di un pixel con il mediano tra i valori dei pixel del suo intorno. La mask è nxn 5x5 per cui i valori si trovano in px nx.

Gaussiano

Il filtro gaussiano è il più efficace del filtro smoothing. Consente di eliminare il rumore aggiunto all'immagine originale. L'idea è di dare a ciascun pixel un peso maggiore rispetto a quelli del loro intorno.

La mask può essere costruita con la distribuzione gaussiana: G(x, y) = 1/(2πσ²) * e^(-((x²+y²)/2σ²))

Un esempio di mask è:

  1. 1
  2. 2
  3. 1
  4. 2
  5. 4
  6. 2
  7. 1
  8. 2
  9. 1

Un pixel corrente è ottenuto sommando il contributo dei pixel del suo intorno e interno.

Dettagli
Publisher
A.A. 2019-2020
30 pagine
1 download
SSD Scienze matematiche e informatiche INF/01 Informatica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher cimmiv di informazioni apprese con la frequenza delle lezioni di Elaborazione delle immagini e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Napoli - Parthenope o del prof Narducci Fabio.