Anteprima
Vedrai una selezione di 5 pagine su 19
Elaborazione delle immagini - appunti dettagliati corso Pag. 1 Elaborazione delle immagini - appunti dettagliati corso Pag. 2
Anteprima di 5 pagg. su 19.
Scarica il documento per vederlo tutto.
Elaborazione delle immagini - appunti dettagliati corso Pag. 6
Anteprima di 5 pagg. su 19.
Scarica il documento per vederlo tutto.
Elaborazione delle immagini - appunti dettagliati corso Pag. 11
Anteprima di 5 pagg. su 19.
Scarica il documento per vederlo tutto.
Elaborazione delle immagini - appunti dettagliati corso Pag. 16
1 su 19
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Percezione e digitalizzazione delle immagini

ΔIloro. Infatti l'occhio umano percepisce la differenza cromatica solo se il raggiunge un determinato valore. Le nostre percezioni prospettiche sono intermedie tra le dimensioni prospettiche e le dimensioni effettive dell'oggetto → nell'immagine del porticato ad archi, gli archi in fondo hanno un'altezza visibile di circa la metà di quelli iniziali, mentre in realtà sono alti uguali → li percepiamo come alti all'incirca i 2/3. Presentazione di un progetto svolto: la percezione. Lezione 5, slide 3 – 10; 15 – 21; 24 - 34. Discretizzazione (digitalizzazione) = Campionamento + Quantizzazione. Campionamento: relazione tra il pixel dell'immagine (con valore uniforme) e una griglia regolare; e gli conferisce un valore discreto che varia a seconda della scala utilizzata (1 bit: bianco e nero; 8 bit: scala di grigi...). Nella digitalizzazione dell'immagine, il piano cartesiano che definisce la matrice viene ruotato: infatti,

l'origine nella matrice deve essere in alto a sinistra, mentre nel piano cartesiano normale esasi trova in basso a sinistra.

Dimensione = Grandezza * Risoluzione

A.A. 2008 - 2009 5 Federica Calzana

LEZIONE 4: 11 marzo 2009

Lezione 5, slide 9 – 13; 35 - 48

Frequenza di campionamento: frequenza con cui viene catturata l'immagine

Per ottenere un segnale uniforme e con minima perdita di informazione, la frequenza dicampionamento deve essere almeno 2 volte maggiore della frequenza massima del segnale stesso

Teorema di Fourier: per quanto un segnale sia complesso, esso può essere percepito comel'insieme di onde di segnale semplici combinate tra loro; questo consente di individuare moltofacilmente la frequenza massima

Con un'immagine ricca di dettagli (ad alta frequenza) è possibile risparmiare sui bit dei livelli digrigio; in un'immagine a bassa frequenza, invece, è preferita una maggiore gradualità nellasfumatura

Modifica di N (grandezza):

zooming (ingrandimento, aggiunta di righe/colonne, interpolazione dei livelli di grigio in modo automatico per creare livelli intermedi) o shrinking (riduzione, interpolazione dei toni di grigio in modo automatico per uniformare i livelli intermedi)

Due tipi di interpolazione: nearest neighbor (→ effetto scacchiera) o bilinear (→ smoothing dell'immagine)

Criterio di vicinanza: due tipologie di individuazione dei punti vicini al punto di coordinate (x, y)

  1. A 4 punti: le coordinate dei punti vicini sono (x+1, y), (x-1, y), (x, y+1), (x, y-1)
  2. A 8 punti: le coordinate dei punti vicini sono (x+1, y), (x-1, y), (x, y+1), (x, y-1), (x+1, y+1), (x+1, y-1), (x-1, y+1), (x-1, y-1)

Criterio di adiacenza: tre tipologie di adiacenza

  1. A 4: i valori di grigio devono essere compresi nello stesso intervallo, il punto Q deve appartenere all'intorno-4 di P
  2. A 8: i valori di grigio devono essere compresi nello stesso intervallo, il punto Q deve appartenere all'intorno-8 di P
  3. A m:
simile all'adiacenza a 8, è relativa alla diagonale, ma l'intorno a 4 dei pixel P e Q deve essere vuoto (non devono avere elementi in comune nel proprio intorno) Funzione di distanza: esistono diversi sistemi di calcolo → ambiguità 1. Distanza a 4: D(p,q)=(x-s)+(y-q) → il cerchio euclideo viene approssimato ad un rombo 2. Distanza a 8: D(p,q)= max( |(x-s)|,|(y-q)|) → il cerchio euclideo viene approssimato a un quadrato Lezione 6, slide 1 - 19 Image Enhancement: miglioramento dell'immagine; diverse modalità; la finestra considerata può variare a seconda dell'algoritmo usato o a discrezione dell'operatore stesso L'intorno minimo di un pixel è il pixel stesso → intorno puntuale Se l'intorno è maggiore di 1 x 1 → intorno locale Se viene considerata l'intera immagine → intorno globale Se vengono considerate più immagini → operatore algebrico/logico L'intorno puntuale consente,ad esempio, di binarizzare l'immagine (solo bianco e nero, senza scala di grigio) → con particolari sistemi di individuazione della soglia, è possibile individuare semplicemente i bordi degli oggetti distinti dallo sfondo Trasformazioni di base: si pongano X come valore iniziale di grigio, e Y come valore finale 1. Lineari: identità (y = x) → nessuna trasformazione; negativo (y = 255-x) 2. Esponenziali: nth root (i valori di grigio vengono schiariti); nth power (i valori di grigio vengono scuriti) 3. Logaritmiche: log (dilatazione zona scura, riduzione zona chiara) e inverse log (dilatazione zona chiara, riduzione zona scura) → queste funzioni permettono di visualizzare al meglio immagini con preponderanza di elementi scuri (log) o chiari (inverse log) Gamma correction → uso della funzione log o inverse log Contrast stretching → è possibile applicarlo anche a singole sezioni dell'immagine, per esaltare il

contrasto solo in range di determinati valori: funzioni lineari a pezzi → è necessario definire bene i punti "di rottura", per migliorare il contrasto senza perdere informazioni

Intensity slicing: esaltazione solo di una determinata porzione dell'immagine, i cui valori di grigio appartengono tutti a un determinato range di valori → i valori esterni al range possono essere azzerati o lasciati così com'erano nell'immagine originale

A.A. 2008 - 2009 7 Federica Calzana

LEZIONE 5: 12 marzo 2009

Lezione 6, slide 19 - 24

L'esaltazione di alcuni livelli di grigio non corrisponde all'esaltazione di particolari porzioni dell'immagine: se si vuole ottenere tale risultato, è necessario introdurre condizioni particolari

Slicing: i livelli di grigio vengono sostituiti da colori, seguendo un codice prestabilito → mappe di rischio sismico, carte altimetriche...

Per ottenere tale risultato, l'immagine deve prima essere scomposta nei

tre livelli (RGB) e quindi si procede all'assegnazione di determinati intervalli di grigio a determinati colori

Ogni immagine è costituita da pixel. Ognuno di essi è codificato in scala di grigi a 8 bit, per cui ogni immagine è costituita da 8 "piani" di bit. L'informazione che caratterizza l'immagine può essere meglio definita solo in alcuni piani; per cui eliminando i livelli meno significativi si ottiene un risparmio di memoria (compressione).

Lezione 7, slide 1 - 7

Istogramma di un'immagine

  1. Individuazione di tutti i pixel con un determinato valore nella scala di grigi
  2. Costruzione dell'istogramma a barre: sull'asse delle ascisse metto i valori possibili della scala di grigio (da 0 a 255), sulle ordinate invece il numero di pixel

Per confrontare due immagini di dimensioni diverse, è necessario normalizzare l'istogramma → va diviso il valore di pixel di una data sfumatura di grigio per il numero totale

dei pixel dell'immagine stessa → valore percentuale; la normalizzazione è, come risultato della somma di tutti i valori, 1. La "gradevolezza" nella percezione di un'immagine è associata all'uniformità delle percentuali di grigio → equalizzazione per uniformare i livelli di grigio e rendere l'immagine più gradevole. L'istogramma può aiutare a separare l'oggetto dallo sfondo o a determinare la soglia su cui lavorare con altri operatori (intensity slicing, contrast stretching...). Laboratorio HIPR2: - Pixel Connectivity: http://homepages.inf.ed.ac.uk/rbf/HIPR2/connect.htm - Connected Components Labeling: http://homepages.inf.ed.ac.uk/rbf/HIPR2/label.htm - Point Operations: http://homepages.inf.ed.ac.uk/rbf/HIPR2/pntops.htm 1. Thresholding 2. Adaptive thresholding 3. Contrast stretching 4. Histogram equalization 5. Logarithm operator 6. Exponential/"Raise to power" operator Lezione 8, slide 1 - 12 Una somma dellefrequenza, mentre le regioni interne sono a bassa frequenza. Pertanto, riducendo le alte frequenze, è possibile ridurre il rumore senza compromettere troppo i dettagli dell'immagine. Per ottenere questo risultato, è possibile utilizzare diverse tecniche di filtraggio, come ad esempio il filtraggio media, il filtraggio mediano o il filtraggio gaussiano. Questi filtri calcolano il valore di ogni pixel in base ai valori dei pixel circostanti, riducendo così le variazioni improvvise e il rumore. Un'altra tecnica comune per ridurre il rumore è l'uso di immagini multiple della stessa scena. Questo approccio sfrutta il fatto che il rumore è casuale e ha media zero. Prendendo più immagini della stessa scena e combinandole insieme, è possibile ridurre il rumore medio e migliorare la qualità complessiva dell'immagine. Inoltre, è possibile applicare maschere alle immagini per selezionare solo determinate regioni e applicare filtri solo a quelle aree. Ad esempio, utilizzando una maschera nera con una finestra bianca, la porzione all'interno della finestra rimarrà invariata, mentre il resto dell'immagine verrà impostato a zero. Al contrario, utilizzando una maschera bianca con una finestra nera, la porzione all'interno della finestra rimarrà invariata, mentre il resto dell'immagine verrà impostato a 255. Infine, è spesso necessario scalare i valori dei pixel per farli rientrare nel range desiderato (solitamente da 0 a 255). Questo è importante perché alcuni algoritmi o dispositivi possono produrre valori fuori da questo intervallo, e la scalatura è necessaria per garantire una corretta visualizzazione dell'immagine. In conclusione, ridurre il rumore nelle immagini è un processo complesso che richiede l'applicazione di diverse tecniche di filtraggio e l'uso di immagini multiple. Questo permette di migliorare la qualità dell'immagine, riducendo le variazioni improvvise e mantenendo i dettagli importanti. (forte contrasto con lo sfondo). Togliendo le basse frequenze da un'immagine, si ottiene un rafforzamento dei bordi dell'oggetto. Come funziona una maschera? La maschera, costituita da un insieme di pixel (maschera minima: 3 x 3), i cui pixel hanno un determinato valore per modificare l'immagine originale. Essa viene spostata pixel dopo pixel per applicare l'effetto in modo omogeneo. La maschera viene applicata dall'angolo superiore sinistro; alcune maschere modificano l'immagine in modo da poter modificare anche il pixel all'angolo estremo, altre invece iniziano ad applicare la maschera dal primo punto disponibile (in caso di una maschera 3 x 3, il primo punto è P(2, 2)). Quindi, o la maschera non modifica i pixel dei bordi, o vengono inserite delle righe e delle colonne di pixel inesistenti nell'originale. I pixel dell'immagine vengono modificati secondo la maschera, tale per cui ogni valore del pixel viene moltiplicato per quello.

corrispondente nella maschera, quindi si effettua una somma di tutti i valori ottenuti e si sostituisce questo valore al pixel centrale della porzione di immagine a cui è sovrapposta la maschera.

Smoothing

Sfocamento dell'immagine; la maschera attenua il contrasto dei pixel dei bordi. Si realizza facendo la media dei valori del pixel centrale e del suo intorno, quindi sostituendo il valore del pixel centrale stesso con questo valore medio ottenuto. Si dice che questo filtro è passa basso, nel senso che vengono esaltate le basse frequenze e ridotte o eliminate quelle alte. Può servire per eliminare il rumore, in quanto esso è costituito da elementi ad alta frequenza, o eliminare i piccoli dettagli dell'immagine (per trovare più facilmente gli elementi di dimensioni maggiori che sono d'interesse)

Filtro mediano

La maschera vuota viene sovrapposta all'immagine originale. Quindi si fa la mediana dei valori all'interno della maschera, e si sostituisce questo valore al pixel centrale della porzione di immagine a cui è sovrapposta la maschera.

Dettagli
Publisher
A.A. 2012-2013
19 pagine
5 download
SSD Ingegneria industriale e dell'informazione ING-INF/05 Sistemi di elaborazione delle informazioni

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Menzo di informazioni apprese con la frequenza delle lezioni di Elaborazione delle immagini e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi dell' Insubria o del prof Binaghi Elisabetta.