Anteprima
Vedrai una selezione di 4 pagine su 13
Digital Image Processing - Riassunto Pag. 1 Digital Image Processing - Riassunto Pag. 2
Anteprima di 4 pagg. su 13.
Scarica il documento per vederlo tutto.
Digital Image Processing - Riassunto Pag. 6
Anteprima di 4 pagg. su 13.
Scarica il documento per vederlo tutto.
Digital Image Processing - Riassunto Pag. 11
1 su 13
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Divisione di un'immagine in regioni non sovrapposte

Definizione: Divisione di un'immagine R in un numero finito di S regioni non sovrapposte R1, R2, ..., R tali che:

  • = R con i = 1, ..., s
  • (Ri, Rj) = 0 con i ≠ j

Method 1: thresholding or binarization

L'algoritmo Otsu per la binarizzazione (minimizza la varianza all'interno della classe)

  1. Calcola l'istogramma dell'immagine
  2. Per ogni soglia T (livelli di intensità)
    • Forground = set di (pixel ≥ T)
    • Sfondo = altri
    • Sia per lo sfondo che per il primo piano calcolare il peso ωi (porzione di pixel nell'insieme i) e varianza (σ^2i); i = primo piano o sfondo
    • Calcola la varianza all'interno della classe:
  3. La T ottimale è quella che garantisce il minimo σ^2(T)

Metodo 2: regione in crescita

Iniziamo con un singolo pixel p e vogliamo riempire una regione coerente.

Definiamo una misura di somiglianza S(i, j) tale che:

  • un valore alto corrisponde a pixel i e j sono simili
  • uno basso altrimenti

Metodo 3: Split-and-merge

Consideriamo quindi un pixel q adiacente al pixel p (4- o 8-vicini di casa)

q viene aggiunto alla regione di p se D (p, q) <T (per una soglia impostata T)

Quindi procedere con gli altri vicini di p e continuare

Walkthrough

Seme iniziale = regione omogenea 3x3, scelta in modo casuale

Per ogni pixel controllare il quartiere 3x3

Controlla solo il pixel non segmentato

Usiamo una matrice di supporto, dove

-1 → pixel non assegna a una regione

I (x, y) =

o → pixel che appartenente alla regione Rm

I (x, y) = mo

Scorrere fino a quando non vengono aggiunti nuovi pixel alla regione

Quindi scegli un altro seme e aggiorna la regione

Misura semplice: I (x, y) appartiene a Rm se| media (Rm) - I (x, y) | <T

Method 3: Split-and-merge

1 ° passo: (solo un'idea)

- Divisione Quadtree se la regione non è omogenea

- Tecnica ricorsiva

2 ° passo:

- Unione di regioni simili (vicine)

- Potresti provare con Metodo Otsu, impostando la soglia su σ2 (T)

CAPITOLO

Definire strutture divicinato arbitrarie

Erosione Dilatazione

Immagine binaria e set

Un'immagine binaria I (u, v) può essere vista come un insieme di tutte le posizioni dei pixel in primo piano: Qf = {(u, v) | I (u, v) = 1} e in background Qb = {(u, v) | I (u, v) = 0}

Per semplificare la notazione

Sia SI = {M × N} (prodotto cartesiano) il set completo di punti di coordinate dell'immagine

Se indichiamo p = (u, v), allora possiamo scrivere Qf = {p | I (p) = 1}.

Operazioni

Erosione

Un'erosione di un'immagine I da parte dell'elemento di struttura H è data dall'operazione impostata

Mantieni solo i pixel p di I in modo tale che H si sovrapponga a I

Dilatazione

Una dilatazione di un'immagine I da parte dell'elemento strutturante H è data dall'operazione impostata

I H = {p SI | {(p + q) QI, q H} 6 =⊕ ∈ ∈ ∈ ∅}

Ingrandisci il primo piano, in ogni posizione di pixel p, se l'elemento di strutturazione H si

sovrapponeparzialmente a QIOpeningL'operazione di apertura è un'erosione seguita da una dilatazione:Le regioni più piccole dell'elemento H verranno rimosse.

ClosingL'operazione di chiusura è una dilatazione seguita da un'erosione:Verranno riempiti i fori in primo piano più piccoli di H.

Qualche considerazioneL'erosione può essere calcolata come dilatazione dello sfondo (dualità)Lo stesso accade per la dilatazioneLa dilatazione è commutativa, associativaL'erosione non è commutativa né associativa

ContornoL'immagine di contorno (chiusa) C (u, v) di un oggetto binario può essere estratto usando una dilatazione seguita da una sottrazione (XOR).

Lo scheletro può essere estratto intrattenendo l'erosione fino a quando non c'è solo una linea di pixel

LABCAPITOLO 1 - BASIC PROCESSINGTrasposizioneFlip VerticaleCroppingNegativo

CAPITOLO 2 - Miglioramento del contrasto

distribuzioni dei valori dei pixel di un'immagine. Può essere utilizzato per analizzare la luminosità, il contrasto e la distribuzione dei colori dell'immagine. Per calcolare l'istogramma di un'immagine, si può utilizzare la seguente formula:

I[k] = nk / (M * N)

Dove: - I[k] è la stima della distribuzione di probabilità (densità per segnali continui) delle intensità dei pixel. - nk è il numero di pixel con intensità k. - M * N è il numero totale di pixel dell'immagine. Inoltre, è possibile calcolare la distribuzione cumulativa utilizzando la seguente formula:

F[k] = Σ da i=0 a k di I[i]

L'istogramma fornisce informazioni importanti sulla distribuzione dei valori dei pixel, consentendo di effettuare operazioni di equalizzazione dell'istogramma per migliorare il contrasto dell'immagine.

Proprietà statistiche dell'immagine utili per:

  • Compressione (codifica sorgente)
  • Quantizzazione
  • Miglioramento
  • Equalizzazione basata sull'istogramma

L'immagine a basso contrasto ha un istogramma stretto.

Le immagini con un buon contrasto hanno un istogramma vicino a U [0, L - 1]:

  • Calcola l'istogramma dell'immagine (distribuzione della probabilità)
  • Calcola l'istogramma cumulativo F [k] (Distribuzione di probabilità cumulativa)
  • Applica la trasformazione del punto
  • Ridimensiona

CAPITOLO 3 - Edge Detection - Canny Method

Rilevazione dei bordi

  • Un punto in un'immagine che identifica una brusca variazione di luminosità / colore
  • La funzionalità fondamentale nel rilevamento dell'elaborazione delle immagini si basa sulle discontinuità delle immagini:
  • Input: immagine da 1 a 3 livelli → Output: immagine booleana
  • 0 = nessun bordo
  • 1 = c'è un bordo
  • Nota: i contorni sono sequenze di bordi
collegatiMetodi Edge
  • Basato su gradiente- massimi / minimi locali
  • Basato su Laplaciano- zero crossing
  • Entrambi sono sensibili al rumore- è necessario il filtro passa-basso
Rilevatore di bordi ottimale
  • Buona rilevazione: l'algoritmo dovrebbe contrassegnare tutti i bordi reali il più possibile
  • Buona localizzazione: i bordi contrassegnati dovrebbero essere vicini quanto possibile a quelli reali
  • Risposta minima: il bordo deve essere contrassegnato una volta, senza falso positivo (a causa del rumore, ad esempio)
Canny edge detector step #1
  1. Filtro del rumore -> convoluzione con un kernel di smoothing gaussiano
  2. Maschera più usata:
    • Matrice 5x5
Canny edge detector step #2
  1. Find the edges using the gradient G = |Gx| + |Gy|
    • Θ = arctan(Gy/Gx) (Gx ≠ 0 or arctan 2)
    • Rounding to the nearest angle multiple of 45 degrees
Canny edge detector step #3

Viene esaminata una matrice 3x3 attorno al pixel (x, y):

  • se Θ (x, y) = 0 °, vengono esaminati i pixel

(x + 1, y), (x, y) e (x - 1, y).- se Θ (x, y) = 90 °, quindi i pixel (x, y + 1), (x, y) e (x, y - 1)vengono esaminati.Se i pixel (x, y) hanno la massima intensità del gradiente dei tre pixel esaminati, viene mantenuto come unbordo.Se uno degli altri due pixel ha una pendenza maggiore, il pixel (x, y) non si trova sul "centro" del bordo edovrebbe non essere contrassegnato come un pixel del bordo.

Soglia di isteresiUna semplice soglia potrebbe eliminare parti valide di un bordo collegato, lasciando un'immagine del bordofinale disconnessa- Succede nelle regioni in cui la magnitudine del gradiente del bordofluttua tra appena sopra e appena sotto la soglia Invece di scegliere una singola soglia, vengono utilizzatedue soglie T h e Tl.- I pixel con intensità gradiente D <T 1 vengono immediatamente eliminati.- I pixel con T ≤ D <T h vengono mantenuti solo se formano una linea di bordo continua con pixel conmagnitudine gradiente elevata- I pixel

con D> T h vengono mantenutiCanny edge detector step #4
  • Se i pixel (x, y) hanno un'intensità del gradiente inferiore a T, scartare il bordo
  • Se i pixel (x, y) hanno un'ampiezza del gradiente maggiore di T h mantenere il bordo
  • Se i pixel (x, y) hanno un'ampiezza del gradiente tra Tl e T h e uno dei suoi vicini in una regione 3x3 attorno ad esso ha un'intensità del gradiente maggiore di T h, mantieni il bordo
  • Se nessuno dei vicini di pixel (x, y) ha grandi gradienti, ma almeno uno cade tra Tl e T h, cerca nella regione 5x5 per vedere se qualcuno di questi pixel ha una magnitudine maggiore di T h. In tal caso, mantieni il bordo.
  • Altrimenti, scarta il bordo

CAPITOLO 3 - Hough transform

Obiettivo: stima dei parametri di una determinata classe di forme in un'immagine

Tipicamente forme "imperfette"

Classe: linee, cerchi, ellissi ...

Perché?

Rilevazione e riconoscimento di oggetti

Rileva la posizione o l'orientamento

degli oggettiCome?

Accumulatore e sistema di voto

Applicazione su linee: equazioni di linee

Forma di intercettazione pendenza: y = mx + q ∞)

È difficile da usare su un computer perché la gamma "reale" di m e q è (-∞, - Pensa alle linee verticali!

Forma normale: x cos θ + y sin θ = r

È utilizzabile / stabile su un computer nella gamma "reale":

  • di θ è [0, π)
  • di r è limitato e abbastanza uniforme per ogni pendenza

The Hough space

Per caratterizzare completamente una retta 2 paramet