vuoi
o PayPal
tutte le volte che vuoi
Divisione di un'immagine in regioni non sovrapposte
Definizione: Divisione di un'immagine R in un numero finito di S regioni non sovrapposte R1, R2, ..., R tali che:
- = R con i = 1, ..., s
- (Ri, Rj) = 0 con i ≠ j
Method 1: thresholding or binarization
L'algoritmo Otsu per la binarizzazione (minimizza la varianza all'interno della classe)
- Calcola l'istogramma dell'immagine
- Per ogni soglia T (livelli di intensità)
- Forground = set di (pixel ≥ T)
- Sfondo = altri
- Sia per lo sfondo che per il primo piano calcolare il peso ωi (porzione di pixel nell'insieme i) e varianza (σ^2i); i = primo piano o sfondo
- Calcola la varianza all'interno della classe:
- La T ottimale è quella che garantisce il minimo σ^2(T)
Metodo 2: regione in crescita
Iniziamo con un singolo pixel p e vogliamo riempire una regione coerente.
Definiamo una misura di somiglianza S(i, j) tale che:
- un valore alto corrisponde a pixel i e j sono simili
- uno basso altrimenti
Metodo 3: Split-and-merge
Consideriamo quindi un pixel q adiacente al pixel p (4- o 8-vicini di casa)
q viene aggiunto alla regione di p se D (p, q) <T (per una soglia impostata T)
Quindi procedere con gli altri vicini di p e continuare
Walkthrough
Seme iniziale = regione omogenea 3x3, scelta in modo casuale
Per ogni pixel controllare il quartiere 3x3
Controlla solo il pixel non segmentato
Usiamo una matrice di supporto, dove
-1 → pixel non assegna a una regione
I (x, y) =
o → pixel che appartenente alla regione Rm
I (x, y) = mo
Scorrere fino a quando non vengono aggiunti nuovi pixel alla regione
Quindi scegli un altro seme e aggiorna la regione
Misura semplice: I (x, y) appartiene a Rm se| media (Rm) - I (x, y) | <T
Method 3: Split-and-merge
1 ° passo: (solo un'idea)
- Divisione Quadtree se la regione non è omogenea
- Tecnica ricorsiva
2 ° passo:
- Unione di regioni simili (vicine)
- Potresti provare con Metodo Otsu, impostando la soglia su σ2 (T)
CAPITOLO
Definire strutture divicinato arbitrarie
Erosione Dilatazione
Immagine binaria e set
Un'immagine binaria I (u, v) può essere vista come un insieme di tutte le posizioni dei pixel in primo piano: Qf = {(u, v) | I (u, v) = 1} e in background Qb = {(u, v) | I (u, v) = 0}
Per semplificare la notazione
Sia SI = {M × N} (prodotto cartesiano) il set completo di punti di coordinate dell'immagine
Se indichiamo p = (u, v), allora possiamo scrivere Qf = {p | I (p) = 1}.
Operazioni
Erosione
Un'erosione di un'immagine I da parte dell'elemento di struttura H è data dall'operazione impostata
Mantieni solo i pixel p di I in modo tale che H si sovrapponga a I
Dilatazione
Una dilatazione di un'immagine I da parte dell'elemento strutturante H è data dall'operazione impostata
I H = {p SI | {(p + q) QI, q H} 6 =⊕ ∈ ∈ ∈ ∅}
Ingrandisci il primo piano, in ogni posizione di pixel p, se l'elemento di strutturazione H si
sovrapponeparzialmente a QIOpeningL'operazione di apertura è un'erosione seguita da una dilatazione:Le regioni più piccole dell'elemento H verranno rimosse.
ClosingL'operazione di chiusura è una dilatazione seguita da un'erosione:Verranno riempiti i fori in primo piano più piccoli di H.
Qualche considerazioneL'erosione può essere calcolata come dilatazione dello sfondo (dualità)Lo stesso accade per la dilatazioneLa dilatazione è commutativa, associativaL'erosione non è commutativa né associativa
ContornoL'immagine di contorno (chiusa) C (u, v) di un oggetto binario può essere estratto usando una dilatazione seguita da una sottrazione (XOR).
Lo scheletro può essere estratto intrattenendo l'erosione fino a quando non c'è solo una linea di pixel
LABCAPITOLO 1 - BASIC PROCESSINGTrasposizioneFlip VerticaleCroppingNegativo
CAPITOLO 2 - Miglioramento del contrasto
distribuzioni dei valori dei pixel di un'immagine. Può essere utilizzato per analizzare la luminosità, il contrasto e la distribuzione dei colori dell'immagine. Per calcolare l'istogramma di un'immagine, si può utilizzare la seguente formula:I[k] = nk / (M * N)
Dove: - I[k] è la stima della distribuzione di probabilità (densità per segnali continui) delle intensità dei pixel. - nk è il numero di pixel con intensità k. - M * N è il numero totale di pixel dell'immagine. Inoltre, è possibile calcolare la distribuzione cumulativa utilizzando la seguente formula:F[k] = Σ da i=0 a k di I[i]
L'istogramma fornisce informazioni importanti sulla distribuzione dei valori dei pixel, consentendo di effettuare operazioni di equalizzazione dell'istogramma per migliorare il contrasto dell'immagine.Proprietà statistiche dell'immagine utili per:
- Compressione (codifica sorgente)
- Quantizzazione
- Miglioramento
- Equalizzazione basata sull'istogramma
L'immagine a basso contrasto ha un istogramma stretto.
Le immagini con un buon contrasto hanno un istogramma vicino a U [0, L - 1]:
- Calcola l'istogramma dell'immagine (distribuzione della probabilità)
- Calcola l'istogramma cumulativo F [k] (Distribuzione di probabilità cumulativa)
- Applica la trasformazione del punto
- Ridimensiona
CAPITOLO 3 - Edge Detection - Canny Method
Rilevazione dei bordi
- Un punto in un'immagine che identifica una brusca variazione di luminosità / colore
- La funzionalità fondamentale nel rilevamento dell'elaborazione delle immagini si basa sulle discontinuità delle immagini:
- Input: immagine da 1 a 3 livelli → Output: immagine booleana
- 0 = nessun bordo
- 1 = c'è un bordo
- Nota: i contorni sono sequenze di bordi
- Basato su gradiente- massimi / minimi locali
- Basato su Laplaciano- zero crossing
- Entrambi sono sensibili al rumore- è necessario il filtro passa-basso
- Buona rilevazione: l'algoritmo dovrebbe contrassegnare tutti i bordi reali il più possibile
- Buona localizzazione: i bordi contrassegnati dovrebbero essere vicini quanto possibile a quelli reali
- Risposta minima: il bordo deve essere contrassegnato una volta, senza falso positivo (a causa del rumore, ad esempio)
- Filtro del rumore -> convoluzione con un kernel di smoothing gaussiano
- Maschera più usata:
- Matrice 5x5
- Find the edges using the gradient G = |Gx| + |Gy|
- Θ = arctan(Gy/Gx) (Gx ≠ 0 or arctan 2)
- Rounding to the nearest angle multiple of 45 degrees
Viene esaminata una matrice 3x3 attorno al pixel (x, y):
- se Θ (x, y) = 0 °, vengono esaminati i pixel
(x + 1, y), (x, y) e (x - 1, y).- se Θ (x, y) = 90 °, quindi i pixel (x, y + 1), (x, y) e (x, y - 1)vengono esaminati.Se i pixel (x, y) hanno la massima intensità del gradiente dei tre pixel esaminati, viene mantenuto come unbordo.Se uno degli altri due pixel ha una pendenza maggiore, il pixel (x, y) non si trova sul "centro" del bordo edovrebbe non essere contrassegnato come un pixel del bordo.
Soglia di isteresiUna semplice soglia potrebbe eliminare parti valide di un bordo collegato, lasciando un'immagine del bordofinale disconnessa- Succede nelle regioni in cui la magnitudine del gradiente del bordofluttua tra appena sopra e appena sotto la soglia Invece di scegliere una singola soglia, vengono utilizzatedue soglie T h e Tl.- I pixel con intensità gradiente D <T 1 vengono immediatamente eliminati.- I pixel con T ≤ D <T h vengono mantenuti solo se formano una linea di bordo continua con pixel conmagnitudine gradiente elevata- I pixel
con D> T h vengono mantenutiCanny edge detector step #4- Se i pixel (x, y) hanno un'intensità del gradiente inferiore a T, scartare il bordo
- Se i pixel (x, y) hanno un'ampiezza del gradiente maggiore di T h mantenere il bordo
- Se i pixel (x, y) hanno un'ampiezza del gradiente tra Tl e T h e uno dei suoi vicini in una regione 3x3 attorno ad esso ha un'intensità del gradiente maggiore di T h, mantieni il bordo
- Se nessuno dei vicini di pixel (x, y) ha grandi gradienti, ma almeno uno cade tra Tl e T h, cerca nella regione 5x5 per vedere se qualcuno di questi pixel ha una magnitudine maggiore di T h. In tal caso, mantieni il bordo.
- Altrimenti, scarta il bordo
CAPITOLO 3 - Hough transform
Obiettivo: stima dei parametri di una determinata classe di forme in un'immagine
Tipicamente forme "imperfette"
Classe: linee, cerchi, ellissi ...
Perché?
Rilevazione e riconoscimento di oggetti
Rileva la posizione o l'orientamento
degli oggettiCome?
Accumulatore e sistema di voto
Applicazione su linee: equazioni di linee
Forma di intercettazione pendenza: y = mx + q ∞)
È difficile da usare su un computer perché la gamma "reale" di m e q è (-∞, - Pensa alle linee verticali!
Forma normale: x cos θ + y sin θ = r
È utilizzabile / stabile su un computer nella gamma "reale":
- di θ è [0, π)
- di r è limitato e abbastanza uniforme per ogni pendenza
The Hough space
Per caratterizzare completamente una retta 2 paramet