によって Lajos Sanyo 8年前.
1507
Optimális
Szórás
Dinamikus lokális
P-ed rész
Ha a kvantálási szintek száma nem elegendő, akkor
hamis kontúrok léphetnek fel, amit kismérvű
mesterséges zaj hozzáadásával (dithering)
mérsékelhetünk.
Tapasztalat szerint egyenletes kvantálás mellett
elegendő 256 szürkeségi szint (8 bit/pixel).
Nem uniform
Mozaikok/rácsok
Escher
Négyszög
Duálisa a négyszög
Háromszög
Duálisa a hatszög
Minden függvény felírható különböző
frekvenciájú sin
és cos függvények súlyozott összegeként.
Ennek matematikai eszköze a Fourier-transzformáció.
Az analóg 2D Fourier transzformáció szeparálható.
A diszkrét 2D Fourier transzformáció szeparálható.
A képen lévő élnek (ahol az intenzitás egy irány
mentén hirtelen megváltozik, pl. eltérő fényességő
tartományok határán) a frekvenciatartományban
(vagyis a kép Fourier-transzformáltjában)
megjelenik az él irányára merőleges vonal
(pontsorozat).
elforgatás
linearitás
eltolás
skálázás
Általában a Fourier-spektrum az origótól
távolodva gyorsan lecseng, ezért
|F(x,y)|
helyett a
log( 1 + |F(X,Y)| )
valós függvényt szokás megjeleníteni.
Egy M-elemő jelsorozat transzformációja
megkapható kettı (M/2)-elemő jelsorozat
transzformációjának O(M) (lineáris) idejő
„összefésülésével”, így az idıigény
O(M·logM)
M-elemő 1D jelsorozatok Fourier transzformációja
tehát egy (konstans) MxM-es és egy Mx1-es
mátrix összeszorzását jelenti.
Az ugyancsak M-elemő eredmény minden
komponense kiszámításához M szorzásra van
szükség, így a diszkrét Fourier transzformáció
idıigénye O(M^2).
T: A=[a(i,j)] --> B=[b(i,j)]
b(i,j)=T{a(i,j), S(i,j), i, j}
a: intenzitás
S: környezet
i,j: pozíció
Szürkeárnyalatos --> RGB:
g(x,y)=1 ha f(x,y) >= T
vagy
g(x,y)=1 ha f(x,y) eleme D
vagy
Sávos küszöbölés
ahol: f a kiindulási kép, T a küszöb, g a küszöbölt kép.
D: szürkeségi értékek halmaza
(pl. egy intervallum)
s = c · r^gamma
• r : régi intenzitás,
• s : új intenzitás,
• c : konstans (c>0),
• gamma : konstans (gamma>0).
(a szemünk logaritmikusan érzékeny)
s = c · log(1+r)
• r : régi intenzitás
• s: új intenzitás
• c: konstans (c>0)
Input:
A=[a(i,j)] MxN-es digitális kép,
Output:
B=[b(i,j)] MxN-es digitális kép, ahol:
b(i,j)=T{a(i,j)},
vagyis az eredményképen egy
képpont intenzitása (denzitása, színe)
csak az input kép ugyanazon pozíciójú
pontjának intenzitásától függ.
Megadása:
Kép-kép operációk:
C[x, y] = f (A[x, y], B[x, y])
• a műveletek kettőnél több képre is
általánosíthatók;
• általában feltételezzük, hogy a képméretek
megegyeznek és mindkét kép ugyanúgy kvantált.
szorzás bináris képpel
abszolút differencia.
változások detektálása
Az intenzitás (fényességi, szürkeségi) értékek
előfordulási gyakorisága a képen.
A képpontok „összerázásával” a hisztogram nem változik, tehát a hisztogramból nem következtethetünk a „látványra”.
Olyan pont-operációk, amelyeknek a T
függvényét az input kép hisztogramjából vagy
az output kép hisztogramjára vonatkozó
elvárások alapján határozzák meg.
Pont-operáció, amely a kiindulási képből az előre megadott hisztogramú képet eredményezi (megközelítőleg).
Olyan monoton növekvő függvényű pont-operáció,
mely „közel” konstans hisztogramú képet eredményez.
Színes
R,G,B csatornánként.
Lokális hisztogram kiegyenlítés
A hisztogram kiegyenlítést (HK) pontonként, az adott pont egy lokális környezete alapján végezzük.
Teljes
A hisztogram széthúzáshoz hasonló, de az intenzitások egy megadott [low, high] intervallumát skálázza a [0, L-1]-be.
(A megadott intervallum szűkebb lehet, mint az előforduló intenzitások 0 L-1 [min, max] sávja.)
A pont-operáció függvénye egy lineáris skála-transzformáció: a képen előforduló intenzitástartományt, a [min, max] intervallumot skálázza a [0, L-1] (a teljes) 0 L-1 intervallumba.
s=T(r)=(L-1)(r-min)/(max-min)
Komplementálás
A képen ott található él, ahol a kép-függvény valamely irány mentén hirtelen változik.
Lépcső, tető, vonal, zajos.
• Konvolváljuk a képet egy (vagy több)
alkalmas LoG függvénnyel.
• Keressünk (közös) nulla-átmeneteket.
Az él nagysága.
Elıjelváltás.
A Gauss függvény Laplace
transzformáltja
(LoG – Laplacian of Gaussian)
LoG (Mexican hat)
Operátor másodrendő deriváltra
A Laplace operátor egy lineáris differenciál-operátor a másodrendő derivált közelítésére:
delta^2 f(x,y)=
=szg^2f(x,y)/szg(x^2)+
+szg^2f(x,y)/szg(y^2)
Diszkrét Laplace operátor pl:
| 0 -1 0|
|-1 4 -1|
| 0 -1 0|
A Laplace operátor tulajdonságai:
+forgásinvariáns
+egyetlen maszkkal számítható
-csak a magnitúdó számítható
-duplán érzékelhet éleket
-zajérzékeny
Frei-Chen (izotropikus)
|1 0 -1| |-1 -2 -1|
|2 0 -2| |0 0 0|
|1 0 -1| |1 2 1|
szg(f)/szg(x) szg(f)/szg(y)
2=gyök(2)
Sobel
|1 0 -1| |-1 -2 -1|
|2 0 -2| |0 0 0|
|1 0 -1| |1 2 1|
szg(f)/szg(x) szg(f)/szg(y)
Simító hatással bír.
Prewitt
|1 0 -1| |-1 -1 -1|
|1 0 -1| |0 0 0|
|1 0 -1| |1 1 1|
szg(f)/szg(x) szg(f)/szg(y)
Roberts
|0 0 -1| |-1 0 1|
|0 1 0| |0 1 0|
|0 0 0| |0 0 0|
szg(f)/szg(x) szg(f)/szg(y)
+ könnyen számítható
– zajérzékeny
|p 0 -p|
|q 0 -q|
|p 0 -p|
Szimmetria, antiszimmetria
Prewitt : p=1, q=1
Sobel : p=1, q=2
Frei -Chen : p=1, q=gyök(2)
A vonal-detektálás célja az egységnyi vastagságú
görbék kijelölése.
A probléma megoldható az adott irányú
vonalpontokra érzékeny gk (k=1,…,n) maszkokkal
történı konvolúcióval.
A feladat a kiugró (a lokális környezetében lévő képpontokétól eltérı intenzitású) pontok detektálása.
Az alábbi maszkkal történő konvolúció „0” értéket ad homogén környezetben lévő pontokra és nagy abszolút értéket a kiugrókra:
|-1 -1 -1|
|-1 8 -1|
|-1 -1 -1|
Konvolúciós tétel
F( f *h) = F( f ) * F(h)
pontonkénti (!) szorzás
Alul- és felüláteresztő
szűrőpárok
HPF(u,v) = 1− LPF(u,v)
Alul-felül
Tulajdonságai:
• nem simít olyan erősen
• nincs gyűrű hatás (folytonos szűrő)
• élek elmosódnak
0 - D_l : részlegesen elnyel
D_l - D_h : kiemel (pl. élek)
D_h - : elnyel (zaj)
H_IHPF(X,Y)=
1 ha D_1<=X^2+Y^2<=D_2
0 különben
csak a (D1,D2) sávba tartozó frekvenciákat engedi át, a többit elnyeli
H_IHPF(X,Y)=
1 ha X^2+Y^2>=D_0
0 különben
H_ILPF(X,Y)=
Nemlineáris morfológiai operátorok.
Ugyanazon környezettel az alábbi 4-elemű
műveletlánc végrehajtása:
– erózió
– dilatáció
– dilatáció
– erózió
g(i, j)=min{ f(i+u, j+v) }
(u,v) eleme S(i,j)
Az a1, a2, …, a2n+1 számok mediánja:
a nagyság szerint rendezett számsorozat
középső, (n+1)-dik eleme,
jelölés: med{a1, a2, …, a2n+1}
Nem lineáris.
Medián szűrés:
g(i, j)=med{ f(i+u, j+v) | (u,v) eleme S }
A mediánszűrés eredményét az S környezet mérete (és alakja) határozza meg.
h(x, y) = f (x, y)*G(x, y)
h: simított fv.
f: kiindulási fv.
G: Gauss szűrő fv.
g(x,y)=1/|S(i,j)|*sum(f(n,m))
(m,n) eleme S(i,j)
ahol:
Az átlagoló szűrés hatása és tulajdonságai
Csak akkor simítunk, ha az adott képpont
intenzitásának a környezeti átlagtól való eltérése
meghalad egy előre választott T küszöbértéket.
g'(i,j)=g(i,j) ha
A környezet intenzitásaihoz (általában a
távolsággal arányosan csökkenő) súlyokat rendelünk.
Zajszűrő/simító maszkoknál a maszkelemek összege 1!
g(i,j)=(f*h)(i,j)
h=1/9*
|1 1 1|
|1 1 1|
|1 1 1|
konvolúciós
maszk
A képpont-intenzitások nemkívánatos változása.
fehér és fekete pontok random előfordulása.
az intenzitásváltozás normál eloszlást követ.