类别 全部

作者:Lajos Sanyo 8 年以前

1507

Képfeldolgozás

A Fourier-transzformáció alapvető eszköz a különböző frekvenciájú függvények elemzésére, amely lehetővé teszi, hogy bármely függvényt sin és cos függvények súlyozott összegeként írjunk fel.

Képfeldolgozás

Képfeldolgozás

Szegmentálás

Illesztésen alapuló
Hierarchikus
Illesztési algoritmus
Kereszt korreláció
Régió alapú
Egyesítés és szétválasztás
Szétválasztás
Egyesítés
Növelés
Hugh transzformáció
Kör
Határkövetés
Többszintű
Bináris
Él alapú
Él-relaxáció
Él-kapcsolás
Subtopic
Küszöböléssel
Küszöb meghatározó módszerek

Optimális

Szórás

Dinamikus lokális

P-ed rész

Definíció

Képalkotás

Kvantálás
Hiba

Ha a kvantálási szintek száma nem elegendő, akkor

hamis kontúrok léphetnek fel, amit kismérvű

mesterséges zaj hozzáadásával (dithering)

mérsékelhetünk.

Tapasztalat szerint egyenletes kvantálás mellett

elegendő 256 szürkeségi szint (8 bit/pixel).

Klaszterezés

Nem uniform

Halftone
Logaritmikus
Uniform/lineáris
Hibák
Időbeli
Moire
Alap

  • a kis objectumok eltűnhetnek
  • hosszú, vékony objektumok széttöredezhetnek
  • hamis kontúrok léphetnek fel
  • Változó mintavételezési frekvenciák
    Mintavételezési módok
    Adaptív
    Uniform

    Mozaikok/rácsok

    Escher

    Négyszög

    Duálisa a négyszög

    Háromszög

    Duálisa a hatszög

    Képfajták
    Indexelt/palettás
    RGB truecolor
    Szürkeárnyalatos/többszintű
    Bináris/kétszintű

    Fourier transzformáció

    Minden függvény felírható különböző

    frekvenciájú sin

    és cos függvények súlyozott összegeként.

    Ennek matematikai eszköze a Fourier-transzformáció.

    Butterfly hálózat
    Tulajdonságai

    Az analóg 2D Fourier transzformáció szeparálható.

    A diszkrét 2D Fourier transzformáció szeparálható.

    A képen lévő élnek (ahol az intenzitás egy irány

    mentén hirtelen megváltozik, pl. eltérő fényességő

    tartományok határán) a frekvenciatartományban

    (vagyis a kép Fourier-transzformáltjában)

    megjelenik az él irányára merőleges vonal

    (pontsorozat).

    elforgatás

    linearitás

    eltolás

    skálázás

    Megjelenítése

    Általában a Fourier-spektrum az origótól

    távolodva gyorsan lecseng, ezért

    |F(x,y)|

    helyett a

    log( 1 + |F(X,Y)| )

    valós függvényt szokás megjeleníteni.

    FFT

    Egy M-elemő jelsorozat transzformációja

    megkapható kettı (M/2)-elemő jelsorozat

    transzformációjának O(M) (lineáris) idejő

    „összefésülésével”, így az idıigény

    O(M·logM)

    Diszkrét

    M-elemő 1D jelsorozatok Fourier transzformációja

    tehát egy (konstans) MxM-es és egy Mx1-es

    mátrix összeszorzását jelenti.

    Az ugyancsak M-elemő eredmény minden

    komponense kiszámításához M szorzásra van

    szükség, így a diszkrét Fourier transzformáció

    idıigénye O(M^2).

    Folytonos

    Konvolúció

    Pont operációk

    Képművelet

    T: A=[a(i,j)] --> B=[b(i,j)]

    b(i,j)=T{a(i,j), S(i,j), i, j}

    a: intenzitás

    S: környezet

    i,j: pozíció

    Álszínezés

    Szürkeárnyalatos --> RGB:

    Bit-síkok kiemelése
    Küszöbölés

    g(x,y)=1 ha f(x,y) >= T

    vagy

    g(x,y)=1 ha f(x,y) eleme D

    vagy

    Sávos küszöbölés

    ahol: f a kiindulási kép, T a küszöb, g a küszöbölt kép.

    D: szürkeségi értékek halmaza

    (pl. egy intervallum)

    Gamma korrekció

    s = c · r^gamma

    • r : régi intenzitás,

    • s : új intenzitás,

    • c : konstans (c>0),

    • gamma : konstans (gamma>0).

    (a szemünk logaritmikusan érzékeny)

    Logaritmikus transzformáció

    s = c · log(1+r)

    • r : régi intenzitás

    • s: új intenzitás

    • c: konstans (c>0)

    Pont-operáció

    Input:

    A=[a(i,j)] MxN-es digitális kép,

    Output:

    B=[b(i,j)] MxN-es digitális kép, ahol:

    b(i,j)=T{a(i,j)},

    vagyis az eredményképen egy

    képpont intenzitása (denzitása, színe)

    csak az input kép ugyanazon pozíciójú

    pontjának intenzitásától függ.

    Megadása:


  • szürkeségi transzformációkat megadó függvénnyel
  • átszínező- vagy keresőtáblával (LUT: look-up-table)
  • Aritmetikai műveletek

    Kép-kép operációk:

    C[x, y] = f (A[x, y], B[x, y])

    • a műveletek kettőnél több képre is

    általánosíthatók;

    • általában feltételezzük, hogy a képméretek

    megegyeznek és mindkét kép ugyanúgy kvantált.

    Maszkolás

    szorzás bináris képpel

    Kivonás

    abszolút differencia.

    változások detektálása

    Átlagolás
    Összeadás

    Hisztogram

    Az intenzitás (fényességi, szürkeségi) értékek

    előfordulási gyakorisága a képen.

    A képpontok „összerázásával” a hisztogram nem változik, tehát a hisztogramból nem következtethetünk a „látványra”.

    hisztogram transzformációk

    Olyan pont-operációk, amelyeknek a T

    függvényét az input kép hisztogramjából vagy

    az output kép hisztogramjára vonatkozó

    elvárások alapján határozzák meg.

    Specifikáció

    Pont-operáció, amely a kiindulási képből az előre megadott hisztogramú képet eredményezi (megközelítőleg).

    Kiegyenlítés

    Olyan monoton növekvő függvényű pont-operáció,

    mely „közel” konstans hisztogramú képet eredményez.

    Színes

    R,G,B csatornánként.

    Lokális hisztogram kiegyenlítés

    A hisztogram kiegyenlítést (HK) pontonként, az adott pont egy lokális környezete alapján végezzük.

    Teljes

    Kontraszt széthúzás

    A hisztogram széthúzáshoz hasonló, de az intenzitások egy megadott [low, high] intervallumát skálázza a [0, L-1]-be.

    (A megadott intervallum szűkebb lehet, mint az előforduló intenzitások 0 L-1 [min, max] sávja.)


  • s=T(r)=(L-1)(r-low)/(high-low)
  • 0 ha r<low
  • L-1 ha r>high
  • Széthúzás

    A pont-operáció függvénye egy lineáris skála-transzformáció: a képen előforduló intenzitástartományt, a [min, max] intervallumot skálázza a [0, L-1] (a teljes) 0 L-1 intervallumba.

    s=T(r)=(L-1)(r-min)/(max-min)

    Pont operációk hatása ahisztogramra

    Komplementálás

    Színeskép
    Átkovertált szürkére
    hisztogramszínkomponensenként
    A kép megítélése

  • sötét
  • világos
  • kontrasztszegény
  • kontrasztos
  • Jellemzők detektálása

    Sarok
    Harris
    Moravec
    Jellemzők szintézise
    Nem max. élek elnyomása
    Él

    A képen ott található él, ahol a kép-függvény valamely irány mentén hirtelen változik.


  • ideális/lépcsős él
  • lejtős él

  • Lépcső, tető, vonal, zajos.

    Marr-Hildreth éldetektor

    • Konvolváljuk a képet egy (vagy több)

    alkalmas LoG függvénnyel.

    • Keressünk (közös) nulla-átmeneteket.

    Hiszterézis
    Skála-tér
    Canny
    Magnitúdó

    Az él nagysága.

    Gauss simítás
    Második derivált

    Elıjelváltás.

    Laplace transzformáció

    A Gauss függvény Laplace

    transzformáltja

    (LoG – Laplacian of Gaussian)

    LoG (Mexican hat)

    Laplace operátor

    Operátor másodrendő deriváltra

    A Laplace operátor egy lineáris differenciál-operátor a másodrendő derivált közelítésére:

    delta^2 f(x,y)=

    =szg^2f(x,y)/szg(x^2)+

    +szg^2f(x,y)/szg(y^2)

    Diszkrét Laplace operátor pl:

    | 0 -1 0|

    |-1 4 -1|

    | 0 -1 0|

    A Laplace operátor tulajdonságai:

    +forgásinvariáns

    +egyetlen maszkkal számítható

    -csak a magnitúdó számítható

    -duplán érzékelhet éleket

    -zajérzékeny

    Irány
    Gradiens
    Diszkrét gradiens operátorok

    Frei-Chen (izotropikus)

    |1 0 -1| |-1 -2 -1|

    |2 0 -2| |0 0 0|

    |1 0 -1| |1 2 1|

    szg(f)/szg(x) szg(f)/szg(y)

    2=gyök(2)

    Sobel

    |1 0 -1| |-1 -2 -1|

    |2 0 -2| |0 0 0|

    |1 0 -1| |1 2 1|

    szg(f)/szg(x) szg(f)/szg(y)

    Simító hatással bír.

    Prewitt

    |1 0 -1| |-1 -1 -1|

    |1 0 -1| |0 0 0|

    |1 0 -1| |1 1 1|

    szg(f)/szg(x) szg(f)/szg(y)

    Roberts

    |0 0 -1| |-1 0 1|

    |0 1 0| |0 1 0|

    |0 0 0| |0 0 0|

    szg(f)/szg(x) szg(f)/szg(y)

    + könnyen számítható

    – zajérzékeny

    Gradiens maszk tervezése(x-irányban)

    |p 0 -p|

    |q 0 -q|

    |p 0 -p|

    Szimmetria, antiszimmetria

    Prewitt : p=1, q=1

    Sobel : p=1, q=2

    Frei -Chen : p=1, q=gyök(2)

    Első derivált
    Egyenes

    A vonal-detektálás célja az egységnyi vastagságú

    görbék kijelölése.

    A probléma megoldható az adott irányú

    vonalpontokra érzékeny gk (k=1,…,n) maszkokkal

    történı konvolúcióval.

    Pont

    A feladat a kiugró (a lokális környezetében lévő képpontokétól eltérı intenzitású) pontok detektálása.

    Az alábbi maszkkal történő konvolúció „0” értéket ad homogén környezetben lévő pontokra és nagy abszolút értéket a kiugrókra:

    |-1 -1 -1|

    |-1 8 -1|

    |-1 -1 -1|

    Szűrés frekvenciatérben

    Konvolúciós tétel

    F( f *h) = F( f ) * F(h)

    pontonkénti (!) szorzás

    Alul- és felüláteresztő

    szűrőpárok

    HPF(u,v) = 1− LPF(u,v)

    Helyreállítás
    Butterworth

    Alul-felül

    Tulajdonságai:

    • nem simít olyan erősen

    • nincs gyűrű hatás (folytonos szűrő)

    • élek elmosódnak

    Ideális
    Kiemelő

    0 - D_l : részlegesen elnyel

    D_l - D_h : kiemel (pl. élek)

    D_h - : elnyel (zaj)

    Sáv

    H_IHPF(X,Y)=

    1 ha D_1<=X^2+Y^2<=D_2

    0 különben

    csak a (D1,D2) sávba tartozó frekvenciákat engedi át, a többit elnyeli

    Felűláteresztő

    H_IHPF(X,Y)=

    1 ha X^2+Y^2>=D_0

    0 különben


  • D_0-nál nagyobb frekvenciákat változtatás nélkül átereszti,míg a többit elnyeli.
  • csak a nagy frekvenciájú komponensek maradnak a képben (pl. él, zaj)
  • Alkalmazási lehetőség: él detektálás
  • Aluláteresztő

    H_ILPF(X,Y)=

  • 1 ha X^2+Y^2<=D_0
  • 0 különben

  • D_0: levágási frekvencia, ahol H=1-ből H=0 ba megy át
  • D_0-nál kisebb frekvenciákat változtatás nélkül átereszti,míg a többit elnyeli.
  • Erős simító hatás
  • Alkalmazási lehetőségek: zajszűrés
  • Simítás/Szűrés képtérben

    Min-max

    Nemlineáris morfológiai operátorok.

    Morfológiai szűrés

    Ugyanazon környezettel az alábbi 4-elemű

    műveletlánc végrehajtása:

    – erózió

    – dilatáció

    – dilatáció

    – erózió

    Dilatáció
    Erózió

    g(i, j)=min{ f(i+u, j+v) }

    (u,v) eleme S(i,j)

    Medián

    Az a1, a2, …, a2n+1 számok mediánja:

    a nagyság szerint rendezett számsorozat

    középső, (n+1)-dik eleme,

    jelölés: med{a1, a2, …, a2n+1}

    Nem lineáris.

    Medián szűrés:

    g(i, j)=med{ f(i+u, j+v) | (u,v) eleme S }

    A mediánszűrés eredményét az S környezet mérete (és alakja) határozza meg.




  • Megszünteti az egyedi (és a „kis” kiterjedésű) kiugrásokat.
  • Jobban megőrzi az éleket, mint az átlagolás.
  • „Nagy” kiterjedésű zajfoltoknál jel-elnyomó.
  • Gauss szűrés

    h(x, y) = f (x, y)*G(x, y)

    h: simított fv.

    f: kiindulási fv.

    G: Gauss szűrő fv.

    Átlag

    g(x,y)=1/|S(i,j)|*sum(f(n,m))

    (m,n) eleme S(i,j)

    ahol:


  • f a kiindulási kép,
  • g a szűrt kép,
  • S(i,j) az (i,j) pont egy környezete,
  • |S(i,j)| a környezetbe tartozó képpontok száma.

    Az átlagoló szűrés hatása és tulajdonságai

  • a képpontok közelebb kerülnek környezetük átlagához, azaz a kép „simább” lesz
  • a szűrt kép intenzitásértékei a kiindulási kép intenzitástartományában maradnak
  • lineáris operátor (mivel a is konvolúció az)
  • haszna: csökkenti a zajt
  • kára: gyengíti az éleket, homályossá teszi a képet.


  • Módosított környezeti átlagolás

    Csak akkor simítunk, ha az adott képpont

    intenzitásának a környezeti átlagtól való eltérése

    meghalad egy előre választott T küszöbértéket.

    g'(i,j)=g(i,j) ha


  • |g(i,j)-f(i,j)|>T
  • f(i,j) különben
  • Súlyozott

    A környezet intenzitásaihoz (általában a

    távolsággal arányosan csökkenő) súlyokat rendelünk.

    Zajszűrő/simító maszkoknál a maszkelemek összege 1!

    Konvolúcióval

    g(i,j)=(f*h)(i,j)

    h=1/9*

    |1 1 1|

    |1 1 1|

    |1 1 1|

    konvolúciós

    maszk

    Zaj

    A képpont-intenzitások nemkívánatos változása.

    Só-bors

    fehér és fekete pontok random előfordulása.

    Gauss

    az intenzitásváltozás normál eloszlást követ.