Sift中尺度空間、高斯金字塔、差分金字塔(DOG金字塔)、圖像金字塔

這是一篇很棒的介紹金字塔的博文,由淺入深,逐步到DOG金字塔~

轉自這裏

一、 圖像金字塔


圖像金字塔是一種以多分辨率來解釋圖像的結構,通過對原始圖像進行多尺度像素採樣的方式,生成N個不同分辨率的圖像。把具有最高級別分辨率的圖像放在底部,以金字塔形狀排列,往上是一系列像素(尺寸)逐漸降低的圖像,一直到金字塔的頂部只包含一個像素點的圖像,這就構成了傳統意義上的圖像金字塔。





獲得圖像金字塔一般包括二個步驟:

1. 利用低通濾波器平滑圖像 

2. 對平滑圖像進行抽樣(採樣)

有兩種採樣方式——上採樣(分辨率逐級升高)和下采樣(分辨率逐級降低)


上採樣:




下采樣:




二、高斯金字塔


高斯金字塔式在Sift算子中提出來的概念,首先高斯金字塔並不是一個金字塔,而是有很多組(Octave)金字塔構成,並且每組金字塔都包含若干層(Interval)。

高斯金字塔構建過程:

1. 先將原圖像擴大一倍之後作爲高斯金字塔的第1組第1層,將第1組第1層圖像經高斯卷積(其實就是高斯平滑或稱高斯濾波)之後作爲第1組金字塔的第2層,高斯卷積函數爲:



對於參數σ,在Sift算子中取的是固定值1.6。

2. 將σ乘以一個比例係數k,等到一個新的平滑因子σ=k*σ,用它來平滑第1組第2層圖像,結果圖像作爲第3層。

3. 如此這般重複,最後得到L層圖像,在同一組中,每一層圖像的尺寸都是一樣的,只是平滑係數不一樣。它們對應的平滑係數分別爲:0,σ,kσ,k^2σ,k^3σ……k^(L-2)σ。

4.  將第1組倒數第三層圖像作比例因子爲2的降採樣,得到的圖像作爲第2組的第1層,然後對第2組的第1層圖像做平滑因子爲σ的高斯平滑,得到第2組的第2層,就像步驟2中一樣,如此得到第2組的L層圖像,同組內它們的尺寸是一樣的,對應的平滑係數分別爲:0,σ,kσ,k^2σ,k^3σ……k^(L-2)σ。但是在尺寸方面第2組是第1組圖像的一半。

這樣反覆執行,就可以得到一共O組,每組L層,共計O*L個圖像,這些圖像一起就構成了高斯金字塔,結構如下:




在同一組內,不同層圖像的尺寸是一樣的,後一層圖像的高斯平滑因子σ是前一層圖像平滑因子的k倍;

在不同組內,後一組第一個圖像是前一組倒數第三個圖像的二分之一採樣,圖像大小是前一組的一半;


高斯金字塔圖像效果如下,分別是第1組的4層和第2組的4層:


        



三、 尺度空間



圖像的尺度空間解決的問題是如何對圖像在所有尺度下描述的問題。

在高斯金字塔中一共生成O組L層不同尺度的圖像,這兩個量合起來(O,L)就構成了高斯金字塔的尺度空間,也就是說以高斯金字塔的組O作爲二維座標系的一個座標,不同層L作爲另一個座標,則給定的一組座標(O,L)就可以唯一確定高斯金字塔中的一幅圖像。

尺度空間的形象表述:



上圖中尺度空間中k前的係數n表示的是第一組圖像尺寸是當前組圖像尺寸的n倍。



四、 DOG金字塔


差分金字塔,DOG(Difference of Gaussian)金字塔是在高斯金字塔的基礎上構建起來的,其實生成高斯金字塔的目的就是爲了構建DOG金字塔。

DOG金字塔的第1組第1層是由高斯金字塔的第1組第2層減第1組第1層得到的。以此類推,逐組逐層生成每一個差分圖像,所有差分圖像構成差分金字塔。概括爲DOG金字塔的第o組第l層圖像是有高斯金字塔的第o組第l+1層減第o組第l層得到的。

DOG金字塔的構建可以用下圖描述:




每一組在層數上,DOG金字塔比高斯金字塔少一層。後續Sift特徵點的提取都是在DOG金字塔上進行的。

DOG金字塔的顯示效果如下:




這些長得黑乎乎的圖像就是差分金字塔的實際顯示效果,只在第1組第1層差分圖像上模糊可以看到一個輪廓。但其實這裏邊包含了大量特徵點信息,只是我們人眼已經分辨不出來了。

下邊對這些DOG圖像進行歸一化,可有很明顯的看到差分圖像所蘊含的特徵,並且有一些特徵是在不同模糊程度、不同尺度下都存在的,這些特徵正是Sift所要提取的“穩定”特徵:



發佈了48 篇原創文章 · 獲贊 43 · 訪問量 13萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章