基於直方圖的特徵-----經典的SIFT特徵

author:catcher_liu

時間:2014/7/29-------


參考學習資料:

1.http://blog.csdn.net/abcjennifer/article/details/7639681 

2.http://www.cs.ubc.ca/~lowe/papers/ijcv04.pdf

3.http://en.wikipedia.org/wiki/Scale-invariant_feature_transform#David_Lowe.27s_method

4.http://wenku.baidu.com/link?url=G3ODclQqtAtFUbcXiNoI7yNybnEmerHwpGoJ7MiV2mt72OJr97y3GuLbU7FGyZmB7NklUpSM3i964UYEhabPDBzW5xf1vTxojqN60GVPqE3

5.http://www.cnblogs.com/cuteshongshong/archive/2012/05/25/2506374.html(lowe的譯文)

1.定義

Scale-invariant feature transform (or SIFT) is an algorithm in computer vision to detect and describe local features in images. The algorithm was published by David Lowe in 1999.


2.特性:

     a.尺度不變性( scale-invariant);b.平移不變性(invariant to image translation)c.旋轉不變性(rotation)d.光照不變性(illumination);e.affine or 3D projection



3.SIFT特徵的求解(分四步)

     a.尺度空間的建立

尺度空間的建立是爲了使得SIFT特徵具有尺度不變性。其實質是通過尺度連續可變的高斯函數與圖像做卷積運算,從而生成幾組模糊圖像(一組是一個子八度octave)。下一組圖像的尺度大小是上一組長寬的一半。組內之間的圖像大小是一樣的,他們的不同在於模糊度不一樣。

根據(Scale-space theory: A basic tool for analysing structures at different scales)可知,高斯核是唯一可以產生多尺度空間的核, 一副圖像的尺度空間可以定義爲原始圖像與一個尺度可變的2維高斯函數卷積運算:


sigma的大小決定圖像的平滑程度,sigma越大,圖像越模糊,體現出圖像的概貌特徵;sigma越小,細節特徵越突出。由變換的尺度構建的高斯金字塔如圖:



用一幅圖像逐漸生成一組模糊後的圖像,然後將原始圖像的尺寸縮小一半,再逐漸生成下一組模糊後的圖像,以此類推。如下圖所示



這裏S=3,因此高斯尺度空間每組有6副圖像

一般要生成S個可以計算特徵點的DOG尺度空間,DOG空間的圖像層數應該有s+2層,那麼高斯空間的圖像層數就應該是S+3層。Lowe中S=3.


尺度是自然存在的,不是人爲創造的!高斯卷積只是表現尺度空間的一種形式

建議

1. 組數和尺度數依賴於原始圖像的大小,SIFT算法發明者建議將組數設爲4,尺度數設爲5是比較理想的。在實現中我們採用作者的建議。

2. 第一組的圖像並不是直接使用原始圖像,而是使用大小放大兩倍並稍微模糊後的圖像,這樣可以多產生4倍的特徵點。

3. 數學上,模糊指的是圖像與高斯核的卷積,卷積後的圖像是一個模糊的圖像。

4.

每個圖像的模糊量是很重要的,假設一幅圖像的模糊量是σ,那麼下一幅圖像的模糊量是k*σ,這裏的k是一個常量。


在SIFT算法的第一階段,我們生成了原始圖像的多組尺度空間,每個組的圖像大小是前者的一半。在一組尺度空間中,圖像使用高斯模糊操作被逐漸模糊。這個過程可以模擬人在距離目標由近到遠時目標在視網膜上的形成過程。


          生成DOG

爲了有效地在尺度空間檢測到穩定的關鍵點位置,引入the difference-of-Gaussian function 


選擇他的理由:計算成本不高;是Laplacian of Gaussian的近似;


    構建DOG的方法:





     b.在DOG空間尋找關鍵點(detect the local maxima and minima)

前面兩個步驟就是爲尋找關鍵點做備準備的,Detecting locations that are invariant to scale change of the image can be accomplished by searching for stable features
across all possible scales, using a continuous function of scale known as scale space(這裏體現出了尺度空間的作用)

關鍵點的確定有三個方面:位置和尺度和方向。爲了找到關鍵點,在DOG空間中對每個點,將其與當前層圖像中的8點鄰域和上下兩層的9點鄰域比較(共26個點),當其比這26個點都大或者都小的時候,確定爲當前層的一個特徵點。並記錄下當前尺度與位置。

 

值得說明的是,這個過程計算量是相當小的,因爲在比較的過程當中,很多點都很容易在少量的比較當中消滅掉。




補充:基本概念

1.scale space(尺度空間) (Witkin,1983).

2.所謂關鍵點,就是在不同尺度空間的圖像下檢測出的具有方向信息的局部極值點


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章