1、SIFT算子的作用

尺度不變特徵轉換即SIFT (Scale-invariant feature transform)是一種計算機視覺的算法。它用來偵測與描述影像中的局部性特徵，它在空間尺度中尋找極值點，並提取出其位置、尺度、旋轉不變量，此算法由 David Lowe在1999年所發表，2004年完善總結。
局部影像特徵的描述與偵測可以幫助辨識物體，SIFT特徵是基於物體上的一些局部外觀的興趣點而與影像的大小和旋轉無關。對於光線、噪聲、些微視角改變的容忍度也相當高。基於這些特性，它們是高度顯著而且相對容易擷取，在母數龐大的特徵數據庫中，很容易辨識物體而且鮮有誤認。使用 SIFT特徵描述對於部分物體遮蔽的偵測率也相當高，甚至只需要3個以上的SIFT物體特徵就足以計算出位置與方位。在現今的電腦硬件速度下和小型的特徵數據庫條件下，辨識速度可接近即時運算。SIFT特徵的信息量大，適合在海量數據庫中快速準確匹配。
SIFT算法的實質是在不同的尺度空間上查找關鍵點(特徵點)，並計算出關鍵點的方向。SIFT所查找到的關鍵點是一些十分突出，不會因光照，仿射變換和噪音等因素而變化的點，如角點、邊緣點、暗區的亮點及亮區的暗點等。

上邊這一段百度上粘過來的哈，自己總結不了這麼詳細哈，下面說一下我自己的理解，SIFT算子就是搞特徵點檢測的，大多就是角點嗎，目的就是爲了能將你感興趣的部分，用幾個點 “代表” 一下，下一次再碰到類似的區塊的時候，把能代表這些區塊的 "點" 也找出來，兩家匹配一下，匹配的上就說明，，，，，說明不了啥，就是配上了，哈哈。

2、SIFT算子的核心步驟，簡要心法

步驟一：建立尺度空間，即建立圖像金字塔，一般是高斯差分金子塔（DOG）。

步驟二：在尺度空間中檢測極值點，也就是特徵點。

步驟三：特徵點方向賦值，完成此步驟後，每個特徵點有三個主要信息：位置尺度方向

步驟四：計算特徵點的描述子。

3、核心步驟講解

3.1 建立尺度空間

圖1

先從一維的尺度空間說哈，如圖1所示，h所代表的就是尺度空間呢，類似於我們常說的分辨率，h越大分辨率越低，所能夠看到的信息就越少。那二維的圖像也類似呢。如圖2。

圖2

看這隻喵，每兩個 ”採樣“ 像素點之間相隔的尺度越大，所能得到的 “有效” 像素點就越少，那這張圖像中的信息就越少，所以圖像就變小了呀，摞一塊，小的在上邊，大的在下邊，初步金字塔就出來了。如圖4。

圖4

不過呢，這只是初步，離真正的金字塔還差點呢，這金子塔每層只有一張圖像，蘊含的信息實在有點少了，我們SIFT算子找角點的主要思想就是，在任何情況下，無論圖像有多模糊，特徵點的值是不會變的，該有的總會有的。所以此時我們這裏每層只有一張圖像，怎麼能夠代表這一層呢，最起碼需要每層要再多來幾張圖求個平均值呀，因此前輩們就在每一層圖像的基礎上，又利用高斯模糊生成基礎圖像的衍生圖像。如圖5。

圖5

以圖4的第一層爲例，再衍生出來幾張圖像如圖5，至於高斯模糊（高斯平滑）的算子解釋自行百度，都寫上，這博客長的滾輪都拉壞了，我的理解就是一個低通濾波器，平滑過頭了就是模糊了，比均值濾波好一點。有了這些圖像我們的金字塔纔算正式形成了。如圖6所示。

圖6

總結一下來說高斯金字塔的建立分爲三步：

1、對圖像做高斯平滑（高斯模糊）

2、對每張圖像做下采樣（包括原圖）

3、摞一塊。

高斯金字塔建立完成，步驟一完成。

3.2 尺度空間中檢測特徵點

要想檢測特徵點，我們就需要利用我們手裏現在最有用的數據-----高斯金字塔了，咋用嘞，前輩們又說話了，僅有一個高斯金字塔是遠遠不夠滴，我們還要進一步生成一個DOG金字塔（高斯差分圖像金字塔），用來觀察每一層金子塔中，是否在無論多麼模糊的情況下，都會有那麼幾個老不死的不願意離開，賴在了圖像上，那麼特徵點就是他們了，可咋找呢，前輩們又總結了，將高斯金字塔中每一層中的圖像兩兩相減，DOG金字塔就出來了，可爲啥是減法呢，爲啥不是除法，比較之類的呢? 跑去問前輩，懟回來一句：just do it ，扯個淡哈，金字塔生成如下圖7所示。