機器智能-高頻問題:目標檢測算法

6、計算機中的圖像語義感知
a、Image Segmentation:將語義對象的位置進行分塊,根據語義來進行圖像位置的劃分。
b、Image Classification:根據圖像的特徵來進行圖像類別的判斷
c、Object Detection:綜合以上兩者,目標檢測,既要找到圖像的位置,又要判斷圖像的語義。
d、Image Captioning:將所得到的信息用自然語言進行組織
7、目標檢測:找出圖像或者視頻中所有感興趣的目標(物體), 確定它們的類別和位置。問題包括:計算機中的圖像是如何表示的?目標檢測的模型是如何實現的?
8、圖像的幾何變換包括了圖像的形狀變換和圖像的位置變換。圖像的形狀變換是指圖像的放大、縮小與錯切。圖像的位置變換是指圖像的平移、鏡像與旋轉。圖像的幾何變換通常在目標識別中使用。
9、圖像錯切:圖像的錯切變換實際上是平面景物在投影平面上的非垂直投影效果。
10、圖像的旋轉計算公式如下:
在這裏插入圖片描述
11、目標檢測算法:問題牽引。
a、問題一:怎樣訓練一個好的模型?
b、問題二:怎樣輸出對象的類別和位置
12、目標檢測算法:訓練與測試
a、面對一張圖片,隨機選定一些框,如果這個框中包含了某些目標,則將框設置爲正樣本,否則設置爲負樣本。
b、將正樣本和負樣本丟給CNN卷積神經網絡,進行訓練。
c、框怎麼畫,是一個很大的問題
13、目標檢測算法:數據預處理
a、訓練錢的數據處理
①、從文件中讀取圖像和標註數據
②、圖像增廣,增加圖像的數量,防止過擬合
③、批量讀取:每次讀取一個batch(批)的數據進行參數的更新
④、多線程加速
b、數據增廣
①、隨機改變亮度,對比度和顏色
②、隨機填充
③、隨機裁剪
④、隨機縮放
⑤、隨機翻轉
14、目標檢測算法:傳統方法
a、先進行區域選擇(隨機選取一些框),然後進行特徵提取,然後進行分類器分類
b、主要問題:
①、基於滑窗的區域選擇策略沒有針對性,時間複雜度高,窗口冗餘;
②、手工設計的特徵對於環境多樣性的變化並沒有很好的魯棒性。
15、目標檢測算法:二階段方法
a、主要特點:
①、二階段:
第一階段:生成大量的候選區域(region proposals);
第二階段:對每個region proposal提取特徵並分類。
②、採用CNN來提取圖片的特徵。
b、慢:需要生成大量的region proposals;慢:需要對每個region proposal用CNN提取特徵;不準:分類與特徵提取分開,錯誤梯度無法傳遞
c、典型是:空間金字塔模型,大幅度提高了特徵提取的速度。
16、目標檢測算法:一階段方法
a、二階段方法先產生候選區域,再對區域進行分類和位置調整。
b、一階段方法同時產生候選區域和分類結果。主要方法有YOLO, SSD, DSSD等。
c、YOLO :
將檢測變爲一個迴歸問題,YOLO 從輸入的圖像,僅僅經過一個神經網絡,直接得到bounding boxes以及每個bounding box所屬類別的概率。
端對端的優化網絡結構。
標準版YOLO 每秒可以實時地處理 45 幀圖像。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章