機器智能-高頻問題：目標檢測算法

原創

2020-06-08 05:23

6、計算機中的圖像語義感知
a、Image Segmentation：將語義對象的位置進行分塊，根據語義來進行圖像位置的劃分。
b、Image Classification：根據圖像的特徵來進行圖像類別的判斷
c、Object Detection：綜合以上兩者，目標檢測，既要找到圖像的位置，又要判斷圖像的語義。
d、Image Captioning：將所得到的信息用自然語言進行組織
7、目標檢測：找出圖像或者視頻中所有感興趣的目標(物體)，確定它們的類別和位置。問題包括：計算機中的圖像是如何表示的？目標檢測的模型是如何實現的？
8、圖像的幾何變換包括了圖像的形狀變換和圖像的位置變換。圖像的形狀變換是指圖像的放大、縮小與錯切。圖像的位置變換是指圖像的平移、鏡像與旋轉。圖像的幾何變換通常在目標識別中使用。
9、圖像錯切：圖像的錯切變換實際上是平面景物在投影平面上的非垂直投影效果。
10、圖像的旋轉計算公式如下：

11、目標檢測算法：問題牽引。
a、問題一：怎樣訓練一個好的模型？
b、問題二：怎樣輸出對象的類別和位置
12、目標檢測算法：訓練與測試
a、面對一張圖片，隨機選定一些框，如果這個框中包含了某些目標，則將框設置爲正樣本，否則設置爲負樣本。
b、將正樣本和負樣本丟給CNN卷積神經網絡，進行訓練。
c、框怎麼畫，是一個很大的問題
13、目標檢測算法：數據預處理
a、訓練錢的數據處理
①、從文件中讀取圖像和標註數據
②、圖像增廣，增加圖像的數量，防止過擬合
③、批量讀取：每次讀取一個batch（批）的數據進行參數的更新
④、多線程加速
b、數據增廣
①、隨機改變亮度，對比度和顏色
②、隨機填充
③、隨機裁剪
④、隨機縮放
⑤、隨機翻轉
14、目標檢測算法：傳統方法
a、先進行區域選擇（隨機選取一些框），然後進行特徵提取，然後進行分類器分類
b、主要問題：
①、基於滑窗的區域選擇策略沒有針對性，時間複雜度高，窗口冗餘；
②、手工設計的特徵對於環境多樣性的變化並沒有很好的魯棒性。
15、目標檢測算法：二階段方法
a、主要特點：
①、二階段：
第一階段：生成大量的候選區域(region proposals)；
第二階段：對每個region proposal提取特徵並分類。
②、採用CNN來提取圖片的特徵。
b、慢：需要生成大量的region proposals；慢：需要對每個region proposal用CNN提取特徵；不準：分類與特徵提取分開，錯誤梯度無法傳遞
c、典型是：空間金字塔模型，大幅度提高了特徵提取的速度。
16、目標檢測算法：一階段方法
a、二階段方法先產生候選區域，再對區域進行分類和位置調整。
b、一階段方法同時產生候選區域和分類結果。主要方法有YOLO, SSD, DSSD等。
c、YOLO ：
將檢測變爲一個迴歸問題，YOLO 從輸入的圖像，僅僅經過一個神經網絡，直接得到bounding boxes以及每個bounding box所屬類別的概率。
端對端的優化網絡結構。
標準版YOLO 每秒可以實時地處理 45 幀圖像。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

機器智能-高頻問題：目標檢測算法

釘釘打卡速度慢

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Golang初學：獲取程序內存使用情況，std runtime

計算機網絡（三十一）：總結

計算機網絡（三十二）：習題解析

計算機網絡（二十八）：差錯檢查和糾正技術

計算機網絡（二十九）：多路訪問鏈路和協議

計算機網絡（二十七）：鏈路層概述

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結