下面是 Siraj Raval,對學習計算機視覺CV的一份建議指南。
詳細原地址請看:https://github.com/zr940326/Learn_Computer_Vision
先決條件
- 學習Python https://www.edx.org/course/introduction-to-python-for-data-science-3
- 微積分http://tutorial.math.lamar.edu/pdf/Calculus_Cheat_Sheet_All.pdf
- 線性代數https://www.souravsengupta.com/cds2016/lectures/Savov_Notes.pdf
第1部分:低級視覺
=== 第1周(基本圖像處理技術)
- 亮度(亮度,對比度,伽瑪,直方圖均衡)
- 線性濾波(增強圖像 - 模糊和銳化,邊緣檢測,圖像計數,卷積)
- 非線性濾波(中位數,雙邊濾波器,形態學)
- 色彩處理(B&W,飽和度,白平衡)
- 抖動(量化,有序抖動,Floyd-Steinberg)
- 混合(圖像金字塔)
- 紋理分析
- 模板匹配(在圖像中查找對象)
視頻講座
閱讀作業
- http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf Sec 3.1.1-2,3.2 Sec 3.2.3,4.2 3.3.2-4
項目
- 通過OpenCV庫檢測圖像中的對象
=== 第2周(運動和光流)
- 運動分析
- 光流
視頻講座
- https://www.udacity.com/course/introduction-to-computer-vision--ud810 Udacity第6課
- https://www.youtube.com/watch?v=-nt80JUNwlw&list=PLjMXczUzEYcHvw5YYSU92WrY8IwhTuq7p&index=2 video 8
- https://www.youtube.com/watch?v=wC8hXuHsHAQ&list=PLvqB6_mDBCdlnT84LK_NvbOqcXLlOTR8j&index=6&t=0s
閱讀作業
- http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf Sec 10.5 Sec 8.4(直到8.4.1)
項目
- 使用OpenCV跟蹤視頻幀中的移動對象
第2部分:中級視覺(圖像>功能)
=== 第3周(基本細分)
- 分段和聚類算法,如分水嶺,抓取
- 交互式細分
- 霍夫變換(檢測圓,線)
- 前景提取
視頻講座
閱讀作業
- Sec Sec 5.2-5.4 http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf
項目
- 使用OpenCV分割道路圖像中的車道線
=== 第4周(Fitting)
- 擬合線條和曲線
- 堅固的配件,RANSAC
- 可變形的輪廓
視頻講座
閱讀作業
- Sec 4.3.2 5.1.1 http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf
項目
- 使用OpenCV計算走廊圖像中的消失點
第3部分:多視圖
=== 第5周(多張圖片)
- 局部不變特徵檢測和描述
- 圖像變換和對齊
- 平面單應性
- 對極幾何和立體聲
- 對象實例識別
視頻講座
閱讀作業
項目
- 使用OpenCV將一組圖像轉換爲3D對象
=== 第6周(3D場景)
- 立體視覺,密集運動和跟蹤; 3d對象
- 3D場景理解
- 3D分割和建模
視頻講座
- https://www.youtube.com/watch?v=-nt80JUNwlw&list=PLjMXczUzEYcHvw5YYSU92WrY8IwhTuq7p&index=2 video 9
- 所有視頻https://www.coursera.org/learn/stereovision-motion-tracking
閱讀作業
谷歌並閱讀以下文件
- N. Dalal,人體檢測的定向梯度直方圖
- G. Csurka等。(視覺詞彙袋 - 跨領域研究的精彩表現)用關鍵點袋進行視覺分類
- S Lazebnik,C Schmid,J Ponce,Beyond of bags of features:用於識別自然場景類別的空間金字塔匹配
- Jegou等人。將本地圖像描述符聚合爲緊湊代碼。
項目
- 使用OpenCV在3D場景中執行對象分割
第4部分:高級視覺(特徵>分析)
=== 第7周(物體檢測和分類)
- 對象/場景/活動分類(語義分割)
- 物體檢測(非最大抑制,滑動窗口,邊界框和錨點,計數)
- YOLO和Darknet,地區提案網絡
- 監督分類算法
- 序列數據的概率模型
- 視覺屬性
- 光學字符識別
- 面部檢測
視頻講座
- https://www.youtube.com/watch?v=a-v5_8VGV0A&list=PLjMXczUzEYcHvw5YYSU92WrY8IwhTuq7p&index=8 10-18
- 我在YOLO的視頻
閱讀作業
項目
- 使用Tensorflow對圖像中的汽車進行分類
=== 第8周(現代深度學習)
- 主動學習
- 維度降低
- 非參數方法和大數據
- 掌中
- 轉學習
- 避免過度擬合
- 甘斯
視頻講座
- 視頻19-20 https://www.youtube.com/watch?v=a-v5_8VGV0A&list=PLjMXczUzEYcHvw5YYSU92WrY8IwhTuq7p&index=8
- 我關於轉學的視頻
- 講座1-16斯坦福大學https://www.youtube.com/watch?v=vT1JzLTH4G4&list=PL3FW7Lu3i5JvHM8ljYj-zLfQRF3EO8sYv
閱讀作業
項目
- 構建生成對抗網絡以檢測面部
-------------------待完善