本文是個人在學習《CS231n 斯坦福李飛飛視覺識別課程》的學習筆記。
第一講:課程簡介
課時1 計算機視覺概述
課時2 計算機視覺歷史背景
課時3 課程後勤
選讀書籍《DeepLearning》
軟件包: TensorFlow, Torch, PyTorch
先修條件:Python, NumPy, 微積分, 線性代數, 計算機圖像, 機器學習,
課程網站: http://cs231n.stanford.edu/(作業,資源)
第二講:圖像分類
課時4 數據驅動方法
作業一:
1.實現自己的K-最近鄰分類器(KNN)
2.實現幾種不同的線性分類器(SVM, Softmax)
3.實現兩層神經網絡分類器
(運用Python, NumPy, Matlab, 谷歌雲)
數據驅動思路: 收集圖片數據集->訓練機器分類這些圖片->機器以某種方式總結分類規則生成模型->用訓練出來的模型識別新的圖片
算法過程: 訓練函數(接收圖片和標籤)->訓練出模型->預測函數(接收模型和測試圖片)
CIFAR-10數據集(5萬張訓練數據圖平均分成10個不同類別, 1萬張額外測試圖片)
L1距離(曼哈頓距離): 用來比較兩幅圖像,每一個對應像素的差值的絕對值的總和
最近鄰算法思路: 訓練函數->訓練出模型->預測函數(用L1距離比較測試圖片與哪幅訓練圖片最接近,