CS231n 斯坦福李飛飛視覺識別課程

本文是個人在學習《CS231n 斯坦福李飛飛視覺識別課程》的學習筆記。

第一講:課程簡介

課時1 計算機視覺概述
課時2 計算機視覺歷史背景
課時3 課程後勤

選讀書籍《DeepLearning》
軟件包: TensorFlow, Torch, PyTorch
先修條件:Python, NumPy, 微積分, 線性代數, 計算機圖像, 機器學習,
課程網站: http://cs231n.stanford.edu/(作業,資源)

第二講:圖像分類

課時4 數據驅動方法
作業一:
1.實現自己的K-最近鄰分類器(KNN)
2.實現幾種不同的線性分類器(SVM, Softmax)
3.實現兩層神經網絡分類器
(運用Python, NumPy, Matlab, 谷歌雲)

數據驅動思路: 收集圖片數據集->訓練機器分類這些圖片->機器以某種方式總結分類規則生成模型->用訓練出來的模型識別新的圖片

算法過程: 訓練函數(接收圖片和標籤)->訓練出模型->預測函數(接收模型和測試圖片)

CIFAR-10數據集(5萬張訓練數據圖平均分成10個不同類別, 1萬張額外測試圖片)

L1距離(曼哈頓距離): 用來比較兩幅圖像,每一個對應像素的差值的絕對值的總和
在這裏插入圖片描述
最近鄰算法思路: 訓練函數->訓練出模型->預測函數(用L1距離比較測試圖片與哪幅訓練圖片最接近,

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章