日誌

2019.10.31

一、在筆記本安裝caffe環境
參考鏈接:https://blog.csdn.net/weixin_37621229/article/details/80547934
1.在筆記本安裝了CUDA10.1,Cudnn10.1,並配置環境變量

2.windows下需要用vs對caffe進行編譯,因此下載安裝vs2013,耗時較長

3.vs2013編譯libcaffe出錯:error : too few arguments in function call,原因,cudnn版本過高,參考網上教程修改cudnn部分代碼
參考鏈接:https://blog.csdn.net/mao_hui_fei/article/details/80326464

4.重新編譯仍然出錯:incompatible with your Protocol Buffer headers.  Please update    d:\caffe-master\caffe-master\include\caffe\proto\caffe.pb.h    13    2    libcaffe
版本不兼容,參考網上教程註釋掉報錯相關代碼
參考鏈接:https://blog.csdn.net/chenkjiang/article/details/15809407

5.重新編譯,報錯:IntelliSense:  不是類名或結構名    d:\caffe-master\caffe-master\include\caffe\proto\caffe.pb.h    661    26    libcaffe

6.刪除源碼重新編譯,報錯:未能從程序集 D:\caffe-master\NugetPackages\OpenCV.2.4.10\build\native\private\coapp.NuGetNativeMSBuildTasks.dll 加載任務“NuGetPackageOverlay”。
未能加載文件或程序集“file:///D:\caffe-master\NugetPackages\OpenCV.2.4.10\build\native\private\coapp.NuGetNativeMSBuildTasks.dll”或它的某一個依賴項。
系統找不到指定的文件。 請確認 <UsingTask> 聲明正確,該程序集及其所有依賴項都可用,並且該任務包含實現 Microsoft.Build.Framework.ITask 的公共類。

7.卸載opencv2.4.10,安裝opencv2.4.11,並修改pencv的配置文件OpenCV.props
參考鏈接:https://www.cnblogs.com/yamin/p/8596748.html

8.初步懷疑是CUDA、cudnn版本過高,網絡教程使用CUDA8.0,實際使用版本爲CUDA10.0,降低CUDA版本爲8.0,安裝時報錯,CUDA與顯卡不匹配,顯卡版本高無法使用8.0低版本CUDA,
修改CUDA版本爲9.0,編譯同樣出錯,錯誤類型--同上!

9.在VS2013中自己配置opencv,重新編譯,成功,問題解決
參考鏈接:https://bbs.csdn.net/topics/392062086

10.測試mnist數據集轉爲lmdb,失敗,需要先將下載好的數據集(.gz)解壓

11.仍然失敗,原因,忘了加空格,加入空格,轉換成功

12.訓練失敗 報錯Check failed: status == CUDNN_STATUS_SUCCESS (8 vs. 0)  CUDNN_STATUS_EXECUTION_FAILED

13.版本兼容性問題,重新安裝CUDA9.2,CUDnn7.4,重新編譯,問題解決
二、安裝了notepad++

2019.11.1

一、安裝pycaffe
1.安裝anconda2
2.編譯報錯:無法找到python2.7d.lib,VS切換成release模式,重新編譯
3.報錯,找不到libcaffe,重新在release編譯libcaffe,再編譯pycaffe,編譯成功
4.將編譯好的pycaffe文件夾複製到python安裝路徑下,即D:\anconda,在python2.7下import caffe,成功。
5.運行caffe-Mobilenet-SSD報錯Message type "caffe.LayerParameter" has no field named "permute_param".,查資料發現,caffe版本不對,崩潰!
6.配置可運行SSD的caffe框架
參考鏈接:https://github.com/runhang/caffe-ssd-windows
7.安裝Cmake
8.不可用,改變戰術
9.根據鏈接https://blog.csdn.net/malvas/article/details/84068173安裝caffe-ssd。
10.心態爆炸,再不行我就得裝雙系統了
11.崩潰,裝雙系統吧
12.裝了雙系統ubuntu16.04,無法使用wifi,查詢資料,低版本系統沒有新網卡驅動,升級系統到18.04,問題解決

2019.11.2

ubuntu18.04安裝caffe-ssd
1、安裝顯卡驅動
2、安裝CUDA10、CUDnn7.6.3
3、配置Caffe-SSD-GPU
參考鏈接:https://blog.csdn.net/CAU_Ayao/article/details/84000151
4.主分區分配存儲太小,需要擴容
5.編譯出錯Makefile:570: recipe for target '.build_release/lib/libcaffe.so.1.0.0-rc3' failed
安裝依賴庫重新編譯
參考鏈接:https://blog.csdn.net/CAU_Ayao/article/details/84023510
6.編譯python版本出錯Check failed: error == cudaSuccess (30 vs. 0)  unknown error
Makefile修改CUDA_ARCH,參考鏈接:https://blog.csdn.net/u010167269/article/details/50703923
把其餘的都註釋掉,增加一行自己顯卡與之相對應計算能力的設置:
CUDA_ARCH := -gencode arch=compute_75,code=compute_75
英偉達GPU算力評估表格:https://blog.csdn.net/iefenghao/article/details/97956440
7.仍然報相同錯誤,查詢資料發現是顯卡驅動問題,使用nvidia-smi
報錯failed to initialize nvml driver/library version mismatch ubuntu
嘗試重啓機器,再使用nvidia-smi成功
參考鏈接:https://blog.csdn.net/jiandanjinxin/article/details/80688900
再次編譯runtest 成功
訓練VOC數據集
參考鏈接:https://blog.csdn.net/la_fe_/article/details/84928958
8.先運行caffe-ssd/data/VOC0712/create_list.sh,修改root_dir爲自己的數據集路徑
root_dir=/home/zimu/caffe-ssd/data/VOC0712/VOCdevkit/
create_data.sh中data_root_dir爲生成的lmdb文件
dataset_name爲數據集的名字
22.訓練時出現training error: Data layer prefetch queue empty
這種問題出現通常是註釋掉 CHECK_LE(a, b) 出現Data layer prefetch queue empty。導致程序出現死循環。
解決辦法修改src/caffe/util/sampler.cpp,如下面修改代碼所示//renew註釋下,加入兩個判斷,使得bbox長寬不要越界。
參考鏈接:https://blog.csdn.net/LuohenYJ/article/details/88416180

2019.11.3

1.今天來到後發現訓練又報錯了,懷疑是電腦休眠的問題,重新訓練VOC數據集
2.學習更改文件中的超參數,如迭代次數,batch等
3.學習顯示出loss曲線
4.訓練迭代10000次出錯Check failed: error == cudaSuccess (2 vs. 0)  out of memory
嘗試減小batch大小,問題解決,顯卡顯存過小,無法使用較大batch
5.使用solverstate繼續訓練,在訓練的時候加入-snapshot=snapshot/mobilenet_iter_12588.solverstate
參考鏈接:https://blog.csdn.net/baidu_32173921/article/details/72470019
6.學習驗證集和測試集的區別
7.交叉驗證法,BN層的作用
8.保存訓練日誌 GLOG_logtostderr=0 GLOG_log_dir='xxx/xxx/xxx/'
參考鏈接:https://blog.csdn.net/xunan003/article/details/73017436

發佈了49 篇原創文章 · 獲贊 39 · 訪問量 9萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章