TensorFlow2.1 Ubuntu 19.10遇坑記錄

前言

之前用Windows版的跑過一邊,一路暢通毫無阻攔。然後換到ubutnu上,一直報cudnn初始化失敗,這裏記錄我遇到或者網上存在我沒用過的解決辦法。版本古老的我就不記錄了!

顯卡被佔用

當在另一個pycharm或者jupyter lab啓動內核在跑時,cudnn應該是被佔用了,這屬於疏忽大意級別,一般不是小白很快能自己解決,80%遇到這個問題都是這個原因。

nv緩存問題

這個沒遇到過,網上說sudo rm -rf ~/.nv這條語句有奇效的不在少數,我曾多次使用也沒解決,應該症狀相似,病根不對。

cuda遇cudnn版本不匹配

屬於小白問題,第一次搭建環境可能會出,細心一點看到官網軟件上的版本號匹配說明還是很容易避免的,按道理網上不應該充斥這種解決辦法。

顯存問題

我這次遇到的是這個,網上也有不少,但是相對於上兩種只能算少之又少,最重要的是很大一部分還停留在1.x時代,而2.x與1.x差別還是很大的。解決辦法是在代碼上加上這句tf.config.experimental.set_memory_growth(tf.config.list_physical_devices('GPU')[0], True)啓用顯存的增量式分配(以前看到過這個,但是都是在明確顯示顯存不足時的解決辦法,避免tf把顯存直接佔滿,從來沒用過,一般顯存不足都是降低batch_size,或者tf自己警告自己能解決的那種)。

坑都踩過了,過程是痛苦的,然後如釋重負繼續往前邊的坑上去踩,希望也能給你帶來幫助。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章