跑tensorflow項目時遇到了該問題
計算機配置
RTX2080 super,ubuntu16.04,tensorflow-gpu1.8,cuda9.0,cudnn7.6.4
(方法一)針對有人說是還有其他程序佔用着GPU
報錯信息(貼出最主要的兩條):
tensorflow.python.framework.errors_impl.InternalError: Failed to create session
failed to run cuBLAS routine cublasSgemm_v2: CUBLAS_STATUS_EXECUTION_FAILED
#判斷顯存佔用,報錯並關閉session
if 'session' in locals() and session is not None:
print('Close interactive session')
session.close()
#分配顯存
import os
os.environ["CUDA_VISIBLE_DEVICES"] = '0' #use GPU with ID=0
config = tf.ConfigProto()
config.gpu_options.per_process_gpu_memory_fraction = 0.5 # maximun alloc gpu50% of MEM
config.gpu_options.allow_growth = True #allocate dynamically
但是結果還是報錯,其實之前已經用
nvidia-smi
查看了顯卡信息,是沒有其他程序運行的,於是又查了下相關資料
CUDA問題
上邊已經介紹了環境配置,其實問題就出在這裏,當初下載CUDA的時候,只下載安裝了CUDA9.0,而沒有安裝其升級包,這其實也是CUDA自己的問題,後邊出了最新的更新包,升級CUDA9.0到最新就解決了該問題。你如果下載不來,可以從此處下載,提取碼:3a0s。
參考文章
[1]https://blog.csdn.net/sinat_30372583/article/details/79461468
[2]https://blog.csdn.net/thunder_k/article/details/90610218?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1&utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1