1.卸載cuda8.0
Tensorflow 1.6 需要 CUDA9.0,原來裝的是 8.0 。這就需要卸載一個、安裝一個。
官方的方案:
http://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#handle-uninstallation
卸載 CUDA 使用:
$ sudo /usr/local/cuda-8.0/bin/uninstall_cuda_8.0.pl
2.安裝cuda9.0
下載 CUDA 9.0: https://developer.nvidia.com/cuda-release-candidate-download
文件1.6G,文件名字是cuda_9.0.176_384.81_linux.run,文件目錄下打開一個終端
執行如下命令:
sudo sh cuda_9.0.176_384.81_linux.run
可能會出現一個類似使用說明的東西,一直點回車看完就行了,然後會出現一些選項問題,除了Install NVIDIA Accelerated Graphics Driver for linux(因爲已經提前安裝了顯卡驅動,所以這裏選擇不安裝)? 選擇n(no)以外,其他的都選y(yes)就行了,安裝結束後,我們要開始添加環境變量了,首先隨便打開一個終端,執行以下代碼打開環境變量:sudo gedit ~/.bashrc(or .profile)
在 .bashrc 文件末尾處加上CUDA 9.0的環境變量,如下代碼:
export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64$LD_LIBRARY_PATH
點擊右上角的Save(保存)按鍵。
測試CUDA 9.0 是否安裝成功:
打開終端,先cd 到 下面的目錄,再執行 sudo make,接着執行 ./deviceQuery,代碼如下:
~$ cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
/usr/local/cuda-9.0/samples/1_Utilities/deviceQuery$ sudo make
/usr/local/cuda-9.0/samples/1_Utilities/deviceQuery$ ./deviceQuery
出現如下,這就說明,你的CUDA 9.0安裝成功,且環境變量也配置完成了。
3.安裝cuDNN v7
cuDNN v7 for 9.0: https://developer.nvidia.com/rdp/cudnn-download 。官方文檔表示 cuDNN 的升級不會衝突,直接安裝就好。
下載完成後,解壓cuDNN的壓縮文件,名字是cudnn-9.0-linux-x64-v7.tgz,解壓完成後,進行如下代碼操作。
~$ sudo cp cuda/include/cudnn.h /usr/local/cuda-9.0/include
~$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda-9.0/lib64
~$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda-9.0/lib64/libcudnn*
這樣我們就完成了cuDNN 7.0 的安裝。
4.安裝tensorflow1.6
卸載tensorflow1.4:
sudo pip uninstall tensorflow==1.4
隨便打開一個終端,運行代碼,Python 3
sodu pip3 install tensorflow-gpu==1.6
測試tf1.6是否裝好:
Python3
import tensorflow as tf
tf.__version__