Ubuntu pytorch安裝(GPU)及NVIDIA顯卡驅動安裝知識總結

首先是重要參考文章
https://www.jb51.net/article/146555.htm
回頭慢慢寫
https://www.cnblogs.com/ranxf/p/9412242.html
https://www.jianshu.com/p/ea169536850f

先明確幾個概念,我是爲了裝GPU加速的pytorch跑神經網絡的,結果以爲就是裝個顯卡驅動,事實證明做事前花一分鐘想想是必要的。
下面第一步是不需要的(直接安裝NVIDIA顯卡驅動),當然失敗也是收穫,講一下如何安裝驅動(我裝完卸載了)(重要參考文章https://www.jb51.net/article/146555.htm):

  1. 禁用Nouveau顯卡驅動
    在進入grub啓動界面時,10秒內使用↑↓鍵選中Ubuntu,按e鍵進行編輯,在倒數第二行quiet slash後添加acpi_osi=linux nomodeset
quiet slash acpi_osi=linux nomodeset

該方法只是暫時禁用Nouveau顯卡驅動,在進入桌面後需要在grub的配置文件裏面更改已使得其永久有效,在命令行中輸入如下命令:

$ sudo gedit /boot/grub/grub.cfg

2.使用標準Ubuntu倉庫進行自動化安裝

(1)檢測你的NVIDIA顯卡型號和推薦的驅動程序的模型。在命令行中輸入如下命令:

$ ubuntu-drivers devices

找到recommend這一項對應的版本號
我的建議安裝的是nvidia-440版本驅動,然後繼續在命令行輸入:

$ sudo ubuntu-drivers autoinstall

將會自動安裝所推薦的nvidia-440版本驅動

安裝過程中,可能會提示需要secure boot,按照默認一步步來即可(我在哪個博客中看到需要先在BIOS中禁用secure boot,我就禁用了,所以我在這裏什麼都沒操作)

至此,Nvidia驅動安裝完成,重啓後即可生效(備註:需要重啓!然後輸入nvidia-smi即可查看對應信息)另外:Linux裏面,輸入命令以後沒有異常輸出,error或者warning,或者沒有輸出就是最好的輸出,只是提醒一下)

然後在下一篇博客裏面我看到安裝cuda-tookit(給pytorch GPU加速用的主要結構)需要卸載掉驅動,於是我又sudo apt-get remove --purge nvidia-*後來發現其實可以不用卸載(在安裝cuda的時候在安裝驅動時選擇no,當然如果卸載掉的話,安裝cuda時一路回車就好(cuda裏面包含了顯卡驅動)),重要參考文章:(https://blog.csdn.net/m0_37518259/article/details/80983024):
官網下載CUDA驅動,官網鏈接:here。請注意,要下載.deb文件。當選擇好文件後,官網會給出相應的Installation instructions,照着來沒錯。(我也是按照這樣做的,下面有五六句命令即可安裝完畢,但是下面的驗證我沒有通過不知道爲什麼,提示我需要安裝,我也懶得管了,因爲後面發現別人博客自己編譯,不選擇deb,而是選擇了runfile(local)的貌似都通過了,但是影響不大,我最後驗證了pytorch GPU可以使用。大家有知道的可以評論解釋一下,感謝。

Command 'nvcc' not found, but can be installed with:

sudo apt install nvidia-cuda-toolkit

接下來驗證安裝結果,報錯說明沒安裝成功。

nvcc -V

接下來參考博客就直接區莊pytorch了,如下:
到PyTorch官網(here)下載pytorch安裝包或直接使用命令安裝,請注意科學上網:),然後檢查顯卡是否可用:

python
    >>> import pytorch
    >>> print(torch.cuda.is_available())

返回true說明安裝成功。
但是我又去安裝了cudnn,(手動狗頭,我現在也不知道爲什麼要裝這個)重要參考文章:https://www.jianshu.com/p/ea169536850f
https://blog.csdn.net/u010801439/article/details/80483036我是看的第二個做的:cuDNN安裝步驟

接下來我們安裝cuDNN
在下載cuDNN之前,我們需要註冊一個賬號

cuDNN is freely available to members of the Accelerated Computing Developer Program

註冊完賬號後我們選擇下載
選擇cuDNN v5.1 Library for Linux

安裝cuDNN非常簡單,我們只需解壓下載的包,並將其拷貝到lib64和include這兩個目錄即可

$ cd ~
$ tar -xzvf cudnn-8.0-linux-x64-v5.1.tgz
$ cd cuda
$ sudo cp lib64/* /usr/local/cuda/lib64/
$ sudo cp include/* /usr/local/cuda/include/
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h   /usr/local/cuda/lib64/libcudnn*

恭喜你! cuDNN 已經安裝成功,解釋一下,解壓完就是cuda這個文件夾,進行一下複製和授權
接下來就可以安裝相應的軟件,如:anaconda,pycharm tensorflow 等。。。當然之前安裝也是沒有毛病的。

最後的pytorch安裝,重要參考博客https://blog.csdn.net/red_stone1/article/details/78727096
當然其實就是打開PyTorch官網:
PyTorch

應該會自動讀取你機器版本以及cuda的版本等等,直接運行它給的conda命令即可(需要提前安裝好anaconda)

conda install pytorch torchvision cudatoolkit=10.1 -c pytorch

進去一看就知道了,沒有截圖工具就不截圖了。

查看顯卡信息相關命令:
https://www.cnblogs.com/ranxf/p/9412242.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章