深度学习——Ubuntu20.04服务器版本系统安装,及NVIDIA显卡驱动和
PyTorc。。。
最近重装了服务器的系统,升级到了Ubuntu 20.04.1 LTS Server版本,同时为了满⾜深度学习对GPU的使⽤需求,安装了NVIDIA显卡驱动和PyTorch环境,在这⾥记录⼀下完整的安装流程。
安装的系统:Ubuntu 20.04.1 LTS Server版本
GPU型号:TITAN XP
1. 使⽤U盘制作启动盘
⾸先我们下载UltraISO软碟通,通过这个软件将系统⽂件刻录到U盘⾥,以制作安装启动盘。打开安装程序,⼀路点击确认,⾃动安装好就可以使⽤了。
接下来,到下载最新LTS版本的系统iso⽂件,LTS意为长期⽀持,会定时发布系统更新。我这⾥选择的是服务器版本ubuntu-20.04.1-live-server-amd64.iso。当然也可以根据⾃⼰的需求选择安装桌⾯版,版本号相同的话,安装的本质内容是相同的。区别在于,桌⾯版有GUI图形界⾯,并且安装了许多服务器版没有的软件,多为个⼈电脑所配置,适合新⼿使⽤;⽽服务器版适⽤于web服务器,服务器版本只能通过命令⾏进⾏操作,需要有⼀定linux基础。
下载好了相应的iso⽂件后,我们需要利⽤UltraISO软碟通软件来将iso⽂件刻录到U盘⾥。在⾃⼰的电脑上插⼊U盘,打开UltraISO软碟通,选择“⽂件>打开”,选择下载好的iso⽂件。再点击“启动>写⼊硬盘镜像”,⾸先对U盘进⾏格式化,写⼊⽅式选择“USB-
HDD+”,点击“便捷启动>写⼊新的驱动器引导扇区”,选择Syslinux,最后点击“写⼊”,等待写⼊完成即可。这样,我们的U盘启动安装盘就制作完成了。
2. 安装Ubuntu系统
将U盘插⼊到服务器的USB接⼝,重启服务器,连续按F11(不同的电脑快捷键不⼀样,请⾃⾏查询)进⼊BOOT启动选项,到并选择我们的U盘启动,⾄此进⼊了安装程序,选择 Install Ubuntu, 回车直接进⼊安装界⾯。
⾸先选择语⾔、键盘布局,这⾥我默认选择了英⽂。接下来根据⾃⼰的情况配置⽹络,也可以先跳过等安装完成后再配置。然后进⼊到分区,我的服务器上有两块硬盘,这⾥我选择⼿动分区。选择空间较⼩的⼀块硬盘(sda)作为系统盘,⾸先选择reformat将硬盘分区重置,最终硬盘空间分配结果为:/boot
分配1GB,/swap分配64GB(这⾥交换空间分配的太多了,具体可以根据⾃⼰的物理内存查合适的swap对应关系),其余空间均分配给根⽬录;同时,将另⼀块1.8T的硬盘(sdb)挂载到/home⽬录,提供给我们创建⽤户使⽤。
配置完分区后,进⼊到设置root账号密码,填写完成后选择安装软件,这⾥我安装了openssh,⽅便之后远程连接。最后,等待系统安装完成出现“finish install”后,选择“reboot now”重启,根据提⽰拔掉U盘,回车,重启后系统成功安装完成。
3. 安装NVIDIA显卡驱动
⾸先我们到NVIDIA官⽹,查适⽤于⾃⼰NVIDIA 产品的驱动程序。
点击DOWNLOAD进⾏下载。
由于我们之前安装了openssh,配置好⽹络后,便可以远程连接服务器进⾏操作。使⽤Xftp将下载好的显卡驱动安装⽂件传到服务器上。使⽤Xshell,通过ssh协议与服务器建⽴连接,进⾏命令⾏操作。远程连接好服务器后,⾸先根据以下命令安装⼀些所需要的依赖,另外缺少什么可以根据提⽰⾃⾏安装。
sudo apt-get update
sudo apt update
sudo apt-get install gcc
sudo apt install lightdm
sudo apt-get install make
sudo apt install nvidia-cuda-toolkit
sudo apt install dkms build-essential linux-headers-generic
禁⽤ nouveau 驱动
sudo vim /etc/modprobe.f
在⽂件末尾加⼊(综合⽹上各种教程)
blacklist rivafb
blacklist vga16fb
blacklist nouveau
blacklist nvidiafb
blacklist rivatv
options nouveau modeset=0
blacklist lbm-nouveau
alias nouveau off
alias lbm-nouveau off
保存并退出
禁⽤ nouveau 内核模块
echo options nouveau modeset=0 | sudo tee-a /etc/modprobe.f
sudo update-initramfs -u
卸载旧版本的nvidia驱动
sudo apt-get --purge remove nvidia-*
重启
sudo reboot
服务器关闭图形界⾯
sudo service lightdm stop
修改⽂件权限,安装驱动
cd /home/software
sudo chmod a+x NVIDIA-Linux-x86_64-450.66.run
sudo ./NVIDIA-Linux-x86_64-450.66.run -no-x-check -no-nouveau-check -no-opengl-files
安装过程中遇到的问题选择
1. Would you like to register the kernel module sources with DKMS? This will allow DKMS to automatically build a new
module, if you install a different kernel later. ——NO
2. Install NVIDIA’s 32-bit compatibility libraries?——NO
3. Would you like to run the nvidia-xconfig utility to automatically update your X configuration file so that the NVIDIA X
driver will be used when you restart X? Any pre-existing X configuration file will be backed up. ——YES
安装完毕,重启
sudo reboot
挂载驱动
modprobe nvidia
nvidia-smi
出现如下界⾯,安装成功
4. 安装Anaconda和Pytorch
到,根据⾃⼰的系统下载对应的Anaconda安装包,我这⾥下载的是Anaconda3-2020.07-Linux-x86_64.sh,并把它放到服务器上,通过如下命令运⾏。
sudo bash Anaconda3-2020.07-Linux-x86_64.sh
空格跳过⽂字,选择安装⽬录
[/root/anaconda3] >>> /usr/anaconda3
安装完成后,修改环境变量,输⼊
sudo vim /etc/profile
在末尾添加 export PATH="/usr/anaconda3/bin:$PATH"
保存并退出,更新系统环境变量
source /etc/profile
在命令⾏输⼊python3,出现以下信息表⽰安装成功
添加清华镜像源,避免以后下载环境过程中,出现下载过慢的情况
conda config --add channels mirrors.tuna.tsinghua.edu/anaconda/pkgs/free/
conda config --add channels mirrors.tuna.tsinghua.edu/anaconda/pkgs/main/
conda config --set show_channel_urls yes
输⼊命令,查看cuda版本号
nvcc -V
到,选择相应的pytorch版本、系统版本、安装⽅式、语⾔和cuda版本,下⽅会⾃动⽣成安装命令。
在命令⾏输⼊
conda install pytorch torchvision cudatoolkit=10.1 -c pytorch
即可进⾏pytorch的安装。
注意:这⾥末尾添加的"-c pytorch"是使⽤pytorch官⽅的通道进⾏下载,但是经常出现下载速度过慢导致⽆法下载完成的情况,这⾥还可以考虑去掉"-c pytorch"使⽤清华镜像源下载。如果需要下载的版本在清华镜像源⾥没有到,那么可以从官⽹下载离线的pytorch安装包,我这⾥选择了pytorch-1.6.0-py3.8_cuda10.1.243_cudnn7.6.3_0.tar.bz2,将安装包传到服务器上,通过以下命令来安装:
conda install --offline pytorch-1.6.0-py3.8_cuda10.1.243_cudnn7.6.3_0.tar.bz2
安装完成后,通过以下命令进⾏检查,出现以下界⾯则pytorch安装成功

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。