Python-深度学习系列10-Ubuntu搭建Cuda环境3060ti
说明
⽔冷的选择: 今天安装的时候听师傅说海魔120漏液他碰到两个case, 整个机器都毁了… 吓得我决定最近买个海盗船…
1 内容
1.1 硬件安装
⼩机箱 or ⼤机箱
⼩机器是在是耗费蛮⼤,⽔冷说最多3年就差不多了
⼤机箱可以⽤风冷,怎么说也⽐较安全
1.2 系统安装
点亮后进⾏系统安装
1.3 ssh连接
直接在机器上操作⽐较⿇烦,因此先切换到远程(假设新机器代号m5),在这⼀步尽量使⽤普通⽤户安装
1 修改root⽤户密码
2 更换镜像源apt_source_set.sh,参考
3 安装⽹络⼯具,查看ip sudo apt install net-tools(不晓得为啥,我竟然需要重启⼀下才能安装)。查到的ip地址为192.168.1.75
4 安装sshd(这样m5就提供了ssh登录服务)。
先⽤whereis sshd查⼀下,结果应该为sshd:
使⽤命令安装sudo apt-get install openssh-server , 再查询时
m5@m5-desktop:~$ whereis sshd
sshd: /usr/sbin/sshd /usr/share/man/man8/
此时在远端(局域⽹内)就可以直接ssh登录了
$ ssh m5@192.168.1.75
The authenticity of host '192.168.1.75 (192.168.1.75)' can't be established.
ECDSA key fingerprint is SHA256:27b4bsNPUmQ4wg6Dd71a+FER3+LuTn0+uKrW3YYxjNk.
Are you sure you want to continue connecting (yes/no)? yes
---
按提⽰输⼊密码就好了
以下均可以在远端m0上操作。
1.4 远端操作
1.4.1 配置root免密登录
这部分可以参考
切换⾄root⽬录,考⼊公钥。
cd /root &&mkdir .ssh &&cd .ssh
echo"ssh-rsa xxx">authorized_keys
配置连接时长
#!/bin/bash
echo "PermitRootLogin prohibit-password">>/etc/ssh/sshd_config
echo "MaxAuthTries 6">>/etc/ssh/sshd_config
echo "ClientAliveInterval 60">>/etc/ssh/sshd_config
echo "ClientAliveCountMax 10">>/etc/ssh/sshd_config
# 重启sshd
systemctl restart sshd.service
此时退出后就可以免密登录了
ssh root@192.168.1.75
1.4.2 安装显卡驱动
此部分主要参考
这次发现了显卡的驱动(估计是在装系统的时候⾃带的)
┌─root@m5-desktop:~
└─ $ lsmod | grep nouveau
nouveau              1892352  0
mxm_wmi                16384  1 nouveau
ttm                  102400  1 nouveau
drm_kms_helper        180224  1 nouveau
drm                  483328  3 drm_kms_helper,ttm,nouveau
i2c_algo_bit          16384  2 igb,nouveau
wmi                    32768  3 wmi_bmof,mxm_wmi,nouveau
ubuntu怎么安装python
video                  49152  1 nouveau
要先禁⽤驱动再安装,
sudo vim /etc/modprobe.f,增加内容
blacklist nouveau
options nouveau modeset=0
#禁⽤nouveau第三⽅驱动,之后也不需要改回来
然后重启
sudo update-initramfs -u #刷新内核
成功了,没出什么⼳蛾⼦
┌─root@m5-desktop:~
└─ $ lsmod |grep nouveau
---⽆输出
使⽤ubuntu-drivers命令,⽆输出
┌─root@m5-desktop:~
└─ $ ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:01.2/0000:02:00.2/0000:03:06.0/0000:08:00.0 == modalias : pci:v00008086d000024FBsv00008086sd00002110bc02sc80i00
vendor  : Intel Corporation
manual_install: True
driver  : backport-iwlwifi-dkms - distro free
参考
add-apt-repository ppa:graphics-drivers/ppa
apt-get update
apt-get install nvidia-430 nvidia-settings nvidia-prime
然⽽没有什么⽤。可能是因为3060ti太新了?
先到驱动(真的是有⼀个版本驱动…),拷到对应⽂件夹下后执⾏
┌─root@m5-desktop:~/downloads
└─ $ ls
NVIDIA-Linux-x86_64-455.45.01.run
# 执⾏安装
chmod a+x NVIDIA-Linux-x86_64-455.45.01.run
sh ./NVIDIA-Linux-x86_64-455.45.01.run --no-opengl-files
过程报错要安装gcc和make。
gcc ,
make,
apt-get install ubuntu-make
sudo apt-get install make
⼿动安装驱动的问题可以参考,谜⼀般的安装
我这⾥跳过了gcc的版本校验,因为apt默认只能7.5的gcc, 7.4的安装太⿇烦了。
简⽽⾔之,就是英伟达驱动使⽤的gcc和你机器上的有着不同的版本。⼀般来说,如果是同⼀个gcc的分⽀,如在这⾥遇到的7.4.0和
7.5.0,使⽤上应该不会有太⼤区别。
强⾏安装后,可以看到驱动安装成功,显⽰没有进程在使⽤(因为之前按telinit 3打算打开⽆显⽰界⾯编辑,结果屏幕⿊了,还好我可以远程):
nvidia-smi
重新启动后再执⾏nvidia-smi,可以看到这时候有输出占⽤了显卡的显存。
1.4.3 安装CUDA
理论上驱动越⾼越好
⽬前3060ti只有⼀款驱动,所以试试看之前的CUDA10.0 + CuDNN7.6.5组合是否依然好⽤。为了避免重新下载,我选择将之前m1已经下好的⽂件转移到m5上。
因为m1是有线⽹络,下⾏速度很快
cuda_10.0.130_410.48_linux.run 100% 1927MB 11.4MB/s 02:48
m5是⽆线⽹络,速度特别慢(1MB/S)
在终端使⽤sudo telinit 3关掉显⽰后,可以从nvida-smi看到确实⽣效了
拷贝完毕后进⼊相关⽬录,执⾏
chmod a+x cuda_10.0.130_410.48_linux.run
./cuda_10.0.130_410.48_linux.run --no-opengl-libs
按着D快速下滑,接受EULA。
选项install nvidia accelerated Graphics Driver,输⼊n,因为我们已经安装了nvidia的驱动。安装过程有缺失包

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。