Linux服务器重启后nvidia-smi⽆法使⽤的解决⽅法
服务器上的nvidia显卡驱动⽤的好好的,突然有⼀天,服务器断电了,然后恢复之后发现常⽤的nvidia-smi命令⽆法使⽤了,具体显⽰什么⽆法建⽴和驱动器的通信之类的,上⽹查了⼀堆,发现问题的核⼼:linux服务器重启之后有时候内核更新了,这时候系统会⾃动更新内核,那么原来的nvidia驱动器的版本就跟不上内核的版本了。⾃⼰设置启动内核是⼀种解决⽅法,另⼀种解决办法是更新nvidia驱动,如果原来是⽤.run⽂件安装的(推荐这种安装⽅式),那么解决⽅法:
⾸先卸载原来安装的驱动: sh NVIDIA-Linux-x86_64-410.73.run --uninstall
然后到nvidia显卡驱动官⽹查询⾃⼰显卡型号对应的驱动.run⽂件,官⽹上的是最新的。
然后给新的⽂件赋予权限:chmod u+x NVIDIA-Linux-x86_64-410.73.run
然后安装 sh NVIDIA-Linux-x86_64-430.26.run --kernel-source-path=/usr/src/kernels/3.10.0-957.12.1.el7.x86_64
这个kernel-source-path根据⾃⼰的内核来,查看就是uname -r能查看到现在的内核。
服务器安装过程中基本上按照默认就⾏,就有⼀个地⽅提⽰之前的依赖⽂件存在⼀部分(可能是卸载的时候没有卸载⼲净),选择安装新的并覆盖原来的就⾏了。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。