RTX3060Tensorflow2.4.1+cuda11.1+cudnn8.0.5配置教程吐槽
RTX3060出来已经有⼀段时间了,但是tensorflow配置教程来说相对较少,之前笔者直接使⽤conda命令安装了tensorflow2.1.0版本,测试gpu是否可⽤时,显⽰的是可⽤,且代码也可以运⾏,不会报错(jupyter上运⾏的,pycharm上没有试过)。但训练模型时,val_loss⼀直都很⼤,不是⼏位数,是⼗多⼆⼗位数的损失,且训练出来的模型⼀直是⼀条没有变化的直线。起初⼀直认为是模型的原因,后来发现同样的环境(tensorflow、python等等版本都相同),在其它电脑上完美运⾏,控制变量法就是显卡的锅。
1.版本关系
直接说版本关系吧!
tensorflow2.4.1 + cuda11.1 + cudnn8.0.5
和同学交流⼀下,RTX3090同样适合该版本。
2.cuda下载、安装
根据⾃⼰电脑配置选,然后点下载。
下载完成后推荐安装就可以了,安装位置默认。
3.Cudnn下载、安装
cudnn⽂件
将cudnn⾥⾯的三个⽂件夹复制到cuda安装⽬录,然后全部替换掉。cuda默认安装话,安装⽬录如下图:
cuda安装⽂件夹
4.环境变量配置
下⾯是环境变量配置,在系统中添加以下 5个 环境变量:
CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.1 (cuda默认安装的话就是这个路径)CUDA_LIB_PATH = %CUDA_PATH%\lib 64
CUDA_BIN_PATH = %CUDA_PATH%\bin
CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\win64
CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib 64
在环境变量Path中添加:
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.1\common\lib 64 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\lib 64
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.1\bin\win64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\bin
⾸先安装anaconda,安装教程⽹上很多,此处不再赘述。
点击开始按钮,在开始中到anaconda,选中anaconda Prompt(anaconda3)
在prompt中输⼊命令,新建⼀个名为tf的虚拟环境,(tf为虚拟环境名称,可以随便改)conda create -n tf python==3.7.9
虚拟环境建⽴完成后,在命令框中输⼊activate tf,就切换到了tf环境下
此时输⼊命令pip install tensorflow-gpu==2.4.1
接下来就是漫长的安装等待,(要是你有科学上⽹⼯具可能快⼀点,但是有可能需要先将pip降低版本,之前我pip版本是20.1.0,我使⽤命令python -m pip install pip==20.0.1 降低了pip版本),安装完成后,关闭。
6.测试
笔者是在pycharm上运⾏的,(记得将pycharm下⼯程的解释器选择到tf环境下,pycharm使⽤就不讲了),测试程序为:
import tensorflowas tf
若输出为下⾯:
有个警告Could not load dynamic library 'cusolver64_10.dll'; dlerror: cusolver64_10.dll not found,直接进⼊到C:\Program
Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\bin到cusolver64_11.dll,将其重命名为cusolver64_11.dll就可以了。(如果没有cusolver64_11.dll,同理,到前缀相同的,把后⾯替换为10),完成后再运⾏测试程序:
pycharm安装教程和使用⾄此,安装完成
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论