colab中⽤tensorflow-1.14.0的gpu版本训练数据集
本⼈在跑⼀个⼈脸识别的项⽬时,在⾃⼰的笔记本上配置好了cuda9.0和cudnn后还是⽆法运⾏,原因是此代码不能在Windows系统上运⾏,于是千⾟万苦在Google Drive上克隆了GitHub上的源代码尝试,以为也要下载与电脑版本对应的cuda9.0等,发现⼀直报错,提⽰libcudart.so.9.0:cannot open shared object file。最后才发现⼈家Google Drive⾃带了cuda10.1,查看的代码如下:
!cat /usr/local/
# 输出:CUDA Version 10.1.243
然后我觉得我应该还要与电脑匹配,于是乎⼜把cuda降级到9.0版本,代码如下:tensorflow版本选择
!wget developer.nvidia/compute/cuda/9.0/Prod/local_installers/cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64-deb
!dpkg -i cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64-deb
!apt-key add /var/cuda-repo-9-0-local/7fa2af80.pub
!apt-get update
!apt-get install cuda=9.0.176-1
然后我按照GitHub上的安装要求,⼜安装了tensorflow==1.14.0的gpu版本(colab上安装时需要将笔记本设置更改为gpu模式,否则会报错,好像是⾃带的属性⼀样),发现再⼀次报错:
MXNetError: [01:23:15] src/operator/nn/./cudnn/cudnn_convolution-inl.h:155: Check failed: e ==
CUDNN_STATUS_SUCCESS (8 vs. 0) : cuDNN: CUDNN_STATUS_EXECUTION_FAILED
然后⼜去查询,发现tensorflow的gpu版本需要⼀些⽀持,如:
TensorFlow GPU ⽀持需要各种驱动程序和库。为了简化安装并避免库冲突,建议您使⽤(仅限 Linux)。此设置仅需要 。
然后再点击,就会发现如下的图:
所以,我现在应该要再去修改,把cuda降级到10.0的版本,因为好像看到有⼈说tensorflow的1.14.0版本最好匹配cuda10.0,否则会有发⽣报错的风险。
!pip install mxnet-cu100
import mxnet as mx
⼀般可以在安装完之后import试试,如果报错就继续改,否则代⼊最终的代码也会卡住。给⼤家看看我最终的输出结果,是输出了两张⼈脸的图像质量:
太激动啦!哈哈哈哈。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。