关于CUDA,cuDNN,TF,CUDA驱动版本兼容问题

摘要:
基本概念CUDA:用于GPU编程的语言,跑TF的时候用了GPU,TF里面很多函数是CUDA语言编写的。不同TF版本需要不同的CUDA。CUDA版本必须和cuDNN版本匹配。个人经验,别用太新的,如果每次都用最新的,那么进而导致CUDA也要不断更新NVIDIA驱动版本:保持最新就好了,NVIDIA驱动版本要求和CUDA版本匹配,而CUDA又要求cuDNN/TF是匹配的。不过NVIDIA驱动版本是向下兼容的,所以保持最新就没事。

实际工作当中,经常维护好几个项目的代码,不同项目依赖的TF版本不一致问题。网上找了好多资料,但是每次遇到的问题都不一样,每次都要去查(就是是一样的问题,解决办法也可能会不一样)每次踩坑无数,今天痛定思痛,下决心总结一下。

基本概念
  • CUDA:用于GPU编程的语言,跑TF的时候用了GPU,TF里面很多函数(或者依赖库)是CUDA语言编写的。不同TF版本需要不同的CUDA。
  • cuDNN:NVIDIA为深度学习,矩阵运算写的一个加速库。CUDA版本必须和cuDNN版本匹配。cuDNN和TF版本匹配与否则无所谓(不过CUDA和TF版本必须匹配,所以cuDNN版本和TF版本是间接依赖关系)。
  • TF:这个没什么好说的。个人经验,别用太新的,如果每次都用最新的,那么进而导致CUDA也要不断更新
  • NVIDIA驱动版本:保持最新就好了,NVIDIA驱动版本要求和CUDA版本匹配,而CUDA又要求cuDNN/TF是匹配的。不过NVIDIA驱动版本是向下兼容的,所以保持最新就没事。输入nvidia-smi可以查看:

  • 关于CUDA,cuDNN,TF,CUDA驱动版本兼容问题第1张
工作当中改如何做?
  • 尽量保持最新的CUDA驱动版本
  • 维护多个cuda版本:cuda安装到/usr/local/目录下,可以通过命令切换不同版本
sudo rm -rf /usr/local/cuda #删除之前创建的软链接
sudo ln -s /usr/local/cuda-8.0 /usr/local/cuda #创建新 cuda 的软链接
  • 将cuDNN和CUDA解耦:说白了就是,二者单独存放,不要混在一起。切换cuDNN只需要在~/.bashrc文件里面设置如下即可:
# 在.bashrc文件里面写入该环境变量,切换cudnn只需要把cudnn设置到/root/cuda路径即可
export LD_LIBRARY_PATH=/root/cuda/lib64:$LD_LIBRARY_PATH
  • TF版本别用太新的:使用pip install tensorflow-gpu=1.x.0安装
  • 遇到问题不要无脑google:先自行分析原因,尝试办法,然后再google。

免责声明:文章转载自《关于CUDA,cuDNN,TF,CUDA驱动版本兼容问题》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇span标签间距图文讲解如何在outlook里设置绑定Gmail企业邮箱教程下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

计算机组成原理 — GPU 图形处理器

目录 文章目录 目录 显卡 GPU GPU 与深度学习 GPU 与 CPU 体系结构的区别 GPU 显存与 CPU 主存的区别 GPU 与 CPU 之间的数据交互方式 GPU 的体系结构 GPU 的工作原理 GPU 的关键参数 CUDA 编程模型 CUDA 的架构 CUDA 的核心概念 CUDA 的工作原理 云主机显卡的实现方式 虚拟显卡...

使用Docker GPU训练环境安装过程中所碰到的问题

输入下条命令,查看你的显卡驱动所使用的内核版本 cat /proc/driver/nvidia/version 输入下条命令,查看电脑驱动 cat /var/log/dpkg.log | grep nvidia 输入下条命令,查看电脑所有驱动 sudo dpkg --list | grep nvidia-* 问题1: root@4f80b64fe9f6:/...

组装自己的tesla超级计算机

原文链接:blog.csdn.net/xqj198404/article/details/20016279 NVIDIA链接:http://www.nvidia.cn/object/tesla_build_your_own_cn.html 组装属于您自己的Tesla个人超级计算机 如何打造属于你自己的Tesla个人超级计算机系统 本指南将帮助你组装一...

NVIDIA深度架构

NVIDIA深度架构 本文介绍A100 GPU,NVIDIA Ampere架构GPU的重要新功能。  现代云数据中心中运行的计算密集型应用程序的多样性推动了NVIDIA GPU加速的云计算的爆炸式增长。此类密集型应用程序包括AI深度学习(DL)训练和推理,数据分析,科学计算,基因组学,边缘视频分析和5G服务,图形渲染,云游戏等。从扩展的AI训练和科学计算,...

CUDA driver version is insufficient for CUDA runtime version 解决

配置ubuntu17.1+CUDA9.2的caffe环境,CUDA sample编译完成,执行到./deviceQuery时报错:CUDA driver version is insufficient for CUDA runtime version 查看CUDA toolkit releaseNote,发现CUDA版本对显卡驱动版本有要求:  https...

编译caffe的诸多注意事项

1.cudnn版本不匹配 首先第一步,编译caffe_train-master就遇到了问题:   但是在同样的环境下(CUDA8.0  +  cudnn-8.0-linux-x64-v6.0)编译官方的caffe-master 就正常通过了:   很显然就是cudnn版本的问题了,但是不巧的是NVIDIA官网在维护,无法下载cudnn5;从同学那里拷贝...