Failed to initialize NVML: Driver/library version mismatch.

摘要:
由于内核mod的英伟达驱动程序版本没有更新,因此出现了驱动程序/库版本不匹配的问题。卸载英伟达kernelmodreloadnvidia kernelmod的两个步骤是sudormnvidia sminvidia smi。如果找不到kernelmod,将自动加载它。通常,您会遇到卸载失败。

服务器更新nvidia driver 版本之后,经常会出现

 
1
Failed to initialize NVML: Driver/library version mismatch

这个问题出现的原因是kernel mod 的 Nvidia driver 的版本没有更新,一般情况下,重启机器就能够解决,如果因为某些原因不能够重启的话,也有办法reload kernel mod。

简单来看,就两步

  1. unload nvidia kernel mod
  2. reload nvidia kernel mod

执行起来就是

  1. sudo rmmod nvidia
  2. sudo nvidia-smi

nvidia-smi 发现没有 kernel mod 会将其自动装载。

但是事情远远不是这么简单,一般情况下都会遇到卸载失败。

 
1
2
$ sudo rmmod nvidia
rmmod: ERROR: Module nvidia is in use by: nvidia_modeset nvidia_uvm

这时,就要一点一点的卸载整个驱动了,首先要知道现在kernel mod 的依赖情况,首先我们从错误信息中知道,nvidia_modeset nvidia_uvm 这两个 mod 依赖于 nvidia, 所以要先卸载他们

 
1
2
3
4
5
$lsmod | grep nvidia
nvidia_uvm            647168  0
nvidia_drm             53248  0
nvidia_modeset        790528  1 nvidia_drm
nvidia              12144640  152 nvidia_modeset,nvidia_uvm            12144640  152 nvidia_modeset,nvidia_uvm

可以看到 nvidia 被使用了152词,我们可以先卸载 nvidia_uvm 和 nvidia_modeset

先查看下有哪些进程使用了 nvidia*

 
1
sudo lsof -n -w  /dev/nvidia*

这些进程有个了解,如果一会卸载失败,记得关闭相关进程。

卸载

 
1
2
sudo rmmod nvidia_uvm
sudo rmmod nvidia_modeset

再 lsof 一遍,如果 nvidia 的使用 Used by 还没有降到 0,kill 相关进程

最后

 
1
2
sudo rmmod nvidia
nvidia-smi

收工

原创文章,转载请注明(最好把图片带走): 转载自Comzyh的博客

本文链接地址: 解决Driver/library version mismatch

免责声明:文章转载自《Failed to initialize NVML: Driver/library version mismatch.》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇php生成二维码Hadoop 序列化下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

运行软件出现:模块“msvcp110.dll”已加载,但找不到入口点DllRegister

根据百度大多数回答来说 1:先是出现   无法启动程序,因为计算机丢失mfc110.dll 尝试重新安装该程序以解决问题   错误处理:下载或者在别人电脑上拷一份 如:'msvcp110.dll‘ 这类文件然后复制粘贴到系统盘即使/C/windows/system32或者64位系统就放到syswow64     楼主亲测是不能成功的。至少大多数情况是这样...

oracle 解锁用户被锁住

1、通常我们遇到oracle用户密码输入多次错误,那么改用户就会变锁定,那么解决方法很简单,如下: 使用plsql工具sys用户登录(亦可dos命令输入:sqlplus / as sysdba ) 解锁 ALTER USER 用户名 ACCOUNT UNLOCK; 2、那么遇到这种用户会被锁的情况,我们可以设置用户密码无限次尝试登录,而该用户不会被锁定:...

开关电源使用

最近与衡孚电源和周立功电源沟通,了解到一些电源使用情况。 温度影响。低温在允许范围内,对电源无影响,高温大于60℃时,效率降额为70%。 裕度考虑。正常情况下可100%工作,但为适应各种情况,最好有20%余量。 过载保护,有打嗝模式,有关断模式,是因为大功率时更注重安全,所以一般情况下大功率都是关断模式。此外,两种处理方式是因为内部电路事项方式不同所致。...

Python有返回值的函数_布尔函数

函数也可以返回布尔值(True或False),这种情况便于隐藏函数内部的复杂测试。例如: #!/bin/python def is_divisible(x, y):     if x % y == 0:        return True     else:        return False print is_divisible(6, 3) $...

【MySQL】MySQL中的锁机制

MySQL锁机制起步 锁是计算机用以协调多个进程间并发访问同一共享资源的一种机制。MySQL中为了保证数据访问的一致性与有效性等功能,实现了锁机制,MySQL中的锁是在服务器层或者存储引擎层实现的。 行锁与表锁 首先我们来了解行锁与表锁的基本概念,从名字中我们就可以了解:表锁就是对整张表进行加锁,而行锁则是锁定某行、某几行数据或者行之间的间隙。 各引擎对锁...

Linux下smi/mdio总线驱动

Linux下smi/mdio总线驱动 韩大卫@吉林师范大学 MII(媒体独立接口), 是IEEE802.3定义的以太网行业标准接口, smi是mii中的标准管理接口, 有两跟管脚, mdio 和mdc ,用来现实双向的数据输入/输出和时钟同步。mdio主要作用用来配置/读取phy的寄存器, 实现监控作用。 Smi总线也就是mdio总线。...