PVE升级内核后如何重新安装vgpu显卡驱动
更新于20230907
每次apt dist-upgrade时都是无脑按y
有时更新重启后可能会发现没有加载显卡驱动,今天就是这样。
不必紧张,重装一下驱动就可以了~
一、进入文本界面【如果你有其他电脑或设备可以直接操作,就没有必要像我这么麻烦了】
记录:因为我用的是融合驱动,重启后没有加载桌面显卡驱动,既没有进入桌面环境,也没有进入文本界面。
手机浏览器远程登陆pve,点击shell,输入init 3,就可以回到电脑端操作了!
二、重装驱动
2.0、清理
dkms status
dkms uninstall -m nvidia -v 525.125.06
dkms remove -m nvidia -v 525.125.06
2.1、安装headers【关键步骤】
apt install pve-headers-$(uname -r)
【patched驱动,跳过下面2.2、2.3,直接./NVIDIA------.run --dkms】
2.2、进入安装时存放的驱动目录【如果已经删除按安装时方法再更新一个】
cd NVIDIA-Linux-x86_64-525.125.06-merged-vgpu-kvm-patched/
2.3、安装,一路选ok
./nvidia-installer --dkms
三、启动服务
3.1、
systemctl daemon-reload
systemctl restart nvidia-{vgpu-mgr,vgpud}.service
systemctl status nvidia-{vgpu-mgr,vgpud}.service
3.2、
启动桌面
init 5
附:
内核更新确认
tail -600 /var/log/dpkg.log | grep kernel-
发现内核果然升级为
6.2.16-10
上一版本是
6.2.16-3
20230907第二次更新内核记录
这次特地注意一下更新日志
dkms: autoinstall for kernel 6.2.16-12-pve was skipped since the kernel headers for this kernel do not seem to be installed.
显然没有自动运行dkms的安装
手动执行
apt install pve-headers-$(uname -r)
因为重启前内核依然是6.2.16-10,无法更新——没有明确指定版本更新。重启后当然无法进入系统。
重启后执行
apt install pve-headers-$(uname -r)
dkms install -m nvidia -v 525.125.06
dkms status
显示
nvidia/525.125.06, 6.2.16-10-pve, x86_64: installed
nvidia/525.125.06, 6.2.16-12-pve, x86_64: installed
执行
systemctl daemon-reload
systemctl restart nvidia-{vgpu-mgr,vgpud}.service
systemctl status nvidia-{vgpu-mgr,vgpud}.service
init 5
进入桌面失败
再次清理安装
dkms uninstall -m nvidia -v 525.125.06 --all
dkms remove -m nvidia -v 525.125.06 --all
dkms install -m nvidia -v 525.125.06
dkms status
systemctl daemon-reload
systemctl restart nvidia-{vgpu-mgr,vgpud}.service
systemctl status nvidia-{vgpu-mgr,vgpud}.service
init 5
依然无法进入桌面
再次清理
dkms uninstall -m nvidia -v 525.125.06 --all
dkms remove -m nvidia -v 525.125.06 --all
进入安装文件夹
cd vGPU-Unlock-patcher/NVIDIA-Linux-x86_64-525.125.06-merged-vgpu-kvm-patched/
./nvidia-installer --dkms
提示错误
重启
reboot
按照0903的安装方法,成功进入桌面。可见前面操作虽然繁琐(某些步骤可能多余),但是能够不经重启即可正确加载融合驱动。