cuda 卸载 centos(cuda卸载重装)

大家好,cuda 卸载 centos相信很多的网友都不是很明白,包括cuda卸载重装也是一样,不过没有关系,接下来就来为大家分享关于cuda 卸载 centos和cuda卸载重装的一些知识点,大家可以关注收藏,免得下次来找不到哦,下面我们开始吧!

centos cuda11.4降级到11.1全过程分析

一、卸载原有的cuda

首先,需要卸载原有的cuda驱动。

可以通过以下两种方法之一进行卸载:

1.1、通过执行.sh文件进行卸载:$ sh NVIDIA-Linux-x86_64-418.126.02.run--uninstall

或者:

1.2、通过yum命令进行卸载:$ yum remove nvidia-*

为了确保清理干净所有相关组件,可以执行以下命令:rpm-qa|grep-i nvid|sort,之后使用yum remove kmod-nvidia-*清理掉所有相关依赖。

二、安装新版本的cuda

安装新版本cuda前,需要检查显卡是否存在,并禁用Nouveau驱动。

在终端中输入命令:$ lspci| grep-i vga,以确认显卡在系统中已加载。

接下来,禁用Nouveau驱动:$ sudo vi/etc/modprobe.d/blacklist.conf,在文件中添加blacklist nouveau,并保存退出。

使用dracut重新构建initramfs文件:$ sudo mv/boot/initramfs-$(uname-r).img/boot/initramfs-$(uname-r).img.bak,然后运行$ sudo dracut-v/boot/initramfs-$(uname-r).img$(uname-r)。

更改系统默认启动模式为文本模式:$ systemctl get-default,设置为multi-user.target:$ sudo systemctl set-default multi-user.target。

重启系统,并检查Nouveau驱动是否已禁用:$ lsmod| grep nouveau。

安装所需的依赖包:yum install epel-release,yum install--enablerepo=epel dkms。

下载并安装新版本的cuda:$ wget developer.download.nvidia.com... linux.run,并给予执行权限:$ sudo chmod+x cuda_11.1.0_455.23.05_linux.run,最后运行安装程序:$ sudo./cuda_11.1.0_455.23.05_linux.run,并根据提示完成安装。

三、常见错误处理

如果在已安装cuda11.1的情况下,输入nvcc-V命令显示无该指令,这说明cuda并未正确添加到系统环境。

为了解决这一问题,可以通过编辑~/.bashrc文件在文件末尾添加以下命令:$ sudo vim~/.bashrc,然后添加以下内容:

完成上述步骤后,重启系统以使更改生效。

解决CentOS下nvidia-smi报错问题

在CentOS系统中,如果遇到nvidia-smi报错,可能是由于driver API和runtime API的CUDA版本不匹配。通常,CUDA Toolkit包含了GPU加速库、调试工具和优化器等,用于部署应用程序。当你电脑安装了PyTorch但未安装CUDA,实际上可以使用GPU,可能是因为系统中使用的GPU驱动并非来自CUDA Toolkit,而是单独安装的。

要解决这个问题,首先需要确认显卡驱动的内核版本,比如内核模块Kernel Module为450.80.02,对应系统内核为Red Hat 4.8.5-39。推荐从NVIDIA官网下载与内核和CUDA版本相匹配的驱动。如果已安装了错误版本的驱动,可以尝试卸载它,比如CUDA 515.65.01与450.80.02不兼容。

在操作时,可能会看到类似这样的输出:系统正在检查依赖关系,安装新的libstdc++-devel版本以支持gcc-c++的升级。这个过程可能需要下载和安装额外的软件包,比如gcc-c++-4.8.5-44.el7.x86_64,总大小约为8.7MB。

总之,确保CUDA和GPU驱动的版本兼容是解决CentOS下nvidia-smi报错的关键,否则可能会导致版本冲突或性能问题。如果有多个版本的CUDA或驱动,务必谨慎处理以避免潜在冲突。

阅读剩余
THE END