服务器显卡驱动(GPU)的安装和配置是确保高性能计算、图形处理以及深度学习任务顺利进行的关键步骤,以下是详细的指南,包括小标题和单元表格:
确定显卡型号
在安装驱动之前,需要先确定你的显卡型号,可以通过以下命令查看显卡信息:
lspci | grep -i nvidia
获取管理员权限
由于驱动安装需要管理员权限,因此需要切换到root用户或使用sudo命令:
sudo -s
禁用nouveau驱动
在安装NVIDIA驱动之前,需要禁用nouveau驱动,这可以通过将nouveau添加到黑名单文件来完成:
echo "blacklist nouveau" | sudo tee /etc/modprobe.d/blacklist-nouveau.conf echo "options nouveau modeset=0" | sudo tee -a /etc/modprobe.d/nouveau-kms.conf sudo update-initramfs -u reboot
下载驱动程序
访问[NVIDIA官方驱动下载页面](https://www.nvidia.cn/Download/index.aspx?lang=cn),根据实例操作系统及GPU规格选择相应的驱动版本进行下载。
设置权限并运行安装脚本
为下载的驱动程序添加执行权限,并运行安装脚本:
chmod +x NVIDIA-Linux-x86_64-xxxx.xx.run sudo sh ./NVIDIA-Linux-x86_64-xxxx.xx.run
在安装过程中,按照提示接受许可协议,并根据需要指定安装选项(通常可以选择默认选项)。
确认驱动程序安装
安装完成后,可以通过以下命令确认驱动程序是否成功安装:
nvidia-smi -q | head
如果返回已安装的NVIDIA驱动程序版本和有关GPU的详细信息,则说明驱动安装成功。
重启服务器
为了应用更改,建议重启服务器:
sudo reboot
安装CUDA和cuDNN(可选)
如果你需要进行深度学习等高性能计算任务,还需要安装CUDA和cuDNN,可以访问[NVIDIA CUDA下载页面](https://developer.nvidia.com/cuda-downloads)下载相应版本的CUDA Toolkit,并按照官方文档进行安装,cuDNN可以从[GitHub](https://github.com/NVIDIA/cuDNN)下载并安装。
9. 测试Docker容器调用GPU服务(可选)
如果你使用的是Docker容器,并且希望容器内能够调用GPU服务,还需要安装nvidia-docker2,具体步骤如下:
Ubuntu系统安装
添加Docker GPG key和软件源 curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt-get update && sudo apt-get install -y nvidia-docker2 sudo systemctl restart docker
CentOS系统安装
添加Docker GPG key和软件源 curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \ curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.repo | sudo tee /etc/yum.repos.d/nvidia-docker.repo sudo yum install -y nvidia-docker2 sudo systemctl restart docker
通过以上步骤,你应该能够在服务器上成功安装并配置NVIDIA显卡驱动(GPU),并根据需要安装CUDA和cuDNN进行高性能计算任务。