• GPU驱动及CUDA安装流程介绍


    安装前准备工作

      确认GPU型号和操作系统版本
      准备gpu驱动和CUDA软件包
      在nvidia官网进行驱动包下载
      GPU驱动下载链接
       Linux系统均选择 Linux 64-bit、CUDA Toolkit选择最新版本
      注意该版本一定要大于等于cuda软件的版本。
      选择CUDA及GPU驱动版本,需同时考虑与客户程序的兼容性问题。
      CUDA 11.0 建议搭配CUDA CUDA toolkit 11.0版本的GPU驱动
    在这里插入图片描述
    CUDA下载链接
      选择合适的操作系统版本进行下载。
    在这里插入图片描述
      检查服务器GPU识别情况
      安装GPU驱动之前需要在操作系统下查看GPU卡是否能够完全识别,如不能识别需要进行重新插拔、对调测试 步骤进行硬件排查,确保可以查看到所有的GPU

     lspci | grep -i nvidia
    
    • 1

    Alt
      GPU驱动卸载方法:

    /usr/bin/nvidia-uninstall
    
    • 1

      CUDA卸载方法:

    /usr/local/cuda-X.Y/bin/cuda-uninstaller
    
    • 1

    在这里插入图片描述  老版本卸载方法

    /usr/local/cuda-X.Y/bin/uninstall_cuda_X.Y.pl
    
    • 1

      安装gcc、g++编译器

    GPU驱动安装时需要gcc编译器。
    cuda安装samples测试程序进行make时需要g++,但安装cuda软件包时不需要。

    CentOS 7

    检查版本

    gcc -v
    
    • 1
    g++ -v
    
    • 1

    软件包安装

    yum install gcc
    
    • 1
    yum install gcc-c++
    
    • 1

    SUSE

    检查版本

    gcc -v
    
    • 1
    g++ -v
    
    • 1

    软件包安装

    zypper in gcc
    
    • 1
    zypper in gcc-c++
    
    • 1

    Ubuntu

    检查版本

    gcc -v
    
    • 1
    g++ -v
    
    • 1

    软件包安装

    apt-get install gcc
    
    • 1
    apt-get install g++
    
    • 1
    apt-get install make
    
    • 1

    软件包检查

    dpkg -l gcc
    
    • 1
    dpkg -l g++
    
    • 1
    dpkg -l make
    
    • 1

    安装kernel-devel和kernel-headers软件包

    CentOS 7

    yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)
    
    • 1

    Ubuntu

    Ubuntu可以不安装,也可以从阿里镜像站或网易镜像站下载,需注意内核版本。

    SUSE

    zypper install kernel-source-$(uname -r)
    
    • 1

    只安装这一个即可

    zypper install kernel-default-devel-$(uname -r)
    
    • 1

    在这里插入图片描述
    禁用系统自带的nouveau模块

    检查nouveau模块是否加载,已加载则先禁用

     lsmod | grep nouveau
    
    • 1

    在这里插入图片描述
    CentOS 7
    没有blacklist-nouveau.conf文件则创建

    vim /usr/lib/modprobe.d/blacklist-nouveau.conf 
    
    • 1

    添加内容如下

    blacklist nouveau
    
    options nouveau modeset=0
    
    • 1
    • 2
    • 3

    执行如下命令使内核生效

     dracut -force
    
    • 1

    需要重启服务器后才可真正禁用nouveau

    Ubuntu

    vi /etc/modprobe.d/blacklist.conf
    
    • 1

    在文本最后添加以下内容:

    blacklist nouveau
    
    options nouveau modeset=0
    
    • 1
    • 2
    • 3

    保存退出,执行以下命令生效:

    update-initramfs -u
    
    • 1

    重启操作系统

    修改系统运行级别为文本模式GPU驱动安装必须在文本模式下进行

    CentOS 7

     systemctl set-default multi-user.target
    
    • 1

    Ubuntu

    systemctl stop lightdm
    
    systemctl set-default multi-user.target(也可以不执行此命令)
    
    • 1
    • 2
    • 3

    然后ctrl+alt+F1 切换到其他字符终端窗口(F7为图形中断窗口),或者init 3

    SUSE

    vim /etc/inittab
    
    • 1

    修改id:5:initdefault:为id:3:initdefault:

    重启系统后,使禁用nouveau模块配置生效并进入文本模式
    在这里插入图片描述

    GPU驱动安装

    CentOS

    1、root用户下进行GPU驱动

    chmod +x NVIDIA-xxx.run
    
    • 1
    ./NVIDIA-Linux-x86_64-390.46.run –no-opengl-files
    
    • 1
     可选:–ui=none –no-questions –accept-license
    
    • 1

    2、配置GPU驱动内存常驻模式
    GPU驱动模式设置为常驻内存:

    nvidia-smi -pm 1
    
    • 1

    3、设置开机自启动

    vim /etc/rc.d/rc.local
    
    • 1

    在文件中添加一行

    nvidia-smi -pm 1
    
    • 1

    4、赋予/etc/rc.d/rc.local文件可执行权限

    chmod +x /etc/rc.d/rc.local
    
    • 1

    若无/etc/rc.d/rc.local,也可修改

    vim /etc/rc.local
    
    • 1
    chmod +x /etc/rc.local
    
    • 1

    ubuntu 18.04

    可以参考此文档

    1、创建文件:

    vi /etc/systemd/system/rc-local.service
    
    • 1

    2、将下面的文字复制里面

    [Unit]
    
    Description=/etc/rc.local Compatibility
    
    ConditionPathExists=/etc/rc.local
    
    [Service]
    
    Type=forking
    
    ExecStart=/etc/rc.local start
    
    TimeoutSec=0
    
    StandardOutput=tty
    
    RemainAfterExit=yes
    
    SysVStartPriority=99
    
    [Install]
    
    WantedBy=multi-user.target
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23

    3、创建文件:

    vi /etc/rc.local
    
    • 1
    #!/bin/sh -e
    
    nvidia-smi -pm 1
    
    exit 0
    
    • 1
    • 2
    • 3
    • 4
    • 5

    4、赋予可执行权限

    chmod +x /etc/rc.local
    
    • 1

    5、启动服务并设置服务开机自启动

    systemctl enable rc-local.service
    
    • 1
    systemctl start rc-local.service
    
    • 1
    systemctl status rc-local.service
    
    • 1

    6、重启系统后验证

    SUSE

    vim /etc/init.d/after.local
    
    • 1

    没有就新建

    nvidia-smi -pm 1
    
    • 1
    chmod +x /etc/init.d/after.local
    
    • 1

    安装完GPU驱动后,可以使用nvidia-smi命令进行GPU状态查看及相关配置。

    nvidia-smi
    
    • 1
  • 相关阅读:
    css中的单位
    【入门篇】ClickHouse最优秀的开源列式存储数据库
    springcloudalibaba架构(23):RocketMQ普通消息和顺序消息
    自动驾驶中的坐标系变换
    线段树基本操作——建树+单点修改+区间查询
    文件上传下载原理及实现逻辑
    26.集合框架-Set接口及其子类(2)[20220727]
    卷积神经网络的基本操作,卷积神经网络卷积计算
    LP Wizard生成带不规则焊盘的封装
    首家上市的量子计算软件公司!Zapata AI拟完成SPAC交易
  • 原文地址:https://blog.csdn.net/xujingran/article/details/127879167