• CentOS nvidia+cuda+cudnn 安装


    NVIDIA驱动

    1. NVIDIA官网下载合适版本驱动
    2. 安装lspci,使用下面命令,寻找lspci,发现在pciutils中,故安装pciutils
      yum whatprovides */lspci
      yum install pciutils 
      
      • 1
      • 2
    3. 检查是否安装了NVIDIA的GPU(硬件层面):lspci | grep -i nvidia
    4. 安装kernel-devel和kernel-headers:使用uname -r查看内核版本,去这个网站下载与你内核匹配的kernel-headers,去这个网站下载与你内核匹配的kernel-devel,可以前往/usr/src/kernels/目录查看安装的kernel版本,使用yum -y install gcc gcc-c++安装gcc
    5. 赋予第一步下载的驱动运行权限:chmod a+x NVIDIA-Linux-x86_64-410.78.run
    6. 禁用nouveau
      # 打开配置文件:
      vi /usr/lib/modprobe.d/dist-blacklist.conf
      # 加上或修改 两行
      blacklist nouveau
      options nouveau modeset=0
      # 备份原来的 initramfs nouveau image镜像
      mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r)-nouveau.img 
      # 创建新的 initramfs image镜像
      dracut /boot/initramfs-$(uname -r).img  $(uname -r) 
      # 重启
      reboot
      # 查看nouveau是否禁用, 如果没有输出代表成功
      lsmod | grep nouveau 
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      • 9
      • 10
      • 11
      • 12
      • 13
    7. 安装
      # 运行
      ./NVIDIA-Linux-x86_64-410.78.run
      # 如果报错,则使用
      sudo ./Nvidia*.sh --kernel-source-path=/usr/src/kernels/按TAB补全
      
      • 1
      • 2
      • 3
      • 4

    CUDA

    1. 英伟达官网下载合适的CUDA,如果官网只提供了最新版,可以使用谷歌搜索CUDA Toolkit x.x进入官网下载
    2. 赋予下载文件运行权限chmod a+x cuda_10.0.130_410.48_linux.run
    3. 安装./cuda_10.0.130_410.48_linux.run
      1. 会先有个阅读声明,需要输入accept
      2. 一直按↓,选择install安装
      3. 安装过程结束后会有以下信息:
          ===========
          = Summary =
          ===========
          Driver:   Not Selected
          Toolkit:  Installed in /usr/local/cuda-10.0
          Samples:  Not Selected
      
          Please make sure that
          -   PATH includes /usr/local/cuda-10.0/bin
          -   LD_LIBRARY_PATH includes /usr/local/cuda-10.0/lib64, or, add /usr/local/cuda-10.0/lib64 to /etc/ld.so.conf and run ldconfig as root
      
          To uninstall the CUDA Toolkit, run the uninstall script in /usr/local/cuda-10.0/bin
      
          Please see CUDA_Installation_Guide_Linux.pdf in /usr/local/cuda-10.0/doc/pdf for detailed information on setting up CUDA.
      
          ***WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 384.00 is required for CUDA 10.0 functionality to work.
          To install the driver using this installer, run the following command, replacing <CudaInstaller> with the name of this run file:
              sudo <CudaInstaller>.run -silent -driver
      
          Logfile is /tmp/cuda_install_11482.log
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      • 9
      • 10
      • 11
      • 12
      • 13
      • 14
      • 15
      • 16
      • 17
      • 18
      • 19
      • 20
      • 21
      • 22
      • 23
    4. 将cuda的bin文件和lib导出到系统环境中,注意更换其中的cuda-x.x
      export PATH="/usr/local/cuda-10.0/bin:$PATH" 
      export LD_LIBRARY_PATH="/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH"
      或者
      vi ~/.bashrc
      export PATH="/usr/local/cuda-10.0/bin:$PATH" 
      export LD_LIBRARY_PATH="/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH"
      source ~/.bashrc
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
    5. 测试:如果下面测试的最后结果都是Result = PASS,说明CUDA安装成功啦。
      1)如果成功会输出版本信息nvcc –V
      2)编译并测试设备 deviceQuery:
      cd /usr/local/cuda-9.2/samples/1_Utilities/deviceQuery
      make
      ./deviceQuery
      
      • 1
      • 2
      • 3
      3)编译并测试带宽 bandwidthTest:
      cd ../bandwidthTest
      make
      ./bandwidthTest
      
      • 1
      • 2
      • 3
    6. 所需的libcudart.so.8.0如果正确安装的话,以下两种方法同理:
      1)ldconfig /usr/local/cuda-8.0/lib64
      2)export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-8.0/lib64
      3)如果仍然不行,再尝试执行:
      export PATH=\$PATH:/usr/local/cuda-8.0/bin 
      export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda-8.0/lib64 
      source /etc/profile 
      
      • 1
      • 2
      • 3
      此时会显示/sbin/ldconfig.real: /usr/local/cuda-8.0/lib64/libcudnn.so.6 不是符号连接。不用担心,这时已经解决问题了。

    cudnn

    1. 这里下载cuDNN Library for Linux (x86_64)
    2. 解压tar -xzvf cudnn-10.0-linux-x64-v7.tgz
    3. 复制
      cp include/cudnn.h /usr/local/cuda-10.0/include/
      cp lib64/libcudnn* /usr/local/cuda-10.0/lib64/
      
      • 1
      • 2
    4. 授权
      chmod a+r /usr/local/cuda-10.0/include/cudnn.h /usr/local/cuda-10.0/lib64/libcudnn*

    参考

  • 相关阅读:
    qt -tablewidget设置列可排序
    Spark面试整理-如何在Spark中进行数据清洗和转换?
    洛谷题解 | P9690 [GDCPC2023] Programming Contest
    Day13--搜索建议-自动获取焦点与防抖处理
    java计算机毕业设计江智能股票推荐系统MyBatis+系统+LW文档+源码+调试部署
    Graphpad Prism10.2.1(395) 安装教程 (含Win/Mac版)
    天玑810和天玑900哪个好 天玑810和天玑900差距
    文件I/O_03PageCache和Mmap
    QGIS编译(跨平台编译)之五十七:qgis_app库在Qt Creator环境下编译的错误处理
    git第一次推送gitlab项目
  • 原文地址:https://blog.csdn.net/qq_43183860/article/details/127657306