• CentOS 7.9.2009 中 Docker 使用 GPU


    一、安装nvidia驱动

    1.1,查看显卡驱动

    # 查看显卡型号 lspci | grep -i nvidia

    1.2,进入 PCI devices ,输入上一步查询到的 2204

    1.3,进入 官方驱动 | NVIDIA,查询 Geforce RTX 3090 驱动并下载

    1.4,禁用nouveau

    1. # 查看系统是否正在使用nouveau,如果有输出,则执行禁用操作
    2. lsmod | grep nouveau
    3. ## 禁用操作
    4. # 创建一个新的内核启动参数文件
    5. sudo vim /etc/modprobe.d/blacklist-nouveau.conf
    6. # 添加以下内容到文件中
    7. blacklist nouveau
    8. options nouveau modeset=0
    9. # 更新initramfs image
    10. sudo dracut --force
    11. # 重启系统
    12. sudo reboot
    13. # 在重启后,nouveau驱动应该已经被禁用,你可以通过运行以下命令来确认
    14. lsmod | grep nouveau

    1.5,执行安装

    1. # 赋执行权限
    2. chmod +x NVIDIA-Linux-x86_64-550.76.run
    3. ## 执行安装命令
    4. # -no-x-check:安装驱动时关闭X服务
    5. # -no-nouveau-check:安装驱动时禁用nouveau
    6. # -no-opengl-files:只安装驱动文件,不安装OpenGL文件
    7. ./NVIDIA-Linux-x86_64-550.76.run -no-x-check -no-nouveau-check -no-opengl-files

    1.6,执行安装时遇到的问题

    1.6.1,GCC 错误

    1.6.1.1,错误展示

    Unable to find the development tool `cc` in your path; please make sure that you have the *** 错误

    1.6.1.2,解决思路

    在您的路径中找不到开发工具“cc”;请确保已安装包“gcc”。如果系统上安装了GCC,请检查“CC”是否在您的路径中。

    1.6.1.3,解决方案:安装gcc
    1. # 确保包列表是最新的
    2. sudo yum update
    3. # 安装GCC和相关工具,运行以下命令
    4. sudo yum install gcc
    5. # 安装完成后,你可以通过运行以下命令来检查GCC的版本:
    6. gcc --version

    1.6.2,缺少 kernel-devel

    1.6.2.1,错误展示

    1.6.2.2,解决思路

    这个错误表明在CentOS操作系统上,系统无法找到与当前运行的内核版本相对应的内核源代码树。这通常发生在编译内核模块或其他需要内核头文件的操作时,因为编译器需要这些头文件来正确编译代码。

    1.6.2.3,解决方法;安装kernel-devel
    1. # 确认当前内核版本
    2. uname -r
    3. # 安装与当前内核版本相匹配的内核开发包
    4. yum install kernel-devel-`uname -r`

    1.7,测试是否安装成功:nvidia-smi

    二、安装 nvidia-docker-runtime

    2.1,查看官方文档,执行安装命令

    Migration Notice | nvidia-container-runtime

    2.2,centos7 的添加方式为

    1. distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
    2. curl -s -L https://nvidia.github.io/nvidia-container-runtime/$distribution/nvidia-container-runtime.repo | \
    3. sudo tee /etc/yum.repos.d/nvidia-container-runtime.repo

    2.3,执行安装

    yum install nvidia-container-runtime

    三、测试

    1. # 重启Docker 服务
    2. systemctl restart docker
    3. # 运行docker容器测试
    4. docker run -it --rm --gpus all centos nvidia-smi

    注:以上内容仅提供参考和交流,请勿用于商业用途,如有侵权联系本人删除!

  • 相关阅读:
    【scikit-learn基础】--『监督学习』之 支持向量机回归
    信奥基本功:打字练习(盲打)
    【libGDX】ApplicationAdapter生命周期
    .bat批处理命令处理文件
    进入docker容器命令行
    正需要!这个温湿度监控方法也太及时了
    【笔记】python函数中指定输入和输出格式
    汇编-EQU伪指令(数值替换)
    极致优化 SSD 并行读调度
    操作系统(02326)考试题库
  • 原文地址:https://blog.csdn.net/wang_jing_jing/article/details/138151620