• nvidia-docker安装指南


    nvidia-docker安装需要安装Docker- CE、NVIDIA Container Toolkit

    Docker-CE安装

    使用官网提供的安装指令,默认是安装最新版本的Docker

    curl https://get.docker.com | sh \
      && sudo systemctl --now enable docker
    
    • 1
    • 2

    注意:If you already have Docker installed, this script can cause trouble, which is
    why we’re displaying this warning and provide the opportunity to cancel the
    installation.
    If you installed the current Docker package using this script and are using it
    again to update Docker, you can safely ignore this message.
    用这个指令安装Docker,后续也可以该指令更新Docker,否则请不要运行该指令,可能会出现一些错误。如果已经运行可以在看到上述提示后按住Ctrl+c停止运行脚本

    在这里插入图片描述
    使用sudo /lib/systemd/systemd-sysv-install enable docker激活Docker,并查看Docker版本

    sudo /lib/systemd/systemd-sysv-install enable docker
    docker --version
    
    • 1
    • 2

    在这里插入图片描述

    NVIDIA Container Toolkit安装

    设置稳定版的库源/GPG密钥

    distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
       && curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - \
       && curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
    
    
    • 1
    • 2
    • 3
    • 4

    如果需要使用到实验特性,可将experimental分支加入库源中,否则跳过此步骤
    curl -s -L https://nvidia.github.io/nvidia-container-runtime/experimental/$distribution/nvidia-container-runtime.list | sudo tee /etc/apt/sources.list.d/nvidia-container-runtime.list

    更新包列表,下载安装nvidia-docker2

    sudo apt-get update
    sudo apt-get install -y nvidia-docker2
    
    
    • 1
    • 2
    • 3

    安装完成后重启docker,之后可通过运行CUDA base容器验证,需要选择CUDA驱动对应的版本

    sudo systemctl restart docker
    sudo docker run --rm --gpus all nvidia/cuda:11.2.0-base-ubuntu18.04 nvidia-smi
    
    • 1
    • 2

    在这里插入图片描述

    nvidia-docker执行GPU训练

    nvidia-docker run -it -v $PWD:/work registry.baidubce.com/paddlepaddle/paddle:2.3.2-gpu-cuda11.2-cudnn8 /bin/bash
    
    • 1

    注意:前提是物理机已经安装GPU驱动

    查看python中paddlepaddle是否安装成功
    在这里插入图片描述

    通过nvidia-smi指令查看验证GPU

    在这里插入图片描述

  • 相关阅读:
    服务端架构演进史
    HTML 转 EXE 工具(HTML App Build)
    嵌入式软件工程师——2025校招专题(一)
    MTK system_server 卡死导致手机重启案例分析
    Hbase相关总结
    从0开始学Java:Java概述
    解决npm install 安装报错记录贴
    leetcode二叉树系列通用输入定义
    生信学院|10月13日《SOLIDWORKS参数化应用——DriveWorksXpress》
    R语言使用plot函数可视化数据散点图,使用xlab参数自定义设置X轴的轴标签
  • 原文地址:https://blog.csdn.net/Ber_Bai/article/details/127725437