• ubuntu 22.04 深度学习环境配置


    第一步 安装驱动

    网址:https://www.nvidia.com/download/index.aspx
    根据硬件选择,我这里是 ubuntu 服务器,显卡是v100
    在这里插入图片描述

    sudo su root
    chmod a+x NVIDIA  //按 TAB 即可   加运行权限
    # 禁用原显卡驱动
    vim /etc/modprobe.d/blacklist.conf
    # 在最后一行加
    blacklist nouveau
    # 执行下面命令,让其生效
    update-initramfs -u
    # 重启
    reboot
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    (非必要)补充:在禁用原显卡驱动时,可以增加一步。
    这两个命令都是用于配置Linux系统中与Nouveau显卡驱动相关的设置,但它们的具体作用和写入内容是不同的。
    第一个命令是禁止Nouveau显卡驱动。
    第二个命令是修改Nouveau显卡驱动的行为,使其在启动时不使用KMS功能

    sudo bash -c "echo blacklist nouveau > /etc/modprobe.d/blacklist-nvidia-nouveau.conf"
    
    • 1

    这个命令的目的是禁止(blacklist)Nouveau显卡驱动。具体来说,它会创建或覆盖/etc/modprobe.d/blacklist-nvidia-nouveau.conf文件,并在其中写入blacklist nouveau这一行。这样,Linux系统在启动时将不会加载Nouveau驱动,这对于需要安装和使用NVIDIA官方闭源驱动的用户来说是有用的,因为Nouveau驱动与NVIDIA官方驱动可能会冲突。

    sudo bash -c "echo options nouveau modeset=0 >> /etc/modprobe.d/blacklist-nvidia-nouveau.conf"
    
    • 1

    这个命令与上一个命令不同,它并不是完全禁止Nouveau驱动,而是修改其行为。这个命令会将options nouveau modeset=0这一行追加到/etc/modprobe.d/blacklist-nvidia-nouveau.conf文件的末尾。modeset=0这个选项意味着在启动时不使用Kernel Modesetting(KMS)功能,KMS是一个用于图形硬件初始化的内核功能。禁用KMS可以解决某些与Nouveau驱动相关的问题,例如启动时的图形故障。
    补充完毕。

    重启后:
    输入用户名,密码
    sudo su
    密码

    # 测试显卡禁用是否成功
    # Lsmod 是小写的l      后面的是竖线 |  不是L也不是i
    Ismod I grep nouveau
    
    service lightdm stop      # 如果不成功  继续下面2行命令的操作
    apt-get install lightdm    
    service lightdm stop
    
    # 安装两个必备包
    apt-get install gcc
    apt-get install make
    
    # 安装驱动
    ./NV # 按TAB键补全
    
    # 驱动安装验证
    nvidia-smi
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17

    重启 reboot
    驱动安装成功

    第二步 安装docker

    官方网址:https://docs.docker.com/engine/install/ubuntu/#set-up-the-repository

    # 更新软件包索引并安装软件包以允许使用 基于 HTTPS 的存储库
    sudo apt-get update
    sudo apt-get install ca-certificates curl gnupg
    
    # 添加 Docker 的官方 GPG 密钥:
    sudo install -m 0755 -d /etc/apt/keyrings
    curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg
    sudo chmod a+r /etc/apt/keyrings/docker.gpg
    
    # 使用以下命令设置存储库:
    echo \
      "deb [arch="$(dpkg --print-architecture)" signed-by=/etc/apt/keyrings/docker.gpg] https://download.docker.com/linux/ubuntu \
      "$(. /etc/os-release && echo "$VERSION_CODENAME")" stable" | \
      sudo tee /etc/apt/sources.list.d/docker.list > /dev/null
    
    sudo apt-get update
    
    # 要安装最新版本,请运行:
    sudo apt-get install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin
    
    # 验证
    sudo docker run hello-world
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22

    第三步 安装nvidia-docker

    ubuntu:

    官方网址:https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html

    # 设置 Docker Ubuntu 上的 Docker-CE 可以使用 Docker 的官方便利脚本进行设置:
    curl https://get.docker.com | sh \
      && sudo systemctl --now enable docker
    # 设置软件包存储库和 GPG 密钥:
    distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
          && curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
          && curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.list | \
                sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
                sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
    # 更新
    sudo apt-get update
    sudo apt-get install -y nvidia-container-toolkit
    # 配置 Docker 守护程序以识别 NVIDIA 容器运行时
    sudo nvidia-ctk runtime configure --runtime=docker
    # 在设置默认运行时后重新启动 Docker 守护程序以完成安装
    sudo systemctl restart docker
    # 此时,可以通过运行基本 CUDA 容器来测试
    sudo docker run --rm --runtime=nvidia --gpus all nvidia/cuda:11.6.2-base-ubuntu20.04 nvidia-smi
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18

    官方上的截图
    在这里插入图片描述

  • 相关阅读:
    java基础---static,多态,抽象类,接口,匿名内部类
    AVR单片机开发1——IO口的输入和输出
    【统计任意一组字符中大小写字母的个数】
    Uniapp学习之从零开始写一个简单的小程序demo(新建页面,通过导航切换页面,发送请求)
    洛谷C++简单题小练习day17—输出保留 3 位小数的浮点数, A*B 问题,白细胞计数三个小程序
    【实践篇】推荐算法PaaS化探索与实践
    逆向-beginners之循环while
    Lucene中的Field域、索引维护、搜索、相关度排序和中文分词器讲解
    NPM 包开发与优化全面指南
    合同法重要知识点
  • 原文地址:https://blog.csdn.net/qq_42102546/article/details/132697448