• Ubuntu20.4部署Cuda12.4


    准备Ubuntu20.4 VM

    安装Cuda12.4

    1.进入如下界面安装安装Cuda12.4版本:

    CUDA Toolkit 12.4 Update 1 Downloads | NVIDIA Developericon-default.png?t=N7T8https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=20.04&target_type=deb_local

    切换到ubuntu进行安装。

    1. wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
    2. sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
    3. wget https://developer.download.nvidia.com/compute/cuda/12.4.1/local_installers/cuda-repo-ubuntu2004-12-4-local_12.4.1-550.54.15-1_amd64.deb
    4. sudo dpkg -i cuda-repo-ubuntu2004-12-4-local_12.4.1-550.54.15-1_amd64.deb
    5. sudo cp /var/cuda-repo-ubuntu2004-12-4-local/cuda-*-keyring.gpg /usr/share/keyrings/
    6. sudo apt-get update
    7. sudo apt-get -y install cuda-toolkit-12-4
    8. sudo apt-get install -y cuda-drivers

    2.验证安装

    nvidia-smi

    安装CUDA Toolkit

    CUDA Toolkit (nvidia): CUDA完整的工具安装包,其中提供了 Nvidia 驱动程序、开发 CUDA 程序相关的开发工具包等可供安装的选项。包括 CUDA 程序的编译器、IDE、调试器等,CUDA 程序所对应的各式库文件以及它们的头文件。

    1.登录到ubuntu用户,执行如下命令,安装toolkit

    sudo apt install nvidia-cuda-toolkit
    

    2.验证安装nvcc

    nvcc -V
    1. ubuntu@msl-instance-3:~$ nvcc -V
    2. nvcc: NVIDIA (R) Cuda compiler driver
    3. Copyright (c) 2005-2019 NVIDIA Corporation
    4. Built on Sun_Jul_28_19:07:16_PDT_2019
    5. Cuda compilation tools, release 10.1, V10.1.243
    6. ubuntu@msl-instance-3:~$
    3.设置环境变量:~/.bashrc
    1. export PATH=/usr/local/cuda/bin:$PATH
    2. export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

    4.source ~/.bashrc

    5.nvcc和nvidia-smi的cuda版本就一致了

    安装cuDNN

    cudnn:为深度学习计算设计的软件库。
    Cuda和cuDNN映射关系:

    Support Matrix — NVIDIA cuDNN v9.1.1 documentation

    1.安装zlib1g
    sudo apt-get install zlib1g
    2.下载
    wget https://developer.download.nvidia.com/compute/cudnn/redist/cudnn/linux-x86_64/cudnn-linux-x86_64-9.1.0.70_cuda12-archive.tar.xz
    
    3. 解压cuDNN package
    $ tar -xvf cudnn-linux-x86_64-9.1.0.70_cuda12-archive.tar.xz
    4,把文件copy到CUDA Toolkit 目录中
    

    1. $ sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include
    2. $ sudo cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64
    3. $ sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

    5.验证安装
    cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
    有如下内容输出,则说明安装成功了。
     
    

    Pytorch安装并验证

    1.安装Anaconda

    参考:超详细Ubuntu安装Anaconda步骤+Anconda常用命令_ubuntu安装conda-CSDN博客

    下载:https://www.anaconda.com/download#downloads

    wget  https://repo.anaconda.com/archive/Anaconda3-2024.02-1-Linux-x86_64.sh

    使用bash命令安装Anaconda,一路回车

    1. ~/.bashrc文件中配置的conda环境变量。
    2. # >>> conda initialize >>>
    3. # !! Contents within this block are managed by 'conda init' !!
    4. __conda_setup="$('/home/ubuntu/anaconda3/bin/conda' 'shell.bash' 'hook' 2> /dev/null)"
    5. if [ $? -eq 0 ]; then
    6.     eval "$__conda_setup"
    7. else
    8.     if [ -f "/home/ubuntu/anaconda3/etc/profile.d/conda.sh" ]; then
    9.         . "/home/ubuntu/anaconda3/etc/profile.d/conda.sh"
    10.     else
    11.         export PATH="/home/ubuntu/anaconda3/bin:$PATH"
    12.     fi
    13. fi
    14. unset __conda_setup
    15. # <<< conda initialize <<<

    2.创建pytorch的虚拟环境

    conda create -n pytorch  python=3.11.7
    
    3.安装pytorch最新版
    
    pip3 install torch torchvision torchaudio

    4.安装验证:

    python

    1. import torch
    2. print('CUDA版本:',torch.version.cuda)
    3. print('Pytorch版本:',torch.__version__)
    4. print('显卡是否可用:','可用' if(torch.cuda.is_available()) else '不可用')
    5. print('显卡数量:',torch.cuda.device_count())
    6. print('是否支持BF16数字格式:','支持' if (torch.cuda.is_bf16_supported()) else '不支持')
    7. print('当前显卡型号:',torch.cuda.get_device_name())
    8. print('当前显卡的CUDA算力:',torch.cuda.get_device_capability())
    9. print('当前显卡的总显存:',torch.cuda.get_device_properties(0).total_memory/1024/1024/1024,'GB')
    10. print('是否支持TensorCore:','支持' if (torch.cuda.get_device_properties(0).major >= 7) else '不支持')
    11. print('当前显卡的显存使用率:',torch.cuda.memory_allocated(0)/torch.cuda.get_device_properties(0).total_memory*100,'%')
    12. # Check if CUDA is available
    13. is_cuda_available = torch.cuda.is_available()
    14. if is_cuda_available:
    15.     print("CUDA is available.")
    16. else:
    17.     print("CUDA is not available.")
    18. # Check if cuDNN is available
    19. from torch.backends import cudnn
    20. cudnn.is_acceptable_type = lambda t: t.is_floating_point or t.is_integer
    21. is_cudnn_available = cudnn.is_available()
    22. if is_cudnn_available:
    23.     print("cuDNN is available.")
    24. else:
    25.      print("cuDNN is not available.")
     
    

  • 相关阅读:
    MySQL实践总结-
    L56.linux命令每日一练 -- 第八章 Linux磁盘与文件系统管理命令 -- swapoff和sync
    MySQL日志管理、备份与恢复
    结构型模式 - 代理模式Proxy
    【项目部署】网页无法打开,xxx.xxx.xxx.xxx目前无法处理此请求
    html实现9*9乘法表
    java专项练习(验证码)
    2、MySql 更新语句执行流程
    《UDS协议从入门到精通》系列——图解0x35:请求上传
    网络安全合规-DSMM
  • 原文地址:https://blog.csdn.net/freedomboy319/article/details/138751432