• Tensorflow-GPU工具包了解和详细安装方法


    目录

    基础知识信息了解

    显卡算力

    CUDA兼容

    Tensorflow gpu安装

    CUDA/cuDNN匹配和下载

    查看Conda driver的版本

    下载CUDA工具包

    查看对应cuDNN版本

    下载cuDNN加速库

    CUDA/cuDNN安装

    CUDA安装方法

    cuDNN加速库安装

    配置CUDA/cuDNN环境变量

    配置环境变量

    核验是否安装成功

    Tensorflow-gpu安装

    命令安装

    报错处理

    核验安装结果


    直通车:人工智能发展历程和工具搭建学习-CSDN博客

            通过之前的文章学习,我们已经安装好了Anaconda和Tensorflow2.4,但是在后期的学习中,会涉及到神经网络的学习等数据量较大的操作,普通的tensorflow-cpu版本处理速度较慢,所以我们再安装一个更加强大的tensorflow-gpu版本,它可以调用conda的接口实现gpu运算的平台,利用显卡帮助我们运算程序,以提高后期学习中的程序处理速度,提高学习效率。

    基础知识信息了解

    显卡算力

            在这个之前,我们首先要确保自己的电脑是英伟达显卡,并且运算能力在3.5以上,大家可以根据下面的网址查看自己电脑显卡的运算能力,然后还需要下载conda工具包和对应的gpu加速库cuDNN。

    直通车:CUDA GPUs - Compute Capability | NVIDIA Developer

            后期安装CUDA通过deviceQuery.exe也可以看到当前显卡的算力。

    CUDA兼容

            这里CUDA12.1是支持的最高版本的CUDA,可以向下兼容,且可以安装多个版本的CUDA,你可以通过更改环境变量来更改为你需要用到的CUDA版本。

    Tensorflow gpu安装

    CUDA/cuDNN匹配和下载

    查看Conda driver的版本

            我们打开命令行窗口cmd,输入nvidia-smi,这里显示的是显卡的版本信息,这里显示的是conda driver的版本信息。

    下载CUDA工具包

            直通车:CUDA Toolkit Archive | NVIDIA Developer

            我们去conda下载官网,下载CUDA工具包。根据刚刚我们查到的CUDA版本信息,此处我的CUDA版本为12.x,根据CUDA可以向下兼容的特性,我们可以对应下载CUDA11.4的工具包。

            在这个界面,由于我的电脑是Windows11 64位,所以我选择的是这些选项,大家要根据自己的电脑系统类型选择合适的版本进行下载。

    查看对应cuDNN版本

    下面查找对应的cuDNN版本,可以在Tensorflows官网中查看tensorflow-gpu跟cuda cudnn的版本对应信息.

    在 Windows 环境中从源代码构建  |  TensorFlow

    下载cuDNN加速库

            接下来我们打开cuDNN下载地址:

    直通车:https://developer.nvidia.com/rdp/cudnn-archive

            由于我们CUDA是11的版本 对应的是cuDNN8的版本,这些版本的对应,小伙伴们一定要注意!现在我们打开cuDNN下载官网,在这里,根据刚刚查看到的cuda版本,选择适当的cuDNN版本,我刚下载的是CUDA11.4的版本,也就是CUDA11.x的版本,所以我选择的是cuDNN8.x的版本,这里我下载版本为8.2.1,然后选择windows x86的选项进行下载。

            注意:在这里点击下载的时候会跳转到注册登录页面,由于在这里我已经登录,所以没有跳转,等待安装包下载完成,我们就准备好了Tensorflow-gpu所需要的工具包,这就是已经下载好的工具包。

            如果各位小伙伴在这里遇到问题无法解决,可以在评论区进行求助。

    CUDA/cuDNN安装

    CUDA安装方法

            接下来我们开始安装CUDA,双击打开下载的安装包,并等待进度条加载完毕。

            点击同意并继续选择自定义,然后点击下一步。在这个界面显示的是将要安装的组件名称、版本号和电脑中该组件的版本号,当前版本号为空,则说明电脑中没有该组件。

            我们取消NVIDIA GeForce Experience这一项,然后点击下一步。这里的安装路径一般选择默认就好,也可以更改,但是文件目录一定要记清楚,后面配置环境的时候会用到

    然后点击下一步,点击next,等待安装完成。

    然后点击下一步,这里显示的是已经安装的所有组件的状态,然后点击关闭。

    cuDNN加速库安装

            下面开始安装Gpu加速库cuDNN,将文件解压,解压完成以后,我们打开会得到如下三个目录。

            然后我们打开刚刚安装好的CUDA的根目录,然后把codnn里边并目录下的所有文件复制到CUDA的bin目录如下。

            将include里边的所有文件复制到CUDA的include文件下,lib文件夹也是如此。这样我们便完成了CUDA和cuDNN的安装。

    配置CUDA/cuDNN环境变量

    配置环境变量

            下面开始设置系统环境变量,右键点击此电脑,选择属性打开高级系统,设置环境变量,在系统变量里面找到path,点击编辑。我们可以看到CUDA的两个文件已经存在,点击新建浏览,找到CUDA目录。

    将其上移,与其他两个环境变量一起,这样就完成了环境变量的设置。

    核验是否安装成功

            可以通过nvcc -V命令查看是否配置CUDA成功

            输入nvidia-smi命令,返回GPU型号则安装成功

             同时也可以通过在CUDA执行bandwidthTest.exe和deviceQuery.exe和核验,返回PASS则表明GPU安装成功

    Tensorflow-gpu安装

            接下来我们开始安装tensorflow-gpu,安装过程可以参考上篇文章tensnflow2.4的安装,这里我就不再详述。不同之处,就是我们创建并激活另一个独立环境tensorflow-gpu选择适当的版本号,小伙伴们可以根据自己的安装环境选择对应的版本安装,第二步是安装相关软件,在第三步的时候安装tensorflow-gpu,命令为pip install tensorflow-gpu==对应版本号安装完成以后就完成了tensorflow-gpu的安装。

    直通车:人工智能发展历程和工具搭建学习-CSDN博客

    命令安装

    创建独立环境并激活

    1. conda create -n tensorflow-gpu python==3.8
    2. conda activate tensorflow-gpu

    安装相关软件包

    1. # conda install numpy matplotlib PIL scikit-learn pandas 于下行命令等价
    2. pip install numpy matplotlib Pillow scikit-learn pandas -i Simple Index

    安装Tensorflow-gpu

    1. pip install tensorflow-gpu==2.6.0 -i Simple Index

    报错处理

            ERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts. matplotlib 3.7.5 requires numpy<2,>=1.20, but you have numpy 1.19.5 which is incompatible. pandas 2.0.3 requires numpy>=1.20.3; python_version < "3.10", but you have numpy 1.19.5 which is incompatible.

    1. pip uninstall numpy
    2. pip install numpy==1.19.5

            TypeError: Descriptors cannot be created directly. If this call came from a _pb2.py file, your generated code is out of date and must be regenerated with protoc >= 3.19.0. If you cannot immediately regenerate your protos, some other possible workarounds are: 1. Downgrade the protobuf package to 3.20.x or lower. 2. Set PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=python (but this will use pure-Python parsing and will be much slower).

    1. pip uninstall protobuf
    2. pip install protobuf==3.20.0

    校验安装结果

            最后我们测试一下是否安装成功,打开命令行窗口,激活我们刚才创建的独立环境。输入python,打开python交互模式,输入import tensorflow as tf,输入我们的测试语句tf.test.is_gpu_available(),它的输出结果为true,显示我们安装成功。

    python
    1. import tensorflow as tf
    2. tf.test.is_gpu_available()
    3. exit()

  • 相关阅读:
    Qt TCP网络编程基本教程
    vue开发-零基础从源码开始解读一个智慧园区项目
    如何使用yum 安装php7.2
    微服务+Java+Spring Cloud +UniApp +MySql智慧工地综合管理云平台源码,SaaS模式
    对卡巴斯基发现的一个将shellcode写入evenlog的植入物的复现
    系统平台同一网络下不同设备及进程的话题通讯--DDS数据分发服务中间件
    MYSQL的存储过程
    nodejs与后端
    dotNet8 全局异常处理
    工作几年,如何快速晋升至架构师?
  • 原文地址:https://blog.csdn.net/qq_30294911/article/details/139712142