使用onnxruntime-gpu 模型推理

1.安装onnxruntime-gpu

新版的onnxruntime-gpu 即支持gpu的推理，也支持cpu的推理。

卸载旧的1.7.1 cpu版本，安装新的gpu版本：


pip uninstall onnxruntime
pip install onnxruntime-gpu

检查是否安装成功：


>>> import onnxruntime
>>> onnxruntime.__version__
'1.10.0'
>>> onnxruntime.get_device()
'GPU'
>>> onnxruntime.get_available_providers()
['TensorrtExecutionProvider', 'CUDAExecutionProvider', 'CPUExecutionProvider']

2.修改推理代码

在推理代码上增加 providers参数，选择推理的框架。看自己支持哪个就选择自己支持的就可以了。


session = onnxruntime.InferenceSession('yolov5s.onnx', None)
# 改为：
session = onnxruntime.InferenceSession('yolov5s.onnx', 
        providers=['TensorrtExecutionProvider', 'CUDAExecutionProvider', 'CPUExecutionProvider'])

如果运行推理代码出现 Tensorrt, CUDA都无法推理，如下所示，则是自己的 ONNX Runtime, TensorRT, CUDA 版本没对应正确。

2022-08-09 15:38:31.386436528 [W:onnxruntime:Default, onnxruntime_pybind_state.cc:509 CreateExecutionProviderInstance] Failed to create TensorrtExecutionProvider. Please reference https://onnxruntime.ai/docs/execution-providers/TensorRT-ExecutionProvider.html#requirements to ensure all dependencies are met.

对应版本如下：

相关阅读:
Android12之/proc/pid/status参数含义(一百六十五)
springboot疫情防控学生自助申报系统毕业设计源码260839
【Oracle系列1】Oracle 的connect权限和create session的区别
PyQt5_股票K线形态查看工具
Synchronized和volatile 面试简单汇总
心法利器[71] | NLP的学习思考(新手和进阶)
linux下查看所有监听端口
基于STM32单片机的天然气与温湿度检测报警系统设计
C++链表创建、删除、排序、奇偶数和计算输出的课程实践源码
Charles 替换接口响应信息

原文地址：https://blog.csdn.net/u012505617/article/details/126249243