码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Triton测试


    Trtion可以部署在cloud端,通过GRPC调用,也可以部署在边缘端,通过CAPI调用。

    1 启动docker

     这个以deepstream的triton镜像为例。

    $ docker run --gpus all -itd --ipc=host --rm -v /tmp/.X11-unix:/tmp/.X11-unix  -v $HOME:/home   -e DISPLAY=$DISPLAY -w /opt/nvidia/deepstream/deepstream nvcr.io/nvidia/deepstream:6.1.1-triton

    2 GRPC方式

    2.1 启动tritonserver

    下载server的代码到本地,git clone https://github.com/triton-inference-server/server.git

    到docs目录下,下载模型,启动tritonserver.

    $ cd /home/code/triton/server/docs/examples

    $ ./fetch_models.sh

    $ tritonserver --model-repository=model_repository

    2.2 测试demo

    从Releases · triton-inference-server/server · GitHub下载client sdk ,如: v2.25.0_ubuntu2004.clients.tar.gz,解压到本地,执行测试,

    $ ../bin/image_client -m inception_graphdef -s INCEPTION -c 3 -b 2 qa/images/mug.jpg

    返回结果如下:

    Request 0, batch size 2
    Image 'qa/images/mug.jpg':
        0.754047 (505) = COFFEE MUG
        0.157065 (969) = CUP
        0.002878 (968) = ESPRESSO
    Image 'qa/images/mug.jpg':
        0.754047 (505) = COFFEE MUG
        0.157065 (969) = CUP
        0.002878 (968) = ESPRESSO

    3 CAPI方式

    3.1 编译simple

    server目录的simple没有提供Makefile,按这个Makefile进行编译,缺少的东西需要添加。

    1. cat Makefile
    2. TARGET=simple
    3. GCC=g++
    4. GCC_PARMS+= -I./rdjson -I /usr/local/cuda-$(CUDA_VER)/include
    5. GCC_PARMS+=-I/opt/tritonserver/include -D TRITON_ENABLE_GPU=ON -D TRITON_MIN_COMPUTE_CAPABILITY=5.3
    6. GCC_LIBS= -L/usr/local/cuda-$(CUDA_VER)/lib64/ -L/opt/tritonserver/lib/
    7. GCC_LIBS+=-lpthread -ltritonserver -lcudart
    8. all: $(TARGET)
    9. %.o: %.cc
    10. $(GCC) $(GCC_PARMS) -c -g -o $@ $^
    11. $(TARGET): $(TARGET).o
    12. $(GCC) $^ $(GCC_LIBS) -o $@
    13. clean:
    14. rm -f $(TARGET).o $(TARGET)
    15. .PHONY: all clean

    3.2 测试simple

    编译成功后,传入模型路径给simple, 如: ./simple -r ../../docs/examples/model_repository/,部分结果打印如下:

    OUTPUT0 is stored in system memory
    OUTPUT1 is stored in system memory
    0 + 1 = 1
    0 - 1 = -1
    1 + 1 = 2
    1 - 1 = 0
    2 + 1 = 3
    2 - 1 = 1
    3 + 1 = 4
    3 - 1 = 2
    4 + 1 = 5
    4 - 1 = 3
    5 + 1 = 6
    5 - 1 = 4
    6 + 1 = 7
    6 - 1 = 5
    7 + 1 = 8
    7 - 1 = 6
    8 + 1 = 9
    8 - 1 = 7
    9 + 1 = 10
    9 - 1 = 8
    10 + 1 = 11
    10 - 1 = 9
    11 + 1 = 12
    11 - 1 = 10
    12 + 1 = 13
    12 - 1 = 11
    13 + 1 = 14
    13 - 1 = 12
    14 + 1 = 15
    14 - 1 = 13
    15 + 1 = 16
    15 - 1 = 14
     

  • 相关阅读:
    图片码二次渲染绕过
    Spark - 第20章 流处理基础
    【二次分配问题】基于遗传算法 (GA)、粒子群优化 (PSO) 和萤火虫算法 (FA) 求解二次分配( QAP)问题(MATLAB 实现)
    无风扇嵌入式车载电脑在矿山车辆行业应用
    c++-stack和queue
    猿创征文 |【SpringBoot2】快速上手SpringBoot
    java#5(数组)
    【数据结构】栈、队列和数组
    关于javaScript的学习总结
    OceanBase荣获OSCAR两项大奖,开源已成主流开发模式
  • 原文地址:https://blog.csdn.net/evsqiezi/article/details/127043811
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号