图像识别作为深度学习算法的主流实践应用方向,早已在生活的各个领域发挥作用。如安全检查、身份核验时的人脸识别;无人货架、智能零售柜中的商品识别,其背后的关键技术都在于此。
图1 PP-ShiTu v2实际预测效果示意图
然而实现理想的识别效果却并不容易:
难点****一:针对海量数据,不同场景均实现优秀的表征能力,能否一套方案全搞定?
难点二:不同物品的差别极其微小,或者同类物品由于受到外界干扰却呈现不同形态,究竟如何进行有效区分?
难点三:识别需求更新频繁,使用单一模型必须不断重训模型,怎样才能降低开发成本,快速跟上迭代步伐?
此次PaddleClas最新升级发布的通用图像识别系统 PP-ShiTu v2完美解决以上难点,无需训练,一套模型即可完成20+高频场景的图像识别,对于新增类别更是只****需两步即可添加入库,实现精准识别。
图2 PP-ShiTu v2覆盖场景列表
⭐ 项目链接 ⭐
https://github.com/PaddlePaddle/PaddleClas
扫描下方二维码加入技术交流群即可获得完整检索库图像数据,还有更多志同道合的朋友随时交流:
不仅如此,此次更新更是联合AI Studio精选项目作者——国内Qt论坛总版主小熊宝宝,发布全新图像库管理工具,通过可视化的界面即可完成检索库类别、图像管理,还支持一键更新索引库:
图3 图像库管理工具效果示意图
⭐文档链接⭐
https://github.com/PaddlePaddle/PaddleClas/tree/release/2.5/deploy/shitu_index_manager
同时还提供了移动端基于飞桨轻量化推理引擎Paddle Lite部署教程,手机上也能轻松实现图像识别,还有Android APP可玩,扫码下载即可体验:
图4 PP-ShiTu v2APP效果展示
本APP已预置196种常见饮料检索库,支持对拍照/本地上传的图片进行识别;同时支持通过拍照/本地更新检索库,可快速适应新增类别的识别需求,构建自己的专属识别APP。
图像识别系统
PP-ShiTu v2核心技术解读
这样的特殊能力,得益于PP-ShiTu v2通过集合目标检测、度量学习、图像检索等技术,形成完整的图像识别系统;但其中每个模块又相互解耦,并将每个模块性能最大化,结合自研PP系列骨干网络,才实现了量化后仅15M的All-in-One超轻量图像识别系统。
图5 PP-ShiTu v2结构示意图
轻量骨干网络PP-LCNet v2,配合SSLD蒸馏算法,模型精度大幅提升。
超轻量主体检测算法PP-PicoDet,快速检测出图像中的目标物体。
基于ReID Strong Baseline等方法,对特征提取模块进一步优化,精度提升8个点。
表1 PP-ShiTu v2性能对比
https://github.com/PaddlePaddle/PaddleClas/blob/develop/docs/zh_CN/PPShiTu/PPShiTuV2_introduction.md
助力开发者
共建开源生态
自PP-ShiTu发布以来,引起了众多开发者的广泛关注。在诸如自助零售柜、生鲜结算台、菜品无人结算等场景实现业务落地。
图6 基于 PP-ShiTu v2的生鲜智能结算方案
深圳市银歌云技术有限公司将深度学习图像识别技术与传统结算流程结合,基于 PP-ShiTu v2,完成了生鲜自助结算系统的开发落地,识别精度高达98%,整个流程在1秒内即可完成,无需人工干预完成结算,减少人工成本的同时,大大提升了结算效率和用户体验。
图7 银歌云生鲜智能结算系统实际效果展示
与此同时,我们也力求为开源社区的繁荣作出贡献,希望PP-ShiTu算法以及优化思路,可以给业界开发者带来更好网络的同时,也带来更多的算法优化启发,为中国的开源发展贡献一份力量!
相关地址
https://www.paddlepaddle.org.cn
https://github.com/PaddlePaddle/PaddleClas
https://gitee.com/paddlepaddle/PaddleClas
拓展阅读
快快给各位开发者一个Star的鼓励吧!
关注【飞桨PaddlePaddle】公众号
获取更多技术内容~