计算机视觉任务一直是GPU的天下,由于GPU超强的算力,也把计算机视觉任务提高了很多水平。但是在移动终端平台,如何来运行大型的模型,一直是大家关注的话题。Mediapipe是Google开源的可以直接运行在移动终端设备上的多任务模型,不仅在计算机视觉任务上,还是NLP自然语言处理任务上,都取得的较好的成绩。本期我们来看看使用Mediapipe如何进行对象分类任务。
Mediapipe对象分类任务,输入可以是以下数据类型之一:
图像分类器输出一个类别列表,其中包含:
图像分类器需要下载图像分类模型,Mediapipe提供了2种尺寸的模型供用户下载。
EfficientNet-Lite0模型
EfficientNet-Lite0 模型使用 EfficientNet 架构,并使用ImageNet进行训练以识别 1,000个类别,例如树木、动物、食物、车辆、人等。EfficientNet-Lite0 可用作 int8