【计算机视觉40例】案例21：图像分类

【导读】本文是专栏《计算机视觉40例简介》的第21个案例《图像分类》。该专栏简要介绍李立宗主编《计算机视觉40例——从入门到深度学习（OpenCV-Python）》一书的40个案例。

目前，该书已经在电子工业出版社出版，大家可以在京东、淘宝、当当等平台购买。

大家可以在公众号“计算机视觉之光”回复关键字【案例21】获取本文案例的源代码及使用的测试图片等资料。

针对本书40个案例的每一个案例，分别录制了介绍视频。如果嫌看文字版麻烦，可以关注公众号“计算机视觉之光”直接观看视频介绍版。

本文简要介绍了本案例的一些基础知识，更详细的理论介绍、代码实现等内容请参考《计算机视觉40例简介》第24章《深度学习应用实践》以获取更详细信息。

图像分类是计算机视觉最基础的任务之一。开始，人们对较简单的具有10个数字类别的手写数字数据集MNIST进行分类。后来，人们对更加复杂的具有10个分类的CIFAR10和100个分类的CIFAR100进行分类。再后来，ImageNet成为人们在分类时所使用的主要数据集。

图像分类，简单来说就是将不同的图像划分到不同的类别内，并保证最小的分类误差。

【例题】使用GoogleNet完成图像分类。


# -*- coding: utf-8 -*-
"""
Created on Mon Sep  6 14:16:58 2021
@author: 李立宗  lilizong@gmail.com
微信公众号：计算机视觉之光（微信号cvlight）
计算机视觉40例——从入门到深度学习（OpenCV-Python）
李立宗 著     电子工业出版社
"""
import numpy as np
import cv2
#=======读取原始图像=============
image=cv2.imread("tower.jpg")
#=======调用模型=============
# 依次执行四个函数：
# readNetFromeCaffe/blogFromImage/setInput/forward
config='model/bvlc_googlenet.prototxt'
model='model/bvlc_googlenet.caffemodel'
net = cv2.dnn.readNetFromCaffe(config, model)
#与readnet不同，需要注意参数的先后顺序
blob = cv2.dnn.blobFromImage(image, 1, (224, 224), (104, 117, 123))
net.setInput(blob)
prob = net.forward()
#=======读取分类信息============
classes =  open('model/label.txt', 'rt').read().strip().split("\n")
#=======确定分类所在行============
rowIndex = np.argsort(prob[0])[::-1][0]
#=======绘制输出结果============
result = "result: {}, {:.0f}%".format(classes[rowIndex],prob[0][rowIndex]*100)
cv2.putText(image, result, (25, 45),  cv2.FONT_HERSHEY_SIMPLEX,1, (0, 0, 255), 2)
#====显示原始输入图像======
cv2.imshow("result",image)
cv2.waitKey()
cv2.destroyAllWindows()

运行程序，显示如图1所示图像。

图1 结果展示

从运行结果可以看到识别结果为“灯塔（beacon, lighthouse, beacon light, pharos）”，置信度为：98.69%。

欢迎大家阅读《计算机视觉40例——从入门到深度学习（OpenCV-Python）》一书中第24章《深度学习应用实践》获取详细内容。

《计算机视觉40例——从入门到深度学习（OpenCV-Python）》在介绍Python基础、OpenCV基础、计算机视觉理论基础、深度学习理论的基础上，介绍了计算机视觉领域内具有代表性的40个典型案例。这些案例中，既有传统的案例（数字识别、答题卡识别、物体计数、缺陷检测、手势识别、隐身术、以图搜图、车牌识别、图像加密、指纹识别等），也有深度学习案例（图像分类、风格迁移、姿势识别、实例分割等），还有人脸识别方面的案例（表情识别、驾驶员疲劳监测、识别性别与年龄等）。

相关阅读:
MyBatis的各种查询功能
【Zookeeper】ZooKeeper的一些重要功能和作用
GPT-3.5发布：大型语言模型的进化与挑战
kubernetes部署dashboard
小白都能轻松掌握，python最稳定的图片识别库ddddocr
drools-加载流程
【CVPR2022】VizWiz-VQA Grounding Challenge冠军算法介绍--Aurora
域名列入备案黑名单解除教程
Vue2 Element表格将单列数据渲染为千分制
Linux操作系统：性能指标监控与通知

原文地址：https://blog.csdn.net/superdont/article/details/126260569