CNN鲜花分类

1、数据集介绍

总共5种花，按照文件夹区分花朵的类别。

下载下来的是个压缩包，需要将其解压。

数据集下载地址：https://storage.googleapis.com/download.tensorflow.org/example_images/flower_photos.tgz

2、代码实战

2.1 导入依赖

import PIL
import numpy as np
import matplotlib.pyplot as plt
import pathlib
import lib

import tensorflow as tf
from tensorflow.keras import layers,models
1
2
3
4
5
6
7
8

2.2 下载数据

# 下载数据集到本地
data_url='https://storage.googleapis.com/download.tensorflow.org/example_images/flower_photos.tgz'
data_dir=tf.keras.utils.get_file('flower_photos',origin=data_url,untar=True)#untar=True 下载后解压
data_dir=pathlib.Path(data_dir)
1
2
3
4

2.3 统计数据集

# 统计数据集大小
dataset_size=len(list(data_dir.glob('*/*.jpg')))
dataset_size
1
2
3

总共3670张照片，比上次小狗分类那个少多了。

# 显示部分图片
imgs=list(data_dir.glob('*/*.jpg'))
imgs
1
2
3

查看下第1张图片

img1=imgs[0] #第一张图片
img1
1
2

str(img1)
1

PIL.Image.open(str(img1)) #读取并显示
1

再查看下第2张图片

img2=imgs[1] #第2张图片
PIL.Image.open(str(img2))
1
2

2.4 创建dataset

训练集：

# 3 创建dataset
BATCH_SIZE=32 
HEIGHT=180
WIDTH=180

#80%是训练集，20%是验证集
train_ds=tf.keras.preprocessing.image_dataset_from_directory(directory=data_dir,
                                                            batch_size=BATCH_SIZE,
                                                            validation_split=0.2,
                                                            subset='training',
                                                            seed=666,
                                                            image_size=(HEIGHT,WIDTH))
train_ds
1
2
3
4
5
6
7
8
9
10
11
12
13

class_names=train_ds.class_names #数据集类别
class_names
1
2

验证集：

val_ds=tf.keras.preprocessing.image_dataset_from_directory(directory=data_dir,
                                                            batch_size=BATCH_SIZE,
                                                            validation_split=0.2,
                                                            subset='validation',
                                                            seed=666,
                                                            image_size=(HEIGHT,WIDTH))
val_ds
1
2
3
4
5
6
7

2.5 可视化一个batch_size

# 可视化一个batch_size的数据
for images,labels in train_ds.take(1):
    for i in range(9): # 一个batch_size有32张，这里只显示9张
        plt.subplot(3,3,i+1)
        plt.imshow(images[i].numpy().astype('uint8'))
        plt.title(class_names[labels[i]])
        plt.axis('off')
1
2
3
4
5
6
7

2.6 将数据集缓存到内存中，加速读取

#将数据集缓存到内存中，加速读取
AUTOTUNE=tf.data.AUTOTUNE
train_ds=train_ds.cache().shuffle(1000).prefetch(buffer_size=AUTOTUNE)
val_ds=val_ds.cache().prefetch(buffer_size=AUTOTUNE)
1
2
3
4

2.7 搭建模型

这里仅作测试，并没有使用预训练模型

#搭建模型
model=models.Sequential([
    layers.experimental.preprocessing.Rescaling(1./255,input_shape=(HEIGHT,WIDTH,3)),# 数据归一化
    layers.Conv2D(16,3,padding='same',activation='relu'),
    layers.MaxPool2D(),
    layers.Conv2D(32,3,padding='same',activation='relu'),
    layers.MaxPool2D(),
    layers.Conv2D(64,3,padding='same',activation='relu'),
    layers.MaxPool2D(),
    layers.Flatten(),
    layers.Dense(128,activation='relu'),
    layers.Dense(5)
])
1
2
3
4
5
6
7
8
9
10
11
12
13

model.summary()
1

2.8 编译模型

#编译模型
model.compile(optimizer='adam',
             loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
             metrics=['accuracy'])
1
2
3
4

这里使用的SparseCategoricalCrossentropy会自动帮我们

2.9 模型训练

#模型训练
EPOCHS=10
history=model.fit(train_ds,validation_data=val_ds,epochs=EPOCHS)
1
2
3

这里由于设备太拉跨，略微出手已是显卡极限，所以就只设置了10个epoch

2.10 可视化训练结果

# 可视化训练结果
ranges=range(EPOCHS)
train_acc=history.history['accuracy']
val_acc=history.history['val_accuracy']

train_loss=history.history['loss']
val_loss=history.history['val_loss']

plt.figure(figsize=(16,8))
plt.subplot(1,2,1)
plt.plot(ranges,train_acc,label='train_acc')
plt.plot(ranges,val_acc,label='val_acc')
plt.title('Accuracy')
plt.xlabel('Epochs')
plt.ylabel('Accuracy')

plt.subplot(1,2,2)
plt.plot(ranges,train_loss,label='train_loss')
plt.plot(ranges,val_loss,label='val_loss')
plt.title('Loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')

plt.show()
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

过拟合非常严重，下面对模型进行优化

3、模型优化

3.1 数据增强设置

# 数据增强参数设置
data_argumentation=tf.keras.Sequential([
    # 随机水平翻转
    layers.experimental.preprocessing.RandomFlip('horizontal',input_shape=(HEIGHT,WIDTH,3)),
    # 随机旋转
    layers.experimental.preprocessing.RandomRotation(0.1), # 旋转
    # 随机缩放
    layers.experimental.preprocessing.RandomZoom(0.1),  # 
])
1
2
3
4
5
6
7
8
9

这块的API太多了，多去查查官网。

3.2 显示数据增强后的效果

# 显示数据增强后的效果
for images,labels in train_ds.take(1):
    for i in range(9): # 一个batch_size有32张，这里只显示9张
        plt.subplot(3,3,i+1)
        argumeng_images=data_argumentation(images) #数据增强
        plt.imshow(argumeng_images[i].numpy().astype('uint8')) # 显示
        plt.title(class_names[labels[i]])
        plt.axis('off')
1
2
3
4
5
6
7
8

3.3 搭建新的模型

#搭建新的模型
model_2=models.Sequential([
    data_argumentation, # 数据增强
    layers.experimental.preprocessing.Rescaling(1./255),# 数据归一化
    layers.Conv2D(16,3,padding='same',activation='relu'),
    layers.MaxPool2D(),
    layers.Conv2D(32,3,padding='same',activation='relu'),
    layers.MaxPool2D(),
    layers.Conv2D(64,3,padding='same',activation='relu'),
    layers.MaxPool2D(),
    layers.Dropout(0.2),
    layers.Flatten(),
    layers.Dense(128,activation='relu'),
    layers.Dense(5)
])
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

model_2.summary()
1

3.4 编译模型

#编译模型
model_2.compile(optimizer='adam',
             loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
             metrics=['accuracy'])
1
2
3
4

3.5 模型训练

#模型训练
history=model_2.fit(train_ds,validation_data=val_ds,epochs=EPOCHS)
1
2

3.6 可视化训练结果

# 可视化训练结果
ranges=range(EPOCHS)
train_acc=history.history['accuracy']
val_acc=history.history['val_accuracy']

train_loss=history.history['loss']
val_loss=history.history['val_loss']

plt.figure(figsize=(16,8))
plt.subplot(1,2,1)
plt.plot(ranges,train_acc,label='train_acc')
plt.plot(ranges,val_acc,label='val_acc')
plt.title('Accuracy')
plt.xlabel('Epochs')
plt.ylabel('Accuracy')

plt.subplot(1,2,2)
plt.plot(ranges,train_loss,label='train_loss')
plt.plot(ranges,val_loss,label='val_loss')
plt.title('Loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')

plt.show()
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

现在这个效果比优化之前的好多了。

3.7 模型预测

# 模型预测
test_img=tf.keras.preprocessing.image.load_img('sunfloor.jpg',target_size=(HEIGHT,WIDTH))
test_img
1
2
3

这里我们自己在网上下载一张向日葵的图片进行预测

test_img=tf.keras.preprocessing.image.img_to_array(test_img) # 类型变换
test_img.shape
1
2

将数据扩充一维，因为第一个维度是batchsize

test_img=tf.expand_dims(test_img,0) #扩充一维
test_img.shape
1
2

预测：

preds=model_2.predict(test_img) #预测
preds.shape
1
2

得分：

preds #得分
1

得分转换成概率：

scores=tf.nn.softmax(preds[0])# 得分转换成概率
scores
1
2

print('模型预测可能性最大的类别是：{},概率值为：{}'.format(class_names[np.argmax(scores)],np.max(scores)))
1

这里最后一个全连接层可以直接加上个softmax激活函数，这样预测后就不用再转化了。

相关阅读:
同行评审的度量与分析
立创EDA仿真入门1 基本操作
Linux系统firewalld防火墙的进阶操作（日志保存 IP网段 ssh服务）
机器人系统 ROS 常用命令行工具
Electron.js入门
Codeforces Round #833 (Div. 2)
模板：全局平衡二叉树
融云 IM & RTC 能力上新盘点
Jmeter TCP/UDP测试
EF Core学习笔记：额外的外键属性 / 单项导航属性

原文地址：https://blog.csdn.net/qq_43753724/article/details/126090255