目前的农作物病害图像识别方法类别:
- 基于手工设计特征的
- 基于深度特征学习的:
- 深度学习模型来提取特种:使用的公开数据集:PlantVillage数据集/基于简单背景的农作物病害识别。没有其他因素影响,图像清晰,病斑明显。
加参数共享的是为了->提高识别鲁棒性实现监督精度和鲁棒性两方面的识别性能
自注意力->在前两种方法上,将自注意力机制引入农作物病害识别研究中来:实际环境中强,但是加入高斯和椒盐两种噪声干扰时,不如上一个强
定义高阶残差网络 HOResNet学习丰富细致的特征,从而识别率更高。自然环境采集的AEX-CD9214数据集。
农作物病害识别方法主要有:
田间症状观察:原始、存在主观误判
基于化学和分子生物学的病害检测:需要昂贵的仪器和实验平台
基于光谱技术的检测:需要光谱仪、对环境的参数变化名改,缺乏病害种类的特异性
基于可见光图像的识别:主要针对于这个
对病害做出有效诊断和防治
能够描述图像类编的相关特征(入颜色、形状纹理等)一般分为图像预处理、特征表示、分类识别等步骤基于手工设计特征的农作物病害图像识别方法流程图
- 支持向量机(Support Vector Machine,SVM)模型广泛使用
- 利用神经网络模型进行分类识别
=Sanyal等人选用神经网络对水稻两种病害叶片和健康叶片实现分类识别,实验结果表明其识别率可以达到89.26%- 使用贝叶斯分类器识别
赵玉霞等人利用朴素贝叶斯分类器的统计学习方法对五种玉米病斑图进行分类识别
唐朝霞等人通过遗传算法进行特征优选之后,采用贝叶斯分类器识别玉米病害图像,使得识别准确率得到了提高
Phadikar等人利用贝叶斯和SVM分类器对水稻叶褐斑病和叶瘟病两种病害进行分类。
结果显示,相比SVM分类器,贝叶斯分类器的识别精度高,识别速度快。- 使用随机森林方法识别
- 其他分类模型研究,
许良凤等人针对单分类器识别的局限性,面向具有复杂性的玉米叶部病害,提出了一种基于自适应加权的多分类器融合玉米叶部病害识别方法
深度卷积神经功能网络基于深度特征学习的图像识别方法,与传统相比:可以获取图像的全局/上下文特征。
只需要迭代学习就可以找到合适的分类特征
- 多层感知机
- 卷积神经网络
大多针对的是PlantVillage/简单的图像识别,需要对复杂条件下进行进一步研究
我国是世界上农作物病害发生较为严重的国家之一,病害分布广、突发性强、防空难度大
原始的卷积神经网络,当网络层加深的时候,会出现精度不变,但是误差增大的情况。因此,为了让网络层数加深,而误差不变大,假如加入恒等映射则会保持参数量、精度和误差都不会收到影响。从而让卷积层只学习细微的特征。相当于只在恒等式的右边加入一个趋近于0的函数,使得加入卷积层对于恒等映射的影响不大
即使得:H(x) = f(x) + x。其中F(x)为残差函数,是卷积层需要学习的残差,也是需要关注的细微特征。
何凯明的残差函数思想使得网络层数可以很深,但是不会出现梯度消失的现象,深度网络的性能更优
- Cheng等人使用ResNet实现复杂农田背景下的害虫的准确识别. ResNet101精度最该
- Artzai等人通过在ResNet50的基础上,用两个连续的33的卷积层代替ResNet50中的第一个77的卷积层,后面都接的是3*3的最大池化层,从而提取更好的细粒视觉特则恶化功能。 0.78 -》0.87
以上都是基于ResNet进行预训练模型的迁移学习,或者只该卷积核的尺度。
定义了:高阶残差模块,如上图。圆圈⭕️表达是和操作层,将多个输入做和运算,将这种级联操作定义为高阶残差模块(HOR)
3个卷积层:CONV1\2\3 输出分别为X1\2\3
X1和X3的通道数相同,可以将X1和X3级联起来,结果为整个残差子网络的总输出
借助了残差学习的思想,卷积层学习的是残差函数
假如 H(x) = F(x) + X1 = X1 + X3,则残差函数F(x) = H(x) - X1 = X3。
整个网络中实现了将经过CONV!卷积的底层特征和经过CONV1\2\3三个卷积层卷积到的高级细节特征一起提取出来,传递到下面的网络结构中继续进行提取
== 总结:该模块可以利用网络中底层特征的斜街描述和高层特征的全局表达,为农作物病害表现提供丰富细致的特征表达==
(在PlantVillage/AES-CD9214(自建)上模拟验证)
残差模块必要性验证
测试中间带/不带卷积层的区别(传统是不带的)-> 带了卷积层更好
卷积层层数的选择
列出在残差模块3/4中间插入3-6层卷积成 -> 5层效果最好 卷积层数增加导致模型参数增大,因此对于训练数据量较少的时候,参数过多容易过拟合
参数详情
选择11/33两种卷积核
避免训练样本不足导致的过拟合问题:选择更深的网络设计策略来设计通道的每一层,在每一层上均使用小通道
方法实现细节
使用Softmax作为目标函数
优化算法:Adam最优化算法,学习率2*10^-3, epoch = 120
PlantVillage:有关农业的问答论坛,数据集基于该论坛建成
AES-CD9214:做着在依然环境下,6种原始病害图像共2240张
采用CNN、FB(带反馈的军机神经网络)、HOResNet作为对照
(a)图像中出现了人手,给识别带来干扰;(b)图像中水沟,杂草等背景影响主体病害图像;(c)图像中固定桩的出现给图像带来了识别干扰:(d)光照不足影响图像质量和识别准确率:(e)光照过强,使得图像主体曝光白化;(f)杂草遮挡病害部位;(g)塑料薄膜出现导致背景复杂:(h)水珠、污溃使得图像病斑变形
引入了高阶残差模块提高了准确率
他人的方法:
- 构建一个两路对称且权值共享的深度卷积神经网络来增强目标的可识别性,来解决目标跟踪过程中遮挡、光照变化等问题的鲁棒性
- 一种通过稳定性训练提高深度网络鲁棒性的方法,该方法,对输入图像具有小扰动的图像进行训练,保持模型保持恒定,具有更高的鲁棒性,在噪声数据集上进行测试时测试准确率更高
- 一种多级卷积神经网络提取多尺度特征,提高图像识别的鲁棒性。
- 提出一种深度对准网络(解决面部图像的头部姿势大的变化),使用整个面部图像在所有阶段
- 在卷积神经网络中引入反馈回路,证明了反馈网络有助于更好地捕捉具有复杂背景和多个物件的图像中预期目标的视觉注意力,而且反馈网络具有一定水平的选择性,可以自上而下推理过程中提供非相关抑制,允许模型聚焦于提高类置信度的最显著图像区域
作者的方法:
将反馈网络引入上文的高阶残差网络中
级联机制:链接了前三个残差模块的输出=》提高模型的识别率
在HORPSF方法中定义了一个新的参数共享反馈子网络
将卷积层重新加载,加载之后进行两次卷积,再将卷积结果返回到前面的浅层,重复加载后作为输出传递到后面的网络层模型中=》将网络中深层卷积层的特征反馈至浅层卷积层,进行再一次的精细过滤调整,进一步压制背景噪声
本文的方法:
采用CNN\PSF\HOR\HORPSF四种方法进行对比实验
深度学习里的注意力机制,源于人脑的注意力机制。只使用一个很小的感受野来处理图像需要特别关注的区域,使得高维的图像处理计算难度降低。深度卷积神经网络本身就自带注意力的功能。激活的维度正好就是显著性区域。
自注意力机制是注意力机制的一种特殊情况,将自注意力机制引入到卷积神经网络中,更好的对农作物病斑区域重点关注。
图中框标出的是病斑区域,可见大部分病斑区域小,与背景对比度小,容易混渚病斑和背景,从而会给识别带来挑战。
Self-Attention Convolutional Neural Network, SACNN 基于自注意力的卷积神经网络
其中普通举行是基本网络Base-Net, 中间的位自注意力模块(Self-Attention,SA)
其中
⨂表示的是矩阵乘法操作:⊕表示的是求和操作,其上方的μ表示SA(x)需要乘以系数μ之后再进行求和操作;卷积层虚线引向的框中列出的是三个卷积层的相应参数,其中c为输入的通道数,ratio表示通道设置比例,可取1/2,1/8,1/10,1/16等。
将基本网络卷积层输出的特征映射In(X)输入到自注意力网络时,首先并行经过卷积层Conv1、Conv2、Conv3卷积,其输出分别为L(x)、M(x)、N(x)。自注意力网络中的卷积层参数如图5.4所示,其中Convl和Conv2通道数为c*ratio,这里c为输入In(x)的通道数,ratio是一个比例系数,可以取1/2、1/4、1/6、1/8、1/10、1/16等,具体取值需要通过实验测试来确定最佳值。
后续再对合理性进行验证
AES-CDR系统可以实现6种病害类别和非病害类别之间的分类识别