An enhanced diabetic retinopathy detection and classification approach using deep convolutional neural network

IF = 5.102/Q2
先验知识/知识拓展
文章结构
- 摘要
- introduction
- 数据和方法
- 应用和性能评估
- 结论
文章结果
眼底图像经过传统方法增强后,使用一个简短的深度卷积神经网络对糖网进行分类。其中使用的传统的图像增强方法是HE和CLAHE
方法
文中提到对于眼底照经常使用的增强方式是:HE和CLAHE(附一篇blog)
- HE:直方均衡化算法

- CLAHE:限制对比度自适应直方图均衡算法

1. 预处理
- resize
- 将图像的三个通道分割
- 使用HE分别对三个通道增强
- 使用CLAHE分别对三个通道增强

2. HE
HE对于具有广泛分布的色调区域的图像非常有用,以便可以观察到具有非常浅的背景和黑暗的前景的图像。由于HE拉伸了局部区域的对比度,我们可以找出图像中隐藏的细节,从而可以观察到所处理区域内的差异
3.CNN网络用于分类
CNN模型类似于中所周知的多层感知器网络,CNN通过在相邻层节点之间应用局部连接模型,利用与相对连接的局部关联。
- 使用了一个八层的卷积神经网络进行分类。输入层,卷积层,ReLU,normalize层,max pooling层,全连接层, softmax 层, 和输出 layer(这种说法是错误的,在文章不足中说).
总结
1. 文章优点
- 文章背景部分写的篇幅很长,在看introduction部分,感觉更像是一篇review。但是不得不说作者前期做了很多文献调研,在workflow部分,也阐述了自己的文献调研部分,一般除了meta分析和review很少见这样的写作方式。背景部分写的详细更容易让读者理解,但是篇幅过于冗长,看起来有些枯燥。

2. 文章不足
- 作者在method部分值介绍了CNN的优势,并没有写具体网络是怎么设计的,找了好久,最后在验证部分看到了网络结构的设计。自己感觉这种写作方式逻辑不清晰,很混乱。在性能验证部分写网络结构以及参数选择,让人容易混乱(个人感觉)
- 医学类文章存在的共性问题,医学方面的人不懂计算机,计算机方面的人不了解医学上的需要。笔者认为网络中的所有层数就是网络的层,但实际是只算shape改变的层数。
可借鉴点/学习点?
- 整体比较完整,有消融实验,分别在原来直接resize后的分类,增加HE后的分类结果和增加CLAHE的效果做对比。
- 预处理部分使用传统方法进行图像增强其实也是一个思路,不止只将眼光放在现在最新的方法上,有的时候传统方法或许会有更好的效果。