与迭代次数有关的一种差值结构

( A, B )---2*30*2---( 1, 0 )( 0, 1 )

做一个2*30*2的网络来分类A和B，让A由两张图片(1,1),(0,1)组成,让B由两张(1,0)组成。将收敛误差固定，得到迭代次数

1	1		1	0		k	1
0	1		1	0		1b	1
2
f2[0]	f2[1]	迭代次数n	平均准确率p-ave	1-0	0-1	δ	耗时ms/次	耗时ms/199次
0.999105	8.96E-04	4018.94	1	1	1	9.00E-04	33.11055	6589
0.999204	7.95E-04	4291.503	1	1	1	8.00E-04	35.9598	7156
0.999304	6.97E-04	4583.06	1	1	1	7.00E-04	36.83417	7330

并统计差值结构，如果等位点都是1则为k，如果都是0则为0，如果一个是1一个是0，则如果1来自A则为1，如果1来自B则为1b。

( A, B )---3*30*2---( 1, 0 )( 0, 1 )

做一个3*30*2的网络来分类A和B，让A由两张图片(0,1,1),(0,0,1)组成,让B由两张(0,1,0)组成。将收敛误差固定，得到的迭代次数为

0	1	1		0	1	0		0	k	1
0	0	1		0	1	0		0	1b	1
3
f2[0]	f2[1]	迭代次数n	平均准确率p-ave	1-0	0-1	δ	耗时ms/次	耗时ms/199次	耗时 min/199	最大准确率p-max	迭代次数标准差
0.999105	8.95E-04	4035.302	1	1	1	9.00E-04	33.19095	6605			247.5778	0
0.999204	7.96E-04	4267.965	1	1	1	8.00E-04	33.42714	6652			246.9168	0
0.999304	6.97E-04	4589.935	1	1	1	7.00E-04	35.62814	7090			258.2833	0

相比2*30的网络，3*30的网络只是图片多了一个0，但他们的迭代次数是很相近的。3*30的网络和2*30的网络都有一个相同的差值结构k,1b,1,1.

( A, B )---4*30*2---( 1, 0 )( 0, 1 )

做一个4*30*2的网络来分类A和B，让A由两张图片(0,0,1,1),(0,0,0,1)组成,让B由两张(0,0,1,0)组成。将收敛误差固定，得到的迭代次数为

0	0	1	1		0	0	1	0		0	0	k	1
0	0	0	1		0	0	1	0		0	0	1b	1
4
f2[0]	f2[1]	迭代次数n	平均准确率p-ave	1-0	0-1	δ	耗时ms/次	耗时ms/199次	耗时 min/199	最大准确率p-max	迭代次数标准差
0.999105	8.95E-04	4031.985	1	1	1	9.00E-04	35.38693	7042			247.9953	0
0.999205	7.96E-04	4267.06	1	1	1	8.00E-04	35.79397	7138			244.3615	0
0.999304	6.96E-04	4627.683	1	1	1	7.00E-04	38.67839	7697			275.0568	0

可观察到的由于4*30的网络的差值结构同样是k,1b,1,1，这个网络和前两个网络的迭代次数是很相近的。

做第4个网络让k,1b和1，1两列隔开

0	1	0	1		0	1	0	0		0	k	0	1
0	0	0	1		0	1	0	0		0	1b	0	1
41
f2[0]	f2[1]	迭代次数n	平均准确率p-ave	1-0	0-1	δ	耗时ms/次	耗时ms/199次	耗时 min/199	最大准确率p-max	迭代次数标准差
0.999105	8.95E-04	4034.759	1	1	1	9.00E-04	36.25126	7214			224.049	0
0.999204	7.95E-04	4291.06	1	1	1	8.00E-04	38.52764	7667			262.9015	0
0.999303	6.96E-04	4628.628	1	1	1	7.00E-04	39.8794	7936			323.5693	0

得到的迭代次数很相近，所以差值结构的0，0列对迭代没有影响。

做第5个网络，颠倒差值结构的横向顺序

0	1	1	0		0	0	1	0		0	1	k	0
0	1	0	0		0	0	1	0		0	1	1b	0
42
f2[0]	f2[1]	迭代次数n	平均准确率p-ave	1-0	0-1	δ	耗时ms/次	耗时ms/199次	耗时 min/199	最大准确率p-max	迭代次数标准差
0.999104	8.95E-04	4023.643	1	1	1	9.00E-04	34.61809	6889			227.8451	0
0.999204	7.96E-04	4281.975	1	1	1	8.00E-04	35.19598	7004			247.0587	0
0.999303	6.96E-04	4601.693	1	1	1	7.00E-04	37.51759	7466			298.1821	0

做第6个网络颠倒差值结构的纵向顺序

1	0	0	0		0	0	0	1		1	0	0	1b
1	0	0	1		0	0	0	1		1	0	0	k
43
f2[0]	f2[1]	迭代次数n	平均准确率p-ave	1-0	0-1	δ	耗时ms/次	耗时ms/199次	耗时 min/199	最大准确率p-max	迭代次数标准差
0.999104	8.95E-04	4048.216	1	1	1	9.00E-04	35.47739	7060			225.8092	0
0.999205	7.96E-04	4287.131	1	1	1	8.00E-04	35.18593	7002			279.3502	0
0.999303	6.96E-04	4581.04	1	1	1	7.00E-04	37.21106	7405			277.4729	0

将6组迭代次数放在一起比较

	2	3	4	41	42	43
δ	迭代次数n	迭代次数n	迭代次数n	迭代次数n	迭代次数n	迭代次数n
9.00E-04	4018.94	4035.302	4031.985	4034.759	4023.643	4048.216
8.00E-04	4291.503	4267.965	4267.06	4291.06	4281.975	4287.131
7.00E-04	4583.06	4589.935	4627.683	4628.628	4601.693	4581.04

比较这3条曲线，将这3条线理解为直线将是很便捷而实用的。所以如果训练集的差值结构一致则他们的迭代次数一致，而与差值结构的顺序无关。

相关阅读:
深度学习中常见概念（收敛、优化器、学习率等）
nginx+flume 数据采集
 HDFS的存储原理
 css预编译器--sass
74. 搜索二维矩阵
 使用C#开发163邮件发送功能
 MyBatis - 代理
 基于深度卷积集成网络的视网膜多种疾病筛查和识别方法
 实例分割Yolact边缘端部署（一）制作自己的数据集
 [持续更新]计算机经典面试题基础篇Day2
原文地址：https://blog.csdn.net/georgesale/article/details/127833318