( A, B )---2*30*2---( 1, 0 )( 0, 1 )

做一个2*30*2的网络来分类A和B,让A由两张图片(1,1),(0,1)组成,让B由两张(1,0)组成。将收敛误差固定,得到迭代次数
| 1 | 1 | 1 | 0 | k | 1 | |||
| 0 | 1 | 1 | 0 | 1b | 1 | |||
| 2 | ||||||||
| f2[0] | f2[1] | 迭代次数n | 平均准确率p-ave | 1-0 | 0-1 | δ | 耗时ms/次 | 耗时ms/199次 |
| 0.999105 | 8.96E-04 | 4018.94 | 1 | 1 | 1 | 9.00E-04 | 33.11055 | 6589 |
| 0.999204 | 7.95E-04 | 4291.503 | 1 | 1 | 1 | 8.00E-04 | 35.9598 | 7156 |
| 0.999304 | 6.97E-04 | 4583.06 | 1 | 1 | 1 | 7.00E-04 | 36.83417 | 7330 |
并统计差值结构,如果等位点都是1则为k,如果都是0则为0,如果一个是1一个是0,则如果1来自A则为1,如果1来自B则为1b。
( A, B )---3*30*2---( 1, 0 )( 0, 1 )

做一个3*30*2的网络来分类A和B,让A由两张图片(0,1,1),(0,0,1)组成,让B由两张(0,1,0)组成。将收敛误差固定,得到的迭代次数为
| 0 | 1 | 1 | 0 | 1 | 0 | 0 | k | 1 | ||||
| 0 | 0 | 1 | 0 | 1 | 0 | 0 | 1b | 1 | ||||
| 3 | ||||||||||||
| f2[0] | f2[1] | 迭代次数n | 平均准确率p-ave | 1-0 | 0-1 | δ | 耗时ms/次 | 耗时ms/199次 | 耗时 min/199 | 最大准确率p-max | 迭代次数标准差 | |
| 0.999105 | 8.95E-04 | 4035.302 | 1 | 1 | 1 | 9.00E-04 | 33.19095 | 6605 | 247.5778 | 0 | ||
| 0.999204 | 7.96E-04 | 4267.965 | 1 | 1 | 1 | 8.00E-04 | 33.42714 | 6652 | 246.9168 | 0 | ||
| 0.999304 | 6.97E-04 | 4589.935 | 1 | 1 | 1 | 7.00E-04 | 35.62814 | 7090 | 258.2833 | 0 | ||
相比2*30的网络,3*30的网络只是图片多了一个0,但他们的迭代次数是很相近的。3*30的网络和2*30的网络都有一个相同的差值结构k,1b,1,1.
( A, B )---4*30*2---( 1, 0 )( 0, 1 )

做一个4*30*2的网络来分类A和B,让A由两张图片(0,0,1,1),(0,0,0,1)组成,让B由两张(0,0,1,0)组成。将收敛误差固定,得到的迭代次数为
| 0 | 0 | 1 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | k | 1 | ||
| 0 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 1b | 1 | ||
| 4 | |||||||||||||
| f2[0] | f2[1] | 迭代次数n | 平均准确率p-ave | 1-0 | 0-1 | δ | 耗时ms/次 | 耗时ms/199次 | 耗时 min/199 | 最大准确率p-max | 迭代次数标准差 | ||
| 0.999105 | 8.95E-04 | 4031.985 | 1 | 1 | 1 | 9.00E-04 | 35.38693 | 7042 | 247.9953 | 0 | |||
| 0.999205 | 7.96E-04 | 4267.06 | 1 | 1 | 1 | 8.00E-04 | 35.79397 | 7138 | 244.3615 | 0 | |||
| 0.999304 | 6.96E-04 | 4627.683 | 1 | 1 | 1 | 7.00E-04 | 38.67839 | 7697 | 275.0568 | 0 | |||
可观察到的由于4*30的网络的差值结构同样是k,1b,1,1,这个网络和前两个网络的迭代次数是很相近的。

做第4个网络让k,1b和1,1两列隔开
| 0 | 1 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | k | 0 | 1 | ||
| 0 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 1b | 0 | 1 | ||
| 41 | |||||||||||||
| f2[0] | f2[1] | 迭代次数n | 平均准确率p-ave | 1-0 | 0-1 | δ | 耗时ms/次 | 耗时ms/199次 | 耗时 min/199 | 最大准确率p-max | 迭代次数标准差 | ||
| 0.999105 | 8.95E-04 | 4034.759 | 1 | 1 | 1 | 9.00E-04 | 36.25126 | 7214 | 224.049 | 0 | |||
| 0.999204 | 7.95E-04 | 4291.06 | 1 | 1 | 1 | 8.00E-04 | 38.52764 | 7667 | 262.9015 | 0 | |||
| 0.999303 | 6.96E-04 | 4628.628 | 1 | 1 | 1 | 7.00E-04 | 39.8794 | 7936 | 323.5693 | 0 | |||
得到的迭代次数很相近,所以差值结构的0,0列对迭代没有影响。

做第5个网络,颠倒差值结构的横向顺序
| 0 | 1 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | k | 0 | ||
| 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 1b | 0 | ||
| 42 | |||||||||||||
| f2[0] | f2[1] | 迭代次数n | 平均准确率p-ave | 1-0 | 0-1 | δ | 耗时ms/次 | 耗时ms/199次 | 耗时 min/199 | 最大准确率p-max | 迭代次数标准差 | ||
| 0.999104 | 8.95E-04 | 4023.643 | 1 | 1 | 1 | 9.00E-04 | 34.61809 | 6889 | 227.8451 | 0 | |||
| 0.999204 | 7.96E-04 | 4281.975 | 1 | 1 | 1 | 8.00E-04 | 35.19598 | 7004 | 247.0587 | 0 | |||
| 0.999303 | 6.96E-04 | 4601.693 | 1 | 1 | 1 | 7.00E-04 | 37.51759 | 7466 | 298.1821 | 0 | |||

做第6个网络颠倒差值结构的纵向顺序
| 1 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 1b | ||
| 1 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | k | ||
| 43 | |||||||||||||
| f2[0] | f2[1] | 迭代次数n | 平均准确率p-ave | 1-0 | 0-1 | δ | 耗时ms/次 | 耗时ms/199次 | 耗时 min/199 | 最大准确率p-max | 迭代次数标准差 | ||
| 0.999104 | 8.95E-04 | 4048.216 | 1 | 1 | 1 | 9.00E-04 | 35.47739 | 7060 | 225.8092 | 0 | |||
| 0.999205 | 7.96E-04 | 4287.131 | 1 | 1 | 1 | 8.00E-04 | 35.18593 | 7002 | 279.3502 | 0 | |||
| 0.999303 | 6.96E-04 | 4581.04 | 1 | 1 | 1 | 7.00E-04 | 37.21106 | 7405 | 277.4729 | 0 | |||
将6组迭代次数放在一起比较
| 2 | 3 | 4 | 41 | 42 | 43 | |
| δ | 迭代次数n | 迭代次数n | 迭代次数n | 迭代次数n | 迭代次数n | 迭代次数n |
| 9.00E-04 | 4018.94 | 4035.302 | 4031.985 | 4034.759 | 4023.643 | 4048.216 |
| 8.00E-04 | 4291.503 | 4267.965 | 4267.06 | 4291.06 | 4281.975 | 4287.131 |
| 7.00E-04 | 4583.06 | 4589.935 | 4627.683 | 4628.628 | 4601.693 | 4581.04 |

比较这3条曲线,将这3条线理解为直线将是很便捷而实用的。所以如果训练集的差值结构一致则他们的迭代次数一致,而与差值结构的顺序无关。