(A,B)---2*30*2---(1,0)(0,1)
用网络分类A和B,让A由两张图片组成(0,0)(0,1),让B由两张图片组成(1,0)(0,0),测试集由(0,0)(0,1)(1,0)(1,1)组成,记为网络0120,固定收敛误差统计迭代次数和分类准确率。得到表格.
0 | 0 | 1 | 0 | 1b | 0 | |||
0 | 1 | 0 | 0 | 0 | 1 | |||
0120 | ||||||||
f2[0] | f2[1] | 迭代次数n | 平均准确率p-ave | 1-0 | 0-1 | δ | 耗时ms/次 | 耗时ms/199次 |
0.537621 | 0.4624 | 22882 | 0.5 | 0.75 | 0.25 | 9.00E-04 | 153.42 | 30530 |
0.44732 | 0.5527 | 25324 | 0.5 | 0.75 | 0.25 | 8.00E-04 | 166.05 | 33044 |
0.477419 | 0.5226 | 28298 | 0.5 | 0.75 | 0.25 | 7.00E-04 | 238.89 | 47555 |
0.462357 | 0.5376 | 32209 | 0.5 | 0.75 | 0.25 | 6.00E-04 | 230.65 | 45899 |
0.48745 | 0.5126 | 37683 | 0.5 | 0.75 | 0.25 | 5.00E-04 | 257.1 | 51168 |
统计收敛误差为5e-4时的分类情况
A | B | |||||
0 | 0 | 0 | 0 | 0 | 0 | |
1 | 0 | 1 | 1 | 0 | 1 | |
2 | 1 | 0 | 2 | 1 | 0 | |
3 | 1 | 1 | 3 | 1 | 1 |
0,1,3都被分类为A,只有2被分类为B.因为A含有(0,1)B含有(1,0),因此(0,1)和(1,0)被分别分类为A和B。但在A和B中都有(0,0).而且(0,0)相对A和B的两列的相似性都是100%,50%,(0,0)被分成A和B的概率应该是一样的。同样A和B的两列相对(1,1)的相似性都是0,50%,所以(1,1)被分成A和B的概率应该也是一样的,但为什么(0,0)(1,1)都被分成了A?
现在让A和B调换顺序,让A为(1,0)(0,0),让B是(0,0)(0,1),测试集同样是(0,0)(0,1)(1,0)(1,1),记为网络2001,同样统计迭代次数和分类准确率
1 | 0 | 0 | 0 | 1 | 0 | |||
0 | 0 | 0 | 1 | 0 | 1b | |||
2001 | ||||||||
f2[0] | f2[1] | 迭代次数n | 平均准确率p-ave | 1-0 | 0-1 | δ | 耗时ms/次 | 耗时ms/199次 |
0.472412 | 0.5276 | 22850 | 0.5 | 0.75 | 0.25 | 9.00E-04 | 156.13 | 31069 |
0.537628 | 0.4624 | 25256 | 0.5 | 0.75 | 0.25 | 8.00E-04 | 169.7 | 33775 |
0.532618 | 0.4674 | 28244 | 0.5 | 0.75 | 0.25 | 7.00E-04 | 190.51 | 37914 |
0.522586 | 0.4774 | 32367 | 0.5 | 0.75 | 0.25 | 6.00E-04 | 224.05 | 44587 |
0.49247 | 0.5075 | 37603 | 0.5 | 0.75 | 0.25 | 5.00E-04 | 275.36 | 54799 |
统计收敛误差为5e-4时的分类情况
A | B | |||||
0 | 0 | 0 | 0 | 0 | 0 | |
1 | 0 | 1 | 1 | 0 | 1 | |
2 | 1 | 0 | 2 | 1 | 0 | |
3 | 1 | 1 | 3 | 1 | 1 |
这时(0,0)(1,0)(1,1)被分成A,只有(0,1)被分成B。两个网络唯一的差别仅仅是进样的先后顺序不同,迭代次数是一致的
0120 | 2001 | |
δ | 迭代次数n | 迭代次数n |
9.00E-04 | 22882 | 22850 |
8.00E-04 | 25324 | 25256 |
7.00E-04 | 28298 | 28244 |
6.00E-04 | 32209 | 32367 |
5.00E-04 | 37683 | 37603 |
但分类结果却并不相同,(0,0)(1,1)在网络2001中被分成了(1,0)(0,0).而在网络0120中被分成了(0,0)(0,1)。
所以这两个网络表达了一种时序优先现象,在存在时序优先的网络中如果一张图片被分成A和B的概率一致,则具体被分成A或B,决于A和B谁先进样。
这个实验也表明了差值结构相同的网络迭代次数相同
1b | 0 | 1 | 0 | |
0 | 1 | 0 | 1b | |
0120 | 2001 |
网络0120和2001的差值结构很容易通过左右变换和上下变换的方式实现转换。所以综合前述的实验,训练集AB的先后进样顺序可能对分类准确率产生影响,但不会影响迭代次数。而训练集中图片的先后顺序则对分类准确率和迭代次数都有影响。