物质世界只有两种粒子,除了费米子就是玻色子。或者加入场,但如果粒子是量子化的场,那场就可以理解为未被量子化的粒子。所以神经网络一定有一个粒子载体,为什么不能用粒子的行为去理解?
前面实验表明神经网络迭代次数和移位距离存在反比关系,这次继续验证这一关系。所用的训练集是mnist的0,1,2,3,4的第一张图片,但不二值化。用间隔取点的办法把图片化成5*5.如1*2*3为网络
( 1, 2, 3 )---25*30*3---( 1, 0, 0 )( 0, 1, 0 )( 0, 0, 1 )
的简记。就是用1,2,3的第一张图片不断的循环往复,直到收敛。每个收敛误差收敛199次,统计平均值。
共进行了10组,得到数据
5*5 | 1*3*4 | 1*2*4 | 1*2*3 | 2*3*4 | 0*1*2 | 0*2*3 | 0*1*3 | 0*1*4 | 0*2*4 | 0*3*4 |
δ | 迭代次数n | 迭代次数n | 迭代次数n | 迭代次数n | 迭代次数n | 迭代次数n | 迭代次数n | 迭代次数n | 迭代次数n | 迭代次数n |
0.01 | 4852.327 | 3971.497 | 3849.93 | 3761.673 | 3297.035 | 3195.578 | 3172.513 | 3154.935 | 3044.357 | 2946.322 |
0.001 | 29105.61 | 23912.9 | 23347.73 | 22709.72 | 21140.85 | 20470.52 | 19926.4 | 19718.28 | 19372.02 | 18622.47 |
9.00E-04 | 31721.76 | 25924.04 | 25584.63 | 24772.43 | 23191.94 | 22528.86 | 21914.49 | 21523.96 | 21264.79 | 20455.74 |
8.00E-04 | 35248.12 | 28807.72 | 28230.64 | 27538.16 | 25774.16 | 24994.17 | 24202.72 | 23810.64 | 23577.19 | 22594.5 |
7.00E-04 | 39688.76 | 32526.52 | 31809.25 | 30926.7 | 29016.18 | 28110.4 | 27321.52 | 26921.52 | 26500.23 | 25583.64 |
s | 9.992157 | 13.10588 | 12.83137 | 14.68235 | 19.04314 | 21.88235 | 18.36863 | 20.65098 | 22.92549 | 22.37647 |
将收敛误差为7e-4的迭代次数画成图
将移位距离s画成图
可见s和n之间的反比关系清晰。s增大n减小。
移位距离假设
(A,B)---m*n*k---(1,0)(0,1)
用神经网络分类A和B,把参与分类的A和B中的数字看作是组成A和B的粒子,分类的过程就是让A和B中的粒子互相交换位置,寻找最短移位路径的过程。而熵H与最短移位距离S成正比,迭代次数n与S成反比。
移位规则汇总
移位距离就是等位点数值差的绝对值的和S=Σ|a-b|,如果训练集有多张图片取s的平均值,如果是多分类问题则移位距离为所有两两组合移位距离的和。
如对一组3*3的矩阵
S=s0+s1+,…,+s8=|a0-b0|+|a1-b1|+,…,+|a8-b8|
如果是3分类问题,就应该实现3个形态之间的两两变换,也就是要完成3对等位点之间的差。
因此移位距离
S=Sab+Sac+Sbc=
|a0-b0|+|a1-b1|+|a2-b2|+|a3-b3|+
|a0-c0|+|a1-c1|+|a2-c2|+|a3-c3|+
|b0-c0|+|b1-c1|+|b2-c2|+|b3-c3|