发布时间:2023-07-16 18:30
(A,B)---4*4*2---(1,0)(0,1)
用神经网络分类A和B,让A和B都是2*2的矩阵,A中有两个1,B有3个1,有4种情况,分布如图。现在分类这两张图片,让这两张图片不断迭代直到收敛。在收敛误差一致的条件下,收敛199次,统计迭代次数平均值并比较。
231 |
232 |
233 |
234 |
|
δ |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
5.00E-04 |
41021.65 |
41278.9 |
50037.13 |
49392.27 |
4.00E-04 |
50523.29 |
50963.42 |
59956.02 |
61147.92 |
3.00E-04 |
66384.27 |
66580.06 |
80493.52 |
80709.36 |
2.00E-04 |
99420.52 |
99074.09 |
115141.3 |
116259.9 |
1.00E-04 |
193358.2 |
192185.9 |
223930 |
225974 |
41 |
41 |
43 |
43 |
经对比发现231和232的迭代次数和前述实验的41系迭代次数曲线高度重合,而233和234与43系的迭代次数曲线重合。
再一次用移动距离和的假设,
把参与分类的A和B中的数字看作是组成A和B的粒子,设分类的过程就是让A和B中的粒子互相交换位置,寻找最短移动路径的过程。而熵与最短移动距离和成正比,迭代次数和熵成反比。
规则汇总
每个粒子移动一次,位置重合不移动,0不动,沿对角线移动距离为1。
首先考虑231的情况
231的A的(0,1)粒子因为位置重合无需移动,(0,0)粒子可以向(1,0),(1,1),(0,1)3个位置移动,按照对角线规则这3种移动方法移动的距离都是1.因此A的移动距离是1.
231的B粒子(0,1)位置重合无需移动,(1,0)粒子无论向(0,0)位或者(0,1)位移动,移动距离都是1.而同样(1,1)粒子的移动距离也是1.因此B粒子的移动距离是2.总的移动距离=1+2=3.这与前面实验得到的41系移动距离相同。因此231和41系的迭代次数曲线重合。
232和231相对A是对称的因此迭代次数相同。
233
233的A中的两个粒子位置全都重合因此无需移动,而B中只有(1,0)位的粒子需要移动,按照对角线规则无论这个粒子向(0,0)或者(0,1)移动,移动的距离都是1,因此总的移动距离为0+1=1.这与前面实验得到的43系的移动距离相同。
同样234和233相对于A是对称的。
再做第二组实验
A中有两个1,B中有3个1.迭代次数如下
235 |
236 |
237 |
238 |
|
δ |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
5.00E-04 |
49320.02 |
40943.28 |
49640.12 |
41129.74 |
4.00E-04 |
61832.89 |
50382.39 |
60254.36 |
50489.45 |
3.00E-04 |
80718.57 |
66563.88 |
79499.84 |
67291.97 |
2.00E-04 |
115483.3 |
98109.73 |
116572.2 |
98653.38 |
1.00E-04 |
223450.9 |
191447.6 |
222403.4 |
191826.2 |
43 |
41 |
43 |
41 |
经对比发现235和237与43系的迭代次数相同,而236和238与41系的迭代次数相同。
再次用移动距离和假设
235
235的A中的全部两个粒子位置都重合,B中也只有(1,1)粒子需要移动,无论向(1,0)还是(0,1)位置移动,移动的距离都是1,因此总的移动距离是1.
237
而237和235相对于A是对称的,因此移动距离也是1.所以235和237与43系的迭代次数曲线重合。
236
A中只有(0,1)粒子需要移动,可以向(0,0)或者(1,1)移动,距离是1.B中(0,0)和(1,1)位置的粒子都需要移动,无论向(1,0)或(0,1)移动距离都是1.因此B的移动距离是2.所以总的距离是3.
238
238和236相对于A对称,因此移动距离都是3,所以和41系曲线重合。
前述实验数据汇总
431 |
432 |
433 |
434 |
|
δ |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
5.00E-04 |
49664.99 |
49837.2 |
50115.58 |
49468.1 |
4.00E-04 |
61174.29 |
60516.34 |
60769.59 |
60547.6 |
3.00E-04 |
79569.04 |
78832.1 |
79287.35 |
80434.3 |
2.00E-04 |
116011.4 |
116304.9 |
115951.6 |
115654.2 |
1.00E-04 |
224611.3 |
223524.3 |
225130.4 |
225118.7 |
421 |
422 |
423 |
424 |
425 |
426 |
|
δ |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
5.00E-04 |
43419.55 |
43768.71 |
44255.1 |
44394.1 |
43234.73 |
43197.22 |
4.00E-04 |
53934.45 |
53668.25 |
54321.85 |
54310.12 |
54123.1 |
53830.5 |
3.00E-04 |
70134.04 |
70128.54 |
70742.93 |
71375.41 |
70132.42 |
70954.73 |
2.00E-04 |
103634.2 |
104216.6 |
103698.3 |
103876 |
103411.5 |
102746.2 |
1.00E-04 |
200992.7 |
201399.3 |
201920.7 |
201201.3 |
197448.6 |
201948.3 |
411 |
412 |
413 |
414 |
|
δ |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
5.00E-04 |
41909.38 |
41784.2 |
42049.96 |
41667.75 |
4.00E-04 |
51967.94 |
52190.18 |
51324.76 |
51861.47 |
3.00E-04 |
67093.26 |
67083.14 |
67088.89 |
66872.62 |
2.00E-04 |
98633.1 |
98606.23 |
101325.4 |
99056.68 |
1.00E-04 |
192559.2 |
193504.3 |
194800.3 |
192974.1 |