( A, B )---2*30*2---( 1, 0 )( 0, 1 )
做一个2*30*2的网络来分类A和B,让A由两张图片(1,1),(0,1)组成,让B由两张(1,0)组成。将收敛误差固定,得到迭代次数
1 |
1 |
1 |
0 |
k |
1 |
|||
0 |
1 |
1 |
0 |
1b |
1 |
|||
2 |
||||||||
f2[0] |
f2[1] |
迭代次数n |
平均准确率p-ave |
1-0 |
0-1 |
δ |
耗时ms/次 |
耗时ms/199次 |
0.999105 |
8.96E-04 |
4018.94 |
1 |
1 |
1 |
9.00E-04 |
33.11055 |
6589 |
0.999204 |
7.95E-04 |
4291.503 |
1 |
1 |
1 |
8.00E-04 |
35.9598 |
7156 |
0.999304 |
6.97E-04 |
4583.06 |
1 |
1 |
1 |
7.00E-04 |
36.83417 |
7330 |
并统计差值结构,如果等位点都是1则为k,如果都是0则为0,如果一个是1一个是0,则如果1来自A则为1,如果1来自B则为1b。
( A, B )---3*30*2---( 1, 0 )( 0, 1 )
做一个3*30*2的网络来分类A和B,让A由两张图片(0,1,1),(0,0,1)组成,让B由两张(0,1,0)组成。将收敛误差固定,得到的迭代次数为
0 |
1 |
1 |
0 |
1 |
0 |
0 |
k |
1 |
||||
0 |
0 |
1 |
0 |
1 |
0 |
0 |
1b |
1 |
||||
3 |
||||||||||||
f2[0] |
f2[1] |
迭代次数n |
平均准确率p-ave |
1-0 |
0-1 |
δ |
耗时ms/次 |
耗时ms/199次 |
耗时 min/199 |
最大准确率p-max |
迭代次数标准差 |
|
0.999105 |
8.95E-04 |
4035.302 |
1 |
1 |
1 |
9.00E-04 |
33.19095 |
6605 |
247.5778 |
0 |
||
0.999204 |
7.96E-04 |
4267.965 |
1 |
1 |
1 |
8.00E-04 |
33.42714 |
6652 |
246.9168 |
0 |
||
0.999304 |
6.97E-04 |
4589.935 |
1 |
1 |
1 |
7.00E-04 |
35.62814 |
7090 |
258.2833 |
0 |
相比2*30的网络,3*30的网络只是图片多了一个0,但他们的迭代次数是很相近的。3*30的网络和2*30的网络都有一个相同的差值结构k,1b,1,1.
( A, B )---4*30*2---( 1, 0 )( 0, 1 )
做一个4*30*2的网络来分类A和B,让A由两张图片(0,0,1,1),(0,0,0,1)组成,让B由两张(0,0,1,0)组成。将收敛误差固定,得到的迭代次数为
0 |
0 |
1 |
1 |
0 |
0 |
1 |
0 |
0 |
0 |
k |
1 |
||
0 |
0 |
0 |
1 |
0 |
0 |
1 |
0 |
0 |
0 |
1b |
1 |
||
4 |
|||||||||||||
f2[0] |
f2[1] |
迭代次数n |
平均准确率p-ave |
1-0 |
0-1 |
δ |
耗时ms/次 |
耗时ms/199次 |
耗时 min/199 |
最大准确率p-max |
迭代次数标准差 |
||
0.999105 |
8.95E-04 |
4031.985 |
1 |
1 |
1 |
9.00E-04 |
35.38693 |
7042 |
247.9953 |
0 |
|||
0.999205 |
7.96E-04 |
4267.06 |
1 |
1 |
1 |
8.00E-04 |
35.79397 |
7138 |
244.3615 |
0 |
|||
0.999304 |
6.96E-04 |
4627.683 |
1 |
1 |
1 |
7.00E-04 |
38.67839 |
7697 |
275.0568 |
0 |
可观察到的由于4*30的网络的差值结构同样是k,1b,1,1,这个网络和前两个网络的迭代次数是很相近的。
做第4个网络让k,1b和1,1两列隔开
0 |
1 |
0 |
1 |
0 |
1 |
0 |
0 |
0 |
k |
0 |
1 |
||
0 |
0 |
0 |
1 |
0 |
1 |
0 |
0 |
0 |
1b |
0 |
1 |
||
41 |
|||||||||||||
f2[0] |
f2[1] |
迭代次数n |
平均准确率p-ave |
1-0 |
0-1 |
δ |
耗时ms/次 |
耗时ms/199次 |
耗时 min/199 |
最大准确率p-max |
迭代次数标准差 |
||
0.999105 |
8.95E-04 |
4034.759 |
1 |
1 |
1 |
9.00E-04 |
36.25126 |
7214 |
224.049 |
0 |
|||
0.999204 |
7.95E-04 |
4291.06 |
1 |
1 |
1 |
8.00E-04 |
38.52764 |
7667 |
262.9015 |
0 |
|||
0.999303 |
6.96E-04 |
4628.628 |
1 |
1 |
1 |
7.00E-04 |
39.8794 |
7936 |
323.5693 |
0 |
得到的迭代次数很相近,所以差值结构的0,0列对迭代没有影响。
做第5个网络,颠倒差值结构的横向顺序
0 |
1 |
1 |
0 |
0 |
0 |
1 |
0 |
0 |
1 |
k |
0 |
||
0 |
1 |
0 |
0 |
0 |
0 |
1 |
0 |
0 |
1 |
1b |
0 |
||
42 |
|||||||||||||
f2[0] |
f2[1] |
迭代次数n |
平均准确率p-ave |
1-0 |
0-1 |
δ |
耗时ms/次 |
耗时ms/199次 |
耗时 min/199 |
最大准确率p-max |
迭代次数标准差 |
||
0.999104 |
8.95E-04 |
4023.643 |
1 |
1 |
1 |
9.00E-04 |
34.61809 |
6889 |
227.8451 |
0 |
|||
0.999204 |
7.96E-04 |
4281.975 |
1 |
1 |
1 |
8.00E-04 |
35.19598 |
7004 |
247.0587 |
0 |
|||
0.999303 |
6.96E-04 |
4601.693 |
1 |
1 |
1 |
7.00E-04 |
37.51759 |
7466 |
298.1821 |
0 |
做第6个网络颠倒差值结构的纵向顺序
1 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
1 |
0 |
0 |
1b |
||
1 |
0 |
0 |
1 |
0 |
0 |
0 |
1 |
1 |
0 |
0 |
k |
||
43 |
|||||||||||||
f2[0] |
f2[1] |
迭代次数n |
平均准确率p-ave |
1-0 |
0-1 |
δ |
耗时ms/次 |
耗时ms/199次 |
耗时 min/199 |
最大准确率p-max |
迭代次数标准差 |
||
0.999104 |
8.95E-04 |
4048.216 |
1 |
1 |
1 |
9.00E-04 |
35.47739 |
7060 |
225.8092 |
0 |
|||
0.999205 |
7.96E-04 |
4287.131 |
1 |
1 |
1 |
8.00E-04 |
35.18593 |
7002 |
279.3502 |
0 |
|||
0.999303 |
6.96E-04 |
4581.04 |
1 |
1 |
1 |
7.00E-04 |
37.21106 |
7405 |
277.4729 |
0 |
将6组迭代次数放在一起比较
2 |
3 |
4 |
41 |
42 |
43 |
|
δ |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
9.00E-04 |
4018.94 |
4035.302 |
4031.985 |
4034.759 |
4023.643 |
4048.216 |
8.00E-04 |
4291.503 |
4267.965 |
4267.06 |
4291.06 |
4281.975 |
4287.131 |
7.00E-04 |
4583.06 |
4589.935 |
4627.683 |
4628.628 |
4601.693 |
4581.04 |
比较这3条曲线,将这3条线理解为直线将是很便捷而实用的。所以如果训练集的差值结构一致则他们的迭代次数一致,而与差值结构的顺序无关。