一.Tensorflow的迭代次数到底应该设置为多少?
二.迭代次数对网络分类准确率的影响
三.快速设定网络参数的一种便捷方法
一
1.训练集对迭代次数的影响
完全相同的两个对象无法被分成两类,比如用一个二分类网络去分类mnist的0和0,这个网络的分类准确率永远是50%。也就是说分类两个完全相同的对象的迭代次数是无穷大,由此可以引申出如果两个被分类对象之间的差异越小,与之对应的迭代次数将越大。
因此可以将迭代次数理解成是两个被分类对象之间差异大小的量度。
制作9个网络分别用来分类0-1到0-9
(mnis 0, mnist x)-con(3*3)-49-30-2-(1,0)(0,1)
三层网络节点数是81,30,2。有一个3*3的卷积核,分类mnist的0和mnist x,让x=1-9,让0向(1,0)收敛,让x向(0,1)收敛。
同时设置这个网络的迭代停止标准是
|输出函数-目标函数|<δ
让δ等于0.1到1e-7的31个值,每组值收敛199次,统计每次的迭代次数并统计平均值,得到的表格
9 |
6 |
8 |
2 |
5 |
3 |
4 |
7 |
1 |
|
δ |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
0.1 |
2362.905 |
2763.372 |
2617.372 |
2785.725 |
3508.412 |
2567.648 |
2352.869 |
2232.146 |
2081.131 |
1.00E-02 |
3377.824 |
3516.397 |
3487.045 |
3620.905 |
4482.322 |
3501.432 |
3239.744 |
3104.673 |
2850.236 |
1.00E-03 |
4638.894 |
4851.055 |
4888.638 |
4846.435 |
6103.94 |
4664.523 |
4525.779 |
4367.447 |
4126.91 |
1.00E-04 |
7127.503 |
7646.131 |
6770.578 |
7709.22 |
8919.698 |
7099.93 |
6481.905 |
6468.623 |
5887.709 |
9*1e-5 |
7156.286 |
7773.497 |
7345.497 |
7951.16 |
9349.02 |
7262.709 |
6723.286 |
6437.633 |
5996.663 |
8*1e-5 |
7367.859 |
7928.668 |
7308.02 |
8182.51 |
9539.442 |
7505.925 |
6901.276 |
6564.357 |
6169.337 |
7*1e-5 |
7518.492 |
8338.367 |
7442.362 |
8193.28 |
10203.43 |
7687.362 |
6983.593 |
6779.578 |
6184.608 |
6*1e-5 |
7833.106 |
8790.824 |
7950.407 |
8780.59 |
9851.553 |
8094.297 |
7224.774 |
6887.774 |
6469.729 |
5*1e-5 |
8203.98 |
8774.352 |
7781.106 |
9227.095 |
10868.83 |
8405.387 |
7523.724 |
7299.528 |
6686.593 |
4*1e-5 |
8463.402 |
9638.643 |
8625.352 |
9473.415 |
11182.1 |
8815.392 |
7910.116 |
7553.477 |
7160.337 |
3*1e-5 |
9201.839 |
10600.94 |
9775.462 |
10478 |
12931.17 |
9679.422 |
8599.352 |
8293.955 |
7711.472 |
2*1e-5 |
10848.2 |
11411.08 |
11628.49 |
12060.84 |
14625.32 |
10461.67 |
9137.015 |
8723.643 |
8744.005 |
1.00E-05 |
13375.71 |
14873 |
14918.06 |
19757.36 |
20225.77 |
12683.54 |
11235.33 |
10555.44 |
9885.658 |
9*1e-6 |
13466.41 |
15159.28 |
14988.04 |
22245.54 |
21326.77 |
13059.99 |
11316.15 |
10476.27 |
9949.095 |
8*1e-6 |
14629.72 |
17935.03 |
16597.2 |
22214.93 |
23468.94 |
13171.09 |
11563.64 |
10925.47 |
10597.78 |
7*1e-6 |
14828.54 |
18620.5 |
17736.16 |
28045.61 |
24229.22 |
13862.52 |
12665.93 |
11219.57 |
10781.61 |
6*1e-6 |
15859.35 |
19321.87 |
20981.81 |
28410.34 |
27358.97 |
15417.61 |
13010.63 |
11748.35 |
11409.87 |
5*1e-6 |
18927.24 |
21230.97 |
21156.49 |
33681.76 |
31394.19 |
15919.56 |
13712.61 |
12474.75 |
11777.72 |
4*1e-6 |
19663.64 |
24558.27 |
24769.43 |
37281.58 |
36071.51 |
18205.72 |
14354.06 |
13049.01 |
12539.73 |
3*1e-6 |
26072.95 |
31304.92 |
32129.62 |
45173.59 |
43770.63 |
22269.52 |
16352.39 |
14324.43 |
13767.38 |
2*1e-6 |
34811.55 |
46862.86 |
53448.89 |
60366.62 |
53362.96 |
31163.59 |
18902.75 |
16918.78 |
14645.3 |
1.00E-06 |
70131.85 |
100355.9 |
73646.55 |
90392.45 |
76472.83 |
47298.7 |
29535.1 |
21313.81 |
18080.93 |
9*1e-7 |
77841.01 |
103772.7 |
81385.9 |
99247.65 |
86231.85 |
50701.34 |
28357.42 |
21287.42 |
18234.14 |
8*1e-7 |
108462 |
119839 |
91615.03 |
95016.96 |
91895.45 |
50896.83 |
32744.68 |
24145.12 |
19182.81 |
7*1e-7 |
123232.6 |
129092.7 |
109482.4 |
113411.5 |
94373.55 |
62449.56 |
35204.73 |
27625.46 |
20378.61 |
6*1e-7 |
140167.9 |
127953.1 |
109426.8 |
116304.3 |
101428.6 |
64837.91 |
39191.89 |
29357.48 |
20348.53 |
5*1e-7 |
149534.4 |
156705.3 |
124867.1 |
129507.3 |
95963.77 |
77875.12 |
48544.11 |
40684.06 |
22365.02 |
4*1e-7 |
164962.1 |
161217.8 |
137533.3 |
135768.1 |
112533.3 |
88745.73 |
60192.69 |
40085.21 |
23351.5 |
3*1e-7 |
249506.1 |
205342.5 |
159985.3 |
149701.4 |
120549.3 |
114492.7 |
69731.63 |
62320.85 |
27243.87 |
2*1e-7 |
289655.7 |
256312.4 |
187551.5 |
155856.8 |
135646.8 |
141850.7 |
99327.43 |
74617.93 |
34178.87 |
1.00E-07 |
318339.7 |
207402.7 |
159863.3 |
1.82E+05 |
155931.3 |
133071.7 |
38643.19 |
可以明显的观察到0-9的迭代次数最大,0-1的迭代次数最少
对应同一个δ迭代次数n由小到大的顺序是1<7<4<3<5<2<8<6<9,这一规律体现出0和9的差异比较小相应的迭代次数就比较多,而0和1的差异则比较大相应的迭代次数则比较少。这两个迭代次数之间的比值可以达到8.45倍。
2.学习率对迭代次数的影响
(mnis 0, mnist 2)-con(3*3)-49-30-2-(1,0)(0,1)
用网络分类0-2,让学习率从0.6变化到1e-3,让δ=0.1到1e-7,利用多次测量求平均值的办法统计对应每个δ和每个学习率的迭代次数
δ\r |
0.6 |
0.5 |
0.4 |
0.3 |
0.2 |
0.1 |
9*1e-2 |
8*1e-2 |
7*1e-2 |
6*1e-2 |
5*1e-2 |
4*1e-2 |
3*1e-2 |
2*1e-2 |
1.00E-02 |
0.1 |
450.9 |
509.7 |
601.6 |
832.2 |
1347 |
2786 |
3022.15 |
3421.49 |
3760.23 |
4466.9 |
5034.79 |
6573.76 |
8421.98 |
13866.1 |
29395.11 |
1.00E-02 |
707.2 |
757.2 |
998.1 |
1110 |
1717 |
3621 |
4132.17 |
4517.59 |
5232.74 |
6364.6 |
7586.89 |
9070.88 |
13176.8 |
17543.2 |
33094.21 |
1.00E-03 |
1102 |
1333 |
1451 |
1674 |
2429 |
4846 |
5419.32 |
6337.57 |
7445.61 |
8704.97 |
10398.8 |
13593.1 |
18510.3 |
26145.6 |
59695.11 |
1.00E-04 |
2527 |
2765 |
3067 |
3262 |
3965 |
7709 |
8515.03 |
9764.71 |
11357.2 |
13413.6 |
17218.2 |
21796.3 |
28744.2 |
42848.8 |
92427 |
0.00009 |
2686 |
2780 |
3145 |
3561 |
4488 |
7951 |
9066.59 |
9938.67 |
11039 |
14057.1 |
17463.9 |
22672.1 |
31534.5 |
46692.4 |
102512.5 |
0.00008 |
2923 |
3232 |
3656 |
3935 |
4710 |
8183 |
8945.27 |
10424.5 |
12045 |
14629.4 |
18146.8 |
22694.6 |
31008.1 |
50762.4 |
96688.84 |
0.00007 |
2632 |
3064 |
3951 |
4072 |
4461 |
8193 |
9274.57 |
10642.4 |
12481.7 |
14741.7 |
18819.3 |
24147.9 |
34670.9 |
46805.2 |
107360.5 |
0.00006 |
3413 |
3510 |
4434 |
4480 |
5156 |
8781 |
9656.64 |
10810.9 |
12898.6 |
15812.2 |
19477.4 |
24635.7 |
34407.5 |
53700.6 |
101850.8 |
0.00005 |
3514 |
3871 |
4467 |
4494 |
5562 |
9227 |
9912.13 |
11487 |
13513.3 |
16702 |
19825.9 |
26156.2 |
34971.2 |
54688.2 |
114240.8 |
0.00004 |
4030 |
4434 |
5692 |
5888 |
6443 |
9473 |
10787.3 |
12214.6 |
15033.8 |
17546.2 |
21844.8 |
27275.6 |
37760.9 |
56086.2 |
110557.3 |
0.00003 |
5155 |
6595 |
6183 |
6651 |
6918 |
10478 |
11589.7 |
13443.5 |
16093.2 |
19075 |
22692.5 |
31011.1 |
41042.7 |
66337.2 |
145883.5 |
0.00002 |
6346 |
6691 |
8426 |
8511 |
12241 |
12061 |
13977.1 |
16357.6 |
18447.9 |
20868.3 |
25713.1 |
34325.6 |
46288.7 |
73116.6 |
157999.1 |
1.00E-05 |
10469 |
12805 |
14397 |
16428 |
17083 |
19757 |
19716.1 |
21967.6 |
28235.1 |
26126.3 |
31903.6 |
42933.4 |
57378.8 |
88206.8 |
184000.7 |
0.000009 |
14149 |
15900 |
14249 |
20380 |
18225 |
22246 |
22123 |
23800.7 |
24885.1 |
30206.6 |
36951.2 |
45709.4 |
61453.5 |
99080.4 |
197259.9 |
0.000008 |
12061 |
16991 |
17343 |
20878 |
18793 |
22215 |
24338.4 |
23525.6 |
26229.4 |
30248.3 |
37264.6 |
45744 |
63118.8 |
102147 |
238433.6 |
0.000007 |
15448 |
17055 |
16757 |
23394 |
24627 |
28046 |
26621.4 |
27583.9 |
27712.9 |
33021.7 |
40300.9 |
48154.7 |
66872.6 |
91680.2 |
227748.7 |
0.000006 |
16363 |
19539 |
23098 |
23525 |
25263 |
28410 |
30478 |
30443.5 |
34617.6 |
36609.3 |
43348.8 |
51335.1 |
72964.4 |
101187 |
235256.2 |
0.000005 |
15435 |
22017 |
28748 |
27565 |
27952 |
33682 |
32414.7 |
34133.3 |
39291.5 |
39831.4 |
49829.6 |
57589.2 |
79256.6 |
112888 |
231381.4 |
0.000004 |
22164 |
27614 |
32166 |
35141 |
38190 |
37282 |
40560.4 |
38845.3 |
49073 |
49934.9 |
56060.9 |
59055.6 |
80945.5 |
105719 |
235798.3 |
0.000003 |
22927 |
28860 |
36660 |
35043 |
42120 |
45174 |
51076.8 |
54023.8 |
56240.5 |
55068.8 |
61498.8 |
72600.9 |
94621.9 |
130338 |
311185.9 |
0.000002 |
33399 |
36130 |
41347 |
47989 |
54458 |
60367 |
70687.1 |
73467.4 |
65498.1 |
79889.1 |
84106.9 |
99886.3 |
110987 |
195190 |
346350.5 |
1.00E-06 |
44777 |
49353 |
58197 |
66138 |
74129 |
90392 |
100524 |
110145 |
103614 |
111490 |
127627 |
135720 |
159008 |
232212 |
477003.3 |
1.00E-07 |
91115 |
2E+05 |
212024 |
243068 |
255093 |
300479 |
360578 |
405315 |
481567 |
结果表明在δ不变的前提下学习率越小对应的迭代次数越大。
3. 权重对迭代次数的影响
(mnis 0, mnist 2)-con(3*3)-49-30-2-(1,0)(0,1)
分类mnist的0-2,设d是从1-100的随机数,让隐藏层的权重=d/x,让x=10到50万,让δ等于0.1到1e-6的22个值。每组值计算99次取平均值。
n |
50w |
10w |
50000 |
10000 |
5000 |
2000 |
1000 |
500 |
100 |
10 |
0.1 |
2954.606 |
2925.677 |
2682.434 |
2789.273 |
2851.414 |
2934.99 |
2785.725 |
2469.051 |
1492.364 |
824.5455 |
1.00E-02 |
3905.949 |
3822.828 |
3697.778 |
3839.242 |
3665.414 |
3597.384 |
3620.905 |
3195.273 |
2412.556 |
2290.162 |
1.00E-03 |
5019.576 |
4922.071 |
5071.838 |
5135.232 |
5039.111 |
5039.828 |
4846.435 |
4716.636 |
4220.495 |
6053.737 |
1.00E-04 |
7745.818 |
7713.869 |
7586.202 |
7566.566 |
7782.485 |
7884.495 |
7709.22 |
7643.263 |
7695.222 |
16028 |
9*1e-5 |
7963.232 |
8079.162 |
7945.636 |
8140.626 |
7738.576 |
7998 |
7951.16 |
7770.828 |
7968.343 |
15690.17 |
8*1e-5 |
8365.172 |
8228.737 |
8023.788 |
8136.414 |
8344.596 |
8009.616 |
8182.51 |
8274.535 |
8373.879 |
13377.99 |
7*1e-5 |
8351.596 |
8663.02 |
8172.141 |
8062.172 |
8338 |
8543.707 |
8193.28 |
8299.495 |
8587.455 |
15126.16 |
6*1e-5 |
8417.556 |
9177.737 |
8753.091 |
8484.495 |
8541.737 |
8616.182 |
8780.59 |
8658 |
8802.596 |
22843.65 |
5*1e-5 |
9031.434 |
8857.374 |
9313.737 |
9411.121 |
8861.606 |
8909.141 |
9227.095 |
8950.667 |
9941.172 |
27780.29 |
4*1e-5 |
9703.253 |
9872.081 |
9288.869 |
9631.778 |
9538.909 |
9668.152 |
9473.415 |
9662.909 |
10444.78 |
27402.92 |
3*1e-5 |
10273.36 |
10113.93 |
10285.41 |
10206.91 |
10629.06 |
10816.66 |
10478 |
10568.34 |
14323.28 |
24808.89 |
2*1e-5 |
11731.25 |
11892.36 |
12266.43 |
11755.62 |
11908.38 |
12202.96 |
12060.84 |
12658.81 |
15518.96 |
41082.65 |
1.00E-05 |
18167.29 |
16326.62 |
17709.88 |
16517.19 |
18050.47 |
17632.76 |
19757.36 |
19631.6 |
27037.91 |
41576.35 |
9*1e-6 |
18092.37 |
17627.63 |
17650.47 |
18858.78 |
18803.26 |
18320.92 |
22245.54 |
22426 |
34867.61 |
55239.19 |
8*1e-6 |
20048.55 |
20191.28 |
20609.12 |
18776.23 |
21052.76 |
20959.47 |
22214.93 |
29472.02 |
32882.16 |
38499.32 |
7*1e-6 |
19530.55 |
23512.86 |
22542.05 |
21879.03 |
23718.92 |
22918.35 |
28045.61 |
27159.87 |
44096.94 |
52918.58 |
6*1e-6 |
24351.96 |
23340.25 |
26207.54 |
24757.15 |
27849.16 |
28211.88 |
28410.34 |
30183.58 |
46843.72 |
46127.79 |
5*1e-6 |
29944.24 |
28645.25 |
28010.44 |
28571.44 |
31057.9 |
30435.4 |
33681.76 |
37208.66 |
53281.34 |
60459.68 |
4*1e-6 |
33255.04 |
35861.74 |
30981.66 |
34554.54 |
35596.87 |
34793.94 |
37281.58 |
40257.97 |
55912.52 |
60573.09 |
3*1e-6 |
42423.89 |
40650.68 |
40574.6 |
43801.63 |
41936.11 |
47156.65 |
45173.59 |
46803.47 |
68222.7 |
57790.01 |
2*1e-6 |
59707.64 |
60227.69 |
60508.31 |
55440.01 |
56348.59 |
58648.75 |
60366.62 |
66742.11 |
79970.38 |
76566.7 |
1.00E-06 |
90144.53 |
82600.19 |
81751.4 |
79639.55 |
85065.39 |
92023.44 |
90392.45 |
93909.44 |
109287.6 |
125939.1 |
结果很清晰在δ不变的前提下x越小迭代次数越大
4.隐藏层节点数对迭代次数的影响
(mnis 0, mnist 2)-con(3*3)-49-x-2-(1,0)(0,1)
分类0和2让隐藏层的节点数等于20-1000,让δ等于0.5到1e-6的26个值,每组值测量199次取平均值
δ |
49*20*2 |
49*30*2 |
49*40*2 |
49*50*2 |
49*60*2 |
49*70*2 |
49*80*2 |
49*90*2 |
49*100*2 |
49*200*2 |
49*500*2 |
49*1000*2 |
0.5 |
25.54271 |
19.34673 |
14.68342 |
11.38191 |
9.562814 |
8.19598 |
8.678392 |
6.643216 |
6.713568 |
5.874372 |
366.4925 |
427.3367 |
0.4 |
1963.995 |
1847.327 |
1764.221 |
1649.487 |
1576.447 |
1480.261 |
1418.327 |
1433.764 |
1318.367 |
972.9296 |
327.407 |
416.7387 |
0.3 |
2327.337 |
2152.91 |
2053.513 |
1929.819 |
1867.296 |
1810.663 |
1733.02 |
1758.487 |
1724.548 |
1385.97 |
351.1457 |
495.2915 |
0.2 |
2514.834 |
2431.106 |
2247.01 |
2125.985 |
2047.809 |
2066.814 |
2061.312 |
1933.638 |
1919.312 |
1509.106 |
445.1106 |
431.7739 |
0.1 |
2907.417 |
2785.725 |
2586.347 |
2471.467 |
2336.698 |
2228.251 |
2266.432 |
2177.734 |
2181.518 |
1814.653 |
551.9648 |
538 |
0.01 |
3885.196 |
3620.905 |
3409.337 |
3290.392 |
3211.704 |
3154.075 |
2935.085 |
2922.005 |
2812.744 |
2409.899 |
1947.156 |
958.5578 |
0.001 |
5718.608 |
4846.435 |
4769.618 |
4482.884 |
4176.96 |
4087.307 |
4172.447 |
3935.538 |
3826.744 |
3242.412 |
2687.367 |
2178.156 |
1.00E-04 |
9210.337 |
7709.22 |
6843.774 |
6534.899 |
6287.417 |
5992.899 |
5800.96 |
5795.191 |
5498.035 |
4641.508 |
3755.719 |
3671.734 |
9.00E-05 |
9710.065 |
7951.16 |
7050.683 |
6653.683 |
6228.538 |
6188.085 |
5818.04 |
5733.683 |
5592.457 |
4643.814 |
3834.146 |
3766.915 |
8.00E-05 |
9738.583 |
8182.51 |
7373.899 |
6771.176 |
6455.231 |
6244.548 |
6237.206 |
5827.538 |
6010.317 |
4800.719 |
4004.121 |
3537.553 |
7.00E-05 |
10116.43 |
8193.28 |
7534.085 |
6862.09 |
6728.658 |
6499.869 |
6520.226 |
5903.482 |
5896.548 |
4944.121 |
3983.704 |
3755.638 |
6.00E-05 |
11118.71 |
8780.59 |
7912.809 |
7370.769 |
6712.94 |
6664.392 |
6259.513 |
6207.869 |
5955.121 |
5034.216 |
4338.09 |
3795.146 |
5.00E-05 |
12111.81 |
9227.095 |
8041.648 |
7763.618 |
7220.683 |
6979.608 |
6658.965 |
6452.015 |
6224.266 |
5301.121 |
4155.116 |
3860.779 |
4.00E-05 |
13728.94 |
9473.415 |
8914.709 |
7870.065 |
7335.975 |
6974.879 |
6793.106 |
6877.789 |
6384.94 |
5264.402 |
4743.256 |
3863.553 |
3.00E-05 |
15497.58 |
10478 |
8983.256 |
8461.719 |
7950.296 |
7625.261 |
7386.211 |
6936.482 |
6846.653 |
5613.075 |
4725.739 |
4506.377 |
2.00E-05 |
23317.28 |
12060.84 |
10254.75 |
9369.106 |
8535.261 |
8129.583 |
7959.653 |
7832.623 |
7559.673 |
6100.709 |
5045.266 |
4465.935 |
1.00E-05 |
38937.04 |
19757.36 |
13325.5 |
11380.39 |
9927.246 |
10038.44 |
9422.307 |
8606.266 |
8652.513 |
6956.779 |
5789.261 |
4991.508 |
9.00E-06 |
43911.23 |
22245.54 |
14199.69 |
12113.82 |
10543.48 |
10136.59 |
9981.849 |
9199.065 |
8930.714 |
7182.894 |
5733.809 |
5153.573 |
8.00E-06 |
53602.43 |
22214.93 |
15274 |
12452.03 |
10837.76 |
10599.35 |
9611.568 |
9402.352 |
8958.739 |
7194.166 |
5806.985 |
5193.623 |
7.00E-06 |
53211.28 |
28045.61 |
16940.79 |
13635.24 |
12077.03 |
11315.1 |
10070.84 |
9749.487 |
9323.196 |
7430.01 |
6073.266 |
5183.844 |
6.00E-06 |
57217.69 |
28410.34 |
19087.45 |
14732.5 |
12292.16 |
11030.2 |
10436.6 |
10225.85 |
9608.98 |
7687.754 |
6300.633 |
5706.01 |
5.00E-06 |
77478.28 |
33681.76 |
19354.78 |
16120.72 |
12830.23 |
12153.75 |
11567.16 |
10823.58 |
10396.34 |
8213.729 |
6550.332 |
6091.136 |
4.00E-06 |
84001.14 |
37281.58 |
24309.85 |
17517.83 |
16267.97 |
14135.49 |
11897.39 |
11054.88 |
11352.55 |
8421.467 |
6433.166 |
5787.121 |
3.00E-06 |
90617.76 |
45173.59 |
30329.22 |
20533.79 |
17320.02 |
15464.66 |
14069.67 |
13135.28 |
12671.94 |
8811.065 |
6982.005 |
6397.271 |
2.00E-06 |
119310.4 |
60366.62 |
40249.79 |
29888.18 |
24441.9 |
20569.78 |
18074.04 |
15542.84 |
15187.57 |
10138.04 |
7838.643 |
6485.407 |
1.00E-06 |
153821.4 |
90392.45 |
66962.16 |
48307.74 |
40945.18 |
31941.37 |
30805.03 |
25686.17 |
23370.95 |
15122.7 |
9934.658 |
8098.126 |
规律很明显x越小对应的迭代次数越大。X越大对应的迭代次数越少。但是x越大网络越大单次迭代的计算量也越大,因此随着x的增大在δ不变的前提下收敛时间有个极小值。
5.卷积核数量对迭代次数的影响
(mnist 0 ,mnist2)81-con(3*3)*n-(49*n)-30-2-(1,0) || (0,1)
分类0和2,向这个网络增加n个3*3的卷积核,让n分别等于0-9.当n=0时,网络相当于一个三层的网络
(mnist 0 ,mnist2)81-30-2-(1,0) || (0,1)
让δ分别等于0.5到1e-6的34个值每组值收敛199次,统计迭代次数平均值。
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
||
δ |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
0.5 |
8.864322 |
16.24623 |
13.80905 |
14.90452 |
15.17588 |
12.13568 |
11.83417 |
11.92462 |
13.06533 |
11.13065 |
0.4 |
208.9397 |
1685.925 |
1134.131 |
882.4573 |
751.9347 |
664.0804 |
594.8342 |
526.3166 |
481.1859 |
445.8191 |
0.3 |
268.7286 |
1923.096 |
1299.829 |
1047.608 |
869.2663 |
788.8694 |
699.3417 |
648.0251 |
593.9447 |
548.1809 |
0.2 |
324.0151 |
2120.045 |
1440.628 |
1160.975 |
988.6633 |
872.4271 |
790.1357 |
712.6784 |
664.0754 |
630.4221 |
0.1 |
410.5879 |
2318.668 |
1637.131 |
1291.804 |
1105.392 |
971.6834 |
880.6131 |
814.5879 |
764.2714 |
718.4573 |
0.01 |
685.5477 |
2832.724 |
2076.397 |
1656.417 |
1424.9 |
1282.628 |
1206.704 |
1101.251 |
1039.472 |
999.1859 |
0.001 |
1447.131 |
3803.322 |
2899.739 |
2436.895 |
2234.598 |
2142.965 |
2086.709 |
2070.985 |
2123.764 |
2199.789 |
9.00E-04 |
1450.915 |
3783.528 |
2924.246 |
2495.834 |
2291.754 |
2173.563 |
2137.221 |
2139.347 |
2256.804 |
2365.523 |
8.00E-04 |
1494.925 |
3831.327 |
3005.176 |
2545.623 |
2314.834 |
2233.156 |
2231.533 |
2247.498 |
2312.97 |
2508.678 |
7.00E-04 |
1552.714 |
3962.889 |
3032.824 |
2621.95 |
2432.156 |
2312.236 |
2360.945 |
2437.226 |
2532.663 |
3025.829 |
6.00E-04 |
1711.628 |
4070.799 |
3151.97 |
2738.246 |
2520.181 |
2427.558 |
2559.216 |
2598.543 |
2897.819 |
3426.171 |
5.00E-04 |
1968.714 |
4228.101 |
3268.749 |
2908.442 |
2656.392 |
2614.231 |
2638.94 |
3189.176 |
3705.146 |
4812.141 |
4.00E-04 |
2165.055 |
4379.653 |
3413.588 |
3049.171 |
2878.216 |
2938.784 |
3379.382 |
4073.372 |
5242.417 |
7248.422 |
3.00E-04 |
2324.08 |
4616.387 |
3568.749 |
3236.673 |
3262.699 |
3474.136 |
4279.653 |
6453.819 |
8586.452 |
11609.67 |
2.00E-04 |
2720.844 |
5050.874 |
4034.085 |
3941.784 |
4741.608 |
5935.935 |
8696.774 |
11151.12 |
15180.14 |
19449.47 |
1.00E-04 |
3165.709 |
6349.699 |
5698.945 |
6692.221 |
9883.704 |
14487.85 |
20128.9 |
26472.59 |
31021.32 |
34488.16 |
9.00E-05 |
3407.91 |
6705.251 |
6425.643 |
7671.834 |
10057.86 |
16786.43 |
22643.76 |
27280.82 |
33107.07 |
36141.16 |
8.00E-05 |
3486.764 |
6955.814 |
6875.578 |
8632.764 |
13695.61 |
18656.79 |
24313.79 |
30661.9 |
32898.83 |
37901.49 |
7.00E-05 |
3668.683 |
7528.92 |
7582.653 |
10520.67 |
14594.5 |
21585.94 |
27430.91 |
33478.19 |
37926.07 |
39971.74 |
6.00E-05 |
3962.563 |
8184.292 |
8908.658 |
10364.41 |
17772.01 |
26005.45 |
33621.57 |
37461.17 |
40297.02 |
43397.05 |
5.00E-05 |
4167.678 |
8865.02 |
9484.176 |
13928.86 |
20620.39 |
29064.9 |
36309.25 |
40110.72 |
43048.42 |
45538.37 |
4.00E-05 |
4515.829 |
9644.558 |
11563.16 |
18354.37 |
27010.35 |
33951.97 |
40799.66 |
44108.27 |
45917.92 |
48308.95 |
3.00E-05 |
5059.879 |
11485.9 |
15935.82 |
23537.47 |
31983.07 |
40540.77 |
44894.17 |
48028.65 |
49944.31 |
52696.23 |
2.00E-05 |
6524.874 |
15515.14 |
23050.37 |
31693.9 |
39692.1 |
46629.56 |
50373.94 |
54465.65 |
55854.44 |
57249.01 |
1.00E-05 |
8527.9 |
25127.07 |
34262.57 |
43816.4 |
51902.06 |
55930.22 |
60159.97 |
61394.46 |
63830.06 |
66139.31 |
9.00E-06 |
8746.422 |
26410.51 |
37680.04 |
46022.3 |
54010.82 |
57544.23 |
61327.05 |
63699.2 |
64750.77 |
68351 |
8.00E-06 |
9474.01 |
29507.95 |
39589.83 |
48614.33 |
54025.24 |
59733.02 |
62842.51 |
64384.89 |
66818.93 |
68970.2 |
7.00E-06 |
10301.67 |
31298.12 |
40019.11 |
50429.01 |
56361.68 |
62009 |
63321.66 |
66217.43 |
69258.37 |
69606.42 |
6.00E-06 |
11850.65 |
33845.36 |
44199.28 |
51939.93 |
59028.91 |
63013.84 |
65983.75 |
67526.19 |
69809.58 |
70851.06 |
5.00E-06 |
13068.73 |
36965.26 |
47009.32 |
56133.38 |
62123.93 |
66072.72 |
68282.15 |
71326.04 |
72951.16 |
74612.08 |
4.00E-06 |
14670.05 |
40347.78 |
49610.82 |
59106.07 |
63852.48 |
69004.8 |
71463.16 |
73956.1 |
77287.44 |
76819.8 |
3.00E-06 |
17112.47 |
44845.01 |
56031.89 |
62566.35 |
67823.03 |
73042.56 |
74778.5 |
77379.65 |
80787.31 |
81893.53 |
2.00E-06 |
23285.87 |
52058.75 |
62225.43 |
70379.01 |
74180.41 |
77512.57 |
81224.45 |
85341.33 |
87238.95 |
87805.16 |
1.00E-06 |
35222.24 |
66830.71 |
77563.4 |
82040.66 |
86059.04 |
90214.99 |
93471.64 |
96062.58 |
99403.25 |
102968.4 |
迭代次数随着卷积核数量的增加而增加。并且迭代次数与卷积核数量的平方根成正比
X---卷积核的数量
α---系数
并且收敛时间与卷积核数量的3/2次幂成正比。
6.网络层数对网络迭代次数的影响
(mnist 0 ,mnist 2)81-30-2-(1,0) || (0,1)
(mnist 0 ,mnist 2)81-30-49-30-2-(1,0) || (0,1)
(mnist 0 ,mnist 2)81-30-49-30-49-30-2-(1,0) || (0,1)
(mnist 0 ,mnist 2)81-30-49-30-49-30-49-30-2-(1,0) || (0,1)
制作4个网络去分类0和2,这4个网络的层数分别是3层,5层,7层,9层.
让δ等于0.5到1e-6的34个值,每组值收敛199次,统计平均值。
9 |
7 |
5 |
3 |
|
δ |
迭代次数n |
迭代次数n |
迭代次数n |
迭代次数n |
0.5 |
8.291457 |
7.628141 |
5.728643 |
4.824121 |
0.4 |
334.3869 |
136.5377 |
47.92965 |
10.60302 |
0.3 |
445.608 |
223.8141 |
105.6432 |
32.92462 |
0.2 |
500.1307 |
275.8442 |
155.2563 |
68.78894 |
0.1 |
612.9146 |
369.5226 |
248.9497 |
155.2965 |
0.01 |
1085.503 |
754.2462 |
596.3015 |
492.8593 |
0.001 |
9882.784 |
8027.377 |
2793.01 |
1295.281 |
9.00E-04 |
10881.03 |
8691.206 |
2924.266 |
1368.503 |
8.00E-04 |
11977.38 |
9745.246 |
3438.271 |
1426.709 |
7.00E-04 |
14072.29 |
10714.58 |
4023.141 |
1494.201 |
6.00E-04 |
16406.42 |
12371.1 |
4890.673 |
1667.829 |
5.00E-04 |
20385.63 |
15137.29 |
5992.065 |
1749.307 |
4.00E-04 |
24298.51 |
17785.58 |
7844.638 |
1875.171 |
3.00E-04 |
32696.08 |
22253.22 |
11235.22 |
2184.286 |
2.00E-04 |
44724.82 |
31035.44 |
15313.87 |
2582.925 |
1.00E-04 |
89078.6 |
56299.69 |
25407.06 |
3498.412 |
9.00E-05 |
95407.9 |
63010.57 |
27220.85 |
3645.025 |
8.00E-05 |
104874.4 |
68325.11 |
29562.66 |
3840.156 |
7.00E-05 |
116214.4 |
78167.16 |
32122.32 |
4077.126 |
6.00E-05 |
131232.3 |
89236.13 |
34942.84 |
4212.678 |
5.00E-05 |
149461.3 |
102580.9 |
39240.9 |
4589.568 |
4.00E-05 |
166924.9 |
117010.6 |
42965.2 |
5167.663 |
3.00E-05 |
204507.9 |
149188.4 |
52871.19 |
5821.111 |
2.00E-05 |
274629 |
212703 |
64717.94 |
6976.513 |
1.00E-05 |
439076.3 |
360851.1 |
90076 |
9615.879 |
9.00E-06 |
473836.4 |
386946.7 |
91610.54 |
9692.05 |
8.00E-06 |
514704.1 |
429464.9 |
99462.98 |
10012.85 |
7.00E-06 |
550991.1 |
455372.7 |
105727.8 |
10419.32 |
6.00E-06 |
616058.6 |
535610.7 |
110838.9 |
11089.11 |
5.00E-06 |
742561 |
608267.8 |
118164.4 |
12141.85 |
4.00E-06 |
892665.6 |
729212.1 |
138541.7 |
12888.37 |
3.00E-06 |
1155870 |
930735.7 |
155032.7 |
13944.59 |
2.00E-06 |
1.69E+06 |
1390712 |
189751.4 |
16152.7 |
1.00E-06 |
3.35E+06 |
2727215 |
318306.6 |
20551.51 |
在δ不变的前提下,随着网络层数的增加迭代次数增加。
将上述所有现象总结成表格
δ |
训练集差异 |
学习率 |
权重 |
隐藏层节点数 |
卷积核数量 |
网络层数 |
|
不变 |
增加 |
减小 |
增大 |
减小 |
增加 |
增加 |
迭代次数增加 |
δ |
训练集差异 |
学习率 |
权重 |
隐藏层节点数 |
卷积核数量 |
网络层数 |
|
减小 |
不变 |
不变 |
不变 |
不变 |
不变 |
不变 |
迭代次数增加 |
在δ不变的前提下,训练集差异增加,学习率减小,权重增大,隐藏层节点数减小,卷积核数增加,网络层数增加都会导致迭代次数增加。
在网络结构不变的前提下δ减小,迭代次数增加。
二.迭代次数对网络分类准确率的影响
前面的所有实验都表明在训练集不变,δ不变的前提下迭代次数越多网络的分类准确率越大。但是不包括由于卷积核数量的增加而引起的迭代次数的增加。
平均性能 |
0-1 |
81*30*2>2>3>4>5>6>7>8>9>1 |
没有正面价值 |
||
0-5 |
2>3>4>5>6>7>8>9>81-30-2>1 |
明显提升 |
|||
0-6 |
81*30*2>2>9>8>1>7>6>5>4>3 |
没有正面价值 |
|||
0-2 |
81*30*2>2>3>4>5>6>7>8>9>1 |
没有正面价值 |
|||
最大性能 |
0-1 |
81*30*2=1=2=3=4=5=6=7=8=9 |
没有提升 |
||
0-5 |
2>3>4>5>6>7>8>9>1>81-30-2 |
提升明显 |
|||
0-6 |
81*30*2=2=7>8>1=3=4>6>5 |
无明显提升 |
|||
0-2 |
5>3>2>4=7=8>1=9>6>81*30*2 |
提升明显 |
卷积核数量对网络性能的影响的实验共做了4次,分别是0-1,0-2,0-5,0-6.这4次实验都表明卷积核的数量有一个最优值,超过最优值以后网络的性能是下降的。
卷积核有可能改善网络性能比如0-5,但是卷积核也有可能没有任何正面价值,比如0-1,0-6,0-2增加卷积核只会导致网络平均性能下降。
7个变量对网络性能影响的总结
δ |
训练集差异 |
学习率 |
权重 |
隐藏层节点数 |
卷积核数量 |
网络层数 |
|
不变 |
增加 |
减小 |
增大 |
减小 |
有最优值 |
增加 |
网络性能增加 |
δ |
训练集差异 |
学习率 |
权重 |
隐藏层节点数 |
卷积核数量 |
网络层数 |
|
减小 |
不变 |
不变 |
不变 |
不变 |
不变 |
不变 |
网络性能增加 |
如果不考虑卷积核数量改变导致的迭代次数改变,可以简单的概括成在δ不变的前提下,迭代次数越多网络性能越好。分类准确率越高。因此使网络性能更好有两种等效的调参策略,一种是通过调节学习率,权重,节点数,网络层数使迭代次数变大;或者在其他所有参数都不变的情况下将δ调小。
三.快速设定网络参数的一种便捷方法
由上述所有讨论,一个参数最优的网络应该满足:隐藏层节点数应该小于等于节点数效率最优值,卷积核数应该等于卷积核数量最优值。而其余无论是由学习率,权重,网络层数引起的迭代次数的增加都可以用δ减小来等效的替代。
也就是可以通过将δ不断减小的办法来使网络性能得到单向的不断的提升。甚至一个网络即便不满足参数最优,把δ调的更小也确定的会使网络的性能得到改善,因此这是一种便捷的单参数调参法。