训练集用mnist的0,1,2,3的前10张图片,做3个二分类网络
(0,1)---4*30*2---(1,0)(0,1)
(0,2)---4*30*2---(1,0)(0,1)
(0,3)---4*30*2---(1,0)(0,1)
用间隔取点的办法把图片化成2*2,测试集与训练集相同。这10张图片不断的循环往复直到收敛,统计与收敛误差对应的分类准确率,并比较。
第一组
(0,1)--- 4*30*2---(1,0)(0,1)
得到的数据
0--1 |
2*2 |
10 |
二值 |
|||
迭代次数n |
平均准确率p-ave |
1-0 |
0-1 |
δ |
耗时ms/次 |
耗时ms/199次 |
15.1256281 |
0.5159129 |
0.61809045 |
0.41373534 |
0.5 |
1.60301508 |
320 |
345.693467 |
0.5 |
0.91959799 |
0.08040201 |
0.48 |
4.92964824 |
983 |
494.346734 |
0.5 |
0.9798995 |
0.0201005 |
0.46 |
5.9798995 |
1190 |
590.256281 |
0.5 |
1 |
0 |
0.44 |
6.93467337 |
1386 |
643.894472 |
0.5 |
1 |
0 |
0.42 |
6.85427136 |
1364 |
695.452261 |
0.5 |
1 |
0 |
0.4 |
6.88442211 |
1370 |
733.984925 |
0.57035176 |
0.96482412 |
0.1758794 |
0.38 |
7.28140704 |
1455 |
767.904523 |
0.72110553 |
0.88944724 |
0.55276382 |
0.36 |
7.62311558 |
1517 |
801.01005 |
0.72222222 |
0.88888889 |
0.55555556 |
0.34 |
7.4120603 |
1480 |
830.497487 |
0.72222222 |
0.88888889 |
0.55555556 |
0.32 |
9.90452261 |
1972 |
859.80402 |
0.73562256 |
0.86208822 |
0.6091569 |
0.3 |
8.92964824 |
1777 |
885.130653 |
0.79480737 |
0.74371859 |
0.84589615 |
0.28 |
12.1105528 |
2410 |
912.809045 |
0.83277499 |
0.66778336 |
0.99776661 |
0.26 |
9.2361809 |
1838 |
943.201005 |
0.83333333 |
0.66666667 |
1 |
0.24 |
11.0854271 |
2206 |
964.547739 |
0.83333333 |
0.66666667 |
1 |
0.22 |
9.45226131 |
1881 |
998.286432 |
0.83333333 |
0.66666667 |
1 |
0.2 |
10.5477387 |
2099 |
1028.8593 |
0.83333333 |
0.66666667 |
1 |
0.18 |
10.1356784 |
2017 |
1056.53769 |
0.83333333 |
0.66666667 |
1 |
0.16 |
12.6180905 |
2511 |
1095.25126 |
0.83333333 |
0.66666667 |
1 |
0.14 |
10.8492462 |
2159 |
1140.74874 |
0.83333333 |
0.66666667 |
1 |
0.12 |
14.9748744 |
2980 |
1192.21608 |
0.83333333 |
0.66666667 |
1 |
0.1 |
16.5075377 |
3285 |
1251.46231 |
0.83333333 |
0.66666667 |
1 |
0.08 |
17.7085427 |
3524 |
1328.79899 |
0.83333333 |
0.66666667 |
1 |
0.06 |
16.9547739 |
3375 |
1452.26633 |
0.83333333 |
0.66666667 |
1 |
0.04 |
18.5276382 |
3687 |
1697.57286 |
0.83333333 |
0.66666667 |
1 |
0.02 |
20.5628141 |
4092 |
网络的峰值分类准确率是5/6.其中0的分类准确率是2/3,1的分类准确率是1.
0 |
0 |
0 |
0 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
0 |
0 |
1 |
1 |
1 |
1 |
|
1 |
0 |
1 |
1 |
0 |
1 |
0 |
0 |
1 |
|
1 |
1 |
1 |
1 |
1 |
0 |
1 |
0 |
0 |
|
********* |
|||||||||
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
1 |
1 |
1 |
0 |
1 |
0 |
0 |
0 |
0 |
|
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
观察这组训练集就会发现,0中有3张图片和1中的图片是重合的。两张(0,0,1,1)和1张(0,0,0,1)。如果网络认为(0,0,1,1)和(0,0,0,1)属于1则,0就将有3张图片分类错误,因此0的分类准确率就是2/3,而1的准确率就是1.因为测试集图片数量相同,因此总的分类准确率就是0.5*2/3+0.5*1=5/6=0.8333333
第二组
(0,2)--- 4*30*2---(1,0)(0,1)
得到数据
0--2 |
2*2 |
10 |
二值 |
1.55555556 |
||
迭代次数n |
平均准确率p-ave |
1-0 |
0-1 |
δ |
耗时ms/次 |
耗时ms/199次 |
15.7738693 |
0.51758794 |
0.58347292 |
0.45170296 |
0.5 |
1.10050251 |
219 |
414.522613 |
0.5 |
0.91457286 |
0.08542714 |
0.48 |
3.92462312 |
781 |
624.417085 |
0.5 |
0.9798995 |
0.0201005 |
0.46 |
5.49246231 |
1093 |
761.41206 |
0.5 |
1 |
0 |
0.44 |
6.1959799 |
1233 |
822.919598 |
0.49692909 |
0.98827471 |
0.00558347 |
0.42 |
6.67336683 |
1328 |
889.582915 |
0.61194863 |
0.66834171 |
0.55555556 |
0.4 |
7.06532663 |
1406 |
946.839196 |
0.61111111 |
0.66666667 |
0.55555556 |
0.38 |
7.84924623 |
1562 |
991.703518 |
0.61111111 |
0.66666667 |
0.55555556 |
0.36 |
11.3015075 |
2249 |
1036.29648 |
0.61111111 |
0.66666667 |
0.55555556 |
0.34 |
12.2361809 |
2435 |
1082.33668 |
0.61111111 |
0.66666667 |
0.55555556 |
0.32 |
9.95979899 |
1982 |
1122.76884 |
0.61111111 |
0.66666667 |
0.55555556 |
0.3 |
12.7135678 |
2530 |
1168.08543 |
0.61111111 |
0.66666667 |
0.55555556 |
0.28 |
9.18090452 |
1827 |
1203.45226 |
0.61111111 |
0.66666667 |
0.55555556 |
0.26 |
9.41708543 |
1874 |
1250.75879 |
0.61390285 |
0.66108319 |
0.5667225 |
0.24 |
9.88944724 |
1968 |
1293.81407 |
0.62339475 |
0.64209939 |
0.60469012 |
0.22 |
10.0452261 |
1999 |
1339.22111 |
0.64349525 |
0.60189838 |
0.68509213 |
0.2 |
10.4321608 |
2076 |
1397.56281 |
0.66275824 |
0.56337242 |
0.76214405 |
0.18 |
10.9095477 |
2171 |
1461.33166 |
0.66638749 |
0.5561139 |
0.77666108 |
0.16 |
11.2211055 |
2233 |
1527.54271 |
0.66666667 |
0.55555556 |
0.77777778 |
0.14 |
11.8442211 |
2357 |
1612.38693 |
0.66666667 |
0.55555556 |
0.77777778 |
0.12 |
12.4020101 |
2468 |
1720.38693 |
0.66666667 |
0.55555556 |
0.77777778 |
0.1 |
13.1809045 |
2623 |
1855.70352 |
0.66666667 |
0.55555556 |
0.77777778 |
0.08 |
14.201005 |
2826 |
2065.91457 |
0.66666667 |
0.55555556 |
0.77777778 |
0.06 |
15.6180905 |
3108 |
2442.73869 |
0.66610832 |
0.55834729 |
0.77386935 |
0.04 |
18.361809 |
3654 |
3209.05025 |
0.69235064 |
0.61976549 |
0.76493579 |
0.02 |
24.2512563 |
4826 |
4150.02513 |
0.71021776 |
0.61083194 |
0.80960357 |
0.01 |
31.0703518 |
6183 |
4486.68844 |
0.72724735 |
0.5985483 |
0.8559464 |
0.008 |
33.4271357 |
6652 |
4910.36683 |
0.75265215 |
0.5773311 |
0.9279732 |
0.006 |
36.1708543 |
7198 |
5627.47236 |
0.77079844 |
0.57621441 |
0.96538247 |
0.004 |
41.4321608 |
8245 |
7051.64322 |
0.82607482 |
0.65214964 |
1 |
0.002 |
51.4773869 |
10244 |
8681.41206 |
0.83333333 |
0.66666667 |
1 |
0.001 |
63.8693467 |
12710 |
9104.8191 |
0.83333333 |
0.66666667 |
1 |
9.00E-04 |
66.6984925 |
13273 |
9515.74372 |
0.83333333 |
0.66666667 |
1 |
8.00E-04 |
69.8341709 |
13897 |
9882.79899 |
0.83333333 |
0.66666667 |
1 |
7.00E-04 |
72.5075377 |
14429 |
10287.7538 |
0.83333333 |
0.66666667 |
1 |
6.00E-04 |
74.9346734 |
14912 |
10919.7437 |
0.83333333 |
0.66666667 |
1 |
5.00E-04 |
79.718593 |
15864 |
12153.0603 |
0.83333333 |
0.66666667 |
1 |
4.00E-04 |
88.5929648 |
17630 |
13265.804 |
0.83333333 |
0.66666667 |
1 |
3.00E-04 |
96.9045226 |
19284 |
16669.9749 |
0.83333333 |
0.66666667 |
1 |
2.00E-04 |
120.603015 |
24000 |
22233.1508 |
0.83333333 |
0.66666667 |
1 |
1.00E-04 |
161.005025 |
32040 |
0与2分类的峰值分类准确率也是5/6.观察这组数据
0 |
0 |
0 |
0 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
0 |
0 |
1 |
1 |
1 |
1 |
|
1 |
0 |
1 |
1 |
0 |
1 |
0 |
0 |
1 |
|
1 |
1 |
1 |
1 |
1 |
0 |
1 |
0 |
0 |
|
********* |
|
|
|||||||
2 |
0 |
0 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
|
1 |
0 |
1 |
1 |
0 |
1 |
1 |
1 |
1 |
|
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
0与2也有3张图片是重合的,两张(0,0,1,1)和1张(0,0,0,1).因此1个分类准确率是2/3,另一个是1,峰值分类准确率和第一组相同。但是这一组当收敛误差为0.001的时候才达到峰值,而第一组在收敛误差为0.24的时候就已经达到了峰值,也就是第二组比第一组的分类准确率的变化率dp/dt要小的多。
单独比较1和2的数据,1中只有两张图片(0,0,1,1)和1张(0,0,0,1),而2中除了这两张图片还有两张不一样的图片(0,1,1,1)和(1,1,1,1),因此2的复杂度要大于1,因此0和2分类的难度大于0和1分类。因此在收敛误差相同的情况下0与2的分类准确率要小于0和1的分类准确率。
第三组
(0,3)--- 4*30*2--(1,0)(0,1)
得到数据
0--3 |
2*2 |
10 |
二值 |
|||
迭代次数n |
平均准确率p-ave |
1-0 |
0-1 |
δ |
耗时ms/次 |
耗时ms/199次 |
13.9145729 |
0.51702959 |
0.5572306 |
0.47682859 |
0.5 |
1.0201005 |
203 |
253.839196 |
0.5 |
0.90452261 |
0.09547739 |
0.48 |
2.66834171 |
531 |
386.155779 |
0.5 |
0.95979899 |
0.04020101 |
0.46 |
3.6080402 |
718 |
460.633166 |
0.5 |
0.98492462 |
0.01507538 |
0.44 |
4 |
796 |
513.974874 |
0.5 |
1 |
0 |
0.42 |
4.24120603 |
859 |
549.01005 |
0.5 |
1 |
0 |
0.4 |
4.55276382 |
906 |
581.030151 |
0.83612507 |
0.90396427 |
0.76828587 |
0.38 |
4.70854271 |
937 |
607.894472 |
0.88888889 |
0.88888889 |
0.88888889 |
0.36 |
5.0201005 |
999 |
629.964824 |
0.88888889 |
0.88888889 |
0.88888889 |
0.34 |
5.10050251 |
1015 |
656.829146 |
0.88888889 |
0.88888889 |
0.88888889 |
0.32 |
5.33668342 |
1062 |
677.542714 |
0.89056393 |
0.88888889 |
0.89223897 |
0.3 |
5.57286432 |
1109 |
695.994975 |
0.89977666 |
0.88888889 |
0.91066443 |
0.28 |
5.5678392 |
1108 |
722.135678 |
0.91485204 |
0.88888889 |
0.94081519 |
0.26 |
5.80904523 |
1156 |
742.035176 |
0.93579006 |
0.88888889 |
0.98269123 |
0.24 |
5.8040201 |
1171 |
764.015075 |
0.94249023 |
0.88888889 |
0.99609157 |
0.22 |
6.04522613 |
1203 |
789.341709 |
0.94416527 |
0.88888889 |
0.99944165 |
0.2 |
6.35678392 |
1265 |
804.356784 |
0.94444444 |
0.88888889 |
1 |
0.18 |
6.35175879 |
1264 |
828.869347 |
0.94444444 |
0.88888889 |
1 |
0.16 |
6.59296482 |
1312 |
855.824121 |
0.94444444 |
0.88888889 |
1 |
0.14 |
6.82914573 |
1359 |
886.577889 |
0.94444444 |
0.88888889 |
1 |
0.12 |
7.06030151 |
1405 |
924.025126 |
0.94444444 |
0.88888889 |
1 |
0.1 |
7.3718593 |
1467 |
962.286432 |
0.94444444 |
0.88888889 |
1 |
0.08 |
7.61306533 |
1515 |
1013.84422 |
0.94444444 |
0.88888889 |
1 |
0.06 |
7.92964824 |
1578 |
1090.90955 |
0.94444444 |
0.88888889 |
1 |
0.04 |
8.47236181 |
1686 |
1230.38693 |
0.94444444 |
0.88888889 |
1 |
0.02 |
9.49246231 |
1889 |
观察这10组数据
0 |
0 |
0 |
0 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
0 |
0 |
1 |
1 |
1 |
1 |
|
1 |
0 |
1 |
1 |
0 |
1 |
0 |
0 |
1 |
|
1 |
1 |
1 |
1 |
1 |
0 |
1 |
0 |
0 |
|
********* |
|||||||||
3 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
1 |
1 |
1 |
0 |
1 |
1 |
1 |
1 |
1 |
0和3有1张图片是重合的(0,0,0,1),因此0的分类准确率是8/9,而3的分类准确率是1因此总的分类准确率是0.5*8/9+0.5*1=17/18=0.944
0--1 |
0--2 |
0--3 |
|
δ |
平均准确率p-ave |
平均准确率p-ave |
平均准确率p-ave |
0.5 |
0.5159129 |
0.51758794 |
0.51702959 |
0.48 |
0.5 |
0.5 |
0.5 |
0.46 |
0.5 |
0.5 |
0.5 |
0.44 |
0.5 |
0.5 |
0.5 |
0.42 |
0.5 |
0.49692909 |
0.5 |
0.4 |
0.5 |
0.61194863 |
0.5 |
0.38 |
0.57035176 |
0.61111111 |
0.83612507 |
0.36 |
0.72110553 |
0.61111111 |
0.88888889 |
0.34 |
0.72222222 |
0.61111111 |
0.88888889 |
0.32 |
0.72222222 |
0.61111111 |
0.88888889 |
0.3 |
0.73562256 |
0.61111111 |
0.89056393 |
0.28 |
0.79480737 |
0.61111111 |
0.89977666 |
0.26 |
0.83277499 |
0.61111111 |
0.91485204 |
0.24 |
0.83333333 |
0.61390285 |
0.93579006 |
0.22 |
0.83333333 |
0.62339475 |
0.94249023 |
0.2 |
0.83333333 |
0.64349525 |
0.94416527 |
0.18 |
0.83333333 |
0.66275824 |
0.94444444 |
0.16 |
0.83333333 |
0.66638749 |
0.94444444 |
0.14 |
0.83333333 |
0.66666667 |
0.94444444 |
0.12 |
0.83333333 |
0.66666667 |
0.94444444 |
0.1 |
0.83333333 |
0.66666667 |
0.94444444 |
0.08 |
0.83333333 |
0.66666667 |
0.94444444 |
0.06 |
0.83333333 |
0.66666667 |
0.94444444 |
0.04 |
0.83333333 |
0.66610832 |
0.94444444 |
0.02 |
0.83333333 |
0.69235064 |
0.94444444 |
0.001 |
0.83333333 |
||
当收敛误差一致的情况下分类准确率3>1>2,峰值分类准确率3>1=2.因为2的训练集复杂度大于1因此2的分类准确率变化率小于1,因此可以得出重合图片越少,峰值分类准确率越大,分类准确率的变化率dp/dt越大。而训练集的复杂度越大,分类准确率的变化率越小。或者至少分类准确率的变化率与重合图片数量和训练集的复杂度都有关系。