张乐最大熵工具包的模型文件格式分析

本文为张乐最大熵工具包模型文件格式分析:

训练文件如下:

c1 f21 f30 f40 f51 f60 f70 f81 f91 f101 f111 f120 f130 f144 f150 f160 f171
c1 f21 f30 f40 f51 f60 f70 f80 f91 f101 f111 f120 f130 f144 f151 f160 f171
c4 f20 f30 f41 f50 f60 f71 f81 f91 f101 f110 f120 f131 f140 f151 f160 f170
c1 f21 f30 f40 f51 f60 f70 f81 f91 f101 f111 f120 f130 f144 f150 f160 f171
c1 f21 f30 f40 f51 f60 f70 f81 f91 f101 f111 f120 f130 f144 f151 f160 f171
c1 f21 f30 f40 f51 f60 f70 f80 f91 f101 f111 f120 f130 f144 f151 f160 f171
c1 f21 f30 f40 f51 f60 f70 f80 f91 f101 f111 f120 f130 f144 f151 f161 f171
c4 f20 f30 f41 f50 f60 f71 f80 f91 f101 f110 f120 f131 f140 f151 f161 f170
c4 f20 f30 f41 f50 f60 f71 f81 f91 f101 f110 f120 f131 f140 f151 f160 f170
c1 f21 f30 f40 f51 f60 f70 f80 f91 f101 f111 f120 f130 f144 f150 f161 f170
c1 f21 f30 f40 f51 f60 f70 f81 f91 f101 f111 f120 f130 f144 f151 f160 f171
c2 f20 f31 f41 f50 f61 f70 f80 f90 f101 f111 f120 f130 f142 f151 f161 f170
c4 f20 f30 f41 f50 f60 f71 f81 f91 f101 f110 f120 f131 f140 f151 f160 f170
c7 f20 f30 f41 f50 f60 f70 f81 f90 f100 f110 f120 f130 f140 f150 f160 f170
c7 f20 f30 f41 f50 f60 f71 f81 f90 f100 f110 f120 f130 f144 f150 f160 f170
c7 f20 f30 f41 f50 f60 f71 f81 f90 f100 f110 f120 f130 f146 f150 f160 f170
c2 f20 f31 f41 f50 f61 f70 f81 f90 f101 f111 f120 f130 f142 f151 f160 f170
c1 f21 f30 f40 f51 f60 f70 f80 f91 f101 f111 f120 f130 f144 f151 f160 f171
c4 f20 f30 f41 f50 f60 f71 f81 f91 f101 f110 f120 f131 f140 f151 f160 f171
c1 f20 f30 f40 f51 f60 f71 f81 f91 f101 f111 f120 f131 f140 f151 f160 f171
c2 f20 f31 f41 f50 f61 f70 f80 f90 f101 f111 f120 f130 f142 f151 f161 f170
c2 f20 f31 f41 f50 f61 f71 f80 f90 f101 f111 f120 f130 f142 f151 f160 f170
c1 f21 f30 f40 f51 f60 f70 f80 f91 f101 f111 f120 f130 f144 f151 f160 f171
c2 f20 f31 f41 f50 f61 f70 f80 f90 f101 f111 f120 f130 f142 f151 f160 f171
c6 f20 f30 f41 f50 f60 f70 f80 f90 f100 f111 f120 f130 f146 f150 f160 f170
c5 f20 f30 f41 f50 f60 f71 f81 f91 f101 f111 f120 f130 f144 f150 f160 f170
c5 f20 f30 f41 f50 f60 f71 f81 f91 f101 f111 f121 f130 f144 f150 f160 f170
c1 f21 f30 f40 f51 f61 f70 f80 f91 f101 f111 f120 f130 f142 f151 f160 f170
c1 f21 f30 f40 f51 f60 f70 f80 f91 f101 f111 f120 f130 f144 f151 f160 f171
c1 f21 f30 f40 f51 f60 f70 f81 f91 f101 f111 f120 f130 f142 f150 f161 f171
c6 f20 f30 f41 f50 f61 f70 f80 f90 f100 f111 f120 f130 f146 f150 f160 f170
c1 f21 f30 f40 f51 f60 f70 f80 f91 f101 f111 f120 f130 f144 f151 f161 f171
c1 f21 f30 f40 f51 f60 f70 f80 f91 f101 f111 f120 f130 f142 f150 f160 f171
c2 f20 f31 f41 f50 f61 f71 f81 f90 f101 f111 f120 f130 f142 f151 f160 f170
c4 f20 f30 f41 f50 f60 f71 f80 f91 f101 f110 f120 f131 f140 f151 f160 f170
c1 f21 f30 f40 f51 f60 f70 f80 f91 f101 f111 f120 f130 f144 f151 f161 f170
c1 f21 f30 f40 f51 f60 f70 f80 f91 f101 f111 f120 f130 f144 f151 f160 f170
c2 f20 f31 f41 f50 f61 f70 f81 f90 f101 f111 f120 f130 f142 f151 f160 f170
c4 f20 f30 f41 f50 f60 f71 f81 f91 f101 f110 f120 f131 f140 f151 f160 f170
c6 f21 f30 f41 f50 f61 f70 f80 f90 f100 f111 f121 f130 f146 f150 f161 f170
c6 f21 f30 f41 f50 f61 f70 f80 f90 f100 f111 f120 f130 f146 f150 f160 f170
c2 f20 f31 f41 f50 f60 f70 f81 f90 f101 f111 f120 f130 f142 f151 f160 f170
c6 f20 f30 f41 f50 f61 f70 f81 f90 f100 f111 f120 f130 f146 f150 f160 f170
c2 f20 f31 f41 f50 f61 f70 f80 f90 f101 f111 f120 f130 f142 f151 f160 f170
c1 f21 f30 f40 f51 f60 f70 f81 f91 f101 f111 f120 f130 f144 f151 f160 f171
c1 f21 f30 f40 f51 f60 f70 f81 f91 f101 f111 f120 f130 f144 f151 f160 f171
c7 f20 f30 f41 f50 f60 f71 f81 f90 f100 f110 f120 f130 f146 f150 f160 f170
c1 f21 f30 f40 f51 f60 f70 f81 f91 f101 f111 f120 f130 f144 f151 f160 f171
c1 f21 f30 f40 f51 f60 f71 f81 f91 f101 f111 f120 f130 f144 f151 f160 f171
c1 f21 f30 f40 f51 f60 f70 f81 f91 f101 f111 f120 f130 f144 f151 f160 f170
c1 f21 f30 f40 f51 f60 f70 f81 f91 f101 f111 f120 f130 f144 f151 f160 f171
c6 f21 f30 f41 f50 f61 f70 f80 f90 f100 f111 f120 f130 f146 f150 f160 f170
c5 f20 f30 f41 f50 f60 f71 f81 f91 f101 f111 f120 f130 f144 f151 f160 f170
c7 f20 f30 f41 f50 f60 f71 f81 f90 f100 f110 f120 f130 f148 f150 f160 f171
c1 f21 f30 f40 f51 f60 f70 f81 f91 f101 f111 f120 f130 f144 f151 f160 f170
c1 f21 f30 f40 f51 f60 f70 f80 f91 f101 f111 f120 f130 f144 f151 f160 f171
c2 f20 f31 f41 f50 f60 f70 f80 f90 f101 f111 f120 f130 f142 f151 f160 f171
c2 f20 f31 f41 f50 f61 f70 f80 f90 f101 f111 f120 f130 f142 f151 f161 f170
c2 f20 f31 f41 f50 f60 f71 f81 f90 f101 f111 f120 f130 f142 f151 f160 f171
c2 f20 f31 f41 f50 f61 f70 f80 f90 f101 f111 f120 f130 f142 f151 f160 f170
c4 f20 f30 f41 f50 f60 f71 f81 f91 f101 f110 f120 f131 f140 f151 f160 f171
c4 f20 f30 f41 f50 f60 f71 f81 f91 f101 f110 f120 f131 f140 f151 f160 f170
c3 f20 f30 f41 f50 f60 f70 f81 f91 f101 f111 f121 f130 f140 f151 f160 f170
c1 f21 f30 f41 f51 f60 f71 f81 f90 f101 f111 f120 f130 f144 f151 f160 f171
c1 f21 f30 f40 f51 f60 f70 f81 f91 f101 f111 f120 f130 f144 f151 f160 f171
c1 f21 f30 f40 f51 f60 f70 f80 f91 f101 f111 f120 f130 f144 f151 f161 f171
c1 f20 f30 f40 f51 f60 f71 f81 f91 f101 f111 f120 f131 f140 f151 f160 f171
c1 f21 f30 f40 f51 f60 f70 f81 f91 f101 f111 f120 f130 f144 f151 f160 f171
c1 f21 f30 f40 f51 f60 f70 f81 f91 f101 f111 f120 f130 f144 f151 f161 f171
c1 f21 f30 f40 f51 f60 f70 f81 f91 f101 f111 f120 f130 f144 f151 f160 f171
c1 f21 f30 f40 f51 f60 f70 f80 f91 f101 f111 f120 f130 f144 f151 f161 f171
c2 f20 f31 f41 f50 f60 f70 f81 f90 f101 f111 f120 f130 f142 f151 f160 f171
c7 f20 f30 f40 f50 f60 f70 f81 f90 f100 f111 f121 f130 f148 f151 f160 f170
c4 f20 f30 f41 f50 f60 f71 f80 f91 f101 f110 f120 f131 f140 f151 f160 f170
c1 f21 f30 f40 f51 f60 f71 f81 f91 f101 f111 f120 f131 f140 f150 f160 f171
c1 f21 f30 f40 f51 f60 f71 f81 f91 f101 f111 f120 f131 f142 f151 f160 f171
c3 f20 f30 f40 f50 f60 f71 f81 f91 f101 f110 f121 f130 f140 f151 f160 f170
c7 f20 f30 f41 f50 f60 f71 f81 f90 f100 f110 f121 f130 f140 f150 f160 f170
c2 f20 f31 f41 f50 f61 f71 f81 f90 f101 f111 f120 f130 f142 f151 f160 f170
c2 f20 f31 f41 f50 f61 f71 f81 f90 f101 f111 f120 f130 f142 f151 f160 f170


训练出的模型文件为:

#txt,maxent/*注释表示模型文件为txt格式*/
35/*表示训练预料中共有35个feature,一下的35行,每行为一个feature*/
f21
f30
f40
f51
f60
f70
f81
f91
f101
f111
f120
f130
f144
f150
f160
f171
f80
f151
f20
f41
f50
f71
f110
f131
f140
f170
f161
f31
f61
f90
f142
f100
f146
f121
f148
7/*表示训练预料中有7个class,一下的7行,每行为一个class*/
c1
c4
c2
c7
c6
c5
c3
/*以下,每行前面的一个数字表示每行的class的数量,这些行和feature的行一一对应,比如*/
2 0 4 /*对已应(f21,c1),(f21,c6),后面的依次类推,共有35行*/
6 0 1 3 4 5 6 
3 0 3 6 
1 0 
7 0 1 2 3 4 5 6 
5 0 2 3 4 6 
7 0 1 2 3 4 5 6 
4 0 1 5 6 
5 0 1 2 5 6 
6 0 2 3 4 5 6 
6 0 1 2 3 4 5 
6 0 2 3 4 5 6 
3 0 3 5 
4 0 3 4 5 
7 0 1 2 3 4 5 6 
4 0 1 2 3 
4 0 1 2 4 
6 0 1 2 3 5 6 
7 0 1 2 3 4 5 6 
7 0 1 2 3 4 5 6 
6 1 2 3 4 5 6 
6 0 1 2 3 5 6 
3 1 3 6 
2 0 1 
4 0 1 3 6 
7 0 1 2 3 4 5 6 
4 0 1 2 4 
1 2 
3 0 2 4 
4 0 2 3 4 
2 0 2 
2 3 4 
2 3 4 
4 3 4 5 6 
1 3 
151/*后面的151行等于值对(feature,class)的数量,后面为这些值对的theta值,为最终的概率数据*/
0.39492290060945723
0.13803667970531924
0.27352101589010291
0.021936348105736553
0.12665861158541863
0.25837970878956706
-0.11665013156613267
-0.14435105244323393
0.39339734813638139
0.35346952182199642
0.11871538942791747
0.43737712324017608
0.24694941994136349
-0.0022992029804162484
-0.86240513381944861
0.21381077277139532
-1.3066048292431796
-0.092107566929012147
-0.15226652164583518
0.26933795622015921
0.078422068890305341
-0.13855531079342134
0.27405773585570276
-0.17776775321131022
0.19317759742300927
-0.2663256188145891
-0.16514612207122312
0.2971715528872626
-1.1133711340200538
0.087340177329061755
0.080621442940062071
0.29690693478975544
0.28311686872607073
0.44273399287097881
0.32316796367401657
0.26175790076338962
-0.0083135007169951869
0.15445495830731928
0.026287348538461985
-0.037763485188048874
0.30085003936084687
0.15557592536742507
-1.4240017393738138
0.089684947693852324
0.1540628112288436
-0.70147831604216959
0.25734922849817343
-0.053483983500905025
0.046011192584705624
-0.22983608213834117
-0.17822902908840443
-0.64516138188609162
0.2216528148614747
0.11625218774632937
0.24554032092895645
-0.0026924040466546062
-0.052993619340876666
0.18189392326716658
0.33437122718645007
-0.29234759295056356
1.0435515507101518
0.16417214318424905
0.48573356602431667
0.78431583422052797
0.33096129366604909
0.20107960511003722
-0.21948186423712343
-0.069148075548932375
0.070846719989515611
-0.086355924178600579
-0.20288101378153106
-0.22192198570180693
0.35902182092695245
-0.64160026326656172
-0.072187197609430445
-0.57743644047765263
0.2593334700138048
-0.050324120524467747
0.11439858736310006
0.24770335089119067
0.23380924427159669
0.077832091349116561
0.19897287142239964
-1.3818118860824542
-1.2272839038944749
-0.0037403510338391843
-1.0936548565164335
0.045460705527294379
0.22275980449115454
0.17432352277396843
-0.33560618621285587
0.12810089060784213
0.024124321345797908
-1.7472723298166459
0.14115581921692255
0.20076207639272969
-0.034598051916530717
0.15197938948883563
0.12754506099257223
-0.80433174669288399
0.095385855757757265
0.19243527358463125
0.12526442563213491
0.13581948366089658
0.10461840534677352
0.059882619884622283
0.049625712468080521
0.31194424264626053
-0.25209305758578687
0.078979151581680229
0.5080211561187008
-0.58504765097705447
0.73800892614818614
0.51046305610543985
0.00033594764266248753
0.22738855280885734
0.87124265912105758
-0.039366612505397011
0.65650050710025176
-0.23104445649301317
0.91271230638070466
-0.23800474591769305
-0.061786819948476485
-0.0063214350427701349
0.1196884482163148
0.17671430913308855
0.20920884512436633
0.21209996996486574
0.29397713475992981
-0.070088375434436911
0.13574718701584182
-0.27623296002646475
0.73356969512721537
-0.053826222178437411
0.44103100218013969
0.39949219988605256
-0.72293074206936903
0.41986783753749723
0.55851725431990351
0.31822179636248737
0.11291737001145527
0.66139166711879693
0.83493974883053834
0.90354654750488095
0.10668266493102255
1.0925797299795357
0.72399703569338525
0.23894678635814157
0.44270074953680433
1.9486743962502344
1.3471314142975634


你可能感兴趣的:(NLP)