VNR共享辞书指南 Shared Dictionary Tutorial

官网源地址:http://sakuradite.com/topic/649
优先进入官网看,官网不行再观看本文
因为VNR官网服务器维护或使用人太多导致崩溃常出现502错误,此帖子用来备份,官网地址若无法学习共享辞书教程,再到这观看即可。
SynCFG语法先去参考更新原贴我过一阵子研究完再整合进本教程内,也就是说只要你还能看到这行字,就说明学习辞书要暂时配合那贴使用
备份地址:VNR共享辞书中翻译的转码和代理


★基础信息
编写人:najizhimo&djz020815
起稿日期:2015/02/06
修订日期:2015/06/06
★导语
本文主要介绍VNR中共享辞书的基本操作及编写注意事项。
面向日汉语水平不同的人群分为基础教程、进阶教程以及断句教程,请根据符合自己水平的教程浏览。
对于不想编写共享词条的用户不需要观看本教程,共享辞书依旧会作用于你玩的所有GAL并辅助改善机翻质量。
★概念
共享辞书是由VNR提供的一个独立于所有翻译引擎之外的,主要针对日常形式多变的对话,以及特定GAL术语的用户自定义辞典。其作用于游戏中提取的文本、输入机器翻译引擎的内容、翻译的过程、以及翻译后即将显示在用户面前的语句等各方面的翻译工序,对机器翻译的改善起到了至关重要的作用。同时因为它的能力强大,因此需要用户在编写词条时谨慎择词,保证共享辞书能正确地实现自己的作用。
不过目前共享辞书系统本身还有不少BUG,参见这里(已不更新)

恢复BUG请到以下新地址回复(请先申请官网ID账号才能回复):

【词库更新(??????】jbeijing词库辞条征集与建议V2 ~OwO~

http://sakuradite.com/topic/1101

★Guidebook Multilingualization
Need MORE Translators~
English Version (nearly completed) start by icefire112233
Korean Version (incompleted) start by mireado
★阅读注意
关于看不清的图片,右键图片选择查看图片就能放大了。
此外可以善用ctrl+F搜索需要的内容。
★更新信息
■2015/06/06
附录加入了SynCFG可填词性
■2015/05/05
增加了韩文版教程链接
■2015/04/09
于进阶教程内增加【读法】类型辞条的叙述
■2015/03/14
由于新增了SynCFG的语法,大幅修正了后缀相关内容
原[[N]]功能替换为SynCFG最常用的[[m]]语序调整介绍,更详细的SynCFG教程稍后开辟一个专门板块
■2015/03/11
[[N]]更名为[[m]]
增加边界功能的注意事项。
■2015/03/04
更新断句教程内的断句符判定信息
■2015/02/22
前言加入共享辞书BUG链接
前言加入英文版链接
补充\功能里的注意事项
■2015/02/20
更新了断句教程的一些注意事项
■2015/02/17
附录加入常用的特殊字符输入方式
■2015/02/15
加入独立断句教程;
加入HTML转义字符介绍;
扩充人名类型相关的信息;
补充边界的例子;
附录加入常用HTML转义字符表;
更新排版;
■2015/02/13
加入【前缀】类型的介绍;
加入[[N]]功能的介绍;
加入边界选项的介绍;
基础教程
★事前准备:
1、于VNR的使用偏好内下载MeCab辞书并启用,此外从别的渠道下载微软日文输入法Windows Japanese IME并设定好路径,这两个软件能有效辅助日语分词,方便用户直观地添加需要的词条。

VNR共享辞书指南 Shared Dictionary Tutorial_第1张图片
2、于使用偏好的国际化选项内屏蔽中文以外的所有语言,因为这会影响到共享辞书的下载范围。
3、目前所有日中翻译引擎内对JBeijing7的修正以及共享词条的数量都处于压倒性优势,请尽量使用JBeijing7软件来进行游戏翻译。机器翻译引擎一般只需要1个,多余的机器翻译反而会影响理解。
4、于游戏内的左侧面板开启游戏文本,这会显示提取的日文原文,对于基础用户,添加共享辞条的途径就在这里。

★编写前的注意事项:
1、共享辞书并不需要时刻都写,只是看到有问题的语句时就顺手添加一下,请抱着轻松游戏的心情就好。
2、一般来说需要添加的词条仅限于名词,即人名、作品中的专用术语、地名等等,这些普遍是机翻难以处理的项目。而名词以外的,如动词、助词、短语等等的若要添加则务必学习进阶教程。
3、切勿添加已有的词条,觉得以前的词条不恰当的话则先要无效该词条,并写上修改建议。
4、非特殊情况不要添加空格以及任何标点符号。
5、长句翻译请写在字幕系统内,那不是共享辞书的范畴。
■案例1:人名词条

 
如图本身人名的まどか并无法被正确翻译,这里我们将鼠标移到原文

 
会看到日文语句经过分词辞书的处理,用不同色块标注了出来,对まどか点击鼠标右键

 
点击添加到共享辞书,系统就会自动打开词条添加窗口并将该分词(色块内的内容)复制到形态里

 
在确认类型无误后(翻译器不需要动),且勾选了系列专用后,在翻译一栏里填入合适的词,如“圆香”,然后提交即可成功添加词条。
此后游戏内出现的所有まどか都会被自动翻译为圆香。
★关于添加【人名】类型词条的注意事项:
1、对于姓名,如“涼宮春日”,那么需要将姓的“涼宮”和名的“春日”分开,各添加一个词条,因为经常会只用姓、或名来称呼某人。而John?Smith这种中间带了分隔点的也一样,John和Smith分别添加一个即可。
2、对于单字人名的添加,如“咲”,若单纯添加【咲→咲】的词条的话,就会影响如“咲け、咲い、咲く”等较为常用的词语,正确的添加方式需要学习进阶教程内的正则表达以及边界选项。
★【前缀】【后缀】类型辞条的连协:
添加了人名词条不单止能让机翻可以识别生疏的名字,还能让共享辞书内的所有用于处理【人名】的后接词的【前缀】【后缀】词条生效,例如“悠クン”中的クン(君)就会因为识别了“悠”属于人名,而让クン译为了君。
★【翻译】类型辞条的添加:
不属于人名的其它名词或短语则需要在词条添加窗口的类型里改为【翻译】,其余的道理同案例1。
★系列专用的基本认识:
从案例1里可以看到词条添加窗口内有【系列专用】的标识,该选项的意义即设定本词条是否只应用于该作品内。那么哪些名词适合【非系列专用】呢,即现实存在的术语、历史名人、书籍、地名等等。
进阶教程
★事前准备:
如果你确定要学习辞书的进阶教程,则必须切实带上一颗负责任的心,进阶的辞书编写将会很大程度地影响某个游戏的机翻质量,甚至整个翻译引擎的润色质量。
以下教程需要用户拥有扎实的日语及汉语基础,以及对共享辞书和翻译引擎的工作过程了解透彻。
在编写过程中务必时刻开启VNR的测试机器翻译窗口来检测自己的词条是否正确。特别是非名词类、以及带正则的辞条。
★关于【正则表达】、【宏】、【HTML转义字符】的基础知识:
这3个都是很基础的计算机术语了,详细的介绍可以自行查看各类百科。
这里简单地一提就是正则表达用于一些逻辑判断,而宏是复合型的正则表达,方便书写用,HTML转义字符则用来添加一些会被识别为辨识符的符号。正则、宏、HTML转义字符能同时使用。正则和宏若要生效则需要勾选辞条窗口中的“正则表达”,此时辞条会被加粗来标识。注意HTML转义字符是不需要勾选正则表达的。
文章末尾附录带有常用的正则表达、HTML转义字符列表。宏则可以通过辞书中的宏类别直接查看。
★运用正则表达及文本宏辅助编写
■案例1:单字、2(3)个片假以内的人名
咲(?![けいく]) → 咲
如基础教程所提到的“咲”,需要根据特定的游戏设计一个专门的排除表,在攻略中不断添加新的筛选项。
用正则排除了各种花开的词组如咲け、咲い、咲く,咲辞条不会捕捉这3个被正则排出掉的情况。
需要查看下文的边界选项配合编写事半功倍。注意短平假名构成的人名是要切实地写正则筛选列表,而不能用边界选项。
■案例2:短句翻译
对于一些日常对话频繁出现的短句,适合使用【翻译】类型辞条来定型。然而由于在日常对话中经常出现平片假名和汉字的随意置换、助词、省略语的影响,并没有特别固定的书写方法,此时就要判断多种表达方式。

通过使用正则将汉字、平假写法均包括在形态中,并且包含了3种助词,以及不包含助词的情况。
■案例3:语气词

这种东西加起来是最繁琐的,该例子首先使用一个{{boc}}和{{eoc}}的宏将该形态独立起来,这使得该辞条只会作用于单句,即整个句子都是用来表达“呼”的内容的情况,避免其它冲突。然后通过添加大量可能附着的发声词,延长符,促音等等来完成。而且由于考虑到会出现多个呼的情况,于是用了2个辞条来分别处理。至于如果出现2字的呼呼怎么办,2字以上的都用3个字的呼来表示多数。
对于短句和语气词翻译的添加特别需要注意的是由于这种辞条的书写可能性会非常多,因此需要长时间的修正,也因为这个原因可能很多前人已经在写该翻译的正则辞条了,只是还没包含你遇到的情况,因此在准备添加之前先在共享辞书内搜索相关的中文翻译,查看是否已有该类型辞条,若有则在更新原因内添加修改建议,这样会方便辞书的整体管理。
★测试机器翻译窗口介绍:
该图能很直观地表达各类型共享辞条的实行步骤。即翻译引擎和VNR配合的完整翻译流程。这对于添加共享辞书是至关重要的信息。
其实测试机器翻译窗口上面的黑色字已经是介绍了,为了更简明化,分别标上了附注。注意窗口之间的箭头,表示处理顺序。
VNR共享辞书指南 Shared Dictionary Tutorial_第2张图片
可以看到仅仅只有第7步是由JBeijing翻译引擎来处理,其它步骤都可以通过独立于翻译引擎以外的共享辞书来修正,由此可见若共享辞条写得好,会极大地提升文本润色质量。
记得顶部的翻译器要正确选择J北京,不要测了其它的翻译器了。
若想加入辞书大军的话请保持你的机器翻译窗口常驻!
★常用的词条类型及语言的选择:
一、【翻译】
顾名思义就是日文→你想要翻译的语言来进行翻译了。
一般会用到的情况:
1、外来语,这个JBeijing实在是很弱。然而对于一些切实是在念英文的,请翻译为英文,尽管辞条语言是设置为中文。
2、一些常用短语及熟语,这个得注意后面的「な」「か」「だ」「て」「で」等,需多考虑些情况再加。
该类型会影响句子的语序。
二、【人名】
原理同【翻译】,只是多了可以与【前缀】【后缀】词条之间进行联动翻译。
一般都是设【系列专用】的,详情见“专用和非专用的设定”的【人名】部分。
该类型会影响句子的语序。
三、【前缀】【后缀】
只会与【人名】词条进行联动翻译,其他情况下是无效的。即识别人名前方和后方的文本来紧贴人名翻译。
该类型不会影响句子的语序。
四、【输入】
可以把一些不能翻译平片假名还原成能翻译的,和修正一些分词之类的错误。前者语言选【全部】后者选【中文】即可。
该类型不会影响句子的语序。
五、【输出】
用于修正一些繁琐的词或是改善翻译的语序,详情见“输出词条案例”。
该类型不会影响句子的语序。
六、【游戏】
这是用在“游戏提取并显示出来的文本”上的,主要用于删除游戏提取的日文文本中存在的垃圾信息,以及“去除重复文本”和“调换人名与正文的顺序”。语言一定是选择【全部】。
该类型不会影响句子的语序。
七、【读法】
该类型辞条是进化版的【人名】类型辞条,可以在执行人名翻译的同时附带读音标记、全语言兼容等功能,然而目前暂时只能用在汉字人名上,对平片假人名无效。添加方式是在VNR的游戏情报窗口左下角点击“导入人名”,再点击相应的读法来添加入辞书。和【人名】一样,姓和名需要分开添加。语言一定是选择【全部】。
■案例4:输入词条 
输入词条可以让一些原本因为书写问题不能被识别的词变得能被翻译引擎翻译,还有就是修正一些因分词和缺少助词(太过口语化)的错误。由于该类型不会影响句子语序,所以比起【翻译】来说,能尽量写【输入】的话效果会更好。输入辞条形态和翻译双方都只允许填写日文。
平假的「りょうほう」→「両方」

和片假的「ぷらとにっく」→「プラトニック」

还有多了「っ」「ッ」的平片假,如「スペッシャル」→「スペシャル」

简写的词条


需要严格替换的

 
平片假组合及有无助词的

 
缺助词出错的可以看情况加上去,至于分词出错的请回复到http://sakuradite.com/topic/220,这是比较头疼的一部分,需要JBeijing词库和VNR共享辞书之间的配合,虽然基本上已经不会出现了。
■案例5:输出词条
输出词条可以修正一些繁琐的词或是改善翻译的语序。而且因为该类型不会影响翻译时的语序,在整句翻译语序非常妥当的时候用该类型的辞条要好于【翻译】类型的辞条。输出辞条形态和翻译双方都只允许填写中文。
「炒子」JBeijing翻译为“煮熟晒干的小沙丁鱼”比较烦,所以可以直接用【输出】翻译成“沙丁鱼干”

各种“挂上(放上)”也可以用【输出】翻译掉,如「ちょっかいをかける」JBeijing的翻译

改善翻译的语序,像JBeijing翻译「何やってんだ」这类的

因各种因素而出现的罗马音

 
对于输出辞条最后记得要在评论栏里填上词条的原文,方便记录和修改。
★【输入】和【输出】类型的专用大杀器“\”
\+数字的作用是映射形态里的小括号里的内容,\1映射第1个小括号,\2映射第2个以此类推,该功能只能作用于【输入】和【输出】辞条。需要开启正则表达。
注意若括号内采用了?:正则那么\是不能映射该括号的
■案例6:更改翻译的同时替换语序
如SF类里经常出现属性之月,这个输出辞条将后一个括号里的内容前移,避免中断属性之月的翻译。

★SynCFG常用人名语序调整符号“[[m]]”
★【前缀】【后缀】类型的专用大杀器“[[N]]”
该功能可以调整【前缀】【后缀】翻译的文本对于人名的位置。只能作用于【前缀】【后缀】辞条。不需要开启正则表达。
[[N]]映射所附着的人名。
■案例7:通过[[N]]替换语序
如:(这仅仅是个例子!)类型为【后缀】
「ばか」→「笨蛋[[N]]」
那么「キョンばか」就会被译为「笨蛋阿虚」
又如:类型为【前缀】
「ミス」→「[[N]]小姐」
那么「ミス長門」就会被译为「长门小姐」
★辞条的“边界”选项
该功能的作用是将落单的单字人名在不需要加正则筛选列表的前提下正确翻译。该功能只能作用于【人名】类型。
该功能只适合单字、2(3)个片假以内的人名,完全不适用于短平假人名,短平假人名需要只用正则列筛选表。
如开启了边界选项的「愛」→「爱」
那么对于“愛情、恋愛”等词组就不会被单独拆开。
然而对于“愛しさ”等非同一字符态的词语,边界则会误伤。
也就是说开启边界的「爱」等价于「{{?<!kanji}}愛{{?!kanji}}(视GAL不同可以再加一大堆筛选列表)」,可以较为方便的添加单字人名,然而识别范围只依赖于Mecab,最完美的判断方式依旧是配合正则表达。
■案例8:边界配合正则快速完成人名辞条

当然じ也不是唯一要筛的,主要还是根据所玩GAL的范围来推断要添加的筛选项。
★专用和非专用的设定:
需要设“系列专用”:
所有【游戏】类型
【人名】
1、游戏内平片假人名。
2、单汉字。
3、与原本意思或其他名词有冲突的人名。
4、平片假+称谓的词条
【翻译】【输出】
游戏内才存在的专用术语或常用短语。
【输入】
1、比较偏门的,或是游戏特指的某个汉字的平片假形式。
2、3个(包含)字符以下的平片汉转换。
3、游戏内出现的平片汉混用、乱用的平片汉转换,一般是外国人或幼女的口语。
无需设“系列专用”:
【人名】
1、真实存在的历史人物名。
2、一些不会与原本意思或其他名词冲突的常见人名。
3、或是像「奈々」这种带有汉字代替符的人名。
【翻译】【输出】
现实存在的各种名词或常见短语。
【输入】
4个(包含)字符以上的规范平片汉转换。
★JBeijing词库与共享辞书的区别:
JBeijing词库因为其拥有语法功能,所以一些动词、形容词、形容动词直接加到JBeijing的话效果会更好,因为并不会扰乱语序。
请到此贴回复想添加的JBeijing辞条:http://sakuradite.com/topic/220
共享辞书主要还是【名词】【短语】【输入】【输出】词条的使用。
共享辞书的好处:
1、具有JBeijing词库所没有的正则表达功能。
2、【输入】【输出】词条的善用是配合JBeijing词库使用的精髓。
3、因为【翻译】是强制性的,所以一些JBeijing加不了的词就能加到共享辞书里了。
4、【人名】的系列专用是很实用的↖(^ω^)↗
★共享辞书的管理:
一般来说每次登录VNR后打开辞书,检索用户+自己ID看看自己写的辞条有没被提修改意见然后根据情况来处理。
VNR共享辞书指南 Shared Dictionary Tutorial_第3张图片
此外在攻略一个新游戏是点击#游戏来查看该游戏已拥有的辞条数量,如果较多的话说明文本润色会比较好,玩的时候会舒服许多。

而日常新增辞条、重复辞条的查错和管理一般都会有人处理。若对自己的日汉语基础有信心的朋友当然也可以不时查看一下并帮忙修改。润色苦力不嫌多。
有任何建议和意见只要点击右下角的NEW并输入文本提交即可告诉鸡翅啦~
直接发送给作者邮箱【[email protected]】这样jichi会很快得到回复。同样详细说明情况和截图。以便作者解决。
另外QQ邮箱发送邮件后,收件箱收不到作者的回信,需要在右上角【邮件全文搜索】搜索【[email protected]】,如果jichi回复,就会显示提示,之后点击查看就好。

★其它辞条类型:
一、【语音合成】
基本上多用在改人名的语音,用于被TTS识别,基本会被设为“系列专用”。语言选择“全部”。
二、【宏】
正则表达的延伸,主要是简化了正则表达的书写。可以在共享辞书的宏标签内查看所有宏。
三、【光学识别】
和【输入】类型的工作原理相同,只不过是用在【光学识别】上的,该辞条只会生效于OCR提取的文本
四、【读法】
中文用不到,无视。
断句教程
断句堪称共享辞书最强武器之一,可以自定义以前一直被引擎独占的断句规则,来对复杂多变的对话划分为一个个能够识别的语句。
断句符为&eos;,输入时会产生…eos…来代表断句。断句符是一个HTML格式的VNR特殊符,不需要开启正则。
由于断句对于语言、引擎的关联性非常强烈,因此一般情况下该类辞条不适合设置为“全语言”和“全翻译器”使用。
JBeijing重要的公用断句规则:
「、」→「&eos;、&eos;」
在写有关顿号判定的【输入】词条时注意是判定“…eos…、…eos…”,宏为{{cbr}},单纯的“…eos…”宏为{{br}}(关于更多断句的相关宏自行查看辞书里的宏分类)。
同时若要在【输出】辞条内判定断句则必须要用&eos;,而不能用{{br}}一类的宏。(我也不清楚为什么)
注意断句本身只能用&eos;,是判定断句才可以用宏。且本教程内的例子不代表现存适用的规则,很多可能都已经经过多次修改,实际规则需浏览更新后的共享辞书
■案例1:通过断句固定开头\结尾的短语
如“流れとして仲間になった”,直接翻译为“作为流动成为了朋友”
此时我想固定一下“流れとして”作为常用短语,于是添加了一个【翻译】辞条 「流れとして」→「机缘巧合」
再次测试发现最终翻译结果为“变成为机缘巧合朋友”,这是由于共享辞书定义的【翻译】词条混淆了本身的词性(被替换为了数字),因此动词倒装的“になった”在翻译后就跨过了“机缘巧合”。
此时只需要加一个【输入】辞条来进行断句「流れとして」→「流れとして&eos;」
再次测试翻译就变回了“机缘巧合成为了朋友”
又如各种句末的“だけ”,引擎会将其处理为“只有”并位置前移,然而一旦遇到引擎无法定义词性的词语,“只有”的位置便会移得相当难看。
这时可以通过将“只有”改译为句尾的“而已”并断句来作固定处理。
先设置一个【输入】类型辞条
「だけ([だね])?(よ)?{{eoc}}」→「&eos;だけ\1\2」
然后创建一个【翻译】
「だけ([だね])?(よ)?{{eoc}}」→「而已」
搞定,可喜可贺
■案例2:通过反断句来连接翻译
如“別に”,作为的独句时通常翻译为“没什么”,而“別にいい”则翻译为“无所谓”
然而说出“別に”的人常常会处于犹豫的状况而加入停顿,即“別に、いい”此时翻译的处理就会将其翻译为“没什么,好”
此时用一个{{cbr}}宏判定将断句也包含入翻译即可
【翻译】辞条
「(別|べつ)に{{cbr}}?いい(だ?けど|です|ですけど)?わ?」→「无所谓」
更多内容正在填坑中,你也可以直接在共享辞书内的翻译项里搜索&eos;来查看naji和djz的断句辞条模板,不过现阶段绝大部分断句辞条都是处于需要反复修正的状态,很少定式规则
附录
★常用的正则表达
*
匹配前面的子表达式零次或多次(大于等于0次)。例如,zo*能匹配“z”以及“zoo”。*等价于{0,}。
+
匹配前面的子表达式一次或多次(大于等于1次)。例如,“zo+”能匹配“zo”以及“zoo”,但不能匹配“z”。+等价于{1,}。
?
匹配前面的子表达式零次或一次。例如,“do(es)?”可以匹配“does”或“does”中的“do”。?等价于{0,1}。
|
将两个匹配条件进行逻辑“或”(Or)运算。例如正则表达式(him|her) 匹配"it belongs to him"和"it belongs to her",但是不能匹配"it belongs to them."。
(pattern)
匹配pattern并获取这一匹配。所获取的匹配可以从产生的Matches集合得到,在VBScript中使用SubMatches集合,在JScript中则使用$0…$9属性。要匹配圆括号字符,请使用“\(”或“\)”。
(?:pattern)
匹配pattern但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。这在使用或字符“(|)”来组合一个模式的各个部分是很有用。例如“industr(?:y|ies)”就是一个比“industry|industries”更简略的表达式。
(?=pattern)
正 向肯定预查,在任何匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例 如,“Windows(?=95|98|NT|2000)”能匹配“Windows2000”中的“Windows”,但不能匹配 “Windows3.1”中的“Windows”。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从 包含预查的字符之后开始。
(?!pattern)
正向否定预查,在任何不匹配pattern的字符串开始处匹配查找字符串。这是 一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如“Windows(?!95|98|NT|2000)”能匹配“Windows3.1”中的 “Windows”,但不能匹配“Windows2000”中的“Windows”。
(?<=pattern)
反向肯定预查,与正向肯定预查类似,只是方向相反。例如,“(?<=95|98|NT|2000)Windows”能匹配“2000Windows”中的“Windows”,但不能匹配“3.1Windows”中的“Windows”。
(?<!pattern)
反向否定预查,与正向否定预查类似,只是方向相反。例如“(?<!95|98|NT|2000)Windows”能匹配“3.1Windows”中的“Windows”,但不能匹配“2000Windows”中的“Windows”。
x|y
匹配x或y。例如,“z|food”能匹配“z”或“food”。“(z|f)ood”则匹配“zood”或“food”。
[xyz]字符集合。匹配所包含的任意一个字符。例如,“[abc]”可以匹配“plain”中的“a”。
[^xyz]负值字符集合。匹配未包含的任意字符。例如,“[^abc]”可以匹配“plain”中的“plin”。
★常用的Html转义字符
半方大的空格 ? ?
全方大的空格 ? ?
不断行的空格 

小于 < <

大于 > >

&符号 & &
·
间隔号 · ?
★常用的特殊字符输入方式
(ALT+数字键盘,然后松开ALT)
0128 ?
0131 ?
0133 …
0134 ?
0135 ?
0137 ‰
0149 ?
0153 ?
0162 ?
0163 ?
0165 ?
0167 §
0169 ?
0170 ?
0171 ?
0172 ?
0174 ?
0176 °
0177 ±
0181 ?
0182 ?
0183 ·
0187 ?
0188 ?
0189 ?
0190 ?
0215 ×
0247 ÷
★SynCFG可填词性
m: 名前, name, probably human's
mp: 地名, place name
n: 名詞, noun
pn: 代名詞, pronoun
v: 動詞, verb
a: 形状詞, stem of adjective/adverb
adn: 連体詞, adnominal
adj: 形容詞, adjective
adv: 副詞, adverb
p: 助詞, particle
aux: 助動詞, auxiliary verb
suf: 接尾辞, suffix
pref: 接頭辞, prefix
int: 感動詞, interjection
conj: 接続詞, conjunction
w: 記号, word in latin or other special characters
punct: 補助記号, punctuation
x: other common phrases


你可能感兴趣的:(正则表达式,共享辞书,VNR,SynCFG)