Paoding 2.0.2记录
paoding 现在在svn上的代码能够支持 自动动态装载词典,并检测词典是否发生了更新、删除。
也支持关闭自动监测(paoding.stopAutoDetecting),而提供一个方法paoding.forceDetecting手动执行一次检测。
现在这个版本为2.0.2,但是现在不打算打成jar包和zip包。
待之后2.0.3支持简繁体、提供GBK->UTF-8;Big5->utf-8转化功能后再发包。
-------------------------------
2007-9-19:
计划变更:简体繁体从2.0去除,推迟到2.1版;2.0.3版本号留空。下一个发布版本是2.0.4-alpha.
错误观点修正:因为lucene输入的是Reader,此时已经没有编码的问题了,全部都是符合unicode规范的字符了。不管是GBK还是BIG5存储的文件转化为Reader后,就没有编码的概念了。所以庖丁不存在GBK->UTF-8的变更。
-------------------------------
2.0.3之后没有特殊原因,不会再增加新的特性或功能了。
之后便是完整测试,并持续发布2.0.4-alpha;-->2.0.4-beta;-->
被**证明**稳定后最终发布2.0.5。
之后除非有严重妨碍使用的bug,否则不再发布新版本。
2.0.5之后的版本将直接跳到2.1.0开始(如果有新特性需要加入才会生版本)。
-------------------------------
2007-9-19:
计划调整:简繁体计划从2.1开始开发
-------------------------------
一个使用手动检测词典变化的例子:
public static void main(String[] args) throws Exception {
Paoding paoding = PaodingMaker.make();
paoding.stopAutoDetecting();//关闭自动词典监测,使用手动检测
PaodingAnalyzer analyzer = PaodingAnalyzer.defaultMode(paoding);
int count = 1;
while (true) {
paoding.forceDetecting();//分词之前手动强制检测一次
TokenStream ts = analyzer.tokenStream(
"", new StringReader("庖丁解牛词典检测"));
Token token;
while ((token = ts.next()) != null) {
System.out.println(token);
}
System.out.println("--" + (count ++) + "--");
Thread.sleep(1000 * 5);
}
}
如果要使用自动监测,应该保证有其他线程在运行,否则自动监测没办法进行
(其他线程如果不存在了,那么Paoding自动退出检测,所以一般只能在Web应用中测试Paoding的自动监测)
如果检测到词典变话,可以从日志/控制台中得到消息提示。