E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
mmseg4j
当前几个主要的Lucene中文分词器的比较
基本介绍: paoding :Lucene中文分词“庖丁解牛” Paoding Analysisimdict :imdict智能词典所采用的智能中文分词程序
mmseg4j
 
JLK
·
2010-11-16 16:00
算法
SVN
Google
Lucene
全文检索
当前几个主要的Lucene中文分词器的比较
基本介绍: paoding :Lucene中文分词“庖丁解牛” Paoding Analysisimdict :imdict智能词典所采用的智能中文分词程序
mmseg4j
 
JLK
·
2010-11-16 16:00
算法
SVN
Google
Lucene
全文检索
mmseg4j
多分词模式与 paoding 分词效果对比
mmseg4j
1.6支持最多分词,应网友的要求:分词效果与paoding对比下。观察了paoding部分分词结果,现总结下。
lengyuhong
·
2010-11-07 16:00
算法
音乐
当前几个主要的Lucene中文分词器的比较
1.基本介绍:paoding :Lucene中文分词“庖丁解牛”PaodingAnalysisimdict :imdict智能词典所采用的智能中文分词程序
mmseg4j
:用Chih-HaoTsai的
lengyuhong
·
2010-11-07 16:00
java
算法
SVN
Google
Lucene
全文检索
当前几个主要的Lucene中文分词器的比较
1.基本介绍:paoding:Lucene中文分词“庖丁解牛”PaodingAnalysisimdict:imdict智能词典所采用的智能中文分词程序
mmseg4j
:用Chih-HaoTsai的MMSeg
suwei19870312
·
2010-09-30 17:00
java
算法
SVN
Google
Lucene
全文检索
在lucene中加入mmseg分词器错误
mmseg4j
-1.8.2Lucene-3.0.2出现如下错误: Exceptioninthread"main"java.lang.AbstractMethodError:org.apache.lucene.analysis.TokenStream.incrementToken
ArthurBryant
·
2010-09-14 17:00
java
thread
exception
Lucene
当前几个主要的Lucene中文分词器的比较
/1/2/20/2009/08/06/46531.html基本介绍:paoding:Lucene中文分词庖丁解牛PaodingAnalysisimdict:imdict智能词典所采用的智能中文分词程序
mmseg4j
jiushuai
·
2010-08-13 11:00
mmseg4j
多分词模式与 paoding 分词效果对比
原文出处:http://blog.chenlb.com/2009/04/
mmseg4j
-max-word-segment-compare-with-paoding-in-effect.html
mmseg4j
1.6
jiushuai
·
2010-08-13 11:00
当前几个主要的Lucene中文分词器的比较
1.基本介绍:paoding:Lucene中文分词“庖丁解牛”PaodingAnalysisimdict:imdict智能词典所采用的智能中文分词程序
mmseg4j
:用Chih-HaoTsai的MMSeg
pangliyewanmei
·
2010-07-13 14:00
java
算法
SVN
Google
Lucene
全文检索
Lucene +
mmseg4j
中文分词记要
http://javadoc.org.cn/home.php?mod=space&uid=2&do=blog&id=19 package test; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org
xypcn
·
2010-06-20 14:00
apache
PHP
JUnit
Google
Lucene
mmseg4j
中文分词器的一些简介整理
这些自带的分词器对中文支持多不好,我觉得比较好的中文分词器是
mmseg4j
。m
lovnet
·
2010-05-14 17:00
lucene
Solr
rmmseg
算法
音乐
mmseg4j
中文分词器的一些简介整理
这些自带的分词器对中文支持多不好,我觉得比较好的中文分词器是
mmseg4j
。m
lovnet
·
2010-05-14 17:00
lucene
Solr
rmmseg
算法
音乐
mmseg4j
中文分词器的一些简介整理
这些自带的分词器对中文支持多不好,我觉得比较好的中文分词器是
mmseg4j
。mmseg
lovnet
·
2010-05-14 17:00
算法
Solr
Lucene
音乐
rmmseg
mmseg4j
中文分词器的一些简介整理
在 lucene 中,我们是使用 IndexWriter 调用 Analyzer 将文章切成以词为单位的 Stream,然后生成索引的。lucene 内建的分词器很多,比如:按空白字符分词的WhitespaceAnalyzer,添加了stopword过滤的StopAnalyzer,以及最常用的是StandardAnalyzer。这些自带的分词器对中文支持多不好,我觉得比较好的中文分词器是 mmse
lovnet
·
2010-05-14 17:00
算法
Lucene
Solr
音乐
rmmseg
mmseg4j
中文分词器的一些简介整理
这些自带的分词器对中文支持多不好,我觉得比较好的中文分词器是
mmseg4j
。m
lovnet
·
2010-05-14 17:00
lucene
Solr
rmmseg
算法
音乐
mmseg4j
中文分词器的一些简介整理
这些自带的分词器对中文支持多不好,我觉得比较好的中文分词器是
mmseg4j
。m
lovnet
·
2010-05-14 17:00
lucene
Solr
rmmseg
算法
音乐
solr全文搜索+
mmseg4j
中文分词[配置]
这二天一直在研究全文搜索,想放到自己的一个网站上做应用;再经过对比之后,选择了同为JAVA的基于lucene的solr+
mmseg4j
中文分词器; 首先:上网下载一个最新的Solr:http
xiaolin0199
·
2010-04-13 17:00
apache
应用服务器
django
Lucene
Solr
二、SOLR搭建企业搜索平台【中文分词】
这篇文章,主要说的是怎么在solr中加入中文分词: 1、下载分词器:http://code.google.com/p/
mmseg4j
/ 2、将解压后的
mmseg4j
-1.8.2目录下的
mmseg4j
-all
dzq2008
·
2010-04-12 09:00
tomcat
搜索引擎
企业应用
Lucene
Solr
中文分词
mmseg4j
-1.8
阅读更多原文出处:http://blog.chenlb.com/2009/10/chinese-segment-
mmseg4j
-1_8-release.html想发布新版的
mmseg4j
到现在已经有二个多月了
dzq2008
·
2010-04-09 15:00
Solr
lucene
rmmseg
Ant
Google
中文分词
mmseg4j
-1.8
原文出处:http://blog.chenlb.com/2009/10/chinese-segment-
mmseg4j
-1_8-release.html 想发布新版的
mmseg4j
到现在已经有二个多月了
dzq2008
·
2010-04-09 15:00
ant
Google
Solr
Lucene
rmmseg
中文分词
mmseg4j
-1.8
阅读更多原文出处:http://blog.chenlb.com/2009/10/chinese-segment-
mmseg4j
-1_8-release.html想发布新版的
mmseg4j
到现在已经有二个多月了
dzq2008
·
2010-04-09 15:00
Solr
lucene
rmmseg
Ant
Google
solr中集成中文分词
mmseg4j
mmseg4j
第一个版本就可以方便地与solr集成,在 googlecode 上面有简单的说明,第一版的发布博客也有简单的使用说明:中文分词
mmseg4j
。
Java2King
·
2010-03-26 16:00
tomcat
Google
Solr
Class
文档
encoding
中文分词
mmseg4j
在 lucene 中的使用示例
mmseg4j
发布也有一段时间了,前些日子忙着发布新的版本,修正 bug 之类的。使用示例一直拖到现在,其实 svn 上的 test 有使用 lucene 例子。
heilwolf
·
2010-03-23 16:00
apache
SVN
JUnit
Lucene
UP
当前几个主要的Lucene中文分词器的比较
基本介绍: paoding :Lucene中文分词“庖丁解牛” Paoding Analysis imdict :imdict智能词典所采用的智能中文分词程序
mmseg4j
: 用 Chih-Hao
zxl263com
·
2009-11-30 09:00
算法
SVN
Google
Lucene
全文检索
基于Lucene的最流行的分词法
Lucene的最流行的分词法2009-11-0516:141.基本介绍:paoding:Lucene中文分词“庖丁解牛”PaodingAnalysisimdict:imdict智能词典所采用的智能中文分词程序
mmseg4j
sealbird
·
2009-11-27 13:00
当前几个主要的Lucene中文分词器的比较
基本介绍: paoding :Lucene中文分词“庖丁解牛” Paoding Analysisimdict :imdict智能词典所采用的智能中文分词程序
mmseg4j
: 用 Chih-Hao Tsai
unixboy
·
2009-10-21 21:00
算法
SVN
Google
Lucene
全文检索
当前几个主要的Lucene中文分词器的比较
基本介绍: paoding :Lucene中文分词“庖丁解牛” Paoding Analysisimdict :imdict智能词典所采用的智能中文分词程序
mmseg4j
: 用 Chih-Hao Tsai
unixboy
·
2009-10-21 21:00
算法
SVN
Google
Lucene
全文检索
中文分词
mmseg4j
-1.8 版发布
阅读更多想发布新版的
mmseg4j
到现在已经有二个多月了。主要是因为这段时间忙其它事情了。现Lucene2.9发布了,solr1.4也应该会比较快就要发布了。
chenlb
·
2009-10-19 09:00
lucene
Solr
rmmseg
Java
Servlet
中文分词
mmseg4j
-1.8 版发布
阅读更多想发布新版的
mmseg4j
到现在已经有二个多月了。主要是因为这段时间忙其它事情了。现Lucene2.9发布了,solr1.4也应该会比较快就要发布了。
chenlb
·
2009-10-19 09:00
lucene
Solr
rmmseg
Java
Servlet
中文分词
mmseg4j
-1.8 版发布
想发布新版的
mmseg4j
到现在已经有二个多月了。主要是因为这段时间忙其它事情了。现 Lucene 2.9 发布了,solr 1.4 也应该会比较快就要发布了。
chenlb
·
2009-10-19 09:00
java
servlet
Lucene
Solr
rmmseg
中文分词
mmseg4j
-1.8 版发布
中文分词
mmseg4j
-1.8版发布想发布新版的
mmseg4j
到现在已经有二个多月了。主要是因为这段时间忙其它事情了。现Lucene2.9发布了,solr1.4也应该会比较快就要发布了。
学习笔迹
·
2009-10-19 09:00
当前几个主要的Lucene中文分词器的比较
基本介绍: paoding :Lucene中文分词“庖丁解牛” Paoding Analysisimdict :imdict智能词典所采用的智能中文分词程序
mmseg4j
 
liliang_xf
·
2009-08-19 12:00
算法
SVN
Google
Lucene
全文检索
当前几个主要的Lucene中文分词器的比较
基本介绍: paoding :Lucene中文分词“庖丁解牛” Paoding Analysis imdict :imdict智能词典所采用的智能中文分词程序
mmseg4j
: 用 Chih-Hao
wallimn
·
2009-08-18 12:00
算法
SVN
Google
Lucene
全文检索
当前几个主要的Lucene中文分词器的比较
基本介绍: paoding :Lucene中文分词“庖丁解牛” Paoding Analysis imdict :imdict智能词典所采用的智能中文分词程序
mmseg4j
: 用 Chih-Hao
wallimn
·
2009-08-18 12:00
算法
SVN
Google
Lucene
全文检索
当前几个主要的Lucene中文分词器的比较
基本介绍: paoding :Lucene中文分词“庖丁解牛” Paoding Analysis imdict :imdict智能词典所采用的智能中文分词程序
mmseg4j
: 用 Chih-Hao
wallimn
·
2009-08-18 12:00
算法
SVN
Google
Lucene
全文检索
当前几个主要的Lucene中文分词器的比较
基本介绍: paoding :Lucene中文分词“庖丁解牛” Paoding Analysisimdict :imdict智能词典所采用的智能中文分词程序
mmseg4j
: 用 Chih-Hao
akunamotata
·
2009-08-10 09:00
算法
SVN
Google
Lucene
全文检索
当前几个主要的Lucene中文分词器的比较
www.javaeye.com/news/96371.基本介绍:paoding:Lucene中文分词“庖丁解牛”PaodingAnalysisimdict:imdict智能词典所采用的智能中文分词程序
mmseg4j
生命科学领域的专业信息解决方案!
·
2009-08-09 10:00
讨论
mmseg4j
的现状,与改进。
mmseg4j
项目也受到一些的关注,十分有必要改进。这贴说明下mmseg4的现状和todo功能,同时希望javaeyer们给予些建议或想法。
chenlb
·
2009-08-04 13:00
lucene
算法
Solr
Google
J#
讨论
mmseg4j
的现状,与改进。
mmseg4j
项目也受到一些的关注,十分有必要改进。这贴说明下 mmseg4 的现状和 todo 功能,同时希望 javaeyer 们给予些建议或想法。
chenlb
·
2009-08-04 13:00
算法
Google
Lucene
Solr
J#
solrj的相关网址
show_full=truehttp://mxsfengg.javaeye.com/blog/277913http://blog.chenlb.com/2009/04/solr-chinese-segment-
mmseg4j
-u
ann
·
2009-06-03 11:00
中文分词
mmseg4j
1.7.2 版发布
中文分词
mmseg4j
1.7.2版发布中文分词
mmseg4j
1.7.2版发布,其实两天前就发布了,只是没有写博客而已。
学习笔迹
·
2009-04-27 20:00
中文分词
mmseg4j
1.7.2 版发布
中文分词
mmseg4j
1.7.2 版发布,其实两天前就发布了,只是没有写博客而已。
chenlb
·
2009-04-27 10:00
ant
Google
Solr
Lucene
Gmail
中文分词
mmseg4j
1.7.2 版发布
阅读更多中文分词
mmseg4j
1.7.2版发布,其实两天前就发布了,只是没有写博客而已。与引版本发布的还有1.6.2,两者基本一样,只是词库的数据结构不同,1.7的是键树,1.6的是数组与二分查找。
chenlb
·
2009-04-27 10:00
lucene
Solr
Ant
Gmail
Google
mmseg4j
1.7 beta 版发布
阅读更多
mmseg4j
1.7beta版,主要改进分词速度。最大的变动是词库的数据结构改变了,改为keytree(键树)。
chenlb
·
2009-04-14 11:00
算法
XP
SVN
数据结构
mmseg4j
1.7 beta 版发布
mmseg4j
1.7 beta 版,主要改进分词速度。最大的变动是词库的数据结构改变了,改为key tree(键树)。
chenlb
·
2009-04-14 11:00
数据结构
算法
SVN
XP
mmseg4j
多分词模式与 paoding 分词效果对比
阅读更多
mmseg4j
1.6支持最多分词,应网友的要求:分词效果与paoding对比下。观察了paoding部分分词结果,现总结下。
chenlb
·
2009-04-13 09:00
音乐
算法
mmseg4j
多分词模式与 paoding 分词效果对比
mmseg4j
1.6支持最多分词,应网友的要求:分词效果与 paoding 对比下。观察了 paoding 部分分词结果,现总结下。
chenlb
·
2009-04-13 09:00
算法
音乐
mmseg4j
中文分词 1.6 版发布
阅读更多经过几天的开发与调试,
mmseg4j
1.6版可以发布了。1.6版主要实现与下功能:实现多分词,在complex基础上,把长的词(大于2)拆出多个词。
chenlb
·
2009-04-07 09:00
Solr
Google
XML
Blog
mmseg4j
中文分词 1.6 版发布
经过几天的开发与调试,
mmseg4j
1.6 版可以发布了。1.6 版主要实现与下功能: 实现多分词,在complex基础上,把长的词(大于2)拆出多个词。
chenlb
·
2009-04-07 09:00
xml
Google
Blog
Solr
mmseg4j
中文分词 1.5 版发布
经过几天的开发与调试,新版的
mmseg4j
可以发布了。定为1.5版,是因为变动比较大。
chenlb
·
2009-04-01 14:00
算法
ant
Google
XP
Solr
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他