E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
mmseg4j
lucene 中文分词器
mmseg4j
用Chih-Hao Tsai 的MMSeg算法实现的中文分词器,并实现lucene的analyzer和solr的TokenizerFactory以方便在Lucene和Solr中使用。
hbiao68
·
2014-09-07 17:00
Lucene
lucene 中文分词器
mmseg4j
用Chih-Hao Tsai 的MMSeg算法实现的中文分词器,并实现lucene的analyzer和solr的TokenizerFactory以方便在Lucene和Solr中使用。
hbiao68
·
2014-09-07 17:00
Lucene
lucene 中文分词器
mmseg4j
用Chih-Hao Tsai 的MMSeg算法实现的中文分词器,并实现lucene的analyzer和solr的TokenizerFactory以方便在Lucene和Solr中使用。
hbiao68
·
2014-09-07 17:00
Lucene
lucene 中文分词器
mmseg4j
用Chih-Hao Tsai 的MMSeg算法实现的中文分词器,并实现lucene的analyzer和solr的TokenizerFactory以方便在Lucene和Solr中使用。
hbiao68
·
2014-09-07 17:00
Lucene
全文检索引擎Solr系列——整合中文分词组件IKAnalyzer
,支持用户词典扩展定义,支持细粒度和智能切分,比如:张三说的确实在理 智能分词的结果是:张三|说的|确实|在理 最细粒度分词结果:张三|三|说的|的确|的|确实|实在|在理 整合IKAnalyzer比
mmseg4j
刘志军
·
2014-09-03 00:00
Solr
教程
基础技术
Java开源项目cws_evaluation:中文分词器分词效果评估
cws_evaluation是通过对前文《word分词器、ansj分词器、
mmseg4j
分词器、ik-analyzer分词器分词效果评估》中写的评估程序进行重构改进后形成的。
杨尚川
·
2014-08-30 23:00
java
开源
中文分词
效果评估
cws_evaluation
mmseg4j
下载地址
http://code.google.com/p/
mmseg4j
/downloads/detail?
chushiyang1989
·
2014-08-14 16:08
mmseg4j
当前几个主要的Lucene中文分词器的比较
基本介绍: paoding :Lucene中文分词“庖丁解牛” Paoding Analysisimdict :imdict智能词典所采用的智能中文分词程序
mmseg4j
: 用 Chih-Hao Tsai
崇尚昆仲
·
2014-07-25 19:00
Lucene
solr4.9+
mmseg4j
1.solr4.9
mmseg4j
-solr-2.2.0 tomcat6 jdk1.7 2.步骤:
lu_tan
·
2014-07-18 09:00
Solr
中文分词(
mmseg4j
)
import java.io.IOException; import java.io.Reader; import java.io.StringReader; import com.chenlb.
mmseg4j
.ComplexSeg
日拱一卒
·
2014-07-12 16:00
中文分词
Solr4.8.1+
mmseg4j
1.9.1 集成
大家好,我是一网菜鸟网(http://www.sklll.com)站长,网站目前正在维护中,今天在这里做一下Solr4.x和mmseg41.9.1集成的详细文章说明,包括
mmseg4j
1.9.1
HideVirus
·
2014-06-25 16:00
关于中文分词
换用StandardAnalyzer,有34%的提高,比较下使用的KAnalyzer,
mmseg4j
1.9.2-snapshot,standardanalyzer,性能分别在1.7M/s,10M/s,20M
jollyjumper
·
2014-06-21 23:00
索引
性能优化
分词
solr4.4 +
mmseg4j
-1.9.1中文分词
1、solr配置请参考solr4.4.0配置笔记.txt 2、
mmseg4j
-1.9.1下载地址 http://
mmseg4j
.googlecode.com/files/
mmseg4j
-1.9.1
tiankong6622
·
2014-06-18 14:00
Lucene
solr 4.4
solr 中文分词
mmseg4j
使用例子
原文出处:http://blog.chenlb.com/2009/04/solr-chinese-segment-
mmseg4j
-use-demo.html
mmseg4j
第一个版本就可以方便地与solr
qq1013712290
·
2014-06-18 10:00
mmseg4j
当前几个主要的Lucene中文分词器的比较
基本介绍:paoding :Lucene中文分词“庖丁解牛”Paoding Analysisimdict:imdict智能词典所采用的智能中文分词程序
mmseg4j
:用Chih-HaoTsai的MMSeg
haomad
·
2014-05-23 17:56
Google
开发者
版本号
处理器
活跃度
mahout 0.9 + hadoop 1.0.2 实现中文文本聚类
我们需要添加自己的分词工具,这里使用
mmseg4j
,它可支持lucene4.6.1。首先,修改mahout源码中examples目录下的po
doc_peter
·
2014-05-09 13:50
Mahout
&
Maven
word分词器、ansj分词器、
mmseg4j
分词器、ik-analyzer分词器分词效果评估
转自:http://yangshangchuan.iteye.com/blog/2056537(有代码可下载)word分词器、ansj分词器、
mmseg4j
分词器、ik-analyzer分词器分词效果评估博客分类
xinklabi
·
2014-05-04 17:00
word分词器
Java开源项目cws_evaluation:中文分词器分词效果评估
cws_evaluation 是通过对前文《word分词器、ansj分词器、
mmseg4j
分词器、ik-analyzer分词器分词效果评估》中写的评估程序进行重构改进后形成的。
yangshangchuan
·
2014-05-01 02:00
java
开源
中文分词
效果评估
cws_evaluation
Java开源项目cws_evaluation:中文分词器分词效果评估
cws_evaluation 是通过对前文《word分词器、ansj分词器、
mmseg4j
分词器、ik-analyzer分词器分词效果评估》中写的评估程序进行重构改进后形成的。
yangshangchuan
·
2014-05-01 02:00
java
开源
中文分词
cws_evaluation
效果评估
Java开源项目cws_evaluation:中文分词器分词效果评估
cws_evaluation 是通过对前文《word分词器、ansj分词器、
mmseg4j
分词器、ik-analyzer分词器分词效果评估》中写的评估程序进行重构改进后形成的。
yangshangchuan
·
2014-05-01 02:00
java
开源
中文分词
效果评估
cws_evaluation
Java开源项目cws_evaluation:中文分词器分词效果评估
cws_evaluation 是通过对前文《word分词器、ansj分词器、
mmseg4j
分词器、ik-analyzer分词器分词效果评估》中写的评估程序进行重构改进后形成的。
yangshangchuan
·
2014-05-01 02:00
java
开源
中文分词
效果评估
cws_evaluation
word分词器、ansj分词器、
mmseg4j
分词器、ik-analyzer分词器分词效果评估
word分词是一个Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。同时提供了Lucene、Solr、ElasticSearch插件。 word分词器分词效果评估主要评估下面7种分词算法: 正向最大匹配算法:MaximumMatching逆向最大匹配算法:ReverseMa
杨尚川
·
2014-04-29 19:00
word分词
word分词器
中文分词
word分词组件
Java中文分词
word分词库
开源中文分词
当前几个主要的Lucene中文分词器的比较
1.基本介绍:paoding :Lucene中文分词“庖丁解牛”PaodingAnalysisimdict :imdict智能词典所采用的智能中文分词程序
mmseg4j
:用Chih-HaoTsai的
july_2
·
2014-04-29 17:00
word分词器、ansj分词器、
mmseg4j
分词器、ik-analyzer分词器分词效果评估
word分词是一个Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。 能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。 同时提供了Lucene、Solr、ElasticSearch插件。 word分词器分词效果评估主要评估下面7种分词算法: 正向最大匹配算法:MaximumMatchi
yangshangchuan
·
2014-04-29 09:00
word分词器
word分词
中文分词
word分词组件
Java中文分词
开源中文分词
word分词库
word分词器、ansj分词器、
mmseg4j
分词器、ik-analyzer分词器分词效果评估
word分词是一个Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。 能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。 同时提供了Lucene、Solr、ElasticSearch插件。 word分词器分词效果评估主要评估下面7种分词算法: 正向最大匹配算法:MaximumMatchi
yangshangchuan
·
2014-04-29 09:00
word分词器
word分词
中文分词
开源中文分词
Java中文分词
word分词组件
word分词库
word分词器、ansj分词器、
mmseg4j
分词器、ik-analyzer分词器分词效果评估
word分词是一个Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。 能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。 同时提供了Lucene、Solr、ElasticSearch插件。 word分词器分词效果评估主要评估下面7种分词算法: 正向最大匹配算法:MaximumMatchi
yangshangchuan
·
2014-04-29 09:00
word分词
word分词器
中文分词
Java中文分词
开源中文分词
word分词库
word分词组件
word分词器、ansj分词器、
mmseg4j
分词器、ik-analyzer分词器分词效果评估
word分词是一个Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。 能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。 同时提供了Lucene、Solr、ElasticSearch插件。 word分词器分词效果评估主要评估下面7种分词算法: 正向最大匹配算法:MaximumMatchi
yangshangchuan
·
2014-04-29 09:00
word分词
word分词器
中文分词
word分词组件
word分词库
开源中文分词
Java中文分词
Solr4.7.0中整合中文分词
mmseg4j
-1.9.1
几年过去了,Lucene和Solr都发展到了4.7.x版本,重拾中文分词,发现庖丁中文分词不再是首选,
mmseg4j
是更
Josh_Persistence
·
2014-04-20 02:00
exception
中文分词
solr4.x
mmseg4j
庖丁分词
Nutch+solr+
mmseg4j
集成
第一章安装配置solr4.2#下载solr4.2.0版本[root@nutchnutch2]#wgethttp://archive.apache.org/dist/lucene/solr/4.2.0/solr-4.2.0.tgz#解压solr4.2.0文件[root@nutchnutch2]#tar-xzvfsolr-4.2.0.tgz#把nutch/conf/schema.xml复制到solr/
hiqj
·
2014-04-18 17:00
配置solr的schema.xml加入中文分词器
在mmseg文件中, 打开readme.txt, 可以看到: [color=blue]5、在 com.chenlb.
mmseg4j
.
alleni123
·
2014-04-16 21:00
Solr
solr中文分词(
mmseg4j
) 编辑
1、从http://code.google.com/p/
mmseg4j
/ 下载
mmseg4j
2、在$SOLR_HOME下建立lib和dic两个目录,讲
mmseg4j
-all-1.8.4.jar拷贝到
phantome
·
2014-04-15 13:00
Solr4.3整合到Tomcat中并添加
MMSeg4j
中文分词器
Solr4.3整合到Tomcat中并添加
MMSeg4j
中文分词器1、新建一个文件夹命名为Solr并在里面建两个文件夹分别命名为home和server。
Big-Data
·
2014-04-10 15:00
mmseg4j
分词器导致的java.lang.AbstractMethodError
java.lang.AbstractMethodError: org.apache.lucene.analysis.Analyzer.tokenStream(Ljava/lang/String;Ljava/io/Reader;)Lorg/apache/lucene/analysis/TokenStream; at org.apache.lucene.analysis.Analyzer.reus
alleni123
·
2014-04-07 17:00
jar
Lucene
mmseg4j
-1.9 solr4 bug 处理
目前中文分词
mmseg4j
在solr4下是不能正常工作的。解决方法可简单了,只是solr4接口有点变化。中文分词mmseg4插件的作者没及时的跟上"solr4接口"变化。
token01
·
2014-04-01 10:00
mmseg4j
1.9.1 + Solr 4.7.0 报错
TokenStreamcontractviolation:reset()/close()callmissing,reset()calledmultipletimes,orsubclassdoesnotcallsuper.reset().PleaseseeJavadocsofTokenStreamclassformoreinformationaboutthecorrectconsumingworkf
wonder4
·
2014-03-14 09:00
solr学习-分词
solr的环境搭建:solr4.3.1+tomcat7.0.29+jdk1.7+
mmseg4j
-1.9.1.zip 通过查找
mmseg4j
的官
jeff_han
·
2014-03-04 14:00
Solr
solr在tomcat下集成mmseg
mmseg最新版本为1.9.1 http://code.google.com/p/
mmseg4j
/,最高仅支持solr4.5.1所以这里solr用的是4.5.1版本(已经出到4.6.0版本了)http
bird_wang
·
2014-02-13 14:30
tomcat
Solr
mmseg
solr在tomcat下集成mmseg
mmseg最新版本为1.9.1http://code.google.com/p/
mmseg4j
/,最高仅支持solr4.5.1所以这里solr用的是4.5.1版本(已经出到4.6.0版本了)http:/
bird_wang
·
2014-02-13 14:30
tomcat
solr
mmseg
IKAnalyzer,
mmseg4j
7、 往服务中添加索引 String url = "http://localhost:8080/solr-4.4.0"; SolrServer server = new HttpSolrServer(url); &n
linshow26
·
2014-01-19 21:00
IKAnalyzer
[置顶] 【Apache Solr系列】使用IKAnalyzer中文分词以及自定义分词字典
之前写的ApacheSolr只介绍了简单的搭建以及导入数据等功能,最近由于项目要求,添加索引分词和搜索分词功能;分词的项目有包括好几个:smartcn、ictclas4j、IK、jeasy、庖丁、
mmseg4j
WeiJonathan
·
2014-01-16 15:00
Solr
IKAnalyzer
中文分词器
solr4.4.0+
mmseg4j
中文分词
首先安装
mmseg4j
官网:https://code.google.com/p/
mmseg4j
/下载地址:http://code.google.com/p/
mmseg4j
/downloads/listwget
huang798807481
·
2013-12-17 16:00
如何在基于Lucene的中文分词器中添加自定义词典(如Paoding、
mmseg4j
、IK Analyzer)
阅读更多如何在基于Lucene的中文分词器中添加自定义词典(如Paoding、
mmseg4j
、IKAnalyzer)2013-07-0821:54:29|分类:计算机|字号订阅1.使用Paoding自定义词典参考文章
leiyongping88
·
2013-09-02 12:00
如何在基于Lucene的中文分词器中添加自定义词典(如Paoding、
mmseg4j
、IK Analyzer)
如何在基于Lucene的中文分词器中添加自定义词典(如Paoding、
mmseg4j
、IK Analyzer) 2013-07-08 21:54:29|  
leiyongping88
·
2013-09-02 12:00
Ik Analyzer
solr中文分词(
mmseg4j
) 编辑
1、从http://code.google.com/p/
mmseg4j
/下载
mmseg4j
2、在$SOLR_HOME下建立lib和dic两个目录,讲
mmseg4j
-all-1.8.4.jar拷贝到lib
jackjobs
·
2013-07-23 16:00
mmseg4j
solr中文分词(
mmseg4j
) 编辑
1、从http://code.google.com/p/
mmseg4j
/下载
mmseg4j
2、在$SOLR_HOME下建立lib和dic两个目录,讲
mmseg4j
-all-1.8.4.jar拷贝到lib
jackjobs
·
2013-07-23 16:00
mmseg4j
solr中文分词(
mmseg4j
) 编辑
1、从http://code.google.com/p/
mmseg4j
/下载
mmseg4j
2、在$SOLR_HOME下建立lib和dic两个目录,讲
mmseg4j
-all-1.8.4.jar拷贝到lib
jackjobs
·
2013-07-23 16:00
mmseg4j
solr中文分词(
mmseg4j
)
1、从http://code.google.com/p/
mmseg4j
/ 下载
mmseg4j
2、在$SOLR_HOME下建立lib和dic两个目录,讲
mmseg4j
-all-1.8.4.jar拷贝到
jackjobs
·
2013-07-23 16:00
mmseg4j
solr中文分词(
mmseg4j
)
1、从http://code.google.com/p/
mmseg4j
/ 下载
mmseg4j
2、在$SOLR_HOME下建立lib和dic两个目录,讲
mmseg4j
-all-1.8.4.jar拷贝到
jackjobs
·
2013-07-23 16:00
mmseg4j
solr中文分词(
mmseg4j
)
1、从http://code.google.com/p/
mmseg4j
/ 下载
mmseg4j
2、在$SOLR_HOME下建立lib和dic两个目录,讲
mmseg4j
-all-1.8.4.jar拷贝到
jackjobs
·
2013-07-23 16:00
mmseg4j
solr中文分词(
mmseg4j
)
1、从http://code.google.com/p/
mmseg4j
/ 下载
mmseg4j
2、在$SOLR_HOME下建立lib和dic两个目录,讲
mmseg4j
-all-1.8.4.jar拷贝到
jackjobs
·
2013-07-23 16:00
mmseg4j
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他