E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
mmseg4j
MMSEG中文分词
MMSEG分词算法设计实现4.
mmseg4j
与solr集成5.参阅文档 1.分词必要性什么是分词分词是指
lzzy_alex
·
2015-10-06 18:00
Slor5.x与
mmseg4j
的集成【使用solr自带的Jetty Server】
一、
mmseg4j
对Solr5.x的支持必须使用
mmseg4j
-2.0以上的版本,本例中我使用的是
mmseg4j
solr2.3.0,使用的solr是截止目前为止的solr5.3.1,可下载附件,注意Solr
Josh_Persistence
·
2015-10-04 11:00
Solr
mmseg4j
5.x
hibernate search -- 中文词法分析
hibernatesearch底层使用Lucene,所以Lucene可以使用的中文分词,hibernatesearch都可以用来支持中文词法分析,比较常用的词法分析器包括paoding,IKAnalyzer,
mmseg4j
开心的D哥
·
2015-09-28 15:42
Java
Java
Web
lucene整合中文分词器
mmseg4j
和高亮highlighter
最近在研究lucene,其实很简单,可以整合中文分词器
mmseg4j
时,总是会报一些异常,这主要是版本兼容问题,在此做一个记录环境:lucene:4.3.1
mmseg4j
:1.9.1主要jar包,如下图
grhlove123
·
2015-09-17 16:00
IK,ansj,
mmseg4j
分词性能比较
http://www.chepoo.com/ik-ansj-
mmseg4j
-segmentation-performance-comparison.html
nysyxxg
·
2015-08-05 17:00
Solr之SolrCloud配置
mmseg4j
同义词
前提,已经安装配置好Tomcat与Solr,并且配置好
mmseg4j
中文分词。
tianwei7518
·
2015-07-02 22:00
Solr
Lucene
全文检索
Solr之中文分词
针对Solr的分词器比较多,其中最常用的的两个是
mmseg4j
和ik-analyzer,使用都很方便,关于分成器的比较参考:与Lucene4.10配合的中文分词比较,ik-analyzer最新版本IKAnalyzer2012FF_u1
tianwei7518
·
2015-07-02 21:00
Lucene
Solr
全文检索
Solr5.2.1搜索服务部署——检索多字段
目录tomcat安装solr安装整合
mmseg4j
2.3.0关联mysql增量索引检索多字段article表中有title,content,username字段,通过搜索词检索,只要这3个字段中包含搜索词就匹配出来
v_小宝
·
2015-06-26 16:00
Solr
Solr5.2.1搜索服务部署——检索多字段
目录tomcat安装solr安装整合
mmseg4j
2.3.0关联mysql增量索引检索多字段article表中有title,content,username字段,通过搜索词检索,只要这3个字段中包含搜索词就匹配出来
v_小宝
·
2015-06-26 16:00
Solr
Solr5.2.1搜索服务部署——增量索引
目录tomcat安装solr安装整合
mmseg4j
2.3.0关联mysql增量索引检索多字段Solr会记录最后一次做增量索引的时间(dih.last_index_time),类型为datetime在全量索引
v_小宝
·
2015-06-26 16:00
Solr
Solr5.2.1搜索服务部署——增量索引
目录tomcat安装solr安装整合
mmseg4j
2.3.0关联mysql增量索引检索多字段Solr会记录最后一次做增量索引的时间(dih.last_index_time),类型为datetime在全量索引
v_小宝
·
2015-06-26 16:00
Solr
Solr5.2.1搜索服务部署——关联mysql
目录tomcat安装solr安装整合
mmseg4j
2.3.0关联mysql增量索引检索多字段1.软件版本Solr5.2.1MySQL5.1.532.配置过程 2.1关联数据库 # vim /usr/
v_小宝
·
2015-06-26 16:00
mysql
Solr
Solr5.2.1搜索服务部署——关联mysql
目录tomcat安装solr安装整合
mmseg4j
2.3.0关联mysql增量索引检索多字段1.软件版本Solr5.2.1MySQL5.1.532.配置过程 2.1关联数据库 # vim /usr/
v_小宝
·
2015-06-26 16:00
mysql
Solr
Solr5.2.1搜索服务部署——整合
mmseg4j
2.3.0
目录tomcat安装solr安装整合
mmseg4j
2.3.0关联mysql增量索引检索多字段1.软件版本Solr5.2.1
mmseg4j
2.3.02.
mmseg4j
配置 下载地址http://pan.baidu.com
v_小宝
·
2015-06-26 15:00
Solr5.2.1搜索服务部署——整合
mmseg4j
2.3.0
目录tomcat安装solr安装整合
mmseg4j
2.3.0关联mysql增量索引检索多字段1.软件版本Solr5.2.1
mmseg4j
2.3.02.
mmseg4j
配置 下载地址http://pan.baidu.com
v_小宝
·
2015-06-26 15:00
Solr5.2.1搜索服务部署——solr安装
目录tomcat安装solr安装整合
mmseg4j
2.3.0关联mysql增量索引检索多字段1.软件版本Solr5.2.12.安装Solr# wget http://apache.fayea.com/lucene
v_小宝
·
2015-06-26 15:00
Solr
Solr5.2.1搜索服务部署——solr安装
目录tomcat安装solr安装整合
mmseg4j
2.3.0关联mysql增量索引检索多字段1.软件版本Solr5.2.12.安装Solr# wget http://apache.fayea.com/lucene
v_小宝
·
2015-06-26 15:00
Solr
Solr5.2.1搜索服务部署——tomcat安装
目录tomcat安装solr安装整合
mmseg4j
2.3.0关联mysql增量索引检索多字段1.软件版本Tomcat8.0.232.安装Tomcat 2.1 卸载旧版java 检查是否已安装
v_小宝
·
2015-06-26 15:00
tomcat
Solr
Solr5.2.1搜索服务部署——tomcat安装
目录tomcat安装solr安装整合
mmseg4j
2.3.0关联mysql增量索引检索多字段1.软件版本Tomcat8.0.232.安装Tomcat 2.1 卸载旧版java 检查是否已安装
v_小宝
·
2015-06-26 15:00
tomcat
Solr
Lucene简单搜索引擎模拟
mmseg4j
:中文分词htmlparser:html解析mavenpom: 5.2.1 org.apache.lucene lucene-core ${lucene.version} org.apache.lucene
tianwei7518
·
2015-06-23 16:00
Lucene
全文检索
与Lucene 4.10配合的中文分词比较
mmseg4j
:最新版已从 https://code.google
tianwei7518
·
2015-06-23 16:00
Lucene
全文检索
Lucene中文分词
mmseg4j
mmseg4j
用Chih-HaoTsai的 MMSeg算法实现的中文分词器,并实现lucene的analyzer和solr的TokenizerFactory以方便在Lucene和Solr中使用。
tianwei7518
·
2015-06-23 16:00
Lucene
全文检索
跟益达学Solr5之使用
MMSeg4J
分词器
要想在Sor中使用
MMSeg4J
分词器,首先你需要自定义一个TokenizerFactory实现类,虽然直接配置Analyzer类也可以,但那样无法配置Analyzer构造函数的参数,不够灵活,
lxwt909
·
2015-06-22 17:00
Solr
mmseg4j
跟益达学Solr5之使用
MMSeg4J
分词器
要想在Sor中使用
MMSeg4J
分词器,首先你需要自定义一个TokenizerFactory实现类,虽然直接配置Analyzer类也可以,但那样无法配置Analyzer构造函数的参数,不够灵活,
lxwt909
·
2015-06-22 17:00
Solr
mmseg4j
文本分词方法
废话不多说,我就直接上干货吧,从过去到现在所知道的分词方法有以下几种:1、
mmseg4j
2、词频分组(有序文本足够)3、jieba分词下面细说一下几种分词方法,第一种,
mmseg4j
,我使用这种方法是以
成伟
·
2015-05-26 18:46
其它技术文章
cws_evaluation v1.1 发布,中文分词器分词效果评估对比
分别是:word分词器、ansj分词器、
mmseg4j
分词器、ik-analyzer分词器、jcseg分词器、fudannlp分词器、smartcn分词器、jieba分词器、stanford分词器。
yangshangchuan
·
2015-05-12 10:00
word分词器
中文分词器
cws_evaluation
分词效果评估
分词效果对比
cws_evaluation v1.1 发布,中文分词器分词效果评估对比
分别是:word分词器、ansj分词器、
mmseg4j
分词器、ik-analyzer分词器、jcseg分词器、fudannlp分词器、smartcn分词器、jieba分词器、stanford分词器。
yangshangchuan
·
2015-05-12 10:00
word分词器
中文分词器
cws_evaluation
分词效果评估
分词效果对比
cws_evaluation v1.1 发布,中文分词器分词效果评估对比
分别是:word分词器、ansj分词器、
mmseg4j
分词器、ik-analyzer分词器、jcseg分词器、fudannlp分词器、smartcn分词器、jieba分词器、stanford分词器。
yangshangchuan
·
2015-05-12 10:00
word分词器
中文分词器
cws_evaluation
分词效果对比
分词效果评估
cws_evaluation v1.1 发布,中文分词器分词效果评估对比
分别是:word分词器、ansj分词器、
mmseg4j
分词器、ik-analyzer分词器、jcseg分词器、fudannlp分词器、smartcn分词器、jieba分词器、stanford分词器。
yangshangchuan
·
2015-05-12 10:00
word分词器
中文分词器
分词效果对比
cws_evaluation
分词效果评估
cws_evaluation v1.1 发布,中文分词器分词效果评估对比
分别是:word分词器、ansj分词器、
mmseg4j
分词器、ik-analyzer分词器、jcseg分词器、fudannlp分词器、smartcn分词器、jieba分词器、stanford分词器。
杨尚川
·
2015-05-12 10:00
word分词器
中文分词器
分词效果评估
分词效果对比
cws_evaluation
Solr分词器大补贴:mlcsseg
1.设计Java系的中文分词挺多了,ik,paoding,
mmseg4j
,ictclas4j,ansj等等,目前选取实现的是ik和ansj。将分词器扩展到solr易用模式
meng_philip
·
2015-05-06 16:11
solr
分词器
solr
Solr分词器大补贴:mlcsseg
1.设计 Java系的中文分词挺多了,ik,paoding,
mmseg4j
,ictclas4j,ansj等等,目前选取实现的是ik和ansj。将分词器扩展
meng_philip
·
2015-05-06 16:11
Solr
分词器
Lucene5学习之使用
MMSeg4j
分词器
MMSeg4j
是一款中文分词器,详细介绍如下: 1、
mmseg4j
用Chih-HaoTsai的MMSeg算法(http://technology.chtsai.org/mmseg/)实现的中文分词器
lxwt909
·
2015-04-30 15:00
Lucene
mmseg4j
Lucene5学习之使用
MMSeg4j
分词器
MMSeg4j
是一款中文分词器,详细介绍如下: 1、
mmseg4j
用Chih-HaoTsai的MMSeg算法(http://technology.chtsai.org/mmseg/)实现的中文分词器
lxwt909
·
2015-04-30 15:00
Lucene
mmseg4j
Solr 3.5 + Tomcat7 +
mmseg4j
配置并运行
机器上已安装:Tomcat7 jdk1.7访问http://www.apache.org/dyn/closer.cgi/lucene/solr,在这个网址里选择一个路径,下载solr3.5的版本1、将将解压后的solr中的lucene\apache-solr-3.5.0\example\solr目录下的文件拷贝到要作为服务器的位置,我是放在这个路径下的:D:\luceneData\solr\ho
Victor_Cindy1
·
2015-04-14 14:00
solr配置笔记
研究了好多天的solr终于配置与中文分词软件
mmseg4j
配置成功了,其中碰见了几个坑,坑不大,也比较容易解决,自己还是忽略了。
_lsliang
·
2015-04-07 18:00
Solr
solr服务器配置与tomcat整合
最近找了视频学习lucene和solr,记一下怎么配置solrJDK使用的为1.7,如果用1.6貌似会提示版本低先下载solr3.5和
mmseg4j
1.8.5的压缩包,下载链接在底部解压solr3.5,
风吹屁屁凉
·
2015-03-26 21:00
mmseg4j
-solr 集成到 Solr4.10.4
1:项目地址: https://github.com/chenlb/
mmseg4j
-solr https://github.com/chenlb/
mmseg4j
-solr/wiki
rayoo
·
2015-03-05 18:00
mmseg4j
Lucene4.10使用教程(五):lucene的分词器
所有要在项目中Lucene,需要添加另外的中分词器,比如IK、
mmseg4j
、paoding等。关于中文分词器的比较和适用情况,可以Google,文章很多,不是我们这里讨论的重点。
codemosi
·
2015-02-16 15:12
lucene
Solr 在
mmseg4j
中使用中文停止词(的、地、得)
1. 从附件中下载中文停止词,如果有需要,你也可以下载英文停止词,操作步骤一样。 2. 可以在Tomcat的Solr 中的某个位置创建一个文件,比如叫stopwords.txt,此处我直接将stopwords.txt放在core目录下,即和schema.xml在同一个目录中。 3.将上面下载的中英文停止词加入到stopwords.txt中 4.
Josh_Persistence
·
2015-02-13 20:00
solr配置中文分词器
可能需要连接上篇《Solr与tomcat整合》1.从http://code.google.com/p/
mmseg4j
/ 下载
mmseg4j
2.从下载的文件中把
mmseg4j
-all-1.8.4.jar
purisuit_knowledge
·
2015-01-28 17:00
tomcat
Solr
solr中
mmseg4j
基本配置
参考网址:http://blog.csdn.net/hidevirus/article/details/34440175
cdh1213
·
2015-01-19 14:00
Lucene4.10使用教程(五):lucene的分词器
所有要在项目中Lucene,需要添加另外的中分词器,比如IK、
mmseg4j
、paoding等。关于中文分词器的比较和适用情况,可以Google,文章很多,不是我们这里讨论的重点。
seven_zhao
·
2015-01-14 11:00
solr 中文分词
mmseg4j
使用例子
solr中文分词
mmseg4j
使用例子原文出处:http://blog.chenlb.com/2009/04/solr-chinese-segment-
mmseg4j
-use-demo.html
mmseg4j
nysyxxg
·
2015-01-08 22:00
Solr整合中文分词
mmseg4j
Solr整合中文分词
mmseg4j
1.Summary本次使用的是Solr-4.7.0整合
mmseg4j
-1.9.1,下载
mmseg4j
-1.9.1.zip,把dist下面的jar文件拷贝到${solr-
p2p2500
·
2014-12-30 18:00
mmseg4j
lucene常用分词器对比
1.基本介绍:paoding :Lucene中文分词“庖丁解牛”PaodingAnalysisimdict :imdict智能词典所采用的智能中文分词程序
mmseg4j
:用Chih-HaoTsai的
明舞
·
2014-12-28 09:00
java分词器大全
git.oschina.net/lionsoul/jcsegIKAnalyzerhttp://www.oschina.net/p/ikanalyzer庖丁中文分词库http://www.oschina.net/p/paoding
mmseg4j
earbao
·
2014-12-12 10:00
solr集成
mmseg4j
分词
solr集成
mmseg4j
分词
mmseg4j
https://code.google.com/p/
mmseg4j
/ https://github.com/chenlb/
mmseg4j
-solr
·
2014-11-20 15:00
mmseg4j
MMSeg4J
改造,使之支持中英文数字连词
packagecom.qfang.util; importjava.io.BufferedReader; importjava.io.IOException; importjava.io.PushbackReader; importjava.io.Reader; importjava.util.LinkedList; importjava.util.Queue; importcom.chenl
Yoara
·
2014-11-20 11:00
Lucene
分词
mmseg4j
中英文
mmseg4j
分词
mmseg4j
分词,所需jar:
mmseg4j
-analysis-1.9.1.jar,
mmseg4j
-core-1.9.1.jar。
itace
·
2014-10-08 10:00
mmseg4j
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他