E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
mmseg4j
全文检索引擎Solr系列——整合中文分词组件IKAnalyzer
,支持用户词典扩展定义,支持细粒度和智能切分,比如:张三说的确实在理 智能分词的结果是:张三|说的|确实|在理 最细粒度分词结果:张三|三|说的|的确|的|确实|实在|在理 整合IKAnalyzer比
mmseg4j
makang110
·
2016-03-18 17:00
Solr
全文检索引擎Solr系列——整合中文分词组件
mmseg4j
能够和Solr集成的中文分词组件有很多,比如:
mmseg4j
、IkAnalyzer、ICTCLAS等等。各有各的特点。这篇文章讲述如何整合S
makang110
·
2016-03-18 17:00
Solr
solr同义词的配置
格式编码为UTF-8schema.xml配置和同义词词库的配置中文,这里采用
mmseg4j
作为分词器,同义词一般只要进行查询的配置就可以了,同义词的配置一般位于分词器的后面下面是中文的同义词和分词的配置
yiduwangkai
·
2016-03-16 14:00
Solr
solr4.7.2+mmseg2.0+pinyinAnalyzer实现拼音、简拼检索
生产环境:solr4.7.2jdk1.6lucene4.7.2
mmseg4j
-core-1.10(https://github.com/chenlb/
mmseg4j
-core.git)mmseg-solr
冰糖葫芦
·
2016-03-15 11:53
Solr
mmseg
拼音检索
pinyinAnalyzer
solr4.7.2+mmseg2.0+pinyinAnalyzer实现拼音、简拼检索
阅读更多生产环境:solr4.7.2jdk1.6lucene4.7.2
mmseg4j
-core-1.10(https://github.com/chenlb/
mmseg4j
-core.git)mmseg-solr
冰糖葫芦
·
2016-03-14 13:00
solr
mmseg
pinyinAnalyzer
拼音检索
中文分词
mmseg4j
+solr 5.3.1配置
阅读更多基础环境:solr5.3.1
mmseg4j
-solr-2.3.0.jar
mmseg4j
-core-1.10.0.jarCentOSrelease6.2(Final)javaversion"1.7.0
yiduwangkai
·
2016-01-10 14:00
solr
mmseg4j
中文分词
中文分词
mmseg4j
+solr 5.3.1配置
基础环境:solr5.3.1
mmseg4j
-solr-2.3.0.jar
mmseg4j
-core-1.10.0.jarCentOSrelease6.2(Final)javaversion"1.7.0_71
yiduwangkai
·
2016-01-10 14:00
Solr
中文分词
mmseg4j
中文分词
mmseg4j
+solr 5.3.1配置
阅读更多基础环境:solr5.3.1
mmseg4j
-solr-2.3.0.jar
mmseg4j
-core-1.10.0.jarCentOSrelease6.2(Final)javaversion"1.7.0
yiduwangkai
·
2016-01-10 14:00
solr
mmseg4j
中文分词
solr5.3.1 添加中文分词之
mmseg4j
1,下载对应jar包,并拷贝到sorl服务器的lib目录底下2,添加配置文件(在Solr的安装部署及简单使用已经有过介绍) 其中 dicPath="d:\solr\my_dic" 是我们指定的词库路径,词库文件都在这个文件夹底下,并且名字要以words开头,以dic做后缀,例如 words_my.dic。作为演示,在词库里添加爱他美 高富帅值得强调的是:这个词典文
Fraud
·
2016-01-06 16:00
solr中文分词器
1、
mmseg4j
把jar包放到webapp\WEB-INF\lib目录下schema加入
yntmdr
·
2015-12-26 19:44
分词
开源 Java 中文分词器 Ansj 作者孙健专访
Ansj是一个开源的Java中文分词工具,基于中科院的ictclas中文分词算法,比其他常用的开源分词工具(如
mmseg4j
)的分词准确率更高。
qq_26562641
·
2015-12-17 13:00
偷梁换柱:
MMSeg4j
借用庖丁解牛的词库
“……他不回答,对柜里说,“温两碗酒,要一碟茴香豆。”便排出九文大钱。他们又故意的高声嚷道,“你一定又偷了人家的东西了!”孔乙己睁大眼睛说,“你怎么这样凭空污人清白……”“什么清白?我前天亲眼见你偷了何家的书,吊着打。”孔乙己便涨红了脸,额上的青筋条条绽出,争辩道,“窃书不能算偷……窃书!……读书人的事,能算偷么?”接连便是难懂的话,什么“君子固穷”,什么“者乎”之类,引得众人都哄笑起来;店内外充
qq_26562641
·
2015-12-16 14:00
Solr 5.x集成中文分词word,
mmseg4j
使用标准分词器,如图:使用word分词器下载word-1.3.jar,注意solr的版本和word分词的版本将文件word-1.3.jar拷贝至文件夹C:\workspace\Tomcat7.0\webapps\solr\WEB-INF\lib\下修改如下文件C:\workspace\solr_home\solr\mysolr\conf\schema.xml 在schema节点下添加如下节点
refactor
·
2015-12-15 22:00
常用中文分词器
分词器:1、word分词器2、ansj分词器3、
mmseg4j
分词器4、ik-analyzer分词器5、jcseg分词器6、fudannlp分词器7、smartcn分词器8、jieba分词器9、stanford
itace
·
2015-12-11 17:00
与Lucene 4.10配合的中文分词比较
mmseg4j
:最新版已从https://code.googl
duanfei
·
2015-12-05 10:00
分词
与Lucene 4.10配合的中文分词比较
mmseg4j
:最新版已从https://code.googl
duanfei
·
2015-12-05 10:00
分词
与Lucene 4.10配合的中文分词比较
mmseg4j
:最新版已从 https://code.google
duanfei
·
2015-12-05 10:00
分词
lucene版本升级到4.6.0以上之后使用
mmseg4j
分词器遇到的问题
使用
mmseg4j
1.9.1使用的是 lucene4.3 没问题。
m635674608
·
2015-11-27 21:00
solr解决访问安全
Tomcat7,solr3.6,mmseg1.81:环境的搭建1:解压tomcat,solr,
mmseg4j
2:复制dist文件夹下apache-solr.war到tomcat的webapp文件夹下,修改文件名为
fengyong7723131
·
2015-11-27 11:00
Solr企业搜索引擎搭建
一、SOLR搭建企业搜索平台运行环境:运行容器:Tomcat6.0.20Solr版本:apache-solr-1.4.0分词器:
mmseg4j
-1.6.2词库:sogou-dic准备工作:下载tomcat6.0.20
dm_ml
·
2015-11-24 11:00
mmseg4j
中文分词 for .net版本
1、
mmseg4j
用 Chih-Hao Tsai 的 MMSeg 算法(http://technology.chtsai.org/mmseg/ )实现的中文分词器,并实现 lucene 的
·
2015-11-13 20:40
mmseg4j
Solr 3.5 + Tomcat7 +
mmseg4j
+ 搜狗词库 -配置并运行
机器上已安装 : Tomcat 7 jdk1.7 mysql 5.0 访问 http://www.apache.org/dyn/closer.cgi/lucene/solr , 在这个网址里选择一个路径 , 下载 solr 3.5 的版本 solr3.5 在本机解压缩以后 , 把 apache-solr-3.5.0
·
2015-11-13 19:58
tomcat7
Solr DIH以Mysql为数据源批量创建索引
演示使用solr管理后台,以mysql为数据源,批量建索引的方法 测试于:Solr 4.5.1,
mmseg4j
1.9.1, Jdk 1.6.0_45, Tomcat 6.0.37 | CentOS
·
2015-11-13 13:05
mysql
solr4.5配置中文分词器
mmseg4j
solr4.x虽然提供了分词器,但不太适合对中文的分词,给大家推荐一个中文分词器
mmseg4j
mmseg4j
的下载地址:https://code.google.com/p/
mmseg4j
/ 通过以下几步就可以把
·
2015-11-13 13:04
mmseg4j
Lucene自定义同义词分词器
org.apache.lucene.analysis.Analyzer; 6 import org.apache.lucene.analysis.TokenStream; 7 8 import com.chenlb.
mmseg4j
.D
·
2015-11-13 11:05
Lucene
IK,ansj,
mmseg4j
分词性能比较
其主页为:https://code.google.com/p/ik-analyzer/下载ansj最新版本:ansj_seg下载mmesg4j最新版本https://code.google.com/p/
mmseg4j
m635674608
·
2015-11-12 15:00
关于中文分词
换用StandardAnalyzer,有34%的提高,比較下使用的KAnalyzer,
mmseg4j
1.9.2-snapshot,standardanalyzer,性能分别在1.7M/s,10M/s,20M
·
2015-11-12 10:26
中文分词
Solr 3.5 suggest autocomplete
上一步 () , 已经配置好了 Solr3.5 和
mmseg4j
分词 , 接下来配置 Solr3.5 的 suggest 来实现 autocomplete(搜索自动提示补全功能
·
2015-11-11 13:52
autocomplete
solr 4.8+mysql数据库数据导入 +
mmseg4j
中文全文索引 配置笔记
转载请标明出处:http://www.cnblogs.com/chlde/p/3768733.html 1.如何将solr部署,请参考之前的文章 2.按上述配置好后,在solr_home文件夹中,将包含collection1文件夹,这就是solr的一个实例。下面我们来看看collection1中的文件内容。 collection1中包含conf和data两个子文件夹。data中包含tlog和
·
2015-11-11 08:04
mmseg4j
中文分词
mmseg4j
的词库格式
原文出处:http://blog.chenlb.com/2009/04/chinese-segment-
mmseg4j
-dictionary-format.html有个网友email问题词库格式怎么样?
m635674608
·
2015-11-09 10:00
中文分词器性能比较
摘要:本篇是本人在Solr的基础上,配置了中文分词器,并对其进行的性能测试总结,具体包括使用
mmseg4j
、IKAnalyzer、Ansj,分别从创建索引效果、创建索引性能、数据搜索效率等方面进行衡量。
m635674608
·
2015-11-07 12:00
Lucene5学习之使用
MMSeg4j
分词器
MMSeg4j
是一款中文分词器,详细介绍如下: 1、
mmseg4j
用Chih-HaoTsai的MMSeg算法(http://technology.chtsai.org/mmseg/)实现的中文分词器
m635674608
·
2015-11-06 00:00
solr4.5安装配置 linux+tomcat6.0+
mmseg4j
-1.9.1分词
首先先介绍下solr的安装配置 solr下载地址 (我这用的solr-4.5.0) 运行环境 JDK 1.5或更高版本 下载地址(Solr 4以上版本,要求JDK 1.6) 我用的JDK1.6 ) 一个java servlet容器,如Tomcat 下载地址 (我用的Tomcat 6,注:JDK1.7 跟Tomcat 7貌似有兼容性问题,记
·
2015-11-03 21:38
mmseg4j
solr 中文分词
mmseg4j
使用例子
原文出处:http://blog.chenlb.com/2009/04/solr-chinese-segment-
mmseg4j
-use-demo.html
mmseg4j
第一个版本就可以方便地与
·
2015-11-02 12:54
mmseg4j
Solr中文分词配置(2)
1、下载分词器:http://code.google.com/p/
mmseg4j
/ 2、将解压后的
mmseg4j
-1.8.2目录下的
mmseg4j
-all
·
2015-11-01 14:45
Solr
solr 中文分词
mmseg4j
使用例子
mmseg4j
第一个版本就可以方便地与 solr 集成,在 google code 上面有简单的说明,第一版的发布博客也有简单的使用说明:中文分词
mmseg4j
。
·
2015-11-01 10:15
mmseg4j
solr+
mmseg4j
mmseg4j
第一个版本就可以方便地与 solr 集成,在 google code 上面有简单的说明,第一版的发布博客也有简单的使用说明:中文分词
mmseg4j
。
·
2015-11-01 10:10
mmseg4j
中文分词
mmseg4j
在 lucene 中的使用示例
原文出处:http://blog.chenlb.com/2009/04/use-chinese-segment-
mmseg4j
-in-lucene-demo.html
mmseg4j
发布也有一段时间了
·
2015-10-31 10:36
mmseg4j
基于MMSeg算法的中文分词类库
原文: 基于MMSeg算法的中文分词类库 最近在实现基于lucene.net的搜索方案,涉及中文分词,找了很多,最终选择了
MMSeg4j
,但
MMSeg4j
只有Java版,在博客园上找到了*王员外
·
2015-10-31 09:57
中文分词
当前几个主要的Lucene中文分词器的比较
基本介绍: paoding :Lucene中文分词“庖丁解牛” Paoding Analysisimdict :imdict智能词典所采用的智能中文分词程序
mmseg4j
: 用 Chih-Hao Tsai
·
2015-10-30 14:28
Lucene
中文分词
mmseg4j
在 lucene 中的使用示例
mmseg4j
发布也有一段时间了,前些日子忙着发布新的版本,修正 bug 之类的。使用示例一直拖到现在,其实 svn 上的 test 有使用 lucene 例子。
·
2015-10-30 13:21
mmseg4j
mmseg4j
中文分词 1.6 版发布
经过几天的开发与调试,
mmseg4j
1.6 版可以发布了。1.6 版主要实现与下功能: 实现多分词,在complex基础上,把长的词(大于2)拆出多个词。
·
2015-10-30 13:20
mmseg4j
solr+
mmseg4j
之二
再发现庖丁的分词过于琐屑,在实际的生产环境中没有
mmseg4j
效果好。 solr的配置就不多说了。
·
2015-10-30 13:13
mmseg4j
solr分词。。。。。
1、开发环境 Mac10.10.4+tomcat6+Java8+solr4.4+
mmseg4j
1.9.12、效果图预览图片1预览图片2
Java_Coder
·
2015-10-29 19:00
solr 中文分词
mmseg4j
使用例子 ,NGramTokenizerFactory
solr 中文分词
mmseg4j
使用例子 版权信息: 可以任意转载, 转载时请务必以超链接形式标明文章原文出处, 即下面的声明.
·
2015-10-28 09:39
factory
Solr 5.3.0集成
mmseg4j
、tomcat部署、Solrj 5.3.0使用
环境:Jdk1.7 Solr5.3.0 Tomcat7
mmseg4j
-solr-2.3.01、Solr环境搭建1.解压solr5.3.02.新建solr_home,将解压文件中的server
daxiong0615
·
2015-10-24 16:00
Solr
mmseg4j
solrj
5.3
中文分词器性能比较
摘要: 本篇是本人在Solr 的基础上,配置了中文分词器, 并对其进行的性能测试总结,具体包括 使用
mmseg4j
、IKAnalyzer、Ansj,分别从创建索引效果
·
2015-10-21 11:15
中文分词器
Solr 5.x的搭建(Solr自带的Jetty Server)与
mmseg4j
中文分词
前言: 如果你对Solr怎么和Tomcat集成以及如何使用
mmseg4j
和自定义的词库丰富完善中文分词,可以参照我的其它与Solr相关的博客。
Josh_Persistence
·
2015-10-17 19:00
中文分词
mmseg4j
solr5
Solr5.x
搜狗词库
Solr 5.x的搭建(Solr自带的Jetty Server)与
mmseg4j
中文分词
阅读更多前言:如果你对Solr怎么和Tomcat集成以及如何使用
mmseg4j
和自定义的词库丰富完善中文分词,可以参照我的其它与Solr相关的博客。
Josh_Persistence
·
2015-10-17 19:00
Solr5.x
Solr5
中文分词
mmseg4j
搜狗词库
Solr 5.x的搭建(Solr自带的Jetty Server)与
mmseg4j
中文分词
阅读更多前言:如果你对Solr怎么和Tomcat集成以及如何使用
mmseg4j
和自定义的词库丰富完善中文分词,可以参照我的其它与Solr相关的博客。
Josh_Persistence
·
2015-10-17 19:00
Solr5.x
Solr5
中文分词
mmseg4j
搜狗词库
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他