E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
mmseg4j
solr4.3之配置中文分词
mmseg4j
前面,笔者已经介绍过solr里面另外2种中文分词的配置,今天就来就简述一下
mmseg4j
在solr4.3里面的配置,
mmseg4j
也是一款很优秀的中文分词器,是用Chih-Hao Tsai 的 MMSeg
qindongliang1922
·
2013-07-19 15:00
Solr
中分分词
mmseg4j
solr4.3之配置中文分词
mmseg4j
前面,笔者已经介绍过solr里面另外2种中文分词的配置,今天就来就简述一下
mmseg4j
在solr4.3里面的配置,
mmseg4j
也是一款很优秀的中文分词器,是用Chih-Hao Tsai 的 MMSeg
qindongliang1922
·
2013-07-19 15:00
Solr
中分分词
mmseg4j
solr4.3之配置中文分词
mmseg4j
前面,笔者已经介绍过solr里面另外2种中文分词的配置,今天就来就简述一下
mmseg4j
在solr4.3里面的配置,
mmseg4j
也是一款很优秀的中文分词器,是用Chih-Hao Tsai 的 MMSeg
qindongliang1922
·
2013-07-19 15:00
Solr
中分分词
mmseg4j
solr4.3之配置中文分词
mmseg4j
前面,笔者已经介绍过solr里面另外2种中文分词的配置,今天就来就简述一下
mmseg4j
在solr4.3里面的配置,
mmseg4j
也是一款很优秀的中文分词器,是用Chih-Hao Tsai 的 MMSeg
qindongliang1922
·
2013-07-19 15:00
Solr
mmseg4j
中分分词
solr4.3之配置中文分词
mmseg4j
前面,笔者已经介绍过solr里面另外2种中文分词的配置,今天就来就简述一下
mmseg4j
在solr4.3里面的配置,
mmseg4j
也是一款很优秀的中文分词器,是用Chih-Hao Tsai 的 MMSeg
qindongliang1922
·
2013-07-19 15:00
Solr
中分分词
mmseg4j
solr4.3之配置中文分词
mmseg4j
前面,笔者已经介绍过solr里面另外2种中文分词的配置,今天就来就简述一下
mmseg4j
在solr4.3里面的配置,
mmseg4j
也是一款很优秀的中文分词器,是用Chih-Hao Tsai 的 MMSeg
qindongliang1922
·
2013-07-19 15:00
Solr
中分分词
mmseg4j
10W文本语义查询记录
控制台输出:请输入查询字符串:航母七月08,20133:21:25下午com.chenlb.
mmseg4j
.DictionaryloadDicINFO:charsloadedtime=154ms,line
lskyne
·
2013-07-08 15:00
Lucene分词组件盘古与
mmseg4j
评测
Lucene分词组件盘古与
mmseg4j
评测前言.Net下分词组件选择不多,最近看到宝玉发布了改进版本的mmseg分词,正好跟使用已久的盘古分词做个对比。
·
2013-06-07 21:00
Lucene
分词
盘古
Lucene分词组件盘古与
mmseg4j
评测
前言.Net下分词组件选择不多,最近看到宝玉发布了改进版本的mmseg分词,正好跟使用已久的盘古分词做个对比。盘古是用自动机来实现分词,更详细的分析http://www.cnblogs.com/eaglet/archive/2008/10/02/1303142.htmlmmseg的算法相对先进一些,更详细的解释:http://www.coreseek.cn/opensource/mmseg/这里只
·
2013-06-07 11:00
mmseg4j
solr3.5同时配置paoding,IKAnalyzer,
mmseg4j
三种分词器词库
先下载三种不同版本的分词器
mmseg4j
-1.8.5.zip; IKAnalyzer3.2.8 bin.zip paoding-analysis-2.0.4-beta.zip solr版本:3.5
ren00317574
·
2013-05-31 17:00
Solr
基于MMSeg算法的中文分词类库
基于MMSeg算法的中文分词类库最近在实现基于lucene.net的搜索方案,涉及中文分词,找了很多,最终选择了
MMSeg4j
,但
MMSeg4j
只有Java版,在博客园上找到了*王员外*(http://
·
2013-05-09 23:00
中文分词
基于MMSeg算法的中文分词类库
基于MMSeg算法的中文分词类库最近在实现基于lucene.net的搜索方案,涉及中文分词,找了很多,最终选择了
MMSeg4j
,但
MMSeg4j
只有Java版,在博客园上找到了*王员外*(http://
宝玉
·
2013-05-09 22:00
基于MMSeg算法的中文分词类库
最近在实现基于lucene.net的搜索方案,涉及中文分词,找了很多,最终选择了
MMSeg4j
,但
MMSeg4j
只有Java版,在博客园上找到了*王员外*(http://www.cnblogs.com/
·
2013-05-09 22:00
中文分词
solr4.0环境搭建
服务器:tomcat6 JDK :1.6 SOLR :4.0 中文分词器 :ik-analyzer,
mmseg4j
一、将apache-solr
韩悠悠
·
2013-04-28 09:00
Solr
solr(五)同义词加中文分词
同义词加中文分词的话可以采用
mmseg4j
,
mmseg4j
的配置步骤如下: 1:下载地址: http://code.google.com/p/
mmseg4j
extrimlycold
·
2013-04-09 13:00
Solr
Elasticsearch集成中文分词
前言 由于elasticsearch基于lucene,所以天然地就多了许多lucene上的中文分词的支持,比如 IK, Paoding,
MMSEG4J
等lucene中文分词原理上都能在elasticsearch
shuminghuang
·
2013-03-31 22:00
elasticsearch
中文分词
当前几个主要的Lucene中文分词器的比较
www.javaeye.com/news/96371.基本介绍:paoding :Lucene中文分词“庖丁解牛”PaodingAnalysisimdict :imdict智能词典所采用的智能中文分词程序
mmseg4j
xiyanlgu
·
2013-03-21 18:00
Lucene
信息检索
分词
mmseg4j
paoding
当前几个主要的Lucene中文分词器的比较
基本介绍: paoding :Lucene中文分词“庖丁解牛” Paoding Analysisimdict :imdict智能词典所采用的智能中文分词程序
mmseg4j
 
lt200819
·
2013-03-19 10:00
Lucene
初识建立索引过程用的分词器和对同义词的处理
mmseg4j
的jar包中的MMSegAnalyzer和ComplexAnalyzer为我们提供了中文分词器前者只能将文本拆分为2个
wangchenggong1988
·
2013-03-15 21:00
Solr4:环境搭建,Tomcat7+Solr4.x+中文分词+多核
//lucene.apache.org/solr/ IKAnalyzer中文分词器下载地址:http://code.google.com/p/ik-analyzer/downloads/list
mmseg4j
·
2013-02-20 15:00
tomcat7
Lucene4:创建查询,并高亮查询关键词
要求 环境: Lucene 4.1版本/IKAnalyzer 2012 FF版本/
mmseg4j
1.9版本功能: 1).高亮查询演示 注意: 此篇文章开始,索引目录将不再使用示范目录,而是使用真实的数据
·
2013-01-25 16:00
Lucene
Lucene4:创建一个简单查询
要求 环境: Lucene 4.1版本/IKAnalyzer 2012 FF版本/
mmseg4j
1.9版本功能: 1). 默认查询,显示文档得分及内容 2.
·
2013-01-25 16:00
Lucene
Lucene4:运用中文分词器创建索引,给指定文本增加boost值
要求 环境: Lucene 4.1版本/IKAnalyzer 2012 FF版本/
mmseg4j
1.9版本 功能: 1). 运行中文分词器进行创建索引工作; 2).
·
2013-01-25 16:00
Lucene
Lucene4:获取中文分词结果,根据文本计算boost
要求 环境: Lucene 4.1版本/IKAnalyzer 2012 FF版本/
mmseg4j
1.9版本 实现功能: 1).给定输入文本,获取中文拆分词结果;2).给定输入文本,对该文本按一定规则进行权重打分
·
2013-01-25 16:00
Lucene
solr4.0环境搭建
服务器:tomcat6 JDK :1.6 SOLR:4.0中文分词器:ik-analyzer,
mmseg4j
安装:目前
mmseg4j
的版本是
mmseg4j
-1.9.0.v20120712-SNAPSHOT
qileilove
·
2013-01-22 14:00
Solr4:配置
mmseg4j
同义词(已经配置好中文分词)
前提,已经安装配置好Tomcat7与Solr4,并且配置好
mmseg4j
中文分词,具体参考Solr4:Tomcat7下面配置Solr以及Solr4:加入中文分词
mmseg4j
。
·
2013-01-18 17:00
mmseg4j
Solr4:加入中文分词
mmseg4j
前提是已经在Tomcat7下面配置好Solr4.0,详情参考:Solr4:Tomcat7下面配置Solr1.下载
mmseg4j
下载地址:http://code.google.com/p/
mmseg4j
/
·
2013-01-18 17:00
mmseg4j
solr中
mmseg4j
支持单个字母、数字及组合搜索
如题,看到这个题目也许觉得功能有些多余,字母、数字连在一块的话,是不会单独分出来的,分词时候是连在一块的,也算正常搜素需求。如输入: Stringtxt="IBM12二次修改123"; 分词效果: ibm|123|二|次|修|改 现在,有一个需求:需要对字母、数字都分词,分词效果要达到: i|b|m| 1|2|3|二|次|修|改
alen1985
·
2013-01-17 17:00
Solr
mmseg4j
solr中
mmseg4j
自定义词库配置
mmseg4j
是一个比较流行的中文分词,具体介绍见:http://code.google.com/p/
mmseg4j
/schema.xml配置文件:
alen1985
·
2013-01-14 14:00
Solr
中文分词
mmseg4j
tomcat+solr3.60+
mmseg4j
1.85整合
3.6.0http://mirror.bit.edu.cn/apache/lucene/solr/3.6.0/apache-solr-3.6.0.zip中文分词器http://code.google.com/p/
mmseg4j
ygd266
·
2013-01-07 15:00
solr+
mmseg4j
中文分词
这篇文章是接着上面一篇文章的:http://blog.sina.com.cn/s/blog_abba9c1d0101d6tx.html首先安装
mmseg4j
官网:https://code.google.com
marujunyy
·
2013-01-04 21:00
Solr4.0搭建应用(四)
既然可以完成添加索引文档了,那么肯定要考虑到中文分词下载
mmseg4j
分词器:http://code.google.com/p/
mmseg4j
/downloads/list 将压缩包解压,
mmseg4j
-all
myten
·
2012-12-26 15:00
Solr
Solr 中文分词器
1.下载
mmseg4j
mmseg4j
-core:核心库文件;
mmseg4j
-solr:solr支持库文件;
mmseg4j
-analysis:分析库文件;下载地址:http://mvnrepository.com
maxracer
·
2012-12-26 15:00
十四、中文分词器
得自己指定词库位置2、创建的时候使用MMSegAnalyzer分词器Analyzera=newMMSegAnalyzer(newFile("D:\\tools\\javaTools\\lucene\\
mmseg4j
youyang_java
·
2012-11-28 13:00
中文分词器
PHP-分词- paoding基于Lucene的最流行的分词法
1.基本介绍:paoding:Lucene中文分词“庖丁解牛”PaodingAnalysisimdict:imdict智能词典所采用的智能中文分词程序
mmseg4j
:用Chih-HaoTsai的MMSeg
dreamzml
·
2012-11-27 22:00
paoding
PHP分词
最流行的分词法
基于Lucene的
一、初步认识lucene
环境搭建:1、lucene-core-3.5.0.jar2、
mmseg4j
-all-1.8.5-with-dic.jar(中文分词器)3、lucene-highlighter-3.5.0.jar、lucene-memory
chongqingnantian
·
2012-11-19 14:52
lucene3.5
一、初步认识lucene
环境搭建: 1、lucene-core-3.5.0.jar 2、
mmseg4j
-all-1.8.5-with-dic.jar(中文分词器) 3、lucene-highlighter-3.5.0
youyang_java
·
2012-11-19 14:00
Lucene
solr4.0环境搭建
服务器:tomcat6 JDK :1.6 SOLR:4.0中文分词器:ik-analyzer,
mmseg4j
安装:目前
mmseg4j
的版本是
mmseg4j
-1.9.0.v20120712-SNAPSHOT
yangaming
·
2012-11-18 14:00
环境
solr4.0
Java中文分词器Ansj
Java中文分词器AnsjAnsj是一个开源的Java中文分词工具,基于中科院的ictclas中文分词算法,比其他常用的开源分词工具(如
mmseg4j
)的分词准确率更高。介绍一下Ansj!
howareyoutodaysoft
·
2012-11-10 11:00
ansj
中文分词器
不了了之
不了了之之了之
开源搜索引擎solr4.0+tomcat7实现中文分词
solr4.0正式版发布,由于其新功能比较给力(特别是关于分布式的新特性,关联zookeeper等),所以准备替换掉老版本官网下载solr4.0:http://lucene.apache.org/solr/
mmseg4j
zhouyuqin3510
·
2012-11-06 16:24
搜索
引擎
lucene
开源搜索引擎solr4.0+tomcat7实现中文分词
solr4.0正式版发布,由于其新功能比较给力(特别是关于分布式的新特性,关联zookeeper等),所以准备替换掉老版本官网下载solr4.0:http://lucene.apache.org/solr/
mmseg4j
zhouyuqin3510
·
2012-11-06 16:24
搜索
Solr
Lucene
分词
引擎
lucene的使用
使用luncene3.6下载地址 http://www.apache.org/dyn/closer.cgi/lucene/java/3.6.1分词器使用
mmseg4j
下载地址 http://code.google.com
eat_suger
·
2012-11-05 15:00
开源 Java 中文分词器 Ansj 作者孙健专访
Ansj是一个开源的Java中文分词工具,基于中科院的ictclas中文分词算法,比其他常用的开源分词工具(如
mmseg4j
)的分词准确率更高。
nanjingjiangbiao_T
·
2012-11-05 13:00
中文分词器
开源 Java 中文分词器 Ansj 作者孙健专访
Ansj是一个开源的Java中文分词工具,基于中科院的ictclas中文分词算法,比其他常用的开源分词工具(如
mmseg4j
)的分词准确率更高。
blogdevteam
·
2012-11-05 13:00
专访
solr中文分词(
mmseg4j
)
1、从http://code.google.com/p/
mmseg4j
/ 下载
mmseg4j
2、在$SOLR_HOME下建立lib和dic两个目录,讲
mmseg4j
-all-1.8.4.jar拷贝到
·
2012-10-24 11:00
mmseg4j
solr和tomcat整合
solr和tomcat整合先下载lucene和solr,及中文分词器
mmseg4j
lucene和solr我用的3.6.1版http://www.apache.org/dyn/closer.cgi/lucene
chrischen214
·
2012-10-23 14:00
Linux下安装使用Solr
1、首先下载Solr、
mmseg4j
分词包、tomcat并解压,这用google、百度都可以搜索得到下载地址。
dengsilinming
·
2012-10-17 11:45
Solr
Linux下安装使用Solr
1、首先下载Solr、
mmseg4j
分词包、tomcat并解压,这用google、百度都可以搜索得到下载地址。
dengsilinming
·
2012-10-17 11:00
tomcat
linux
filter
Solr
Class
regex
Linux下安装使用Solr
1、首先下载Solr、
mmseg4j
分词包、tomcat并解压,这用google、百度都可以搜索得到下载地址。
eat_suger
·
2012-10-09 17:00
MMSeg中文分词算法
Java中有一些开源的分词项目,比如:IK、Paoding、
MMSEG4J
等等。这里主要说的是
MMSEG4J
中使用的MMSeg算法。
suwei19870312
·
2012-09-27 17:00
java
算法
语言
2010
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他