E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
MMSeg
让盘古分词支持最新的Lucene.Net 3.0.3
让盘古分词支持最新的Lucene.Net3.0.3好多年没升级过的Lucene.Net最近居然升级了,到了3.0.3后接口发生了很大变化,原来好多分词库都不能用了,所以上次我把
MMSeg
给修改了一下支持了
宝玉
·
2013-05-27 20:00
让盘古分词支持最新的Lucene.Net 3.0.3
好多年没升级过的Lucene.Net最近居然升级了,到了3.0.3后接口发生了很大变化,原来好多分词库都不能用了,所以上次我把
MMSeg
给修改了一下支持了Lucene.Net3.0.3(参考《基于
MMSeg
·
2013-05-27 20:00
Lucene
coreseek安装中的一些问题
的过程中出现了一下错误config.status:error:cannotfindinputfile:src/Makefile.intar-zxv-fcoreseek-3.2.14.tar.gz进入到
mmseg
吴朝辉
·
2013-05-24 18:00
coreseek(sphinx中文版)安装配置
coreseek(sphinx中文版)安装配置关于coreseek介绍http://www.coreseek.cn/products-install/install_on_bsd_linux/
mmseg
smart818
·
2013-05-21 17:08
安装
local
中文版
opt
基于
MMSeg
算法的中文分词类库
基于
MMSeg
算法的中文分词类库最近在实现基于lucene.net的搜索方案,涉及中文分词,找了很多,最终选择了
MMSeg
4j,但
MMSeg
4j只有Java版,在博客园上找到了*王员外*(http://
·
2013-05-09 23:00
中文分词
基于
MMSeg
算法的中文分词类库
基于
MMSeg
算法的中文分词类库最近在实现基于lucene.net的搜索方案,涉及中文分词,找了很多,最终选择了
MMSeg
4j,但
MMSeg
4j只有Java版,在博客园上找到了*王员外*(http://
宝玉
·
2013-05-09 22:00
基于
MMSeg
算法的中文分词类库
最近在实现基于lucene.net的搜索方案,涉及中文分词,找了很多,最终选择了
MMSeg
4j,但
MMSeg
4j只有Java版,在博客园上找到了*王员外*(http://www.cnblogs.com/
·
2013-05-09 22:00
中文分词
solr4.0环境搭建
服务器:tomcat6 JDK :1.6 SOLR :4.0 中文分词器 :ik-analyzer,
mmseg
4j 一、将apache-solr
韩悠悠
·
2013-04-28 09:00
Solr
solr(五)同义词加中文分词
同义词加中文分词的话可以采用
mmseg
4j,
mmseg
4j的配置步骤如下: 1:下载地址: http://code.google.com/p/
mmseg
4j
extrimlycold
·
2013-04-09 13:00
Solr
Elasticsearch集成中文分词
前言 由于elasticsearch基于lucene,所以天然地就多了许多lucene上的中文分词的支持,比如 IK, Paoding,
MMSEG
4J等lucene中文分词原理上都能在elasticsearch
shuminghuang
·
2013-03-31 22:00
elasticsearch
中文分词
当前几个主要的Lucene中文分词器的比较
www.javaeye.com/news/96371.基本介绍:paoding :Lucene中文分词“庖丁解牛”PaodingAnalysisimdict :imdict智能词典所采用的智能中文分词程序
mmseg
4j
xiyanlgu
·
2013-03-21 18:00
Lucene
信息检索
分词
mmseg4j
paoding
coreseek+sphinx详细安装配置
sphinx.tgzyuminstall m4 autoconf automake libtool mysql-devellibxml2-develexpat-develtarzxvf coreseek-3.2.14.tar.gz首先安装
mmseg
cd
864318131
·
2013-03-21 11:08
当前几个主要的Lucene中文分词器的比较
基本介绍: paoding :Lucene中文分词“庖丁解牛” Paoding Analysisimdict :imdict智能词典所采用的智能中文分词程序
mmseg
4j 
lt200819
·
2013-03-19 10:00
Lucene
初识建立索引过程用的分词器和对同义词的处理
mmseg
4j的jar包中的
MMSeg
Analyzer和ComplexAnalyzer为我们提供了中文分词器前者只能将文本拆分为2个
wangchenggong1988
·
2013-03-15 21:00
elasticsearch中文分词
两个中文分词插件,一个是ik的,一个是
mmseg
的,下面分别介绍下两者的用法,其实都差不多的,先安装插件,命令行:安装ik插件:plugin-installmedcl/elasticsearch-analysis-ik
skydxd
·
2013-03-06 10:00
elasticsearch中文分词
两个中文分词插件,一个是ik的,一个是
mmseg
的,下面分别介绍下两者的用法,其实都差不多的,先安装插件,命令行:安装ik插件:plugin-installmedcl/elasticsearch-analysis-ik
skydxd
·
2013-03-06 10:00
MySQL+Sphinx+SphinxSE安装步骤(sphinx-0.9.8)
1、安装python支持(以下针对CentOS系统,其他Linux系统请使用相应的方法安装) yum install -y python python-devel 2、编译安装Lib
MMSeg
ljl_xyf
·
2013-02-26 17:00
sphinx
Solr4:环境搭建,Tomcat7+Solr4.x+中文分词+多核
//lucene.apache.org/solr/ IKAnalyzer中文分词器下载地址:http://code.google.com/p/ik-analyzer/downloads/list
mmseg
4j
·
2013-02-20 15:00
tomcat7
Centos5.6 coreseek 安装
下载coreseek并解压,先安装
mmseg
分词器。进入
mmseg
目录 运行./configure --prefix=/usr/local/
mmseg
结束后报错。
lipengyu2006
·
2013-02-17 22:00
coreseek
mmseg
Lucene4:创建查询,并高亮查询关键词
要求 环境: Lucene 4.1版本/IKAnalyzer 2012 FF版本/
mmseg
4j 1.9版本功能: 1).高亮查询演示 注意: 此篇文章开始,索引目录将不再使用示范目录,而是使用真实的数据
·
2013-01-25 16:00
Lucene
Lucene4:创建一个简单查询
要求 环境: Lucene 4.1版本/IKAnalyzer 2012 FF版本/
mmseg
4j 1.9版本功能: 1). 默认查询,显示文档得分及内容 2.
·
2013-01-25 16:00
Lucene
Lucene4:运用中文分词器创建索引,给指定文本增加boost值
要求 环境: Lucene 4.1版本/IKAnalyzer 2012 FF版本/
mmseg
4j 1.9版本 功能: 1). 运行中文分词器进行创建索引工作; 2).
·
2013-01-25 16:00
Lucene
Lucene4:获取中文分词结果,根据文本计算boost
要求 环境: Lucene 4.1版本/IKAnalyzer 2012 FF版本/
mmseg
4j 1.9版本 实现功能: 1).给定输入文本,获取中文拆分词结果;2).给定输入文本,对该文本按一定规则进行权重打分
·
2013-01-25 16:00
Lucene
solr4.0环境搭建
服务器:tomcat6 JDK :1.6 SOLR:4.0中文分词器:ik-analyzer,
mmseg
4j安装:目前
mmseg
4j的版本是
mmseg
4j-1.9.0.v20120712-SNAPSHOT
qileilove
·
2013-01-22 14:00
lucene自定义停用词分词器和
mmseg
中文分词器
import java.io.Reader; import java.util.Set; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.LetterTokenizer; import org.apache.lucene.analysis.LowerCaseF
soukenan
·
2013-01-20 11:55
Lucene
自定义分词器
mmseg分词器
lucene自定义停用词分词器和
mmseg
中文分词器
import java.io.Reader; import java.util.Set; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.LetterTokenizer; import org.apache.lucene.analysis.LowerCaseFilter; import o
soukenan
·
2013-01-20 11:55
lucene
自定义分词器
mmseg分词器
Lucene
Solr4:配置
mmseg
4j同义词(已经配置好中文分词)
前提,已经安装配置好Tomcat7与Solr4,并且配置好
mmseg
4j中文分词,具体参考Solr4:Tomcat7下面配置Solr以及Solr4:加入中文分词
mmseg
4j。
·
2013-01-18 17:00
mmseg4j
Solr4:加入中文分词
mmseg
4j
前提是已经在Tomcat7下面配置好Solr4.0,详情参考:Solr4:Tomcat7下面配置Solr1.下载
mmseg
4j下载地址:http://code.google.com/p/
mmseg
4j/
·
2013-01-18 17:00
mmseg4j
solr中
mmseg
4j支持单个字母、数字及组合搜索
如题,看到这个题目也许觉得功能有些多余,字母、数字连在一块的话,是不会单独分出来的,分词时候是连在一块的,也算正常搜素需求。如输入: Stringtxt="IBM12二次修改123"; 分词效果: ibm|123|二|次|修|改 现在,有一个需求:需要对字母、数字都分词,分词效果要达到: i|b|m| 1|2|3|二|次|修|改
alen1985
·
2013-01-17 17:00
Solr
mmseg4j
solr中
mmseg
4j自定义词库配置
mmseg
4j是一个比较流行的中文分词,具体介绍见:http://code.google.com/p/
mmseg
4j/schema.xml配置文件:
alen1985
·
2013-01-14 14:00
Solr
中文分词
mmseg4j
PHP特级课视频教程_第二十七集 Coreseek安装与测试_李强强
教程内容:1.中文分词理论2.
mmseg
中文分词安装3.coreseek安装4.修改coreseek配置文件5.coreseek测试6.php加载sphinx模块视频播放地址:视频下载地址: http:
lamp小强
·
2013-01-11 22:00
redis
PHP
搜索
memcache
sphinx
为全文检索方案更新词库
目前对中文分词比较好的插件主要有ik-analyzer、
mmseg
、庖丁等。ik是目前使用比较广泛,而且作者刚对其进行了更新,目前已经能支持简单的分词歧义排除算法,详细情况请参见ik的开发网站。
eagler006
·
2013-01-11 15:00
ik
全文检索
lucene
elasticsearch
为全文检索方案更新词库
目前对中文分词比较好的插件主要有ik-analyzer、
mmseg
、庖丁等。ik是目前使用比较广泛,而且作者刚对其进行了更新,目前已经能支持简单的分词歧义排除算法,详细情况请参见ik的开发网站。
eagler006
·
2013-01-11 15:00
elasticsearch
Lucene
全文检索
IK
tomcat+solr3.60+
mmseg
4j1.85整合
3.6.0http://mirror.bit.edu.cn/apache/lucene/solr/3.6.0/apache-solr-3.6.0.zip中文分词器http://code.google.com/p/
mmseg
4j
ygd266
·
2013-01-07 15:00
solr+
mmseg
4j 中文分词
这篇文章是接着上面一篇文章的:http://blog.sina.com.cn/s/blog_abba9c1d0101d6tx.html首先安装
mmseg
4j官网:https://code.google.com
marujunyy
·
2013-01-04 21:00
使用Coreseek建立全文搜索索引
首先安装Coreseek,具体如何安装:gitHubsource需要注意的是官网给的指导是安装libtool-2.2.6b,但是在安装
mmseg
的时候会报错,所以我们安装的时候需要安装libtool-2.2.10
marujunyy
·
2013-01-04 21:00
Node.JS 中文分词模块
mmseg
-node一个基于lib
mmseg
的NodeJS驱动。
marujunyy
·
2013-01-04 21:00
Solr4.0搭建应用(四)
既然可以完成添加索引文档了,那么肯定要考虑到中文分词下载
mmseg
4j分词器:http://code.google.com/p/
mmseg
4j/downloads/list 将压缩包解压,
mmseg
4j-all
myten
·
2012-12-26 15:00
Solr
Solr 中文分词器
1.下载
mmseg
4j
mmseg
4j-core:核心库文件;
mmseg
4j-solr:solr支持库文件;
mmseg
4j-analysis:分析库文件;下载地址:http://mvnrepository.com
maxracer
·
2012-12-26 15:00
Sphinx 中文CoreSeek全文搜索安装 + sphinxSE 引擎安装
安装
mmseg
$cd/usr/local/src/coreseek-4.1-beta/
mmseg
-3.2.14$./bootstrap #输出的warning信息可以忽略,
vsbanana520
·
2012-12-18 09:19
sphinx
全文索引
十四、中文分词器
已经没有更新了
mmseg
:使用搜狗的词库()1、导入包(有两个包:1、带dic,2、不带dic)如果使用不带dic的,得自己指定词库位置2、创建的时候使用
MMSeg
Analyzer分词器Analyzera
youyang_java
·
2012-11-28 13:00
中文分词器
PHP-分词- paoding基于Lucene的最流行的分词法
1.基本介绍:paoding:Lucene中文分词“庖丁解牛”PaodingAnalysisimdict:imdict智能词典所采用的智能中文分词程序
mmseg
4j:用Chih-HaoTsai的
MMSeg
dreamzml
·
2012-11-27 22:00
paoding
PHP分词
最流行的分词法
基于Lucene的
coreseek(sphinx中文版) 安装配置+sphinx存储引擎for mysql
关于coreseek介绍http://www.coreseek.cn/products-install/install_on_bsd_linux/
mmseg
安装(中文分词)#wgethttp://www.coreseek.cn
cqfish
·
2012-11-20 16:58
sphinx
Linux
coreseek(sphinx中文版) 安装配置+sphinx存储引擎for mysql
关于coreseek介绍http://www.coreseek.cn/products-install/install_on_bsd_linux/
mmseg
安装(中文分词)#wgethttp://www.coreseek.cn
cqfish
·
2012-11-20 16:58
sphinx
一、初步认识lucene
环境搭建:1、lucene-core-3.5.0.jar2、
mmseg
4j-all-1.8.5-with-dic.jar(中文分词器)3、lucene-highlighter-3.5.0.jar、lucene-memory
chongqingnantian
·
2012-11-19 14:52
lucene3.5
一、初步认识lucene
环境搭建: 1、lucene-core-3.5.0.jar 2、
mmseg
4j-all-1.8.5-with-dic.jar(中文分词器) 3、lucene-highlighter-3.5.0
youyang_java
·
2012-11-19 14:00
Lucene
提高coreseek的搜索精度
由于coreseek带的
mmseg
默认词库只有1w多个字词,搜索出来的结果准确度不是很理想。花了半天找了下搜索引擎相关的资料,现在记录下一些提高搜索精度的方法和步骤:1.
phpseyo
·
2012-11-19 11:00
coreseek
solr4.0环境搭建
服务器:tomcat6 JDK :1.6 SOLR:4.0中文分词器:ik-analyzer,
mmseg
4j安装:目前
mmseg
4j的版本是
mmseg
4j-1.9.0.v20120712-SNAPSHOT
yangaming
·
2012-11-18 14:00
环境
solr4.0
java开源中文分词-jcseg
jcseg是使用Java开发的一个中文分词器,使用流行的
mmseg
算法实现。1。目前最高版本:jcseg1.7.1。兼容最高版本的lucene。2。
jcseg
·
2012-11-15 10:29
java
中文分词
jcseg
java开源中文分词-jcseg
jcseg是使用Java开发的一个中文分词器,使用流行的
mmseg
算法实现。1。目前最高版本:jcseg1.7.1。兼容最高版本的lucene。2。
jcseg
·
2012-11-15 10:29
java
中文分词
jcseg
中文分词
上一页
11
12
13
14
15
16
17
18
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他