E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
mmseg
[置顶] 【Apache Solr系列】使用IKAnalyzer中文分词以及自定义分词字典
之前写的ApacheSolr只介绍了简单的搭建以及导入数据等功能,最近由于项目要求,添加索引分词和搜索分词功能;分词的项目有包括好几个:smartcn、ictclas4j、IK、jeasy、庖丁、
mmseg
4j
WeiJonathan
·
2014-01-16 15:00
Solr
IKAnalyzer
中文分词器
浅谈
MMSEG
分词算法
最近看了下
MMSEG
分词算法,觉得这个算法简单高效,而且还非常准确作者声称这个规则达到了99.69%的准确率并且93.21%的歧义能被这个规则消除。
pwlazy
·
2013-12-25 20:00
solr4.4.0+
mmseg
4j 中文分词
首先安装
mmseg
4j官网:https://code.google.com/p/
mmseg
4j/下载地址:http://code.google.com/p/
mmseg
4j/downloads/listwget
huang798807481
·
2013-12-17 16:00
paip..禁用
mmseg
的默认词库. . 仅仅使用自定义词库from数据库.
paip..禁用
mmseg
的默认词库..仅仅使用自定义词库from数据库.
mmseg
默认词库只能是文件格式...不好维护..要是不个词库放的个数据库里面走好维护兰..要实现2个目标..:1.禁用默认词库
attilax
·
2013-12-16 18:00
[转]关于
MMSEG
分词算法
转自:http://hi.baidu.com/catro/item/5c76247c0ff6a9376f29f6ed
MMSEG
是中文分词中一个常见的、基于词典的分词算法(作者主页:http://chtsai.org
bjzhkuang
·
2013-12-11 14:00
mmseg
分词
算法
[转]关于
MMSEG
分词算法
转自:http://hi.baidu.com/catro/item/5c76247c0ff6a9376f29f6ed
MMSEG
是中文分词中一个常见的、基于词典的分词算法(作者主页:http://
bjzhkuang
·
2013-12-11 14:00
msseg 分词 算法
python
mmseg
WindowsError: [Error 126]
/usr/bin/python # -*- coding: utf-8 -*- """ Function: 【记录】折腾Python中的
mmseg
中文分词模块
fuzhaohui
·
2013-11-26 16:00
python
python easy_install “Unable to find vcvarsall.bat
用python安装
mmseg
分词包时发生了 Unable to find vcvarsall.bat 错误 Searching for
mmseg
Reading http://pypi.python.org
fuzhaohui
·
2013-11-26 14:00
python
中文分词
一,中文分词概述,请参考http://www.ppc110.com/search-engine.pdf二,
mmseg
,一个中文分词实现,转自:http://leeing.org/2009/11/01/
mmseg
-chinese-segmentation-algorithm
dong976209075
·
2013-10-30 16:00
coreseek中LibMMsg中文分词
[php] view plain copy
mmseg
-u unigram.txt 该命令执行后,将会在
abc123456789cba
·
2013-10-28 22:00
coreseek
分布式搜索elasticsearch中文分词集成
elasticsearch官方只提供smartcn这个中文分词插件,效果不是很好,好在国内有medcl大神(国内最早研究es的人之一)写的两个中文分词插件,一个是ik的,一个是
mmseg
的,下面分别介绍下两者的用法
wbj0110
·
2013-10-20 11:00
elasticsearch
分布式搜索elasticsearch中文分词集成
阅读更多elasticsearch官方只提供smartcn这个中文分词插件,效果不是很好,好在国内有medcl大神(国内最早研究es的人之一)写的两个中文分词插件,一个是ik的,一个是
mmseg
的,下面分别介绍下两者的用法
wbj0110
·
2013-10-20 11:00
ElasticSearch
分布式搜索elasticsearch中文分词集成
elasticsearch官方只提供smartcn这个中文分词插件,效果不是很好,好在国内有medcl大神(国内最早研究es的人之一)写的两个中文分词插件,一个是ik的,一个是
mmseg
的,下面分别介绍下两者的用法
wbj0110
·
2013-10-20 11:00
elasticsearch
分布式搜索elasticsearch中文分词集成
elasticsearch官方只提供smartcn这个中文分词插件,效果不是很好,好在国内有medcl大神(国内最早研究es的人之一)写的两个中文分词插件,一个是ik的,一个是
mmseg
的,下面分别介绍下两者的用法
wbj0110
·
2013-10-20 11:00
elasticsearch
sphinx中文检索安装配置篇
/coreseek_4.1-sphinx_2.0.1-beta.html#supported-system$tarxzvfsphinx-2.0.1-beta.tar.gz$cdsphinx1.首先安装
MMSeg
linuxblind
·
2013-09-27 10:44
sphinx
中文检索
sphinx中文检索安装配置篇
/coreseek_4.1-sphinx_2.0.1-beta.html#supported-system$tarxzvfsphinx-2.0.1-beta.tar.gz$cdsphinx1.首先安装
MMSeg
linuxblind
·
2013-09-27 10:44
sphinx
中文检索
数据库
提高coreseek的搜索精度
由于coreseek带的
mmseg
默认词库只有1w多个字词,搜索出来的结果准确度不是很理想。
zkaipmoo
·
2013-09-18 17:00
搜索引擎
分词
coreseek
MMSEG
的python实现
原文:http://yongsun.me/2013/06/simple-implementation-of-
mmseg
-with-python/ Since I heard of
MMSEG
san_yun
·
2013-09-06 15:00
python
如何在基于Lucene的中文分词器中添加自定义词典(如Paoding、
mmseg
4j、IK Analyzer)
阅读更多如何在基于Lucene的中文分词器中添加自定义词典(如Paoding、
mmseg
4j、IKAnalyzer)2013-07-0821:54:29|分类:计算机|字号订阅1.使用Paoding自定义词典参考文章
leiyongping88
·
2013-09-02 12:00
如何在基于Lucene的中文分词器中添加自定义词典(如Paoding、
mmseg
4j、IK Analyzer)
如何在基于Lucene的中文分词器中添加自定义词典(如Paoding、
mmseg
4j、IK Analyzer) 2013-07-08 21:54:29|  
leiyongping88
·
2013-09-02 12:00
Ik Analyzer
为coreseek添加
mmseg
分词
1.准备好需要添加的词表,一般都是每行一词,注意要保存为utf-8; 例如: -- 林书豪 -- 2.利用UltraEdit的查找替换功能,使词表格式符合
mmseg
的要求;
王一丁z
·
2013-09-01 18:00
PHP
分词
coreseek
mmseg
coreseek 生成索引时xmlpipe2 support NOT compiled in. To use xmlpipe2, install missing
阅读更多coreseek生成索引时:$cdtestpack$catvar/test/test.xml#此时应该正确显示中文$/usr/local/
mmseg
3/bin/
mmseg
-d/usr/local
vtrtbb
·
2013-08-28 23:00
coreseek 生成索引时xmlpipe2 support NOT compiled in. To use xmlpipe2, install missing
coreseek 生成索引时: $ cd testpack $ cat var/test/test.xml #此时应该正确显示中文 $ /usr/local/
mmseg
3
vtrtbb
·
2013-08-28 23:00
coreseek
centos6.2安装coreseek4 错误
安装
mmseg
3时出现config.status: error: cannot find input file: src/Makefile.in 于是 下载了一下四个包
vtrtbb
·
2013-08-28 23:00
coreseek
centos6.2安装coreseek4 错误
阅读更多安装
mmseg
3时出现config.status:error:cannotfindinputfile:src/Makefile.in于是下载了一下四个包:$curl-O-Lhttp://mirrors.kernel.org
vtrtbb
·
2013-08-28 23:00
xsplit A PHP extension for Chinese segmentation using
MMSEG
algorithm[zz]
from:https://code.google.com/p/xsplit/一点历史这个project大约是09年初开始做的,很快就形成了现在版本的样子,后陆续做了一些小修改和修复了一些小bug,现整理了一下决定发布。把它opensource的主要原因,就是希望这个小工具能对大家有用,并且能够参与进来一起把它做的更好20101025ChangeLog201305090.0.9releasedfix
xiaomage234
·
2013-08-13 17:00
开源中文检索软件CoreSeek之初体验
国人开发的CoreSeek实际是上基于Sphinx的定制版,使用
mmseg
进行中文分词并实现中文搜索。
kisops
·
2013-08-12 19:00
linux
sphinx
coreseek
higkoo
mmesg
coreseek 与 php mysql 的联合使用
www.coreseek.cn/uploads/csft/3.2/coreseek-3.2.14.tar.gz tarxzvfcoreseek-3.2.14.tar.gz cdcoreseek-3.2.14##安装
mmseg
foxidea
·
2013-08-07 11:00
solr中文分词(
mmseg
4j) 编辑
1、从http://code.google.com/p/
mmseg
4j/下载
mmseg
4j2、在$SOLR_HOME下建立lib和dic两个目录,讲
mmseg
4j-all-1.8.4.jar拷贝到lib
jackjobs
·
2013-07-23 16:00
mmseg4j
solr中文分词(
mmseg
4j) 编辑
1、从http://code.google.com/p/
mmseg
4j/下载
mmseg
4j2、在$SOLR_HOME下建立lib和dic两个目录,讲
mmseg
4j-all-1.8.4.jar拷贝到lib
jackjobs
·
2013-07-23 16:00
mmseg4j
solr中文分词(
mmseg
4j) 编辑
1、从http://code.google.com/p/
mmseg
4j/下载
mmseg
4j2、在$SOLR_HOME下建立lib和dic两个目录,讲
mmseg
4j-all-1.8.4.jar拷贝到lib
jackjobs
·
2013-07-23 16:00
mmseg4j
solr中文分词(
mmseg
4j)
1、从http://code.google.com/p/
mmseg
4j/ 下载
mmseg
4j 2、在$SOLR_HOME下建立lib和dic两个目录,讲
mmseg
4j-all-1.8.4.jar拷贝到
jackjobs
·
2013-07-23 16:00
mmseg4j
solr中文分词(
mmseg
4j)
1、从http://code.google.com/p/
mmseg
4j/ 下载
mmseg
4j 2、在$SOLR_HOME下建立lib和dic两个目录,讲
mmseg
4j-all-1.8.4.jar拷贝到
jackjobs
·
2013-07-23 16:00
mmseg4j
solr中文分词(
mmseg
4j)
1、从http://code.google.com/p/
mmseg
4j/ 下载
mmseg
4j 2、在$SOLR_HOME下建立lib和dic两个目录,讲
mmseg
4j-all-1.8.4.jar拷贝到
jackjobs
·
2013-07-23 16:00
mmseg4j
solr中文分词(
mmseg
4j)
1、从http://code.google.com/p/
mmseg
4j/ 下载
mmseg
4j 2、在$SOLR_HOME下建立lib和dic两个目录,讲
mmseg
4j-all-1.8.4.jar拷贝到
jackjobs
·
2013-07-23 16:00
mmseg4j
solr4.3之配置中文分词
mmseg
4j
前面,笔者已经介绍过solr里面另外2种中文分词的配置,今天就来就简述一下
mmseg
4j在solr4.3里面的配置,
mmseg
4j也是一款很优秀的中文分词器,是用Chih-Hao Tsai 的
MMSeg
qindongliang1922
·
2013-07-19 15:00
Solr
中分分词
mmseg4j
solr4.3之配置中文分词
mmseg
4j
前面,笔者已经介绍过solr里面另外2种中文分词的配置,今天就来就简述一下
mmseg
4j在solr4.3里面的配置,
mmseg
4j也是一款很优秀的中文分词器,是用Chih-Hao Tsai 的
MMSeg
qindongliang1922
·
2013-07-19 15:00
Solr
中分分词
mmseg4j
solr4.3之配置中文分词
mmseg
4j
前面,笔者已经介绍过solr里面另外2种中文分词的配置,今天就来就简述一下
mmseg
4j在solr4.3里面的配置,
mmseg
4j也是一款很优秀的中文分词器,是用Chih-Hao Tsai 的
MMSeg
qindongliang1922
·
2013-07-19 15:00
Solr
中分分词
mmseg4j
solr4.3之配置中文分词
mmseg
4j
前面,笔者已经介绍过solr里面另外2种中文分词的配置,今天就来就简述一下
mmseg
4j在solr4.3里面的配置,
mmseg
4j也是一款很优秀的中文分词器,是用Chih-Hao Tsai 的
MMSeg
qindongliang1922
·
2013-07-19 15:00
Solr
mmseg4j
中分分词
solr4.3之配置中文分词
mmseg
4j
前面,笔者已经介绍过solr里面另外2种中文分词的配置,今天就来就简述一下
mmseg
4j在solr4.3里面的配置,
mmseg
4j也是一款很优秀的中文分词器,是用Chih-Hao Tsai 的
MMSeg
qindongliang1922
·
2013-07-19 15:00
Solr
中分分词
mmseg4j
solr4.3之配置中文分词
mmseg
4j
前面,笔者已经介绍过solr里面另外2种中文分词的配置,今天就来就简述一下
mmseg
4j在solr4.3里面的配置,
mmseg
4j也是一款很优秀的中文分词器,是用Chih-Hao Tsai 的
MMSeg
qindongliang1922
·
2013-07-19 15:00
Solr
中分分词
mmseg4j
sphinx安装报错找不到mysql-devel
/configure�Cprefix=/usr/local/coreseek�Cwithout-unixodbc�Cwith-
mmseg
�Cwith-
mmseg
-includes=/usr/local/
低吟浅唱
·
2013-07-16 16:56
sphinx
coreseek
sphinx安装报错找不到mysql-devel
/configure–prefix=/usr/local/coreseek–without-unixodbc–with-
mmseg
–with-
mmseg
-includes=/usr/local/
mmseg
3
低吟浅唱
·
2013-07-16 16:56
sphinx
coreseek
搜索
10W文本语义查询记录
控制台输出:请输入查询字符串:航母七月08,20133:21:25下午com.chenlb.
mmseg
4j.DictionaryloadDicINFO:charsloadedtime=154ms,line
lskyne
·
2013-07-08 15:00
sphinx安装报错找不到mysql-devel
/configure�Cprefix=/usr/local/coreseek�Cwithout-unixodbc�Cwith-
mmseg
�Cwith-
mmseg
-includes=/usr/local/
低吟浅唱
·
2013-06-20 10:18
sphinx
编译
coreseek
Lucene分词组件盘古与
mmseg
4j评测
Lucene分词组件盘古与
mmseg
4j评测前言.Net下分词组件选择不多,最近看到宝玉发布了改进版本的
mmseg
分词,正好跟使用已久的盘古分词做个对比。
·
2013-06-07 21:00
Lucene
分词
盘古
Lucene分词组件盘古与
mmseg
4j评测
前言.Net下分词组件选择不多,最近看到宝玉发布了改进版本的
mmseg
分词,正好跟使用已久的盘古分词做个对比。
·
2013-06-07 11:00
mmseg4j
solr3.5同时配置paoding,IKAnalyzer,
mmseg
4j三种分词器词库
先下载三种不同版本的分词器
mmseg
4j-1.8.5.zip; IKAnalyzer3.2.8 bin.zip paoding-analysis-2.0.4-beta.zip solr版本:3.5
ren00317574
·
2013-05-31 17:00
Solr
MMSEG
分词算法
MMSEG
是中文分词中一个常见的、基于词典的分词算法(作者主页:http://chtsai.org/index_tw.html),简单、效果相对较好。
stormbjm
·
2013-05-30 17:00
让盘古分词支持最新的Lucene.Net 3.0.3
让盘古分词支持最新的Lucene.Net3.0.3好多年没升级过的Lucene.Net最近居然升级了,到了3.0.3后接口发生了很大变化,原来好多分词库都不能用了,所以上次我把
MMSeg
给修改了一下支持了
·
2013-05-27 22:00
Lucene
上一页
10
11
12
13
14
15
16
17
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他