E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
mmseg
Solr 5.x的搭建(Solr自带的Jetty Server)与
mmseg
4j中文分词
阅读更多前言:如果你对Solr怎么和Tomcat集成以及如何使用
mmseg
4j和自定义的词库丰富完善中文分词,可以参照我的其它与Solr相关的博客。
Josh_Persistence
·
2015-10-17 19:00
Solr5.x
Solr5
中文分词
mmseg4j
搜狗词库
Solr 5.x的搭建(Solr自带的Jetty Server)与
mmseg
4j中文分词
阅读更多前言:如果你对Solr怎么和Tomcat集成以及如何使用
mmseg
4j和自定义的词库丰富完善中文分词,可以参照我的其它与Solr相关的博客。
Josh_Persistence
·
2015-10-17 19:00
Solr5.x
Solr5
中文分词
mmseg4j
搜狗词库
MMSEG
中文分词
文章目标本文旨在描述
MMSEG
中文分词算法核心设计概念,简要介绍中文分词实现方式(基于语法,基于词典,基于统计)。适用于对中文分词感兴趣的入门读者。
lzzy_alex
·
2015-10-06 18:00
Slor5.x与
mmseg
4j的集成【使用solr自带的Jetty Server】
一、
mmseg
4j对Solr5.x的支持必须使用
mmseg
4j-2.0以上的版本,本例中我使用的是
mmseg
4jsolr2.3.0,使用的solr是截止目前为止的solr5.3.1,可下载附件,注意Solr
Josh_Persistence
·
2015-10-04 11:00
Solr
mmseg4j
5.x
hibernate search -- 中文词法分析
hibernatesearch底层使用Lucene,所以Lucene可以使用的中文分词,hibernatesearch都可以用来支持中文词法分析,比较常用的词法分析器包括paoding,IKAnalyzer,
mmseg
4j
开心的D哥
·
2015-09-28 15:42
Java
Java
Web
lucene整合中文分词器
mmseg
4j和高亮highlighter
最近在研究lucene,其实很简单,可以整合中文分词器
mmseg
4j时,总是会报一些异常,这主要是版本兼容问题,在此做一个记录环境:lucene:4.3.1
mmseg
4j:1.9.1主要jar包,如下图
grhlove123
·
2015-09-17 16:00
elasticsearch中文分词集成
elasticsearch官方只提供smartcn这个中文分词插件,效果不是很好,好在国内有medcl大神(国内最早研究es的人之一)写的两个中文分词插件,一个是ik的,一个是
mmseg
的,下面分别介绍下两者的用法
Horsemen
·
2015-09-17 09:00
ElasticSearch安装ik分词插件
对于索引可能最关系的就是分词了一般对于es来说默认的smartcn 但效果不是很好 一个是ik的,一个是
mmseg
的,下面分别介绍下两者的用法,其实都差不多的,先安装插件,命令行:安装ik插件plugin-installmedcl
m635674608
·
2015-08-07 04:00
elasticsearch
IK,ansj,
mmseg
4j分词性能比较
http://www.chepoo.com/ik-ansj-
mmseg
4j-segmentation-performance-comparison.html
nysyxxg
·
2015-08-05 17:00
python: 中文分词器py
mmseg
的编译安装
在使用libsvm的时候,缺少各种依赖,首先是libsvm.dll自带的是32位,只好找64的,在http://www.lfd.uci.edu/~gohlke/pythonlibs/#libsvm下载了64位的dll,然后又缺少了libiomp5md.dll在这个http://cn.dll-files.com/libiomp5md.dll.html下载了,在运行train.py的时候,仍然报错,又
u013652219
·
2015-07-29 17:00
python
pymmseg
使用搜狗词库制作
mmseg
自定义词典
使用搜狗词库制作
mmseg
自定义词典http://blog.atime.me/note/
mmseg
-custom-dict.html#content-heading总结使用搜狗词库制作
mmseg
词典的方法和步骤
hani1990
·
2015-07-26 16:04
Solr之SolrCloud配置
mmseg
4j同义词
前提,已经安装配置好Tomcat与Solr,并且配置好
mmseg
4j中文分词。
tianwei7518
·
2015-07-02 22:00
Solr
Lucene
全文检索
Solr之中文分词
针对Solr的分词器比较多,其中最常用的的两个是
mmseg
4j和ik-analyzer,使用都很方便,关于分成器的比较参考:与Lucene4.10配合的中文分词比较,ik-analyzer最新版本IKAnalyzer2012FF_u1
tianwei7518
·
2015-07-02 21:00
Lucene
Solr
全文检索
coreseek(sphinx)全文检索
一、安装(前提安装好LAMP)1、下载解压coreseektar-zxvfcoreseek-3.2.14.tar.gz2、先安装
mmseg
中文分词cdcoreseek-3.2.14/mmes
mlx212
·
2015-06-29 10:00
Solr5.2.1搜索服务部署——检索多字段
目录tomcat安装solr安装整合
mmseg
4j2.3.0关联mysql增量索引检索多字段article表中有title,content,username字段,通过搜索词检索,只要这3个字段中包含搜索词就匹配出来
v_小宝
·
2015-06-26 16:00
Solr
Solr5.2.1搜索服务部署——检索多字段
目录tomcat安装solr安装整合
mmseg
4j2.3.0关联mysql增量索引检索多字段article表中有title,content,username字段,通过搜索词检索,只要这3个字段中包含搜索词就匹配出来
v_小宝
·
2015-06-26 16:00
Solr
Solr5.2.1搜索服务部署——增量索引
目录tomcat安装solr安装整合
mmseg
4j2.3.0关联mysql增量索引检索多字段Solr会记录最后一次做增量索引的时间(dih.last_index_time),类型为datetime在全量索引
v_小宝
·
2015-06-26 16:00
Solr
Solr5.2.1搜索服务部署——增量索引
目录tomcat安装solr安装整合
mmseg
4j2.3.0关联mysql增量索引检索多字段Solr会记录最后一次做增量索引的时间(dih.last_index_time),类型为datetime在全量索引
v_小宝
·
2015-06-26 16:00
Solr
Solr5.2.1搜索服务部署——关联mysql
目录tomcat安装solr安装整合
mmseg
4j2.3.0关联mysql增量索引检索多字段1.软件版本Solr5.2.1MySQL5.1.532.配置过程 2.1关联数据库 # vim /usr/
v_小宝
·
2015-06-26 16:00
mysql
Solr
Solr5.2.1搜索服务部署——关联mysql
目录tomcat安装solr安装整合
mmseg
4j2.3.0关联mysql增量索引检索多字段1.软件版本Solr5.2.1MySQL5.1.532.配置过程 2.1关联数据库 # vim /usr/
v_小宝
·
2015-06-26 16:00
mysql
Solr
Solr5.2.1搜索服务部署——整合
mmseg
4j2.3.0
目录tomcat安装solr安装整合
mmseg
4j2.3.0关联mysql增量索引检索多字段1.软件版本Solr5.2.1
mmseg
4j2.3.02.
mmseg
4j配置 下载地址http://pan.baidu.com
v_小宝
·
2015-06-26 15:00
Solr5.2.1搜索服务部署——整合
mmseg
4j2.3.0
目录tomcat安装solr安装整合
mmseg
4j2.3.0关联mysql增量索引检索多字段1.软件版本Solr5.2.1
mmseg
4j2.3.02.
mmseg
4j配置 下载地址http://pan.baidu.com
v_小宝
·
2015-06-26 15:00
Solr5.2.1搜索服务部署——solr安装
目录tomcat安装solr安装整合
mmseg
4j2.3.0关联mysql增量索引检索多字段1.软件版本Solr5.2.12.安装Solr# wget http://apache.fayea.com/lucene
v_小宝
·
2015-06-26 15:00
Solr
Solr5.2.1搜索服务部署——solr安装
目录tomcat安装solr安装整合
mmseg
4j2.3.0关联mysql增量索引检索多字段1.软件版本Solr5.2.12.安装Solr# wget http://apache.fayea.com/lucene
v_小宝
·
2015-06-26 15:00
Solr
Solr5.2.1搜索服务部署——tomcat安装
目录tomcat安装solr安装整合
mmseg
4j2.3.0关联mysql增量索引检索多字段1.软件版本Tomcat8.0.232.安装Tomcat 2.1 卸载旧版java 检查是否已安装
v_小宝
·
2015-06-26 15:00
tomcat
Solr
Solr5.2.1搜索服务部署——tomcat安装
目录tomcat安装solr安装整合
mmseg
4j2.3.0关联mysql增量索引检索多字段1.软件版本Tomcat8.0.232.安装Tomcat 2.1 卸载旧版java 检查是否已安装
v_小宝
·
2015-06-26 15:00
tomcat
Solr
Lucene简单搜索引擎模拟
mmseg
4j:中文分词htmlparser:html解析mavenpom: 5.2.1 org.apache.lucene lucene-core ${lucene.version} org.apache.lucene
tianwei7518
·
2015-06-23 16:00
Lucene
全文检索
与Lucene 4.10配合的中文分词比较
mmseg
4j:最新版已从 https://code.google
tianwei7518
·
2015-06-23 16:00
Lucene
全文检索
Lucene中文分词
mmseg
4j
mmseg
4j用Chih-HaoTsai的
MMSeg
算法实现的中文分词器,并实现lucene的analyzer和solr的TokenizerFactory以方便在Lucene和Solr中使用。
tianwei7518
·
2015-06-23 16:00
Lucene
全文检索
Lucene中文分词Jcseg
Jcseg是使用Java开发的一款开源的中文分词器,基于流行的
mmseg
算法实现,分词准确率高达98.4%,支持中文人名识别,同义词匹配,停止词过滤等。
tianwei7518
·
2015-06-23 16:00
Lucene
全文检索
跟益达学Solr5之使用
MMSeg
4J分词器
要想在Sor中使用
MMSeg
4J分词器,首先你需要自定义一个TokenizerFactory实现类,虽然直接配置Analyzer类也可以,但那样无法配置Analyzer构造函数的参数,不够灵活,
lxwt909
·
2015-06-22 17:00
Solr
mmseg4j
跟益达学Solr5之使用
MMSeg
4J分词器
要想在Sor中使用
MMSeg
4J分词器,首先你需要自定义一个TokenizerFactory实现类,虽然直接配置Analyzer类也可以,但那样无法配置Analyzer构造函数的参数,不够灵活,
lxwt909
·
2015-06-22 17:00
Solr
mmseg4j
CentOS7下安装coreseek
www.coreseek.cn/uploads/csft/3.2/coreseek-3.2.14.tar.gztarxzvfcoreseek-3.2.14.tar.gzcdcoreseek-3.2.14cd
mmseg
huang_he_87
·
2015-06-15 21:39
linux
sphinx
coreseek
CentOS7下安装coreseek
www.coreseek.cn/uploads/csft/3.2/coreseek-3.2.14.tar.gztarxzvfcoreseek-3.2.14.tar.gzcdcoreseek-3.2.14cd
mmseg
huang_he_87
·
2015-06-15 21:39
linux
sphinx
coreseek
文本分词方法
废话不多说,我就直接上干货吧,从过去到现在所知道的分词方法有以下几种:1、
mmseg
4j2、词频分组(有序文本足够)3、jieba分词下面细说一下几种分词方法,第一种,
mmseg
4j,我使用这种方法是以
成伟
·
2015-05-26 18:46
其它技术文章
cws_evaluation v1.1 发布,中文分词器分词效果评估对比
分别是:word分词器、ansj分词器、
mmseg
4j分词器、ik-analyzer分词器、jcseg分词器、fudannlp分词器、smartcn分词器、jieba分词器、stanford分词器。
yangshangchuan
·
2015-05-12 10:00
word分词器
中文分词器
cws_evaluation
分词效果评估
分词效果对比
cws_evaluation v1.1 发布,中文分词器分词效果评估对比
分别是:word分词器、ansj分词器、
mmseg
4j分词器、ik-analyzer分词器、jcseg分词器、fudannlp分词器、smartcn分词器、jieba分词器、stanford分词器。
yangshangchuan
·
2015-05-12 10:00
word分词器
中文分词器
cws_evaluation
分词效果评估
分词效果对比
cws_evaluation v1.1 发布,中文分词器分词效果评估对比
分别是:word分词器、ansj分词器、
mmseg
4j分词器、ik-analyzer分词器、jcseg分词器、fudannlp分词器、smartcn分词器、jieba分词器、stanford分词器。
yangshangchuan
·
2015-05-12 10:00
word分词器
中文分词器
cws_evaluation
分词效果对比
分词效果评估
cws_evaluation v1.1 发布,中文分词器分词效果评估对比
分别是:word分词器、ansj分词器、
mmseg
4j分词器、ik-analyzer分词器、jcseg分词器、fudannlp分词器、smartcn分词器、jieba分词器、stanford分词器。
yangshangchuan
·
2015-05-12 10:00
word分词器
中文分词器
分词效果对比
cws_evaluation
分词效果评估
cws_evaluation v1.1 发布,中文分词器分词效果评估对比
分别是:word分词器、ansj分词器、
mmseg
4j分词器、ik-analyzer分词器、jcseg分词器、fudannlp分词器、smartcn分词器、jieba分词器、stanford分词器。
杨尚川
·
2015-05-12 10:00
word分词器
中文分词器
分词效果评估
分词效果对比
cws_evaluation
Solr分词器大补贴:mlcsseg
1.设计Java系的中文分词挺多了,ik,paoding,
mmseg
4j,ictclas4j,ansj等等,目前选取实现的是ik和ansj。将分词器扩展到solr易用模式
meng_philip
·
2015-05-06 16:11
solr
分词器
solr
Solr分词器大补贴:mlcsseg
1.设计 Java系的中文分词挺多了,ik,paoding,
mmseg
4j,ictclas4j,ansj等等,目前选取实现的是ik和ansj。将分词器扩展
meng_philip
·
2015-05-06 16:11
Solr
分词器
Lucene5学习之使用
MMSeg
4j分词器
MMSeg
4j是一款中文分词器,详细介绍如下: 1、
mmseg
4j用Chih-HaoTsai的
MMSeg
算法(http://technology.chtsai.org/
mmseg
/)实现的中文分词器
lxwt909
·
2015-04-30 15:00
Lucene
mmseg4j
Lucene5学习之使用
MMSeg
4j分词器
MMSeg
4j是一款中文分词器,详细介绍如下: 1、
mmseg
4j用Chih-HaoTsai的
MMSeg
算法(http://technology.chtsai.org/
mmseg
/)实现的中文分词器
lxwt909
·
2015-04-30 15:00
Lucene
mmseg4j
让盘古分词支持最新的Lucene.Net 3.0.3
好多年没升级过的Lucene.Net最近居然升级了,到了3.0.3后接口发生了很大变化,原来好多分词库都不能用了,所以上次我把
MMSeg
给修改了一下支持了Lucene.Net 3.0.3(参考《基于
MMSeg
·
2015-04-30 05:00
Lucene
elasticsearch 笔记
":{\"field\":\"gongqiu.tags\"}}] 配置: 默认搜索和创建索引的分词算法: index.analysis.analyzer.default.type:"
mmseg
zhangcaiyanbeyond
·
2015-04-27 22:00
elasticsearch
Solr 3.5 + Tomcat7 +
mmseg
4j 配置并运行
机器上已安装:Tomcat7 jdk1.7访问http://www.apache.org/dyn/closer.cgi/lucene/solr,在这个网址里选择一个路径,下载solr3.5的版本1、将将解压后的solr中的lucene\apache-solr-3.5.0\example\solr目录下的文件拷贝到要作为服务器的位置,我是放在这个路径下的:D:\luceneData\solr\ho
Victor_Cindy1
·
2015-04-14 14:00
solr配置笔记
研究了好多天的solr终于配置与中文分词软件
mmseg
4j配置成功了,其中碰见了几个坑,坑不大,也比较容易解决,自己还是忽略了。
_lsliang
·
2015-04-07 18:00
Solr
如何采用 coreseek(sphinx) 搭建搜索系统
coreseek实战总结该文章包含以下内容:coreseek的典型架构实时性解决方案
mmseg
分词使用经验同义词使用经验后继目标coreseek的典型架构coreseek的典型结构,就是通过增量索引来满足近似实时性
若水003
·
2015-04-04 17:12
技术共享
PHP+Sphinx中文分词搜索引擎coreseek的安装及测试
详细介绍查看其官网:http://www.coreseek.cn/第一步:先安装
mmseg
wgethttp://www.coreseek.cn/uploads/csf
sakmon
·
2015-03-31 10:00
sphinx
coreseek
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他