E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
ansj
solrcloud和zookeeper的搭建、使用、心得、教训
搜索准确度已经通过改用
ansj
分词器和不断优化的个人词库和停用词库来解决,这是个不断优化的过程,需要长时间的跟进才有明显效果。第二个数据同步问题,其实包括了快捷新建搜索core、搜索性能负
·
2015-11-12 20:40
zookeeper
IK,
ansj
,mmseg4j分词性能比较
下载ik最新版本:IKAnalyer2012-FFhotfix1完整分发包这个版本是支持lucene4的.其主页为:https://code.google.com/p/ik-analyzer/下载
ansj
m635674608
·
2015-11-12 15:00
【工具类】Android获得手机信息
是否有可用数据链接8.当前的数据链接类型9.手机剩余内存10.手机总内存11.手机CPU型号12.手机名称13.手机型号14.手机设备制造商名称 View Code package com.r
ansj
.tool
·
2015-11-08 09:04
android
中文分词器性能比较
摘要:本篇是本人在Solr的基础上,配置了中文分词器,并对其进行的性能测试总结,具体包括使用mmseg4j、IKAnalyzer、
Ansj
,分别从创建索引效果、创建索引性能、数据搜索效率等方面进行衡量。
m635674608
·
2015-11-07 12:00
Elasticsearch- 分词查询
curl命令查看:1.使用自定义的分析器查看分词:
ansj
_index_synonym:自定交分析器名称. pretty:json格式显示 [plain] viewplaincopy curl -XGET
m635674608
·
2015-11-07 12:00
如何解包/编辑/打包boot.img文件
感谢本文的作者:Al
ansj
, DarkriftX, RyeBrye, Will, Try OP9, Tonyb486, Timmmm, Lxrose还有好多不知名的作者们在wiki上的不懈努力。
·
2015-11-06 08:50
Boot
elasticsearch 批量入库bulk性能测试
1万条数据 分词器 时间es默认分词器 1秒多ik 60秒左右mmseg 1秒多
ansj
m635674608
·
2015-11-04 22:00
Servlet学习
JSP+JavaBe
ansJ
SP+JavaBeans+Servlet Servlet工作原理:Servlet由支持Servlet的服务器:Servlet引擎,负责管理运行。
·
2015-11-02 18:51
servlet
JAVA游戏编程学习笔记(一)
了解Java编程的基础(变量、数据类型、条件及循环等基础知识),了解一些类及面向对象编程的基础,知道JavaswingJFrame等GUI类下的一些属性及方法,熟悉eclipse或NetBe
ansJ
avaIDE
J_sky
·
2015-11-01 21:00
java
game
[分词]Java开源中文分词器
ANSJ
_SEG初次试用
ICTCLAS2014),NLPIR的教程在[分词]NLPIR/ICTCLAS2014分词系统的C++ API 在Windows下初次使用,但是直观上感觉分词效果不怎么理想,所以就选用了另一个工具,同学推荐我用一下
ANSJ
·
2015-10-27 11:26
开源中文分词
joda-time介绍
Joda项目包括:Joda-Time-BasictypesforDateandTimeJoda-Money-BasictypesforMoneyJoda-Beans-NextgenerationJavaBe
ansJ
oda-Convert-StringtoObjectconversionJoda-Collect-Additionalcollectiondatastructures
jxplus
·
2015-10-23 10:00
java
Joda
joda-time
中文分词器性能比较
摘要: 本篇是本人在Solr 的基础上,配置了中文分词器, 并对其进行的性能测试总结,具体包括 使用mmseg4j、IKAnalyzer、
Ansj
,分别从创建索引效果
·
2015-10-21 11:15
中文分词器
注解式springMVC的demo
RELEASE首先maven中加入spring依赖: UTF-8 org.springframework 3.0.5.RELEASE mvn-repo http://maven.
ansj
.org
charsli
·
2015-09-14 20:00
IK,
ansj
,mmseg4j分词性能比较
http://www.chepoo.com/ik-
ansj
-mmseg4j-segmentation-performance-comparison.html
nysyxxg
·
2015-08-05 17:00
【Java】利用
Ansj
中文分词工具对段落进行切词
对于切词确实是一个复杂的功能,足以写上好几篇论文,但是如果仅仅想对一个句子、一个段落、一篇文章进行切词,可以利用中国自然语言开源组织中各位大牛写好的工具。已经打包成jar包,可以直接调用了,无须自己再考虑复杂的算法。当然这种切词是对于自然语言的,对于一些有规律的字符串,请自行利用indexOf、substring、split的各类Java自带函数,没有使用额外java包的必要。首先假如有如下的一个
yongh701
·
2015-08-04 09:33
Java
【Java】利用
Ansj
中文分词工具对段落进行切词
对于切词确实是一个复杂的功能,足以写上好几篇论文,但是如果仅仅想对一个句子、一个段落、一篇文章进行切词,可以利用中国自然语言开源组织中各位大牛写好的工具。已经打包成jar包,可以直接调用了,无须自己再考虑复杂的算法。当然这种切词是对于自然语言的,对于一些有规律的字符串,请自行利用indexOf、substring、split的各类Java自带函数,没有使用额外java包的必要。首先假如有如下的一个
yongh701
·
2015-08-04 09:00
java
分词
切词
语义分析
词语分析
天亮舆情系统-架构设计-01
2、系统模块组成2.1采集模块:垂直采集器:天亮微博采集器,天亮电商平台采集器通用网页采集器:天亮舆情采集器2.2分析与挖掘中文分词器:天亮中文分词,
ansj
中文分词主题词提取:基于天亮分词实现的theme_extractor
周天亮
·
2015-08-02 17:22
天亮舆情系统
天亮舆情系统-架构设计-01
系统模块组成 2.1采集模块:垂直采集器:天亮微博采集器,天亮电商平台采集器通用网页采集器:天亮舆情采集器 2.2分析与挖掘 中文分词器:天亮中文分词,
ansj
erliang20088
·
2015-08-02 17:00
java
大数据
采集器
网络舆情系统
天亮舆情系统
solr的全量索引
紧接上篇
ansj
分词整合后,开始需要做索引。索引分增量和全量,可以直接连接数据库去做,也可以通过程序去做,以下实现连接数据库去做,相对来说比较简单。
jinxinwei
·
2015-07-27 23:00
Solr
ansj
词典加载及简要分词过程
阅读更多粗略看了点
ansj
源代码,记录备忘。
goofyan
·
2015-07-03 09:00
ansj
分词
ansj
词典加载及简要分词过程
粗略看了点
ansj
源代码,记录备忘。
goofyan
·
2015-07-03 09:00
分词
ansj
ansj
词典加载及简要分词过程
阅读更多粗略看了点
ansj
源代码,记录备忘。
goofyan
·
2015-07-03 09:00
ansj
分词
跟益达学Solr5之使用
Ansj
分词器
基于上篇博客,我们知道了在Solr中配置分词器有两种方式,一种是直接配置分词器类,比如: 一种是配置TokenizerFactory类,由于SolrAPI中并没有内置类似IK,
Ansj
这样的中文分词器的
lxwt909
·
2015-06-19 13:00
Solr
ansj
跟益达学Solr5之使用
Ansj
分词器
基于上篇博客,我们知道了在Solr中配置分词器有两种方式,一种是直接配置分词器类,比如: 一种是配置TokenizerFactory类,由于SolrAPI中并没有内置类似IK,
Ansj
这样的中文分词器的
lxwt909
·
2015-06-19 13:00
Solr
ansj
jmxtrans安装使用
判断是否已安装此软件#rpm -qa |grep jmx#卸载软件#rpm -e jmxXXXXXX#安装jmxtransrpm -ivh说明:jmxtrans安装目录:/usr/share/jmxtr
ansj
mxtrans
tjbklx33
·
2015-05-24 19:36
安装使用
jmxtrans
监控报警
elasticsearch1.2.1集成
ansj
中文分词
主要参考的这篇博文https://github.com/4onni/elasticsearch-analysis-
ansj
,和与
ansj
分词作者孙建,以及“群名称是elasticsearch交流2,群号为
erliang20088
·
2015-05-17 17:00
elasticsearch
互联网
大数据
云计算
SkyLightAnalyzer(天亮分词器)小结
一直以来想写个自己的中文分词器,从2013年5月份写了基于二分插入、双数组算法实现的中文粗分词,之后由于各种原因未能进一步完善达到一个标准分词器的水准,自上周从公司离职后,历经一周的努力,并在
ansj
erliang20088
·
2015-05-17 16:00
java
算法
中文分词器
cws_evaluation v1.1 发布,中文分词器分词效果评估对比
分别是:word分词器、
ansj
分词器、mmseg4j分词器、ik-analyzer分词器、jcseg分词器、fudannlp分词器、smartcn分词器、jieba分词器、stanford分词器。
yangshangchuan
·
2015-05-12 10:00
word分词器
中文分词器
cws_evaluation
分词效果评估
分词效果对比
cws_evaluation v1.1 发布,中文分词器分词效果评估对比
分别是:word分词器、
ansj
分词器、mmseg4j分词器、ik-analyzer分词器、jcseg分词器、fudannlp分词器、smartcn分词器、jieba分词器、stanford分词器。
yangshangchuan
·
2015-05-12 10:00
word分词器
中文分词器
cws_evaluation
分词效果评估
分词效果对比
cws_evaluation v1.1 发布,中文分词器分词效果评估对比
分别是:word分词器、
ansj
分词器、mmseg4j分词器、ik-analyzer分词器、jcseg分词器、fudannlp分词器、smartcn分词器、jieba分词器、stanford分词器。
yangshangchuan
·
2015-05-12 10:00
word分词器
中文分词器
cws_evaluation
分词效果对比
分词效果评估
cws_evaluation v1.1 发布,中文分词器分词效果评估对比
分别是:word分词器、
ansj
分词器、mmseg4j分词器、ik-analyzer分词器、jcseg分词器、fudannlp分词器、smartcn分词器、jieba分词器、stanford分词器。
yangshangchuan
·
2015-05-12 10:00
word分词器
中文分词器
分词效果对比
cws_evaluation
分词效果评估
cws_evaluation v1.1 发布,中文分词器分词效果评估对比
分别是:word分词器、
ansj
分词器、mmseg4j分词器、ik-analyzer分词器、jcseg分词器、fudannlp分词器、smartcn分词器、jieba分词器、stanford分词器。
杨尚川
·
2015-05-12 10:00
word分词器
中文分词器
分词效果评估
分词效果对比
cws_evaluation
Solr分词器大补贴:mlcsseg
1.设计Java系的中文分词挺多了,ik,paoding,mmseg4j,ictclas4j,
ansj
等等,目前选取实现的是ik和
ansj
。将分词器扩展到solr易用模式
meng_philip
·
2015-05-06 16:11
solr
分词器
solr
Solr分词器大补贴:mlcsseg
1.设计 Java系的中文分词挺多了,ik,paoding,mmseg4j,ictclas4j,
ansj
等等,目前选取实现的是ik和
ansj
。将分词器扩展
meng_philip
·
2015-05-06 16:11
Solr
分词器
Lucene5学习之使用
Ansj
-seg分词器
这回我们来玩玩
ansj
分词器,由于Lucene5.0在API上有点小变化,需要修改
ansj
分词器源码,重新打包jar包,然后mvninstall到本地仓库才能引用到项目中。
lxwt909
·
2015-03-19 15:00
Lucene
ansj
spseg-基于词库的高召回索引型分词器
通常进行索引的分词器都是基于词库的,目前主流的分词器ik,
ansj
,mmseg,jieba等等都是。这些分词器都提供了智能分词效果,是把句子切成不产生交集的词与字,也就是消除了歧义。
lgnlgn
·
2015-02-25 00:00
分词
spseg
分词一致性
Java代码质量检测评估工具-PMD
PMD下载地址:http://sourceforge.net/projects/pmd/可以在线安装也可以下载下来解压到eclipse下有feature和plugin 简介:PMDsc
ansJ
avasourcecodeandlooksforpotentialproblemslike
ajan
·
2015-02-03 19:13
ES1.4 中文分词插件ik
所以为了这个需求,找一个第三方的中文分词插件.看了一下,国内有几款中分分词插件:ik、
ansj
和mmseg。最后我选择使用了ik。 ES1.4下安装ik,碰到了不少坑。最后终于搞定,所以分享一下i
david_bj
·
2015-01-15 15:00
IK
es
ES1.4 中文分词插件ik
所以为了这个需求,找一个第三方的中文分词插件.看了一下,国内有几款中分分词插件:ik、
ansj
和mmseg。最后我选择使用了ik。ES1.4下安装ik,碰到了不少坑。
david_bj
·
2015-01-15 15:00
ES
IK
Elasticsearch
ES1.4 中文分词插件ik
所以为了这个需求,找一个第三方的中文分词插件.看了一下,国内有几款中分分词插件:ik、
ansj
和mmseg。最后我选择使用了ik。 ES1.4下安装ik,碰到了不少坑。最后终于搞定,所以分享一下i
david_bj
·
2015-01-15 15:00
IK
es
IKanalyzer、
ansj
_seg、jcseg三种中文分词器的实战较量
选手:IKanalyzer、
ansj
_seg、jcseg 硬件:i5-3470 3.2GHz 8GB win7 x64 比赛项目:1、搜索;2、自然语言分析 选手介绍:
lies_joker
·
2015-01-06 13:00
Solr
IKAnalyzer
分词
ansj_seg
jcseg
IKanalyzer、
ansj
_seg、jcseg三种中文分词器的实战较量
阅读更多选手:IKanalyzer、
ansj
_seg、jcseg硬件:i5-34703.2GHz8GBwin7x64比赛项目:1、搜索;2、自然语言分析选手介绍:1,IKanalyzerIKanalyzer
lies_joker
·
2015-01-06 13:00
IKanalyzer
ansj_seg
分词
jcseg
solr
IKanalyzer、
ansj
_seg、jcseg三种中文分词器的实战较量
阅读更多选手:IKanalyzer、
ansj
_seg、jcseg硬件:i5-34703.2GHz8GBwin7x64比赛项目:1、搜索;2、自然语言分析选手介绍:1,IKanalyzerIKanalyzer
lies_joker
·
2015-01-06 13:00
IKanalyzer
ansj_seg
分词
jcseg
solr
netbeans jdkhome 启动问题
netbe
ansj
dkhome启动问题:找不到JDK解决方法之一:建立一个WINDOWS快捷件如下:在后面加入jdkhome 路径如: --jdkhome"C:\ProgramFiles\Java\jdk1.8.0
bigtree_3721
·
2014-12-26 15:00
java
Netbeans
jdkhom
ansj
_seg源码分析之用户自定义词性覆盖系统原有词性
废话不多说,直接上代码: packageorg.
ansj
.demo; importjava.io.IOException; importjava.util.List; importorg.
ansj
.domain.Term
yucang52555
·
2014-12-12 15:00
分词
ansj
词库
用户自定义
词性标注
ansj
_seg源码分析之用户自定义词性覆盖系统原有词性
废话不多说,直接上代码:packageorg.
ansj
.demo;importjava.io.IOException;importjava.util.List;importorg.
ansj
.domain.Term
yucang52555
·
2014-12-12 15:00
ansj
词性标注
用户自定义
分词
词库
TreeSet排序
今天查阅
ansj
源码是看到权重这里: private List<Keyword> computeArticleTfidf(String
yucang52555
·
2014-12-11 11:00
java基础
排序
TreeSet
TreeSet排序
阅读更多今天查阅
ansj
源码是看到权重这里:privateListcomputeArticleTfidf(Stringcontent,inttitleLength){Maptm=newHashMap()
yucang52555
·
2014-12-11 11:00
java基础
treeSet
排序
set排序
ansj
_seg源码分析之用户自定义词库
最近,工作上用到中文分词
ansj
,先前我是整合到ES里面,但是觉得这样不利于源码分析,所以我们先把源码部署起来: 在线演示:[url]http://
ansj
.sdapp.cn/demo/seg.jsp
yucang52555
·
2014-12-10 14:00
java
开源
中文分词
自定义词库
ansj源码
ansj
_seg源码分析之用户自定义词库
阅读更多最近,工作上用到中文分词
ansj
,先前我是整合到ES里面,但是觉得这样不利于源码分析,所以我们先把源码部署起来:在线演示:[url]http://
ansj
.sdapp.cn/demo/seg.jsp
yucang52555
·
2014-12-10 14:00
中文分词
ansj源码
自定义词库
开源
java
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他