E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
ikanalyzer
编写Ansj的Solr插件
http://rainyzz.com/2014/02/02/solr-ansj-plugin.html在一个基于Solr搜索的项目中之前使用的
IKAnalyzer
分词效果不是很好,师兄推荐我用Ansj,
rainystars
·
2014-02-25 00:00
lucene
solr
ansj
solr4.6.1配置ik分词器
接上篇文章windows+tomcat7安装solr4.6.1下载解压
IKAnalyzer
2012FF_hf1(下载列表注意ik的版本,支持不同solr版本,此版本支持lucene4/solr4)。
Bingo许
·
2014-02-16 22:00
ik分词器
solr4.6.1
lucene4.0与
IKAnalyzer
的冲突
在网上下载了lucene当前最新版本4.0,以及
IKAnalyzer
中文分词器的完整发布包。
yiluoAK_47
·
2014-02-13 10:00
【文本分类】中文分词开源软件介绍
从2006年12月推出1.0版开始,
IKAnalyzer
已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKA
jiayanhui2877
·
2014-02-12 16:00
自然语言处理(NLP)常用开源工具总结
1.
IKAnalyzer
IKAnalyzer
是一个开
·
2014-02-07 10:00
自然语言处理
IKAnalyzer
,mmseg4j
7、 往服务中添加索引 String url = "http://localhost:8080/solr-4.4.0"; SolrServer server = new HttpSolrServer(url); &n
linshow26
·
2014-01-19 21:00
IKAnalyzer
[置顶] 【Apache Solr系列】使用
IKAnalyzer
中文分词以及自定义分词字典
之前写的ApacheSolr只介绍了简单的搭建以及导入数据等功能,最近由于项目要求,添加索引分词和搜索分词功能;分词的项目有包括好几个:smartcn、ictclas4j、IK、jeasy、庖丁、mmseg4j;以上几种分词器各有优缺点,根据不同场景可分可定制和不可定制两种:一种是基于中科院ICTCLAS的隐式马尔科夫HMM算法的中文分词器,如smartcn,ictclas4j,优点是分词准确度高
WeiJonathan
·
2014-01-16 15:00
Solr
IKAnalyzer
中文分词器
IK中文分词器简介
从2006年12月推出1.0版开始,
IKAnalyzer
已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。
beijing20120926
·
2014-01-11 13:00
算法
搜索
开源项目
全文检索
分词
文章中提取关键字
lucene-core-3.6.2.jar,lucene-memory-3.6.2.jar, *lucene-highlighter-3.6.2.jar,lucene-analyzers-3.6.2.jar *
IKAnalyzer
2012
awj3584
·
2014-01-08 11:00
lucene全文检索学习记录,附带源码——三种实现,超全超细致
还需要中文分词器
IKAnalyzer
3.2.8.jar,ojdbc14.jar至此环境搭配完成。 下面开始实现,只用lava类,没连接w
leilovege
·
2014-01-03 16:00
Lucene
全文检索
lucene源码
lucene学习记录
Solr4.0+
IKAnalyzer
中文分词安装
有近2年没接触Solr跟Lucene了,这2年自己跟solr/lucene都发生了很多变化。不过有种疏途同归的感觉,那就是都向分布式/云和监控靠了。2年前接触了solrcloud,那时大概玩了一周。那时很想玩cloud,但发现solrcloud并不是具有那种cloud。于是放弃了。现在发现solr4.0貌似集成了以前的solrcloud,通过zookeeper去管理集群。同时监控和运维管理方面也更
·
2013-12-25 23:00
IKAnalyzer
solr4.6.0安装部署以及配置中文分词
IKAnalyzer
阅读更多一定要看Changes.htmlsolr从4.8之后支持jdk只能是1.7以上了。也就是说4.7.2是当前支持jdk1.6的最高版本了。坑了一天时间,就是因为版本不对。一,solr安装部署1,解压tomcat,修改tomcat的端口和编码:apache-tomcat-7.0.47\conf\server.xml2,解压solr,拷贝\solr-4.6.0\dist\solr-4.6.0.w
yq81862
·
2013-12-19 13:00
solr
Lucene
paip.
ikanalyzer
重加载词库的方法.
paip.
ikanalyzer
重加载词库的方法.作者Attilax 艾龙, EMAIL:
[email protected]
来源:attilax的专栏地址:http://blog.csdn.net/attilaxif
attilax
·
2013-12-19 09:00
OSChina 的全文搜索设计说明 —— 索引过程
OSChina使用的是全文搜索的技术,涉及到的开源软件包括Lucene和国产的
IKAnalyzer
。谈到分词,有些人喜欢问,你怎么不用xxx呢?很不好意思
eggbucket
·
2013-12-14 15:00
开源中文分词框架分词效果对比smartcn与
IKanalyzer
一、引言:中文分词一直是自然语言处理的一个痛处,早在08年的时候,就曾经有项目涉及到相关的应用(Lunce构建全文搜索引擎),那时的痛,没想到5年后的今天依然存在,切分效果、扩展支持、业务应用等方面依然不甚理想。收费的版本不提了,原因自不必言表,开源版本中,发现之前曾经活跃的版本,大多已经没落(好几年没更新了),存活下来的寥寥无几。我是一个守旧的人,评估版本的选择有些保守,至少目前为止,只看1.0
zhangziliang09
·
2013-12-09 15:00
开源中文分词框架分词效果对比smartcn与
IKanalyzer
一、引言: 中文分词一直是自然语言处理的一个痛处,早在08年的时候,就曾经有项目涉及到相关的应用(Lunce构建全文搜索引擎),那时的痛,没想到5年后的今天依然存在,切分效果、扩展支持、业务应用等方面依然不甚理想。收费的版本不提了,原因自不必言表,开源版本中,发现之前曾经活跃的版本,大多已经没落(好几年没更新了),存活下来的寥寥无几。我是一个守旧的人,评估版本的选择有些保守,至少目前为止,只
·
2013-12-09 15:00
IKAnalyzer
Maven如何手动添加依赖的jar文件到本地Maven仓库
这里以
IKAnalyzer
.jar包为例进行讲解。1.将
IKAnalyzer
.jar包存放在一个文件夹中,比如mylib文件夹2.打开CMD,进入到mylib文件
liusocg520
·
2013-12-05 15:00
IKAnalyzer
作者林良益访谈实录
关于开源访谈开源访谈是开源中国推出的一系列针对国内优秀开源软件作者的访谈,以文字的方式记录并传播。我们希望开源访谈能全面的展现国内开源软件、开源软件作者的现状,着实推动国内开源软件的应用与发展。【嘉宾简介】林良益 一位资深的Java程序员,多个开源项目的发起者。有11年的程序开发和设计经验。从事过电信,证券,政府,互联网等多个领域的系统开发与设计。现任畅游福州分公司(17173)java系统架构师
likika2012
·
2013-12-03 09:00
Lucene使用
IKAnalyzer
分词实例 及
IKAnalyzer
扩展词库
方案一: 基于配置的词典扩充项目结构图如下:IK分词器还支持通过配置
IKAnalyzer
.cfg.xml文件来扩充您的专有词典。
fengbin2005
·
2013-11-20 16:00
数据结构
Lucene
Lucene使用
IKAnalyzer
分词实例 及
IKAnalyzer
扩展词库
阅读更多方案一:基于配置的词典扩充项目结构图如下:IK分词器还支持通过配置
IKAnalyzer
.cfg.xml文件来扩充您的专有词典。
fengbin2005
·
2013-11-20 16:00
lucene
数据结构
IKAnalyzer
中文分词器简介
类文档:http://tool.oschina.net/uploads/apidocs/
ikanalyzer
/index.html?
zeq9069
·
2013-11-18 19:00
Lucene
IKAnalyzer
中文分词器
Solr添加IKAnalysis中文分词
1.下载中文分词器
IKAnalyzer
地址:http://code.google.com/p/ik-analyzer/downloads/list 2.修改schema.xml文件,加入以下配置:
kobe_hz
·
2013-11-18 10:00
Solr
IKAnalyzer
中文分词
paip.禁用
IKAnalyzer
的默认词库.仅仅使用自定义词库.
paip.禁用
IKAnalyzer
的默认词库.仅仅使用自定义词库.
·
2013-11-14 20:00
IKAnalyzer
自然语言处理(NLP)常用开源工具总结----不定期更新
从2006.12推出1.0版本开始,
IKAnalyzer
已经推出了多个版本,当前最新版本为2012u6,最
yunzhongfeiniao
·
2013-11-14 20:00
自然语言处理
NLP
开源工具
利用Lucene给网站、系统增加搜索功能
本篇用到的技术:Lucene 3.0.2 ,
IKAnalyzer
3.2.5search.properties主要是配置搜索的信息,内容: &
du_bo
·
2013-11-08 22:00
Lucene
IKAnalyzer
.cfg.xml为
IKAnalyzer
的配置文件
Key为ext_stopwords为停止词所在的位置。 Key为ext_dict为配置自己的扩展字典所在的位置。如图所示可以在mydict.dic中添加自己所需要的词。如:”传智播客” 添加完以后分词器分”“传智播客的本拉登被击毙了”结果为: 传智播客、本拉登、拉登、击毙Analyzeranalyzer4=newIKAnalyzer();基本上可以把词分出来(经常用的分词器)
lifei128
·
2013-11-07 15:00
Lucene检索索引
java.io.IOException; import java.util.HashMap; import java.util.Map; import org.wltea.analyzer.lucene.
IKAnalyzer
javafu
·
2013-10-28 21:00
Lucene
IKAnalyzer
基于Lucene4.2 的开发案例
基于
IKAnalyzer
的lucene案例 用于4.2版本的lucenepackagetest;importjava.io.File;importjava.io.IOException;importorg.apache.lucene.analysis.Analyzer
zhuhongming123
·
2013-10-22 16:00
Lucene
IKAnalyzer
lucene4.2
读
IKAnalyzer
源码之IK启动
阅读更多
IKAnalyzer
非常流行的中文分词器,对中文切词有兴趣的朋友可以看看。基本所有的框架都分两部分,一是:框架的初始化,也就是框架启动;二是:调用框架,让框架为我们做一些事。
破晓初
·
2013-10-13 00:00
lucene分词器
中文分词
分词器
读
IKAnalyzer
源码之IK启动
阅读更多
IKAnalyzer
非常流行的中文分词器,对中文切词有兴趣的朋友可以看看。基本所有的框架都分两部分,一是:框架的初始化,也就是框架启动;二是:调用框架,让框架为我们做一些事。
破晓初
·
2013-10-13 00:00
lucene分词器
中文分词
分词器
Solr4:加入中文分词
IKAnalyzer
2012 FF
前提是已经在Tomcat7下面配置好Solr4.0,详情参考:Solr4:Tomcat7下面配置Solr注意:Solr4.0需要
IKanalyzer
2012FF以上版本。
lalanicer
·
2013-10-09 16:00
IKAnalyzer
使用
IKAnalyzer
进行中文分词
在不需要标注词性的情况下,
IKAnalyzer
这个工具能实现较好的分词效果。
Felven
·
2013-09-26 14:20
Felven在职场
solr 4.4 安装
IKAnalyzer
1、下载
IKAnalyzer
2012FF_hf1.zip https://ik-analyzer.googlecode.com/files/IK%20Analyzer%202012FF_hf1.zip解压
u011310328
·
2013-09-24 10:00
Solr
solr4整合ikanalyze
1.增加
IKAnalyzer
2012FF_u1.jar包.
fengbin2005
·
2013-09-22 11:00
swing版网络网络知识库1.0 .1源码
swing版网络网络知识库1.0 测试版 使用到的相关开源项目: lucene4.3.1,mybatis3.1.1,spring3.2.4,
IKAnalyzer
2012FF 主要目标: 1:通过此工具快速高效管理自己平时积累的知识
javacoo
·
2013-09-12 21:00
spring
swing
Lucene
Drupal 中文切面搜索 - Search API + Facet API + Apache Solr +
IKAnalyzer
Drupal7可以处理简单的中文搜索,如果你需要一个更灵活的搜索功能,想要更高的效率与更准确的搜索结果,可以试试 search_api + facetapi + search_api_solr +
IKAnalyzer
wbj0110
·
2013-09-05 09:00
apache
api
api
搜索引擎
Lucene
Solr
Solr
search
IKAnalyzer
+
+
+
facet
-
drupal
drupal
中文切面搜索
Drupal 中文切面搜索 - Search API + Facet API + Apache Solr +
IKAnalyzer
Drupal7可以处理简单的中文搜索,如果你需要一个更灵活的搜索功能,想要更高的效率与更准确的搜索结果,可以试试 search_api + facetapi + search_api_solr +
IKAnalyzer
wbj0110
·
2013-09-05 09:00
apache
api
api
搜索引擎
Lucene
Solr
Solr
search
IKAnalyzer
+
+
+
facet
-
drupal
drupal
中文切面搜索
Drupal 中文切面搜索 - Search API + Facet API + Apache Solr +
IKAnalyzer
Drupal7可以处理简单的中文搜索,如果你需要一个更灵活的搜索功能,想要更高的效率与更准确的搜索结果,可以试试 search_api + facetapi + search_api_solr +
IKAnalyzer
wbj0110
·
2013-09-05 09:00
apache
api
搜索引擎
api
Lucene
Solr
Solr
search
IKAnalyzer
+
+
+
facet
-
drupal
drupal
中文切面搜索
改写
IKAnalyzer
分词器
ik4solr4.3solr4.3的ik分词器([https://github.com/lgnlgn/ik4solr4.3] 主要改动不是我完成的,只是指点。使用maven)支持从solr自己的环境中获取自定义词典(使用solr的ResourceLoader,只需要把字典文件放到conf目录里)增加一个定时更新的停用词、同义词工厂类============我是分割线====以下是详细说明=====
songjinbin
·
2013-09-03 17:00
如何在基于Lucene的中文分词器中添加自定义词典(如Paoding、mmseg4j、IK Analyzer)
阅读更多如何在基于Lucene的中文分词器中添加自定义词典(如Paoding、mmseg4j、
IKAnalyzer
)2013-07-0821:54:29|分类:计算机|字号订阅1.使用Paoding自定义词典参考文章
leiyongping88
·
2013-09-02 12:00
Solr学习(2) Solr4.2.0+IK Analyzer 2012
solr列子下载Solr学习(二)Solr4.2.0+
IKAnalyzer
2012开场白:本章简单讲述如何在solr中配置著名的
IKAnalyzer
分词器。
cymlancy
·
2013-08-29 16:00
裴东辉-使用lucene集成IKIKAnalyzer实现分词并建立索引
基本环境: ext_stopword.dic和
IKAnalyzer
.cfg.xml放到classpath下面 引入jar
·
2013-08-28 20:00
IKAnalyzer
Lucene 实例教程(三)之操作索引
地址:http://blog.csdn.net/chenghui0317/article/details/10366255一、前言 前面简单介绍了如何使用Lucene将索引写入磁盘,并且提供
IKAnalyzer
ch656409110
·
2013-08-27 21:00
java
Web
javaee
Lucene
全文检索
Lucene 实例教程(二)之
IKAnalyzer
中文分词器
原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处、作者信息和本人声明。否则将追究法律责任。作者:永恒の_☆地址:http://blog.csdn.net/chenghui0317/article/details/10281311一、前言 前面简单介绍了Lucene,以及如何使用Lucene将索引写入内存,地址:http://blog.csdn.net/chenghui0317
ch656409110
·
2013-08-24 21:00
java
Web
javaee
Lucene
全文检索
lucene4中简单的query,以及与lucene3的一些区别
以下代码可以看看与3的区别,下面代码中解释File2DocumentUtils类就不上传了,就是将File转换成lucene中的Document,如果需要运行的话再贴出来lucene包用的是4.1.0分词器用了
IKAnalyzer
chaney
·
2013-08-01 13:00
query
lucene4
lucene3
大文本相似度比较
步骤为:a.给整篇文档分词term,分词用的是
IKAnalyzer
。 b.计算每个分词term的MD5哈希值。由于比较的文本
huangxia73
·
2013-07-17 18:00
利用lucene给网站、系统增加搜索功能
本篇用到的技术:lucene3.0.2,
IKAnalyzer
3.2.5search.properties主要是配置搜索的信息,内容:sql=sele
houyj1986
·
2013-07-08 21:00
IKAnalyzer
独立使用 配置扩展词库
我的一个范例截图对应的
IKAnalyzer
.cf
zhanghui_hn
·
2013-07-08 10:00
Solr
IKAnalyzer
中文分词
扩展词库
solr独立使用
关于调用maven命令的BAT脚本
org.zhixun
IKAnalyzer
1.0 system ${basedir}/..
turkeyzhou
·
2013-07-07 18:00
使用
IKAnalyzer
分词计算文章关键字并分享几个分词词典
http://www.oschina.net/p/
ikanalyzer
今天仅仅使用到了IK的分词功能。所以代码很简单,我就直接贴上来了。
王小明123
·
2013-07-02 21:00
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他