E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
IKANalyzer
Lucene之七(开源的中文分析器)
从2006年12月推出1.0版开始,
IKAnalyzer
已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。
yufenfei
·
2012-12-22 09:00
Lucene
Lucene之七(开源的中文分析器)
从2006年12月推出1.0版开始,
IKAnalyzer
已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。
yufenfei
·
2012-12-22 09:00
Lucene
Hadoop上的中文分词与词频统计实践
1)不同的中文分词方法,这里使用
IKAnalyzer
,主页在htt
·
2012-12-16 19:00
hadoop
中文分词之Java实现使用IK Analyzer实现
阅读更多http://blog.csdn.net/lijun7788/article/details/7719166#
IKAnalyzer
是基于lucene实现的分词开源框架,下载路径:http://code.google.com
yeshaoting
·
2012-11-30 14:00
中文分词之Java实现使用IK Analyzer实现
IK Analyzer是基于lucene实现的分词开源框架,下载路径:http://code.google.com/p/ik-analyzer/downloads/list 需要在项目中引入:
IKAnalyzer
.cfg.xml
yeshaoting
·
2012-11-30 14:00
Ik Analyzer
中文分词之Java实现使用IK Analyzer实现
IK Analyzer是基于lucene实现的分词开源框架,下载路径:http://code.google.com/p/ik-analyzer/downloads/list 需要在项目中引入:
IKAnalyzer
.cfg.xml
yeshaoting
·
2012-11-30 14:00
Ik Analyzer
中文分词之Java实现使用IK Analyzer实现
IK Analyzer是基于lucene实现的分词开源框架,下载路径:http://code.google.com/p/ik-analyzer/downloads/list 需要在项目中引入:
IKAnalyzer
.cfg.xml
yeshaoting
·
2012-11-30 14:00
Ik Analyzer
Solr4.0+
IKAnalyzer
中文分词安装
有近2年没接触Solr跟Lucene了,这2年自己跟solr/lucene都发生了很多变化。不过有种疏途同归的感觉,那就是都向分布式/云和监控靠了。2年前接触了solrcloud,那时大概玩了一周。那时很想玩cloud,但发现solrcloud并不是具有那种cloud。于是放弃了。现在发现solr4.0貌似集成了以前的solrcloud,通过zookeeper去管理集群。同时监控和运维管理方
a52071453
·
2012-11-29 19:00
IKAnalyzer
Solr4.0+
IKAnalyzer
中文分词安装
有近2年没接触Solr跟Lucene了,这2年自己跟solr/lucene都发生了很多变化。不过有种疏途同归的感觉,那就是都向分布式/云和监控靠了。2年前接触了solrcloud,那时大概玩了一周。那时很想玩cloud,但发现solrcloud并不是具有那种cloud。于是放弃了。现在发现solr4.0貌似集成了以前的solrcloud,通过zookeeper去管理集群。同时监控和运维管理方
a52071453
·
2012-11-29 19:00
IKAnalyzer
Solr4.0+
IKAnalyzer
中文分词安装
本人新浪微博:http://weibo.com/guoyunwb 有近2年没接触Solr跟Lucene了,这2年自己跟solr/lucene都发生了很多变化。不过有种疏途同归的感觉,那就是都向分布式/云和监控靠了。2年前接触了solrcloud,那时大概玩了一周。那时很想玩cloud,但
guoyunsky
·
2012-11-29 11:00
IKAnalyzer
Solr4.0+
IKAnalyzer
中文分词安装
本人新浪微博:http://weibo.com/guoyunwb 有近2年没接触Solr跟Lucene了,这2年自己跟solr/lucene都发生了很多变化。不过有种疏途同归的感觉,那就是都向分布式/云和监控靠了。2年前接触了solrcloud,那时大概玩了一周。那时很想玩cloud,但
guoyunsky
·
2012-11-29 11:00
IKAnalyzer
solr3.6+
IKAnalyzer
2012 安装配置说明
下载地址:http://www.eng.lsu.edu/mirrors/apache/lucene/solr/配置修改tomcat安装目录下conf/server.xml,修改URIEncoding=”UTF-8”把下载的solr目录下的solr/dist目录下的apache-solr-3.6.0.war重命名为solr.wartomcat安装目录下conf/Catalina/localhost,
awl910213
·
2012-11-26 11:00
Lucene的中文分词器
IKAnalyzer
Lucene的中文分词器
IKAnalyzer
分词器对英文的支持是非常好的。
howareyoutodaysoft
·
2012-11-25 23:00
Lucene
lucene开发关键代码
Lucene 1.创建indexWriter-- commoms-io.jar||
IKAnalyzer
3.2.8.jar||lucene-core3.0.3.jar|| lucene-analyzers
huayaoyue6
·
2012-11-20 10:00
Lucene
分词器
全文搜索
索引读取
索引创建
OSChina 的全文搜索设计说明 —— 索引过程
OSChina使用的是全文搜索的技术,涉及到的开源软件包括Lucene和国产的
IKAnalyzer
。谈到分词,有些人喜欢问,你怎么不用xxx呢?很不好意思
jspamd
·
2012-11-17 22:00
maven在pom文件里引用本地jar
groupId>org.wltea</groupId> <artifactId>
IKAnalyzer
shilianjun
·
2012-11-16 11:00
maven
Lucene
IKAnalyzer
扩展词典(强制分词)
前面说到solr+
IKAnalyzer
来配置中文分词;在实际中我们有些需求是需要将特定的词作为一个分词来处理,那么我们就需要设置自己的词典例子:连帽上衣希望将“连帽”作为一个词来处理,并不希望作为连,帽来处理默认分词
longxia1987
·
2012-11-13 18:00
Solr
强制分词
ext_dict
IKAnalyzer
扩展词典(强制分词)
前面说到solr+
IKAnalyzer
来配置中文分词;在实际中我们有些需求是需要将特定的词作为一个分词来处理,那么我们就需要设置自己的词典例子:连帽上衣希望将“连帽”作为一个词来处理,并不希望作为连,帽来处理默认分词
longxia1987
·
2012-11-13 18:00
IKAnalyzer
Lucene下分词工具的学习探讨(二)
今天又找到一种分词器
IKanalyzer
,对Lucene的支持挺好,不过我没有找到它的人名,地名识别功能在哪里!这个分词器的文档做得还挺好,挺细致,挺全面的!基本的功能看文档就都能学会了!
sbp810050504
·
2012-11-13 17:51
IKAnalyzer
Lucene分词
搜索引擎
Lucene下分词工具的学习探讨(二)
今天又找到一种分词器
IKanalyzer
,对Lucene的支持挺好,不过我没有找到它的人名,地名识别功能在哪里! 这个分词器的文档做得还挺好,挺细致,挺全面的!基本的功能看文档就都能学会了!
sbp810050504
·
2012-11-13 17:51
IKAnalyzer
lucene分词
IKAnalyzer
中文分词快速入门
IKAnalyzer
是一个基于Java的中文分词工具包。起初是基于Apache的Lucene项目,目前已经成为一个独立的分词组件。
liangtee
·
2012-11-09 13:00
IKAnalyzer
教程
中文分词
IKAnalyzer
3.2通过List方式加入自定义词典
首先我们查看
IKAnalyzer
的源码,看词典存储位置: class DictSegment implements Comparable<DictSegment>{
小网客
·
2012-11-05 15:00
IKAnalyzer
IKAnalyzer
3.2通过List方式加入自定义词典
首先我们查看
IKAnalyzer
的源码,看词典存储位置: class DictSegment implements Comparable<DictSegment>{
小网客
·
2012-11-05 15:00
IKAnalyzer
solr中使用IKAnalysizer 基于配置的自定义词典扩充
基于配置的词典扩充 IK 分词器还支持通过配置
IKAnalyzer
.cfg.xml 文件来扩充您的专有词典以及停止词典(过滤词典)。 步骤如下: 1.
fhqllt
·
2012-11-04 20:00
Solr
Solr中文分词配置(
IKAnalyzer
)
本文介绍以
IKAnalyzer
为主的Solr中文分词的配置。 1.关于IKAnalyzerIKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。
liuweitoo
·
2012-10-31 17:00
中文分词软件概览
从2006年12月推出1.0版开始,
IKAnalyzer
已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。
wuwuwuwuwuwuwuwu
·
2012-10-26 15:00
发布 IK Analyzer 2012 FF 版本
果然,又是一次不兼容的修订啊~~时间紧迫的推出了
IKAnalyzer
2012FF版本(你问啥是FF,其实就是For4.0),在API和功能上保
林良益
·
2012-10-23 18:00
发布 IK Analyzer 2012 FF 版本
果然,又是一次不兼容的修订啊~~时间紧迫的推出了
IKAnalyzer
2012FF版本(你问啥是FF,其实就是For4.0),在API和
linliangyi2007
·
2012-10-23 17:00
中文分词
IK
Java
开源
solr 扩展中文分词
IKAnalyzer
配置文件路径
搭建好solr后,为了给
IKAnalyzer
添加上扩展分词。可是害苦了我。尝试各种办法而不得,运行demo都不奏效。无奈,遂打开源代码。
bob007
·
2012-10-22 23:00
jvm
tomcat
百度
Solr
扩展
基于Lucene 4.x的ik-analyzer
需要修改
IKAnalyzer
.java、IKTokenizer.java、IKTokenizerFactory.java。
·
2012-10-08 11:00
Lucene
Lucene学习——
IKAnalyzer
中文分词(二)
一、环境1、平台:MyEclipse8.5/JDK1.52、框架:Lucene3.6.1/
IKAnalyzer
2012/htmlparser二、目标1、整合前面连篇文章(Lucene学习——
IKAnalyzer
CYXLZZS
·
2012-09-20 15:00
MyEclipse
String
搜索引擎
Lucene
url
扩展
lucene集成IK实现中文分词检索
IKAnalyzer
2012_u5.zip下载地址:http://code.google.com/p/ik-analyzer/downloads/detail?
萝卜丁辣子
·
2012-09-20 15:00
Lucene
分词器
IKAnalyzer
中文分词
IK
Lucene学习——
IKAnalyzer
中文分词(一)
一、环境1、平台:MyEclipse8.5/JDK1.52、开源框架:Lucene3.6.1/
IKAnalyzer
20123、目的:测试
IKAnalyzer
的分词效果二、开发调试1、下载框架 1)
IKAnalyzer
CYXLZZS
·
2012-09-20 11:00
exception
properties
MyEclipse
String
Lucene
扩展
lucene3 中文
IKAnalyzer
分词例子
import java.io.IOException; import java.io.StringReader; import java.util.Iterator; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.TokenStream; import org.apache.
a52071453
·
2012-09-10 13:00
luence
lucene3 中文
IKAnalyzer
分词例子
import java.io.IOException; import java.io.StringReader; import java.util.Iterator; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.TokenStream; import org.apache.
a52071453
·
2012-09-10 13:00
luence
分词器,使用中文分词器,扩展词库,停用词
常见的中文分词器有:极易分词的(MMAnalyzer) 、"庖丁分词"分词器(PaodingAnalzyer)、
IKAnalyzer
等等。
xiaoyu714543065
·
2012-09-04 14:00
测试
ext
Lucene
扩展
encoding
2010
关于solr不能搜索中文
关于solr不能搜索中文1、需要配置中文分词器,我在此使用的
IKAnalyzer
分词器,需要jar:
IKAnalyzer
3.2.8.jarschema.xml 分词配好之后,我们可以再
longxia1987
·
2012-08-27 16:00
tomcat
Date
String
测试
Solr
Class
关于solr不能搜索中文
关于solr不能搜索中文1、需要配置中文分词器,我在此使用的
IKAnalyzer
分词器,需要jar:
IKAnalyzer
3.2.8.jarschema.xml 分词配好之后,我们可以再
longxia1987
·
2012-08-21 10:00
Solr
apache-solr-4.0.0-BETA&
IKAnalyzer
4.1和apache-solr-4.0.0&
IKAnalyzer
4.2
如下为
IKAnalyzer
4.1的新目录结构
IKAnalyzer
4.0的jar包==>下载 解压后把
IKAnalyzer
4.1.jar,
IKAnalyzer
.cfg,stopword.dic放
·
2012-08-19 14:00
IKAnalyzer
中文分词之Java实现使用IK Analyzer实现
IK Analyzer是基于lucene实现的分词开源框架,下载路径:http://code.google.com/p/ik-analyzer/downloads/list 需要在项目中引入:
IKAnalyzer
.cfg.xml
yeshaoting
·
2012-08-12 10:00
Ik Analyzer
IKAnalyzer
中文分词 高亮
nbsp; public void execute() { System.out.println("开始创建索引工单"); Analyzer analyzer = new
IKAnalyzer
sblig
·
2012-08-07 14:00
IKAnalyzer
mongodb 全文搜索解决方案(lucene+
IKAnalyzer
)
的文档类型中加字段,存分词结果,然后从该字段中匹配)但是我尝试了效率比原先的好像还要低http://www.oschina.net/question/200745_61968 后来我尝试了 lucene+
IKAnalyzer
章彦儿
·
2012-07-25 09:00
mongodb
Lucene
IKAnalyzer
apache-solr-4.0.0-ALPHA中文分析器
IKAnalyzer
4.0
solr出了4.0ALPHA版本,管理界面比3.x漂亮,而且在和mmseg和lucene的SmartChineseAnalyzer、StandardAnalyzer、CJKAnalyzer比较之后,感觉
IKAnalyzer
·
2012-07-22 11:00
Lucene
Solr
IKAnalyzer
apache-solr-4.0.0-ALPHA中文分析器
IKAnalyzer
4.0
solr出了4.0ALPHA版本,管理界面比3.x漂亮,而且在和mmseg和lucene的SmartChineseAnalyzer、StandardAnalyzer、CJKAnalyzer比较之后,感觉
IKAnalyzer
·
2012-07-22 02:00
IKAnalyzer
中文分词之Java实现使用IK Analyzer实现
IKAnalyzer
是基于lucene实现的分词开源框架,下载路径:http://code.google.com/p/ik-analyzer/downloads/list需要在项目中引入:
IKAnalyzer
.cfg.xmlIKAnalyzer2012
Lijun7788
·
2012-07-05 16:00
java
String
Lucene
Class
语言
工具
IK的整个分词处理过程
Lucene的分词基类是Analyzer,所以IK提供了Analyzer的一个实现类
IKAnalyzer
。
yingbin920
·
2012-06-26 14:00
IK
lucene3.6.0——入门示例
,项目所需的jar包如下: 1.lucene-core-3.6.0.jar(Lucene核心包) 2.lucene-analyzers-3.6.0.jar(Lucene分词器) 3.
IKAnalyzer
3.2.8
空云万里晴
·
2012-05-22 14:00
Lucene
全文检索
入门实例
Lucene3.6.0
solr 主从配置 索引的主从复制
配置solr (windows) 并配中文分词
IKAnalyzer
现在做一下主从配置笔记: 修改主:solrconfig.xml文件 <requestHandler
leiwuluan
·
2012-05-21 14:00
Solr
solr 字段配置,和数据库数据索引配置
文件里配置先讲解一下,里面的一些字段1、...表示类型,数据类型不难理解上面就是配置定义solr数据类型、上面都是solr里面的类型,那么我们也可以配置自已的数据类型,比如:我们要用到中文分词的时候,这里配一下
IKanalyzer
f776527249
·
2012-05-16 14:29
solr
IKAnalyzer
分词如何消歧
拿
IKAnalyzer
分词器为例,
IKAnalyzer
的切分方式是细粒度切分,当不需要智能处理时,其就把切出的所有词输出,但若启动了智能处理,
单眼皮大娘
·
2012-05-11 15:00
数据结构
算法
IKAnalyzer
TreeSet
分词消歧
上一页
8
9
10
11
12
13
14
15
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他