E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
ikanalyzer
lucene3.0 中文分词实例
IKAnalyzer
StandardAnalyzer
之前想做lucene的中文分词,上网一搜,结果都是针对lucene2.x的,于是就写了一实例针对lucene3.x版本的,以下仅为学习交流之用; 时间仓促,实例示下: package com.hpjianhua.lucene; import java.io.IOException; import java.io.Reader; import java.io.Strin
hpjianhua
·
2011-04-08 11:00
apache
Lucene
lucene第一步---6.分页
创建测试数据的索引 String path = "index";//索引目录 Analyzer analyzer = new
IKAnalyzer
();//采用的分词器 IndexWriter
geshenyi
·
2011-03-18 09:00
Lucene
lucene第一步---5.中文分词
IKAnalyzer
和高亮highlighter的使用
下面的例子主要是介绍中文分词器
IKAnalyzer
的使用和Lucene高亮显示。
geshenyi
·
2011-03-18 09:00
java
apache
算法
Lucene
全文检索
lucene进行全文检索的一个简单例子
我用的lucene版本为3.0.2,中文分词是
IKAnalyzer
3.2.下面是我的一些代码。仅供参考。第一步: 建立文件索引: public
464872333
·
2011-03-09 17:00
c
F#
Lucene
全文检索
Adobe
发布 IK Analyzer 3.2.8 for Lucene3.X
阅读更多
IKAnalyzer
3.2.8版本修订1.优化了英文字符处理,支持如:C++等带符号单词输出2.简化了数词处理,使输出结果更符合用户观感3.改进了最大词长切分,使输出结果更符合用户观感4.性能优化
linliangyi2007
·
2011-03-04 17:00
lucene
Gmail
Google
算法
F#
nutch1.2中加入中文分词以及搜索错误解决
这里我使用的IK_Analyzer 1、下载
IKAnalyzer
3.2.5Stable.jar。
p_x1984
·
2011-03-02 12:00
apache
thread
xml
ant
Lucene
nutch1.2中加入中文分词以及搜索错误解决
这里我使用的IK_Analyzer 1、下载
IKAnalyzer
3.2.5Stable.jar。
p_x1984
·
2011-03-02 12:00
apache
thread
xml
ant
Lucene
Lucene和
IKAnalyzer
处理中文:索引、搜索实例[续]
版本:lucene3.02,
IKAnalyzer
3.20 上一篇分享了应用Lucene和
IKAnalyzer
如何对中文建索引的方法,现在讨论如何在索引基础上进行搜索。
cesul
·
2011-01-07 17:00
F#
Lucene
Lucene和
IKAnalyzer
处理中文:索引、搜索实例
版本:lucene3.02,
IKAnalyzer
3.20 检索程序(Indexer.java)实现了对给定文件夹下深度遍历txt文件经行索引。
cesul
·
2011-01-07 16:00
F#
Lucene
ide
solr
IKAnalyzer
搜索中文分词配置 过程
从听说有这么个东西,到把solr+
IKAnalyzer
框架搭起来用了一天时间。 下面是本人在今天的劳动成果,拿出来给大家分享下,欢迎讨论和指教。
jsxzzliang
·
2010-12-27 00:00
apache
tomcat
xml
Lucene
Solr
使用Lucene3和
IKAnalyzer
对一段文本进行分词
import java.io.IOException; import java.io.StringReader; import java.util.ArrayList; import java.util.List; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.TokenSt
hotsunshine
·
2010-12-23 21:00
java
apache
Lucene
转 lucene3搜索引擎,索引建立搜索排序分页高亮显示,
IKAnalyzer
分词
package com.zjr.service.impl; import java.io.File; import java.io.IOException; import java.io.StringReader; import java.lang.reflect.InvocationTargetException; import java.util.Arra
peirenlei
·
2010-12-20 12:00
apache
bean
搜索引擎
F#
Lucene
Nutch1.2增加
IKAnalyzer
中文分词
为适应我们的使用习惯必须加上中文分词,我加的是
IKAnalyzer
。
laigood12345
·
2010-12-12 16:00
Stream
String
null
input
import
token
三,nutch 1.0 爬虫配置与运行
本文为solomon@javaeye原创,如有转载,注明出处(作者solomon与链接http://zolomon.javaeye.com).本专题使用中文分词为
ikanalyzer
,感谢其作者为java
ssyan
·
2010-11-30 10:00
三,nutch 1.0 爬虫配置与运行
本文为solomon@javaeye原创,如有转载,注明出处(作者solomon与链接http://zolomon.javaeye.com).本专题使用中文分词为
ikanalyzer
,感谢其作者为java
wapysun
·
2010-11-30 10:00
Google
三,nutch 1.0 爬虫配置与运行
本文为solomon@javaeye原创,如有转载,注明出处(作者solomon与链接http://zolomon.javaeye.com).本专题使用中文分词为
ikanalyzer
,感谢其作者为java
wapysun
·
2010-11-30 10:00
Google
三,nutch 1.0 爬虫配置与运行
本文为solomon@javaeye原创,如有转载,注明出处(作者solomon与链接http://zolomon.javaeye.com).本专题使用中文分词为
ikanalyzer
,感谢其作者为java
isiqi
·
2010-11-30 10:00
Google
二,nutch 1.0 web应用部署
本文为solomon@javaeye原创,如有转载,注明出处(作者solomon与链接http://zolomon.javaeye.com).本专题使用中文分词为
ikanalyzer
,感谢其作者为java
wapysun
·
2010-11-30 10:00
tomcat
xml
Web
hadoop
Google
二,nutch 1.0 web应用部署
本文为solomon@javaeye原创,如有转载,注明出处(作者solomon与链接http://zolomon.javaeye.com).本专题使用中文分词为
ikanalyzer
,感谢其作者为java
ssyan
·
2010-11-30 10:00
二,nutch 1.0 web应用部署
本文为solomon@javaeye原创,如有转载,注明出处(作者solomon与链接http://zolomon.javaeye.com).本专题使用中文分词为
ikanalyzer
,感谢其作者为java
wapysun
·
2010-11-30 10:00
tomcat
Web
hadoop
xml
Google
二,nutch 1.0 web应用部署
本文为solomon@javaeye原创,如有转载,注明出处(作者solomon与链接http://zolomon.javaeye.com).本专题使用中文分词为
ikanalyzer
,感谢其作者为java
isiqi
·
2010-11-30 10:00
tomcat
Web
hadoop
xml
Google
IKAnalyzer
中文分词分析内容目录
IKAnalyzer
中文分词的学习:Java开源分词系统
IKAnalyzer
学习(一)大致简介Java开源分词系统
IKAnalyzer
学习(二)架构Java开源分词系统
IKAnalyzer
学习(三)流程
lengyuhong
·
2010-11-25 15:00
nutch中文分词(通过插件的方式)
1、需要的工具:
IKAnalyzer
jar包(将其命名为analysis-zh.jar) javacc工具 ant 2、部署nutch工程到eclipse中。
fushengfei
·
2010-11-19 16:00
apache
eclipse
xml
ant
Lucene
Java开源分词系统
IKAnalyzer
学习(八) 基于词库分词
分词操作: Lexemel=null;while((l=ikSeg.next())!=null){System.out.println(l);} 相关流程 词典匹配的关键代码:/***匹配词段*@paramcharArray*@returnHit*/publicHitmatch(char[]charArray){returnthis.match(charArray,0,charAr
lengyuhong
·
2010-11-16 15:00
Java开源分词系统
IKAnalyzer
学习(六) 词库加载源代码——Hit类
/****/packageorg.wltea.analyzer.dic;/***IKAnalyzerv3.2*表示词典检索的命中结果*@author林良益**/publicclassHit{//Hit不匹配privatestaticfinalintUNMATCH=0x00000000;//Hit完全匹配privatestaticfinalintMATCH=0x00000001;//Hit前缀匹配p
lengyuhong
·
2010-11-15 15:00
java
Class
Java开源分词系统
IKAnalyzer
学习(五) 词库加载源代码——DictSegmenty类
/****/packageorg.wltea.analyzer.dic;importjava.util.HashMap;importjava.util.Map;/***IKAnalyzerv3.2*字典子片断字典匹配核心类*该类采用数组结合HashMap,实现词典存储,词语匹配**当下属的页节点小等于3时,采用数组存储*当下属的页节点大于3时,采用HashMap存储*@author林良益**/pu
lengyuhong
·
2010-11-15 15:00
java
HashMap
null
存储
Class
character
Java开源分词系统
IKAnalyzer
学习(七) 词库加载分词
词库加载模块的源码:Java开源分词系统
IKAnalyzer
学习(四)词库加载源代码——Dictionary类Java开源分词系统
IKAnalyzer
学习(五)词库加载源代码——DictSegmenty
lengyuhong
·
2010-11-15 14:00
java
设计模式
null
存储
character
Dictionary
Java开源分词系统
IKAnalyzer
学习(四) 词库加载源代码——Dictionary类
词库加载的源代码:/****/packageorg.wltea.analyzer.dic;importjava.io.BufferedReader;importjava.io.IOException;importjava.io.InputStream;importjava.io.InputStreamReader;importjava.util.Collection;importjava.util
lengyuhong
·
2010-11-15 14:00
java
String
null
扩展
extension
Dictionary
Java开源分词系统
IKAnalyzer
学习(三) 流程
为了学习的方便,我用如下代码跑一遍业务流程:源代码:Stringt="一件红色西装";System.out.println(t);IKSegmentationikSeg=newIKSegmentation(newStringReader(t),true);try{Lexemel=null;while((l=ikSeg.next())!=null){System.out.println(l);}}c
lengyuhong
·
2010-11-09 10:00
java
算法
String
Class
input
interface
Java开源分词系统
IKAnalyzer
学习(二) 架构
由于自己现在也是在学习阶段,所以很有可能会有些讲解不当的地方,大家可以留言讨论
IKAnalyzer
的包结构具体如下: 其中的lucence,solr是基于lucene的应用
lengyuhong
·
2010-11-08 17:00
java
配置管理
Lucene
Solr
Java开源分词系统
IKAnalyzer
学习(一) 大致简介
首先申明,我这里只用到
IKAnalyzer
独立于Luncene的分词组件,所以会跟作者原本的使用手册信息略不同1.
IKAnalyzer
3.X介绍
IKAnalyzer
是一个开源的,基于java语言开发的轻量级的中文分词工具包
lengyuhong
·
2010-11-08 16:00
java
算法
优化
Blog
Lucene
语言
网络信息体系结构作业 2
配置Lucene, 对ccer数据建立索引和查询系统 中文分词模块(
IKAnalyzer
可选) 2。
hanyuanbo
·
2010-11-07 11:00
数据结构
算法
Google
Lucene
用MultiSearcher在多索引中进行搜索
/** * 多索引进行查询 */ public void testCreateIndex() { Analyzer analyzer = new
IKAnalyzer
catastiger
·
2010-11-05 14:00
多线程
工作
利用Boost影响Lucene查询结果的排序
下面是通过lucene3.0,
IKAnalyzer
1.通过设置doc boost改变排序结果
catastiger
·
2010-11-05 14:00
C++
c
C#
F#
Lucene
lucene3搜索引擎,索引建立搜索排序分页高亮显示,
IKAnalyzer
分词
package com.zjr.service.impl; import java.io.File; import java.io.IOException; import java.io.StringReader; import java.lang.reflect.InvocationTargetException; import java.util.ArrayList; impo
catastiger
·
2010-10-26 16:00
apache
bean
搜索引擎
F#
Lucene
利用lucene给网站、系统增加搜索功能
本篇用到的技术:lucene3.0.2,
IKAnalyzer
3.2.5search.properties主要是配置搜索的信息,内容:sql=sele
penngo
·
2010-10-07 15:00
solr1.4+
IKAnalyzer
配置
solr1.4+
IKAnalyzer
配置 solr1.4,分词采用
IKAnalyzer
最新,servlet采用tomcat6 1、修改tomcat目录下conf下的server.xml,查找8080,
zhipingch
·
2010-09-30 23:00
apache
tomcat
jsp
xml
Solr
solr多实例配置以及应用中文分词器
IKAnalyzer
前面的两篇博客写的有点傻了,这里整理下,写下整个过程: 参考官方文档: http://wiki.apache.org/solr/SolrTomcat 但是不是完全按照官方文档来的。 一、准备材料: 从这里下载solr:http://lucene.apache.org/solr/ ,我下载的是sorl-1.4.0 本机上安装tomcat,我装的是apach
iammonster
·
2010-09-24 15:00
tomcat
应用服务器
浏览器
Solr
Lucene
solr多实例配置以及应用中文分词器
IKAnalyzer
前面的两篇博客写的有点傻了,这里整理下,写下整个过程: 参考官方文档: http://wiki.apache.org/solr/SolrTomcat 但是不是完全按照官方文档来的。 一、准备材料: 从这里下载solr:http://lucene.apache.org/solr/ ,我下载的是sorl-1.4.0 本机上安装tomcat,我装的是apach
iammonster
·
2010-09-24 15:00
tomcat
应用服务器
浏览器
Solr
Lucene
IKAnalyzer
中文分词
/** * @{#} TokenStreamDemo.java Create on 2010-9-16 上午09:12:11 * * Copyright (c) 2010 by beckham. */ package cn.com.test; import java.io.File; import java.io.StringReader; import junit.framework.TestC
gaowenming
·
2010-09-16 16:00
apache
JUnit
Lucene
IKAnalyzer
中文分词
阅读更多/***@{#}TokenStreamDemo.javaCreateon2010-9-16上午09:12:11**Copyright(c)2010bybeckham.*/packagecn.com.test;importjava.io.File;importjava.io.StringReader;importjunit.framework.TestCase;importorg.apach
gaowenming
·
2010-09-16 16:00
lucene
Apache
junit
发布 IK Analyzer 3.2.5 稳定版 for Lucene3.0
地址:http://linliangyi2007.iteye.com/blog/941132
IKAnalyzer
3.2.5版本修订在3.2.3版本基础上,更新如下:1.修订了分词器内部的数组越界异常2.
linliangyi2007
·
2010-09-08 14:00
lucene
Solr
QQ
Eclipse
Google
Lucene 3.0 分词
IKAnalyzer
下面的例子主要是介绍中文分词器
IKAnalyzer
的使用和Lucene高亮显示。
turingfellow
·
2010-09-02 12:00
apache
算法
搜索引擎
Lucene
全文检索
lucene 多字段查询+文字高亮显示
lucene3.0 Directory directory = null; IndexSearcher isearcher = null; Analyzer analyzer = new
IKAnalyzer
navy0168
·
2010-08-18 14:00
Lucene
solr1.4配置
IKAnalyzer
3.2
个人技术博客:http://demi-panda.com 搜索引擎相关开源框架,一开始是lucene,这两天看了看solr,下了一个最新版本,配置了下,遇到一些问题。解决了一些,还有一些没有解决,这里将我的一些已经解决的问题,分享给大家。 1、下载solr1.4 http://apache.freelamp.com/lucene/solr/&n
a280606790
·
2010-08-14 23:00
apache
tomcat
搜索引擎
Solr
Lucene
ik-analyzer
IKAnalyzer
是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,
IKAnalyzer
已经推出了3个大版本。
代码生活
·
2010-08-02 15:00
算法
Lucene
全文检索
solr中使用IKAnalysizer的自定义词典的配置
参看:
IKAnalyzer
中文分词器V3.2使用手册
IKAnalyzer
安装包包含:1.
·
2010-07-24 17:00
Solr
solr中使用IKAnalysizer的自定义词典的配置
参看:
IKAnalyzer
中文分词器V3.2使用手册
IKAnalyzer
安装包包含:1.
mlzboy
·
2010-07-24 17:00
Hibernate
log4j
Web
ext
Solr
solr中使用IKAnalysizer的自定义词典的配置
参看:
IKAnalyzer
中文分词器V3.2使用手册
IKAnalyzer
安装包包含:1.
mlzboy
·
2010-07-24 17:00
log4j
Hibernate
Web
ext
Solr
IKAnalyzer
3.2.0 Stable版使用自定义词典出现数组下标越界异常
使用环境: Solr1.4 Lucene2.9.1 或 Lucene2.9.2 或 Lucene2.9.3 出错过程: 根据
IKAnalyzer
3.X官方手册,配置自定义词典,在启动时报错如下
wdmsyf
·
2010-07-22 15:00
java
apache
thread
Solr
Lucene
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他