E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
IKANalyzer
paoding分词工具的字典如何构建
在调研了mmseg4j,ictclas4j(imdict和ictclas4j属于一类,只不过其为了效率去掉了ictclas4j的命名实体识别部分),
IKAnalyzer
单眼皮大娘
·
2012-05-02 16:00
分词
paoding
词典结构
IKanalyzer
分词器(???)
//今天看了看
IKanalyzer
扩充词汇看得我一头雾水 分词器的使用还没理解直接搞扩充词汇有点知识脱节//谁能举个例看看怎么扩充????
superlele123
·
2012-04-29 13:00
数据库
Hibernate
log4j
api
文档
扩展
IKAnalyzer
分词测试DEMO,非Lucene,Solr整合。
使用版本3.2.8 地址 http://code.google.com/p/ik-analyzer/downloads/list 将
IKAnalyzer
3.2.8.jar
wangking717
·
2012-04-11 10:00
IKAnalyzer
lucene 获取分词后的关键词
使用不同的分词器,最后得到的关键词不同,需要的时间也不同需要中文分词是,用
IKAnalyzer
是不错的选择,但相比时间,我的电脑上大概分词需要800+ms分词器工作流程:输入文本(What'syourname
Ping_QC
·
2012-04-11 10:00
exception
工作
String
Lucene
Solr试用小记
1、下载tomcat7、solr 3.5.0 以及
IKAnalyzer
2012_u4,tomcat解压缩 2、展开solr压缩包,把包里的example\solr目录复制到D:\apache-tomcat
zjnbshifox
·
2012-04-10 09:00
tomcat
Solr
lucene学习
IKAnalyzer
分词器
Lucene 学习 分词器 Analyzer analyzer = new
IKAnalyzer
(); 分词器词典扩展方法
zdb_cn
·
2012-04-01 10:00
IKAnalyzer
Tomcat启动时加载
IKAnalyzer
词典
因为IK实在第一次分词时才加载词典,可能会导致第一次分词较慢,所以打算在Tomcat启动时就加载到内容,提高速度。步骤如下: 1. 实现ServletContextListner接口 在contextInitialized(ServletContextEvent arg0)方法中,初始化加载: System.out.println("tomcat启动:初始化词典"
BlackWing
·
2012-03-23 11:00
tomcat
IK
Nutch1.2 添加
IKAnalyzer
中文分词
原版nutch中对中文的处理是按字划分,而不是按词划分,我们可以为其添加一些中文分词插件,例如
IKAnalyzer
。参看了网上很多教程,最后也没能成功,最后综合了几个教程的内容,最终成功。
xiaoyu714543065
·
2012-03-20 08:00
Lucene学习总结
索引中文分词可以研究下
IKAnalyzer
。 imp
wenxin2009
·
2012-03-19 00:00
Lucene
配置solr (windows) 并配中文分词
IKAnalyzer
1、下载http://mirror.bjtu.edu.cn/apache/lucene/solr/3.5.0/ 2、解压安装 创建存放solr配置文件和索引目录E:/solr/solr_home 将conf拷到下面E:/solr/solr_home 创建存放solr项目源文件solr.warE:/solr/solr.war ()将solr.war拷到E:/solr/下 3、到tomcat/c
leiwuluan
·
2012-03-10 11:00
IKAnalyzer
IKAnalyzer
lucene分词器
IKAnalyzer
是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,
IKAnalyzer
已经推出了3个大版本。
leiwuluan
·
2012-03-08 16:00
Lucene
发布 IK Analyzer 2012 版本
阅读更多新版本改进:支持分词歧义处理支持数量词合并词典支持中英文混合词语,如:Hold住
IKAnalyzer
2012特性采用了特有的“正向迭代最细粒度切分算法“,支持细粒度和智能分词两种切分模式;在系统环境
linliangyi2007
·
2012-03-08 11:00
java
中文分词
lucene
lucene3+IK分词器 改造 lucene2.x+paoding
void createIndex(Article article) throws Exception { // 实例化分词器,使用的是中文分词器 Analyzer analyzer = new
IKAnalyzer
longzhun
·
2012-02-27 21:00
paoding
maven
maven安装本地库: mvn install:install-file -DgroupId=
IKAnalyzer
3.2.8 -DartifactId=
IKAnalyzer
3.2.8 -Dversion
wenxin2009
·
2012-02-15 13:00
maven
采访IK Analyzer 中文分词器开源项目作者林良益(十三)
43-ik-analyzer 众所周知,全文搜索几乎已经成为每个网站的必须提供的基本功能之一,用Lucene构造一个“索引-查询”的应用是常见的java解决方案,目前由linliangyi2007创立的
IKAnalyzer
Love_JavaProgram
·
2012-02-08 19:00
java
互联网
Google
Lucene
全文检索
自然语言处理
www.8brl.cn网站上线了,请大家多多指教
全文检索采用的是
IKAnalyzer
数据库: MySQL 自己二次开发的WEBIM, 在产品详细页用户后台-我的收藏采用的Apache mahout框架开发的推荐系统商品详细页、大类页面采用计划生成静态页面
fengfan2008
·
2012-02-02 13:00
全文检索
Apache Mahout
lucene使用
IKAnalyzer
3.2.5中文分词器进行索引的一个小例子
本文通过一个小例子方便大家学习
IKAnalyzer
3.2.5和lucene的索引功能。以下是需要的准备环境 需要两个jar包。
hiphopmattshi
·
2012-01-29 14:00
thread
exception
String
File
Lucene
query
Lucene排序以及自定义排序
所以代码创建的方式 有那么点变化,我使用的分词器是
IkAnalyzer
。
zhcheng
·
2012-01-05 14:00
Lucene
14款中文分词开源软件
从2006年12月推出1.0版开始,
IKAnalyzer
已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKA
zimohuakai
·
2012-01-03 21:00
solr3.5 +
IKAnalyzer
3.2.8 + Tomcat5.5 搭建配置(一)
Solr是一个全文检索服务器,基于Lucene3.5开发的,我们可以在solr的基础上进行定制化的开发。要进行solr开发首先得搭建一个solr服务器。1、首先我们下载solr3.5和lucene3.5,分别在: Solr:http://apache.etoak.com//lucene/solr/3.5.0 Lucene: http://apache.etoak.com//l
wuce7758
·
2011-12-29 09:00
lucene3.5
solr3.5
IKAnalyzer3.2.8
tomcat5.5
Wvtool学习(四):实现wvtool与IK_Analyzer的分词结合
太有成就感了……呵呵首先得把IK_Analyzer的jar包放到项目中,然后“当前project”->properities->javabuildpath->addjar把
IKAnalyzer
3.2.5Stable.jar
sbp810050504
·
2011-12-24 20:37
休闲
IKAnalyzer分词
NLP&ML
Wvtool学习(四):实现wvtool与IK_Analyzer的分词结合
太有成就感了……呵呵 首先得把IK_Analyzer的jar包放到项目中,然后“当前project”->properities->javabuildpath->addjar把
IKAnalyzer
3.2.5Stable.jar
sbp810050504
·
2011-12-24 20:37
中文分词
休闲
wvtool
IKAnalyzer分词
IKAnalyzer
介绍
IKAnalyzer
是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,
IKAnalyzer
已经推出了3个大版本。
zhanshenny
·
2011-12-15 15:00
Lucene
全文检索
IKAnalyzer
解决 maven system 部署问题
; <dependency> <groupId>org.wltea</groupId> <artifactId>
IKAnalyzer
toeo
·
2011-12-08 09:00
System
hibernate Search 学习研究 附件是maven工程
分词使用的是
IKAnalyzer
网站是:http://code.google.com/p/ik-analyzer/使用的是hibernate3.6.8+spring3.0.6+hibernatesearch3.4.1
toeo
·
2011-11-29 13:00
hibernate Search 学习研究 附件是maven工程
分词使用的是
IKAnalyzer
网站是 : http://code.google.com/p/ik-analyzer/ &
toeo
·
2011-11-29 13:00
Hibernate
solr 3.4配置中文分词
IKAnalyzer
3.2.8
中文分词的文章,但是测试很久都不行,而且paoding这个分词工具很久没更新了,最新版本是paoding-analysis-2.0.4-beta.zip,于是在想有没有其它的分词工具可以使用,后来找到了
IKAnalyzer
aswang
·
2011-11-20 22:00
IKAnalyzer
solr 3.4配置中文分词
IKAnalyzer
3.2.8
中文分词的文章,但是测试很久都不行,而且paoding这个分词工具很久没更新了,最新版本是paoding-analysis-2.0.4-beta.zip,于是在想有没有其它的分词工具可以使用,后来找到了
IKAnalyzer
aswang
·
2011-11-20 22:00
IKAnalyzer
SHOP++中文分词检索词库扩展
编辑中文分词词库文件 词典文件编码格式:UTF-8(无 BOM) 每个中文词汇独立占一行,使用\r\n 的 DOS 方式换行(请参考
IKAnalyzer
3.1.6GA.jar文件org.wltea.analyzer.dic
txf2004
·
2011-11-03 10:00
中文分词
SHOP++中文分词检索词库扩展
默认只加入了基础中文词库文件,您可以根据实际需求增减词库量中文分词词库扩展:1.编辑中文分词词库文件词典文件编码格式:UTF-8(无BOM)每个中文词汇独立占一行,使用\r\n的DOS方式换行(请参考
IKAnalyzer
3.1.6GA.jar
iteye_8644
·
2011-11-03 10:00
IkAnalyzer
3.1.6 分词 (兼容lucene2.4 和2.9)
package com.ourdms.util; import java.io.IOException; import java.io.StringReader; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.Token; import org.apache.lucene.analysis
wmj2003
·
2011-11-01 15:00
IKAnalyzer
IkAnalyzer
3.1.6 分词 (兼容lucene2.4 和2.9)
package com.ourdms.util; import java.io.IOException; import java.io.StringReader; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.Token; import org.apache.lucene.analysis
wmj2003
·
2011-11-01 15:00
IKAnalyzer
org.apache.lucene.analysis.TokenStream.incrementToken()Z
在使用lucene3与
IKAnalyzer
集成的时候可能会出现以下错误: Exception in thread "main" java.lang.AbstractMethodError
aiyan3344
·
2011-10-25 14:00
Lucene
Lucene入门级笔记五 -- 分词器,使用中文分词器,扩展词库,停用词 .
阅读更多1.常见的中文分词器有:极易分词的(MMAnalyzer)、"庖丁分词"分词器(PaodingAnalzyer)、
IKAnalyzer
等等。
yang7527
·
2011-10-24 22:00
Lucene入门级笔记五 -- 分词器,使用中文分词器,扩展词库,停用词 .
常见的中文分词器有:极易分词的(MMAnalyzer) 、"庖丁分词"分词器(PaodingAnalzyer)、
IKAnalyzer
等等。
yang7527
·
2011-10-24 22:00
Lucene
IKanalyzer
3.2的问题
使用
IKanalyzer
3.2+lucene3.0搜索一个文本内容,结果只能出现一条,其实能匹配很多条,下面是源代码: package com.lucene.demo; import
jp0520
·
2011-10-15 16:00
IKAnalyzer
Eclipse WepProject 和JavaProject对修改文件的影响
一个小问题,真是郁闷.需要使用
IKAnalyzer
的自定义字典.本来是很简单的事情,但却浪费我这么多时间。
westsince2001
·
2011-10-14 11:00
eclipse
IK Analyzer 3.0 中文分词器
http://linliangyi2007.iteye.com/blog/429960发布
IKAnalyzer
3.0中文分词器博客分类:程序人生luceneJavaSVN算法Eclipse最新:
IKAnalyzer
3.2.3
·
2011-09-29 15:00
IK
analyzer
solr3.3 中文IK分词 (
IKAnalyzer
3.2.8 bin.zip) --亲测
solr3.3中文IK分词(
IKAnalyzer
3.2.8bin.zip)(亲测) 1.IK下载地址 http://code.google.com/p/ik-analyzer/downloads/detail
黎明lm
·
2011-08-26 09:00
Solr
ik分词
solr3.3 中文IK分词 (
IKAnalyzer
3.2.8 bin.zip) --亲测
solr3.3中文IK分词(
IKAnalyzer
3.2.8bin.zip)(亲测) 1.IK下载地址 http://code.google.com/p/ik-analyzer/downloads/detail
黎明lm
·
2011-08-26 09:00
Solr
ik分词
Lucene3.3.0 烂笔头
项目中需要用到全文检索,不用说首选lucene.目前版本为3.3.0 lib中增加lucene-core-3.3.0.jar 分词器采用第三方的
IKAnalyzer
.版本为
IKAnalyzer
3.2.8
westsince2001
·
2011-08-11 14:00
Lucene
最新SH、Lucene3、
IKAnalyzer
3.2.3整合实例
Spring3.1,Hibernate3.6,Lucene3.0.3以及
IKAnalyzer
3.2.3,数据库采用Mysql,连接池采用dbcp.主要Jar如下:Spring重要Bean配置:
maxrocray
·
2011-08-05 10:00
quartz
Spring3
hibernate3.6
lucene3
IKAnalyzer
试用手记
其它什么的不哆嗦了,直接上代码。 import java.io.IOException; import java.io.StringReader; import org.wltea.analyzer.IKSegmentation; import org.wltea.analyzer.Lexeme; public class Test { /** * @param
luoyahu
·
2011-06-28 11:00
ext
dos
SHOP++中文分词词库扩展
编辑中文分词词库文件 词典文件编码格式:UTF-8(无 BOM)每个中文词汇独立占一行,使用 \r\n 的 DOS 方式换行(请参考
IKAnalyzer
3.1.6GA.jar文件org.wltea.analyzer.dic
一飞天
·
2011-06-16 22:00
Web
xml
ext
dos
sun
Nutch1.2 添加
IKAnalyzer
中文分词
原版nutch中对中文的处理是按字划分,而不是按词划分,我们可以为其添加一些中文分词插件,例如
IKAnalyzer
。参看了网上很多教程,最后也没能成功,最后综合了几个教程的内容,最终成功。
jiutao_tang
·
2011-06-02 17:00
tomcat
ant
String
jar
query
import
python 中文编码
wiki.woodpecker.org.cn/moin/PyInChinese1.中文.编码 1.1.背景知识 BPUG第15次.栖息谷文化传播现场会课Unicode应用交流(AlexDong) 1.2.中文搜索/分词 庖丁分词
IKAnalyzer
linuxerhqt
·
2011-05-31 11:00
windows
python
File
character
n2
encoding
nutch中文分词
这时,我还是用了
IKAnalyzer
,再次感谢作者的辛劳。提醒一下,这时用到的NUTCH是1.2版本。
墙头草的Java
·
2011-05-17 11:00
nutch中文分词
这时,我还是用了
IKAnalyzer
,再次感谢作者的辛劳。提醒一下,这时用到的NUTCH是1.2版本。
cxshun
·
2011-05-16 23:00
apache
.net
ant
Solr
J#
IKAnalyzer
中文分词器V3.0使用手册
1.
IKAnalyzer
3.0介绍
IKAnalyzer
是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,
IKAnalyzer
已经推出了3个大版本。
xuan0506
·
2011-05-10 16:00
设计模式
算法
Lucene
全文检索
Lucene入门级笔记五 -- 分词器,使用中文分词器,扩展词库,停用词
常见的中文分词器有:极易分词的(MMAnalyzer) 、"庖丁分词"分词器(PaodingAnalzyer)、
IKAnalyzer
等等。
登山之道
·
2011-04-17 19:00
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他