E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Paoding
HighLighter
并设定环境变量
PAODING
_DIC_HOME指向词典位置。前两个可以
jetway
·
2010-05-06 08:00
apache
.net
ant
Lucene
Gmail
hibernate spring 的第二种方式 ( 通过 定时器进行数据同步)compass-2.2.0 lucene-2.9.2. hibernate-distribut spring 2.5.6
paoding
jixiuffff
·
2010-04-27 13:00
spring
Hibernate
bean
Class
attributes
delay
lucene 查看分词器分出的词
importjava.io.StringReader;importnet.
paoding
.analysis.analyzer.
Paoding
Analyzer;importorg.apache.lucene.analysis.Analyzer
jixiuffff
·
2010-04-25 15:00
lucene compass 学习系列 笔记 一,纯lucene 构建搜索
一:下载lucene以下版本,lucene-3.0.1 及lucene-2.9.23.0.1版本的与以前的版本有很大的差异,而像
paoding
-analysis-2.0.4-beta (庖丁中文分词器,
jixiuffff
·
2010-04-25 14:00
c
数据库
Lucene
query
insert
Dictionary
Httpd Tomcat整合
、软件版本: Tomcate 5.5;Apache Httpd 2.2;JDK 1.6;S6240本;WinXP Home Edition操作系统; 2、需求概况: 对外总共有5个服务:www.
paoding
.net
kilroy
·
2010-04-14 23:00
tomcat
应用服务器
.net
jsp
Office
sphinx中聚类统计的实现与数据表设计
阅读更多开场白:sphinx是一个简单但功能相当强大的基于mysql的一个搜索插件包.1搜索速度方面稍比lucene快,索引分词速度上也比lucene的分词工具如:IK,
paoding
等快.
kernaling.wong
·
2010-04-12 19:00
设计模式
数据结构
lucene
MySQL
SQL
sphinx中聚类统计的实现与数据表设计
开场白:sphinx是一个简单但功能相当强大的基于mysql的一个搜索插件包.1搜索速度方面稍比lucene快,索引分词速度上也比lucene的分词工具如:IK,
paoding
等快.
kernaling.wong
·
2010-04-12 19:00
设计模式
数据结构
sql
mysql
Lucene
对庖丁解牛(
paoding
)画蛇添足
在用
paoding
的时候,我发现一些词组我认为是有用,却被它过滤掉,查看了一下源代码,发现有加载过x-noise-word,于是我将x-noise-word里面关于我需要的词组删除掉,那么这样是变成有用的词了吧
lzj0470
·
2010-04-12 17:00
java
.net
Paoding
Analyzer 庖丁 解牛 分词
Paoding
Analyzer庖丁解牛 je分词用lucene.中文分词庖丁解牛 一般使用使用评估参考资料下载开始使用分词策略 效果体验 在命令行模式下执行analyzer.bat(windows
wisdombrave
·
2010-01-14 17:00
apache
.net
linux
JUnit
Lucene
regain 安装
一、修改增加中文分词模块为
Paoding
-analysis 非常简单,只需要修改一个源码文件。
wujiangming
·
2010-01-10 19:00
apache
.net
jsp
ant
Lucene
java lucene乱码
regain增加
paoding
中文分词以及server端版本设置 原文来自:http://monner.iteye.com/blog/254804 ———————————————————————-
wujiangming
·
2010-01-10 17:00
java
windows
.net
Blog
Lucene
paoding
庖丁解牛中文分词介绍
paoding
庖丁解牛中文分词介绍 北京一个同事写的东东,最近要做搜索,所以拿来用用。先学会如何使用。有空再分析分析代码,多向高手学习学习。
sillycat
·
2010-01-05 23:00
.net
xml
SVN
配置管理
Google
java lucene
file_id=2419546 http://code.google.com/p/
paoding
/downloads/list lucene3.0入门实例20
wujiangming
·
2010-01-05 23:00
java
.net
F#
Google
Lucene
Lucene简单入门示例
zhch.illq.lucene; import java.io.File; import java.io.FileReader; import java.io.IOException; import net.
paoding
.analysis.analyzer.
Paoding
Anal
qinglangee
·
2009-12-22 14:00
apache
.net
F#
Lucene
Lucene+
Paoding
完整实例
一个小小的搜索例子,实现对某个文件夹下的文件进行搜索 这里只有主要代码,整个project在附件中,导入到MyEclipse中时根据自己的情况修改配置文件中
paoding
-dic-home.properties
xuexin0714
·
2009-12-10 17:00
jsp
PHP
MyEclipse
servlet
Lucene
中文庖丁分词的ANT文件
> <project name="
paoding
analysis" basedir=".
qinglangee
·
2009-11-30 16:00
xml
ant
ssh与compass结合的例子
.jar compass-index-patch.jar lucene-core.jar lucene-highlighter.jar
paoding
-analysis.jar
ttaale
·
2009-11-30 11:00
spring
xml
quartz
ssh
Lucene
当前几个主要的Lucene中文分词器的比较
基本介绍:
paoding
:Lucene中文分词“庖丁解牛”
Paoding
Analysis imdict :imdict智能词典所采用的智能中文分词程序 mmseg4j : 用 Chih-Hao
zxl263com
·
2009-11-30 09:00
算法
SVN
Google
Lucene
全文检索
基于Lucene的最流行的分词法
基于Lucene的最流行的分词法2009-11-0516:141.基本介绍:
paoding
:Lucene中文分词“庖丁解牛”
Paoding
Analysisimdict:imdict智能词典所采用的智能中文分词程序
sealbird
·
2009-11-27 13:00
paoding
庖丁解牛中文分词介绍
paoding
庖丁解牛中文分词介绍 北京一个同事写的东东,最近要做搜索,所以拿来用用。先学会如何使用。有空再分析分析代码,多向高手学习学习。
laotu5i0
·
2009-11-09 16:00
xml
.net
SVN
Google
配置管理
在Lucene中应用poading进行分词
1、下载poading解牛 http://code.google.com/p/
paoding
/downloads/list 2、设置系统环境变量
PAODING
_DIC_HOME指向词典安装目录 如:
paoding
.dic.home
zfsn
·
2009-11-07 17:00
apache
.net
Google
软件测试
Lucene
当前几个主要的Lucene中文分词器的比较
基本介绍:
paoding
:Lucene中文分词“庖丁解牛”
Paoding
Analysisimdict :imdict智能词典所采用的智能中文分词程序mmseg4j : 用 Chih-Hao Tsai
unixboy
·
2009-10-21 21:00
算法
SVN
Google
Lucene
全文检索
当前几个主要的Lucene中文分词器的比较
基本介绍:
paoding
:Lucene中文分词“庖丁解牛”
Paoding
Analysisimdict :imdict智能词典所采用的智能中文分词程序mmseg4j : 用 Chih-Hao Tsai
unixboy
·
2009-10-21 21:00
算法
SVN
Google
Lucene
全文检索
compass+
paoding
分词器与Spring的集成使用
1、先说一下
paoding
分词器的使用: 1>把安装目录下的
paoding
-analysis.jar文件拷贝到项目的classpath下.2>把安装目录下的dic整个拷贝到项目的src下.3&
wjjbfq
·
2009-09-23 22:00
spring
bean
Hibernate
jpa
配置管理
linux下更新发布futuresi18.txt
1、打包前与本地版本的区别需要修改的几个文件:(1)jdbc.properties(2)
paoding
-dic-home.properties(3)system_en_US.properties(4)system_zh_CN.properties
whp0731
·
2009-09-17 20:00
tomcat
linux
jdbc
Nutch1.0开源搜索引擎与
Paoding
在eclipse中用plugin方式集成(终极篇)
本文主要描述的是如何将
paoding
分词用plugin方式集成到 nutch1.0中去,在集成之前首先要在eclipse中把nutch1.0编译通过。
banditjava
·
2009-09-14 13:00
apache
eclipse
ant
搜索引擎
Lucene
在lucene中应用poading进行分词
1、下载poading解牛 http://code.google.com/p/
paoding
/downloads/list 2、设置系统环境变量
PAODING
_DIC_HOME指向词典安装目录 如
zhxmyself
·
2009-09-07 11:00
apache
.net
Google
软件测试
Lucene
当前几个主要的Lucene中文分词器的比较
基本介绍:
paoding
:Lucene中文分词“庖丁解牛”
Paoding
Analysisimdict :imdict智能词典所采用的智能中文分词程序mmseg4j 
liliang_xf
·
2009-08-19 12:00
算法
SVN
Google
Lucene
全文检索
当前几个主要的Lucene中文分词器的比较
基本介绍:
paoding
:Lucene中文分词“庖丁解牛”
Paoding
Analysis imdict :imdict智能词典所采用的智能中文分词程序 mmseg4j : 用 Chih-Hao
wallimn
·
2009-08-18 12:00
算法
SVN
Google
Lucene
全文检索
当前几个主要的Lucene中文分词器的比较
基本介绍:
paoding
:Lucene中文分词“庖丁解牛”
Paoding
Analysis imdict :imdict智能词典所采用的智能中文分词程序 mmseg4j : 用 Chih-Hao
wallimn
·
2009-08-18 12:00
算法
SVN
Google
Lucene
全文检索
当前几个主要的Lucene中文分词器的比较
基本介绍:
paoding
:Lucene中文分词“庖丁解牛”
Paoding
Analysis imdict :imdict智能词典所采用的智能中文分词程序 mmseg4j : 用 Chih-Hao
wallimn
·
2009-08-18 12:00
算法
SVN
Google
Lucene
全文检索
solr 和
paoding
整合
solr 和
paoding
整合 一.
qiaopang
·
2009-08-18 11:00
apache
tomcat
.net
Lucene
Solr
使用Lucene和
Paoding
实现关键词高亮
,忙的以至于我忘记了我还写过一个Lucene的搜索程序,最初写这个程序是在2008年9月,到上周进行更改已经过了将近1年的时间,对于中文的分词包也出现了多个版本,发现目前比较流行的中文分词包是“庖丁(
Paoding
sw840227
·
2009-08-13 15:19
Lucene
高亮
关键词
paoding
庖丁
使用Lucene和
Paoding
实现关键词高亮
,忙的以至于我忘记了我还写过一个Lucene的搜索程序,最初写这个程序是在2008年9月,到上周进行更改已经过了将近1年的时间,对于中文的分词包也出现了多个版本,发现目前比较流行的中文分词包是“庖丁(
Paoding
sw840227
·
2009-08-13 15:19
关键词
高亮
Lucene
Lucene&Heritrix
使用Lucene和
Paoding
实现关键词高亮
,忙的以至于我忘记了我还写过一个Lucene的搜索程序,最初写这个程序是在2008年9月,到上周进行更改已经过了将近1年的时间,对于中文的分词包也出现了多个版本,发现目前比较流行的中文分词包是“庖丁(
Paoding
sw840227
·
2009-08-13 15:19
Lucene
高亮
关键词
paoding
庖丁
当前几个主要的Lucene中文分词器的比较
基本介绍:
paoding
:Lucene中文分词“庖丁解牛”
Paoding
Analysisimdict :imdict智能词典所采用的智能中文分词程序mmseg4j : 用 Chih-Hao
akunamotata
·
2009-08-10 09:00
算法
SVN
Google
Lucene
全文检索
当前几个主要的Lucene中文分词器的比较
当前几个主要的Lucene中文分词器的比较【转载】转载地址:http://www.javaeye.com/news/96371.基本介绍:
paoding
:Lucene中文分词“庖丁解牛”
Paoding
Analysisimdict
生命科学领域的专业信息解决方案!
·
2009-08-09 10:00
关于Spring + Compass +
paoding
配置的一个注意点
compass.cfg.xmlapplicationContext.xmlclasspath:xxx/POJO.cmd.xmlclasspath:xxx/POJO.cpm.xmlC:/targetnet.
paoding
.analysis.analyzer.
Paoding
Analyzer
kunshan_shenbin
·
2009-08-04 15:00
spring
c
Class
Path
encoding
Lucene中文分析器的中文分词准确性和性能比较
分析器依次为:StandardAnalyzer、ChineseAnalyzer、 CJKAnalyzer、IK_CAnalyzer、MIK_CAnalyzer、MMAnalyzer(JE分词)、
Paoding
Analyzer
lzj0470
·
2009-07-30 10:00
Blog
Google
Lucene
体育
Lucene整合"庖丁解牛"中文分词 ----入门 2
Lucene整合"庖丁解牛"中文分词 ----入门 2 相关的lucene包请到:http://code.google.com/p/
paoding
/downloads/list 下载
luanmad_java
·
2009-07-24 17:00
apache
jsp
MyEclipse
搜索引擎
Lucene
lucene实现多词/短语搜索
通过
Paoding
Analyzer、IK_Analyzer两个分词器来实现。具体分出来的无用的字:比如:的、人……,那么我们可以写一个配置文件。先罗列出一些无用的词。那么我们在建立索引的时候。
p_x1984
·
2009-07-14 10:00
Lucene
lucene实现多词/短语搜索
通过
Paoding
Analyzer、IK_Analyzer两个分词器来实现。具体分出来的无用的字:比如:的、人……,那么我们可以写一个配置文件。先罗列出一些无用的词。那么我们在建立索引的时候。
p_x1984
·
2009-07-14 10:00
Lucene
lucene中
paoding
的中文分词
1,把
paoding
-analysis-2.0.4-beta解压缩,给项目中加入
paoding
-analysis.jar。2,把dic文件夹放到项目的根目录中。dic文件夹里是
paoding
的词库。
p_x1984
·
2009-07-02 14:00
tomcat
Web
应用服务器
Lucene
lucene中
paoding
的中文分词
1,把
paoding
-analysis-2.0.4-beta解压缩,给项目中加入
paoding
-analysis.jar。2,把dic文件夹放到项目的根目录中。dic文件夹里是
paoding
的词库。
p_x1984
·
2009-07-02 14:00
tomcat
应用服务器
Web
Lucene
Lucene中使用
Paoding
中文分词
1,把
paoding
-analysis-2.0.4-beta解压缩,给项目中加入
paoding
-analysis.jar。2,把dic文件夹放到项目的根目录中。dic文件夹里是
paoding
的词库。
Squall
·
2009-06-30 16:00
Lucene笔记+
Paoding
Analyzer+高亮显示
[1](1)Lucene是一个基于Java全文搜索引擎,利用它可以轻易地为Java软件加入全文搜寻功能。(2)Lucene能做什么?Lucene可以对任何的数据做索引和搜索。Lucene不管数据源是什么格式,只要它能被转化为文字的形式,就可以被Lucene所分析利用。也就是说不管是MSword,Html,pdf还是其他什么形式的文件只要你可以从中抽取出文字形式的内容就可以被Lucene所用。(3)
shenzhenchufa
·
2009-06-17 17:14
职场
休闲
Lucene笔记+
Paoding
Analyzer+高亮显示
[1](1)Lucene是一个基于Java全文搜索引擎,利用它可以轻易地为Java软件加入全文搜寻功能。(2)Lucene能做什么?Lucene可以对任何的数据做索引和搜索。Lucene不管数据源是什么格式,只要它能被转化为文字的形式,就可以被Lucene所分析利用。也就是说不管是MSword,Html,pdf还是其他什么形式的文件只要你可以从中抽取出文字形式的内容就可以被Lucene所用。(3)
shenzhenchufa
·
2009-06-17 17:14
职场
休闲
Paoding
analysis使用小结
对
paoding
je、IK等进行测试,发现JE使用时一不注意就容易出现在索引或者检索时内存泄漏,其加载字典时花费内存45m左右,所以在运行时一般会在环境下设置内存参数 -Xmx256M等方法解决
凤凰山
·
2009-06-06 15:00
F#
idea
配置
paoding
analysis
在开源中文analysis,我选择了
paoding
analysis,link:http://code.google.com/p/
paoding
配置如下:在CLASSPATH上面加入:E:\eclipse
marshzg
·
2009-05-22 18:00
java
eclipse
log4j
.net
Lucene
mmseg4j 多分词模式与
paoding
分词效果对比
阅读更多mmseg4j1.6支持最多分词,应网友的要求:分词效果与
paoding
对比下。观察了
paoding
部分分词结果,现总结下。
chenlb
·
2009-04-13 09:00
音乐
算法
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他