- Lucene中索引的删除,更新与查找以及恢复(lucene3.5)
LvesLi
Lucene
packageorg.itat.text1;importjava.io.File;importjava.io.IOException;importjavax.management.Query;importorg.apache.lucene.analysis.standard.StandardAnalyzer;importorg.apache.lucene.document.Document;imp
- Lucene3.5 之 索引删除和更新
doymm2008
Java技术
packagecom.ethan.index;importjava.io.File;importjava.io.IOException;importorg.apache.commons.io.FileUtils;importorg.apache.lucene.analysis.standard.StandardAnalyzer;importorg.apache.lucene.document.Do
- ElasticSearch之深度分页
球球T爸爸
Lucene3.5提供深度分页支持searchAfter方法(http://www.cnblogs.com/yuanermen/archive/2012/02/09/2343993.html)@OverridepublicListsearchBlogsList(Stringcontent,StringbTypeId,StringsDate,StringeDate,Pagepage)throwsIO
- Lucene3.5例子
ld_flex
java
原文地址:http://www.juziku.com/sunlightcs/wiki/4205.htmLucene3.5+IK分词器的例子,Lucene3.5改动有点大,很多方法都不推荐使用了。示例代码如下所示:?123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051
- 19、学习Lucene3.5索引之高亮搜索
咸鱼最牛逼
全文搜索引擎lucene3.5
/***Lucene高亮显示:*1.引入“lucene-highlighter”包*/publicclassHighLighter{privateIndexReaderindexReader;publicvoidhighLightTest(){try{Stringstr="我是一只丑小鸭,咿呀咿呀呦!门前一只鸭,四五六七八;鹅鹅鹅,曲项向天歌,白毛浮绿水,红掌拨清波";QueryParserque
- lucene初探(二):中文分词,以及系统自带分词简单比较
都市桃源
lucene
lucene学习我不得不承认这门技术是我目前接触的最有难度的一门技术,也许是因为我最近比较浮躁吧,也也是因为我没有找到,官方的说明文档和网络上比较不错的视频教程,不是有的讲解人普通话说得跟方言似的,英文读的跟3岁小孩似的,比如宋亮,他的lucene3.5的教程简直让我难以忍受所以还是自己摸索摸索吧上一篇lucene初探(一),讲解了简单的lucene文件查询,貌似lucene和solr配合更能发挥
- Lucene教程
万古情仇一梦中
一:简单的示例
1.1:生成索引1.1.1:Field.Store和Field.Index1.1.2:为数字生成索引1.1.3:为索引加权1.1.4:为日期生成索引1.2:查询1.2.1:介绍IndexReader1.3:删除1.3.1:还原删除的文档1.3.2:清空回收站时面的数据1.4:更新 前言:本教程用于Lucene3.5,Maven地址为
org.apache.lucene
lu
- lucene两种分页,在solr我还没测试过
fengyong7723131
基于lucene的分页有两种: lucene3.5之前分页提供的方式为再查询方式(每次查询全部记录,然后取其中部分记录,这种方式用的最多),lucene官方的解释:由于我们的速度足够快。处理海量数据时,内存容易内存溢出。 lucene3.5以后提供一个searchAfter,这个是在特大数据量采用(亿级数据量),速度相对慢一点,像google搜索图片的时候,点击更多,然后再出来一批。这种方式就
- lucene学习-创建索引
Lucene
本文的lucene是基于lucene3.5版本.
使用lucene实现搜索引擎开发,核心的部分是建立索引和搜索。本节主要是记录创建索引部分的内容。
创建的索引结构如图所示。
创建索引的步骤分为以下几个步骤:
1、建立索引器IndexWriter
2、创建
- lucene的两种分页操作
m635674608
Lucene
基于lucene的分页有两种:
lucene3.5之前分页提供的方式为再查询方式(每次查询全部记录,然后取其中部分记录,这种方式用的最多),lucene官方的解释:由于我们的速度足够快。处理海量数据时,内存容易内存溢出。
lucene3.5以后提供一个searchAfter,这个是在特大数据量采用(亿级数据量),速度相对慢一点,像google
- lucene的两种分页操作
lucene分页
基于lucene的分页有两种:lucene3.5之前分页提供的方式为再查询方式(每次查询全部记录,然后取其中部分记录,这种方式用的最多),lucene官方的解释:由于我们的速度足够快。处理海量数据时,内存容易内存溢出。lucene3.5以后提供一个searchAfter,这个是在特大数据量采用(亿级数据量),速度相对慢一点,像google搜索图片的时候,点击更多,然后再出来一批。这种方式就是把数据
- lucene3.5通过NRTManager和SearchManager实现近实时搜索
Victor_Cindy1
搜索Lucene
实时搜索(近实时搜索) 完全的实时搜索:只要数据库一变动,马上要更新索引,writer.commit来操作 近实时搜索:当用户修改了信息之后,先把索引保存到内存中,然后在一个统一的时间对内存中的所有的索引进行提交操作。reopen,NRTManager(near-real-time)lucene通过NRTManager这个类来实现近实时搜索,所谓近实时搜索即在索引发生改变时,通过线程跟踪,在
- lucene3.5实现自定义同义词分词器
Victor_Cindy1
搜索Lucene扩展
最近一直在学Lucene3.5,感觉里面的知识真的很棒。今天就和大家一起分享一下我们自己来实现一个同义词的分词器。一个分词器由多个Tokenizer和TokenFilter组成,这篇文章讲解的就是我们利用这两个特性实现自己的一个简单的同义词分词器,不妥之处请大家指出。一、设计思路什么叫同义词搜索呢?比如我们在搜”中国“这个词的时候,我们也可以搜索”大陆“这个词,后者搜索的要包含”中国“这个单词的文
- Lucene3.5自定义评分以及根据域进行自定义评分设定
Victor_Cindy1
一、首先来综述一下Lucene自定义评分的步骤:1、创建一个评分域FieldScoreQueryfd=newFieldScoreQuery("score",Type.INT);2、根据评分域和原有的query创建自定义的query对象MyCustomScoreQueryquery=newMyCustomScoreQuery(q,fd);@SuppressWarnings("serial")
pri
- lucene4.0入门1
明舞
Lucene主要分为三大块:1、创建索引2、分词3、读取并查询索引前提:由于本人目前看的是3.5的视频材料,所以可能里面有的写法还是3.5的写法,我能保证demo能跑通,能运营,能明白意思。发现在lucene3.5里,lucene的主要jar都在core包里,但是在4.0以后好像被拆分成了多个jar,需要根据项目需要,一点一点自己往上加jar包。所用jar: lucene4.10.2教学视频:lu
- lucene学习-创建索引
gyouxu
本文的lucene是基于lucene3.5版本. 使用lucene实现搜索引擎开发,核心的部分是建立索引和搜索。本节主要是记录创建索引部分的内容。 创建的索引结构如图所示。 创建索引的步骤分为以下几个步骤:1、建立索引器IndexWriter2、创建文档对象Document3、建立信息对象字段Field4、将Field对象添加到Document5、将Document对象添加到Inde
- lucene学习-创建索引
gyouxu
本文的lucene是基于lucene3.5版本. 使用lucene实现搜索引擎开发,核心的部分是建立索引和搜索。本节主要是记录创建索引部分的内容。 创建的索引结构如图所示。 创建索引的步骤分为以下几个步骤:1、建立索引器IndexWriter2、创建文档对象Document3、建立信息对象字段Field4、将Field对象添加到Document5、将Document对象添加到Inde
- lucene可视化工具luke
hbiao68
Lucene
由于我自己是在网上下载的视频,学习的是lucene3.5,因此也提供下载链接:http://pan.baidu.com/s/1mgr6CcC luke是一个查询索引的工具,使用时必须注意:版本要与lucene的版本完全一致,否则可能打不开索引信息。 java-jarluke-xx-xx.jar可以打开索引 选择索引所存储的目录,就可以使用luke查询和操作相应的索引信息,并且可以在search中根
- lucene可视化工具luke
hbiao68
Lucene
由于我自己是在网上下载的视频,学习的是lucene3.5,因此也提供下载链接:http://pan.baidu.com/s/1mgr6CcC luke是一个查询索引的工具,使用时必须注意:版本要与lucene的版本完全一致,否则可能打不开索引信息。 java-jarluke-xx-xx.jar可以打开索引 选择索引所存储的目录,就可以使用luke查询和操作相应的索引信息,并且可以在search中根
- lucene可视化工具luke
hbiao68
Lucene
由于我自己是在网上下载的视频,学习的是lucene3.5,因此也提供下载链接:http://pan.baidu.com/s/1mgr6CcC luke是一个查询索引的工具,使用时必须注意:版本要与lucene的版本完全一致,否则可能打不开索引信息。 java-jarluke-xx-xx.jar可以打开索引 选择索引所存储的目录,就可以使用luke查询和操作相应的索引信息,并且可以在search中根
- lucene可视化工具luke
hbiao68
Lucene
由于我自己是在网上下载的视频,学习的是lucene3.5,因此也提供下载链接:http://pan.baidu.com/s/1mgr6CcC luke是一个查询索引的工具,使用时必须注意:版本要与lucene的版本完全一致,否则可能打不开索引信息。 java-jarluke-xx-xx.jar可以打开索引 选择索引所存储的目录,就可以使用luke查询和操作相应的索引信息,并且可以在search中根
- lucene3.5 solr1.8.5 tomcat6.0
qq1013712290
lucene3.5
solr:
1.建立solr目录:E:\ProgramData\solr\home,并把apache-solr-3.5.0\example\solr目录下的所有文件复制过来
2.建立solr目录:E:\ProgramData\solr\server\solr,并把E:\Program Files (x86)\tomcats\apache-solr-3.5.0\example\webapps\s
- 三、lucene3.5的分词语法[停用词扩展、同义词搜索等]
wxwzy738
1、2、语汇单元的结构解释3、同义词的设计思路4、分词器的比较和测试packageorg.lucene.test;
importjava.io.File;
importjava.io.IOException;
importorg.apache.lucene.analysis.Analyzer;
importorg.apache.lucene.analysis.SimpleAnalyzer;
im
- 二、lucene3.5的查询语法
wxwzy738
1、工程结构2、查询语法代码packageorg.itat.index;
importjava.io.File;
importjava.io.IOException;
importjava.io.StringReader;
importjava.text.ParseException;
importjava.text.SimpleDateFormat;
importjava.util.Date;
- 一、lucene3.5的创建和增删改查
wxwzy738
1、工程结构2、索引创建时的属性:Field.Store.YES或者NO(存储域选项)设置为YES表示或把这个域中的内容完全存储到文件中,方便进行文本的还原设置为NO表示把这个域的内容不存储到文件中,但是可以被索引,此时内容无法完全还原(doc.get)Field.Index(索引选项)Index.ANALYZED:进行分词和索引,适用于标题、内容等Index.NOT_ANALYZED:进行索引,
- lucene3.5 中文分解IKAnalyzer 和 元分解 StandardAnalyzer
sungang_1120
Lucene
lucene3.5 中文分解IKAnalyzer 和 元分解 StandardAnalyzer
[size=large][/size][align=center][/align]
package com.txt.test2;
import java.io.IOException;
import java.io.Reader;
import ja
- lucene3.5 中文分解IKAnalyzer 和 元分解 StandardAnalyzer
sungang_1120
Lucene
lucene3.5 中文分解IKAnalyzer 和 元分解 StandardAnalyzer
[size=large][/size][align=center][/align]
package com.txt.test2;
import java.io.IOException;
import java.io.Reader;
import ja
- 用lucene3.6搜索数据库和txt文件内容
zjhh
lucene3站内搜索
我们以前经常碰到搜索数据库的内容;用like%的sql语句;如果数据量大而且多表查询时;速度实在让人难以忍受。。。如果用lucene3.6那就可以把这个恼人的问题解决了。lucene3.6搜索photo表的title,username,tagname,desr内容;用一个例题来说明更直观;此例题能搜索中文分词;(需要mysql5的jdbc包和lucene3.5的包):1、数据库我用mysql5;建
- lucene3.5以上版本jar包模块的用处(分词+分组+高亮+搜索提示)
yjflinchong
JOINjarLucenequery全文检索
lucene3.5以上版本jar包模块的用处(分词+分组+高亮+搜索提示)免费的源码demo http://download.csdn.net/detail/yjflinchong/4291818analyzers: 各种分词器以国家、语言、功能进行分类http://download.csdn.net/detail/yjflinchong/4291723http://download.csdn.
- 我对Lucene3.5实时搜索的一点儿整理
寒冰蓝血
Lucene3.5实时搜索
lucene3.5中,对于其近实时搜索,主要包括了两个核心的东西,NRTManager,SearcherManager,记录下自己的理解和认知。。。。。。构建NRTManager,利用NRTManager,SearcherManager来实现近实时搜索 其原理是: 首先要说明2个问题,实时搜索包含两部分: 1能够将索引实时的提交commit,也就是我们用到的IndexWriter对象的commit
- 统一思想认识
永夜-极光
思想
1.统一思想认识的基础,才能有的放矢
原因:
总有一种描述事物的方式最贴近本质,最容易让人理解.
如何让教育更轻松,在于找到最适合学生的方式.
难点在于,如何模拟对方的思维基础选择合适的方式. &
- Joda Time使用笔记
bylijinnan
javajoda time
Joda Time的介绍可以参考这篇文章:
http://www.ibm.com/developerworks/cn/java/j-jodatime.html
工作中也常常用到Joda Time,为了避免每次使用都查API,记录一下常用的用法:
/**
* DateTime变化(增减)
*/
@Tes
- FileUtils API
eksliang
FileUtilsFileUtils API
转载请出自出处:http://eksliang.iteye.com/blog/2217374 一、概述
这是一个Java操作文件的常用库,是Apache对java的IO包的封装,这里面有两个非常核心的类FilenameUtils跟FileUtils,其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装,开发中对文件的操作,几乎都可以在这个框架里面找到。 非常的好用。
- 各种新兴技术
不懂事的小屁孩
技术
1:gradle Gradle 是以 Groovy 语言为基础,面向Java应用为主。基于DSL(领域特定语言)语法的自动化构建工具。
现在构建系统常用到maven工具,现在有更容易上手的gradle,
搭建java环境:
http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/
搭建android环境:
http://m
- tomcat6的https双向认证
酷的飞上天空
tomcat6
1.生成服务器端证书
keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
- 托管虚拟桌面市场势不可挡
蓝儿唯美
用户还需要冗余的数据中心,dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台,提供服务或者MSP也可以自己来控制。
在某些情况下,MSP会在dinCloud的云服务上进行服务分层,如监控和补丁管理。
MSP的利润空间将根据其参与的程度而有所不同,Din说。
“我们有一些合作伙伴负责将我们推荐给客户作为个
- spring学习——xml文件的配置
a-john
spring
在Spring的学习中,对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中,采用XML配置也是最常见的。以下是一个简单的XML配置文件:
<?xml version="1.0" encoding="UTF-8"?>
<beans xmlns="http://www.springframework.or
- HDU 4342 History repeat itself 模拟
aijuans
模拟
来源:http://acm.hdu.edu.cn/showproblem.php?pid=4342
题意:首先让求第几个非平方数,然后求从1到该数之间的每个sqrt(i)的下取整的和。
思路:一个简单的模拟题目,但是由于数据范围大,需要用__int64。我们可以首先把平方数筛选出来,假如让求第n个非平方数的话,看n前面有多少个平方数,假设有x个,则第n个非平方数就是n+x。注意两种特殊情况,即
- java中最常用jar包的用途
asia007
java
java中最常用jar包的用途
jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口,提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法,以及接收和处理SOAP错误的方法. w
- ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法
百合不是茶
jsjson编码返回异常
一:ajax获取自定义Struts框架中的json编码 出现以下 问题:
1,强制flush输出 json编码打印在首页
2, 不强制flush js会解析json 打印出来的是错误的jsp页面 却没有跳转到错误页面
3, ajax中的dataType的json 改为text 会
- JUnit使用的设计模式
bijian1013
java设计模式JUnit
JUnit源代码涉及使用了大量设计模式
1、模板方法模式(Template Method)
定义一个操作中的算法骨架,而将一些步骤延伸到子类中去,使得子类可以不改变一个算法的结构,即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构,也就是步骤,而步骤的实现可以在子类中完成。
 
- Linux常用命令(摘录)
sunjing
crondchkconfig
chkconfig --list 查看linux所有服务
chkconfig --add servicename 添加linux服务
netstat -apn | grep 8080 查看端口占用
env 查看所有环境变量
echo $JAVA_HOME 查看JAVA_HOME环境变量
安装编译器
yum install -y gcc
- 【Hadoop一】Hadoop伪集群环境搭建
bit1129
hadoop
结合网上多份文档,不断反复的修正hadoop启动和运行过程中出现的问题,终于把Hadoop2.5.2伪分布式安装起来,跑通了wordcount例子。Hadoop的安装复杂性的体现之一是,Hadoop的安装文档非常多,但是能一个文档走下来的少之又少,尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布,但是它的配置跟2.5.0,2.5.1没有分别。 &nb
- Anychart图表系列五之事件监听
白糖_
chart
创建图表事件监听非常简单:首先是通过addEventListener('监听类型',js监听方法)添加事件监听,然后在js监听方法中定义具体监听逻辑。
以钻取操作为例,当用户点击图表某一个point的时候弹出point的name和value,代码如下:
<script>
//创建AnyChart
var chart = new AnyChart();
//添加钻取操作&quo
- Web前端相关段子
braveCS
web前端
Web标准:结构、样式和行为分离
使用语义化标签
0)标签的语义:使用有良好语义的标签,能够很好地实现自我解释,方便搜索引擎理解网页结构,抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容,具有很好的可读性,从而实现对特殊终端的兼容。
1)div和span是没有语义的:只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时,才会适当添加div
- 编程之美-24点游戏
bylijinnan
编程之美
import java.util.ArrayList;
import java.util.Arrays;
import java.util.HashSet;
import java.util.List;
import java.util.Random;
import java.util.Set;
public class PointGame {
/**编程之美
- 主页面子页面传值总结
chengxuyuancsdn
总结
1、showModalDialog
returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值
主界面
var sonValue=window.showModalDialog("son.jsp");
子界面
window.retu
- [网络与经济]互联网+的含义
comsci
互联网+
互联网+后面是一个人的名字 = 网络控制系统
互联网+你的名字 = 网络个人数据库
每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
- oracle 创建视图 with check option
daizj
视图vieworalce
我们来看下面的例子:
create or replace view testview
as
select empno,ename from emp where ename like ‘M%’
with check option;
这里我们创建了一个视图,并使用了with check option来限制了视图。 然后我们来看一下视图包含的结果:
select * from testv
- ToastPlugin插件在cordova3.3下使用
dibov
Cordova
自己开发的Todos应用,想实现“
再按一次返回键退出程序 ”的功能,采用网上的ToastPlugins插件,发现代码或文章基本都是老版本,运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。
ToastPlugin.java
package&nbs
- C语言22个系统函数
dcj3sjt126com
cfunction
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分(尾数)x和 以2位的指数部分n,即num=x*2n,指数n存放在exp指向的变量中,返回x。D
- 开发一个类的流程
dcj3sjt126com
开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件,并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库,供以后复用。
以下是开发流程:
1. 明确类的功能,抽象出类的大概结构
2. 初步设想类的接口
3. 类名设计(驼峰式命名)
4. 属性设置(权限设置)
判断某些变量是否有必要作为成员属
- java 并发
shuizhaosi888
java 并发
能够写出高伸缩性的并发是一门艺术
在JAVA SE5中新增了3个包
java.util.concurrent
java.util.concurrent.atomic
java.util.concurrent.locks
在java的内存模型中,类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享,局部变量与方法参数都是线程私有的,不会被共享。
- Spring Security(11)——匿名认证
234390216
Spring SecurityROLE_ANNOYMOUS匿名
匿名认证
目录
1.1 配置
1.2 AuthenticationTrustResolver
对于匿名访问的用户,Spring Security支持为其建立一个匿名的AnonymousAuthenticat
- NODEJS项目实践0.2[ express,ajax通信...]
逐行分析JS源代码
Ajaxnodejsexpress
一、前言
通过上节学习,我们已经 ubuntu系统搭建了一个可以访问的nodejs系统,并做了nginx转发。本节原要做web端服务 及 mongodb的存取,但写着写着,web端就
- 在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值
lhbthanks
javahtmlstrutscheckbox
第一种方法:获取结果String类型
在 Action 中获得的是一个 String 型数据,每一个被选中的 checkbox 的 value 被拼接在一起,每个值之间以逗号隔开(,)。
所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。
以下是实现的代码:
前台 HTML 代码:
- 003.Kafka基本概念
nweiren
hadoopkafka
Kafka基本概念:Topic、Partition、Message、Producer、Broker、Consumer。 Topic: 消息源(Message)的分类。 Partition: Topic物理上的分组,一
- Linux环境下安装JDK
roadrunners
jdklinux
1、准备工作
创建JDK的安装目录:
mkdir -p /usr/java/
下载JDK,找到适合自己系统的JDK版本进行下载:
http://www.oracle.com/technetwork/java/javase/downloads/index.html
把JDK安装包下载到/usr/java/目录,然后进行解压:
tar -zxvf jre-7
- Linux忘记root密码的解决思路
tomcat_oracle
linux
1:使用同版本的linux启动系统,chroot到忘记密码的根分区passwd改密码 2:grub启动菜单中加入init=/bin/bash进入系统,不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 3: grub启动菜单中加入 single以单用户进入系统. 4:用以上方法mount到根分区把/etc/passwd中的root密码去除 例如: ro
- 跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现
xueyou
jsonpjquery框架UIhtml5
postMessage 是 HTML5 新方法,它可以实现跨域窗口之间通讯。到目前为止,只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持,而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样,前者是前端擅长跨域文档数据即时通讯,后者擅长针对跨域服务端数据通讯,p