- Lucene中索引的删除,更新与查找以及恢复(lucene3.5)
LvesLi
Lucene
packageorg.itat.text1;importjava.io.File;importjava.io.IOException;importjavax.management.Query;importorg.apache.lucene.analysis.standard.StandardAnalyzer;importorg.apache.lucene.document.Document;imp
- Lucene3.5 之 索引删除和更新
doymm2008
Java技术
packagecom.ethan.index;importjava.io.File;importjava.io.IOException;importorg.apache.commons.io.FileUtils;importorg.apache.lucene.analysis.standard.StandardAnalyzer;importorg.apache.lucene.document.Do
- ElasticSearch之深度分页
球球T爸爸
Lucene3.5提供深度分页支持searchAfter方法(http://www.cnblogs.com/yuanermen/archive/2012/02/09/2343993.html)@OverridepublicListsearchBlogsList(Stringcontent,StringbTypeId,StringsDate,StringeDate,Pagepage)throwsIO
- Lucene3.5例子
ld_flex
java
原文地址:http://www.juziku.com/sunlightcs/wiki/4205.htmLucene3.5+IK分词器的例子,Lucene3.5改动有点大,很多方法都不推荐使用了。示例代码如下所示:?123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051
- 19、学习Lucene3.5索引之高亮搜索
咸鱼最牛逼
全文搜索引擎lucene3.5
/***Lucene高亮显示:*1.引入“lucene-highlighter”包*/publicclassHighLighter{privateIndexReaderindexReader;publicvoidhighLightTest(){try{Stringstr="我是一只丑小鸭,咿呀咿呀呦!门前一只鸭,四五六七八;鹅鹅鹅,曲项向天歌,白毛浮绿水,红掌拨清波";QueryParserque
- lucene初探(二):中文分词,以及系统自带分词简单比较
都市桃源
lucene
lucene学习我不得不承认这门技术是我目前接触的最有难度的一门技术,也许是因为我最近比较浮躁吧,也也是因为我没有找到,官方的说明文档和网络上比较不错的视频教程,不是有的讲解人普通话说得跟方言似的,英文读的跟3岁小孩似的,比如宋亮,他的lucene3.5的教程简直让我难以忍受所以还是自己摸索摸索吧上一篇lucene初探(一),讲解了简单的lucene文件查询,貌似lucene和solr配合更能发挥
- Lucene教程
万古情仇一梦中
一:简单的示例
1.1:生成索引1.1.1:Field.Store和Field.Index1.1.2:为数字生成索引1.1.3:为索引加权1.1.4:为日期生成索引1.2:查询1.2.1:介绍IndexReader1.3:删除1.3.1:还原删除的文档1.3.2:清空回收站时面的数据1.4:更新 前言:本教程用于Lucene3.5,Maven地址为
org.apache.lucene
lu
- lucene两种分页,在solr我还没测试过
fengyong7723131
基于lucene的分页有两种: lucene3.5之前分页提供的方式为再查询方式(每次查询全部记录,然后取其中部分记录,这种方式用的最多),lucene官方的解释:由于我们的速度足够快。处理海量数据时,内存容易内存溢出。 lucene3.5以后提供一个searchAfter,这个是在特大数据量采用(亿级数据量),速度相对慢一点,像google搜索图片的时候,点击更多,然后再出来一批。这种方式就
- lucene学习-创建索引
Lucene
本文的lucene是基于lucene3.5版本.
使用lucene实现搜索引擎开发,核心的部分是建立索引和搜索。本节主要是记录创建索引部分的内容。
创建的索引结构如图所示。
创建索引的步骤分为以下几个步骤:
1、建立索引器IndexWriter
2、创建
- lucene的两种分页操作
m635674608
Lucene
基于lucene的分页有两种:
lucene3.5之前分页提供的方式为再查询方式(每次查询全部记录,然后取其中部分记录,这种方式用的最多),lucene官方的解释:由于我们的速度足够快。处理海量数据时,内存容易内存溢出。
lucene3.5以后提供一个searchAfter,这个是在特大数据量采用(亿级数据量),速度相对慢一点,像google
- lucene的两种分页操作
lucene分页
基于lucene的分页有两种:lucene3.5之前分页提供的方式为再查询方式(每次查询全部记录,然后取其中部分记录,这种方式用的最多),lucene官方的解释:由于我们的速度足够快。处理海量数据时,内存容易内存溢出。lucene3.5以后提供一个searchAfter,这个是在特大数据量采用(亿级数据量),速度相对慢一点,像google搜索图片的时候,点击更多,然后再出来一批。这种方式就是把数据
- lucene3.5通过NRTManager和SearchManager实现近实时搜索
Victor_Cindy1
搜索Lucene
实时搜索(近实时搜索) 完全的实时搜索:只要数据库一变动,马上要更新索引,writer.commit来操作 近实时搜索:当用户修改了信息之后,先把索引保存到内存中,然后在一个统一的时间对内存中的所有的索引进行提交操作。reopen,NRTManager(near-real-time)lucene通过NRTManager这个类来实现近实时搜索,所谓近实时搜索即在索引发生改变时,通过线程跟踪,在
- lucene3.5实现自定义同义词分词器
Victor_Cindy1
搜索Lucene扩展
最近一直在学Lucene3.5,感觉里面的知识真的很棒。今天就和大家一起分享一下我们自己来实现一个同义词的分词器。一个分词器由多个Tokenizer和TokenFilter组成,这篇文章讲解的就是我们利用这两个特性实现自己的一个简单的同义词分词器,不妥之处请大家指出。一、设计思路什么叫同义词搜索呢?比如我们在搜”中国“这个词的时候,我们也可以搜索”大陆“这个词,后者搜索的要包含”中国“这个单词的文
- Lucene3.5自定义评分以及根据域进行自定义评分设定
Victor_Cindy1
一、首先来综述一下Lucene自定义评分的步骤:1、创建一个评分域FieldScoreQueryfd=newFieldScoreQuery("score",Type.INT);2、根据评分域和原有的query创建自定义的query对象MyCustomScoreQueryquery=newMyCustomScoreQuery(q,fd);@SuppressWarnings("serial")
pri
- lucene4.0入门1
明舞
Lucene主要分为三大块:1、创建索引2、分词3、读取并查询索引前提:由于本人目前看的是3.5的视频材料,所以可能里面有的写法还是3.5的写法,我能保证demo能跑通,能运营,能明白意思。发现在lucene3.5里,lucene的主要jar都在core包里,但是在4.0以后好像被拆分成了多个jar,需要根据项目需要,一点一点自己往上加jar包。所用jar: lucene4.10.2教学视频:lu
- lucene学习-创建索引
gyouxu
本文的lucene是基于lucene3.5版本. 使用lucene实现搜索引擎开发,核心的部分是建立索引和搜索。本节主要是记录创建索引部分的内容。 创建的索引结构如图所示。 创建索引的步骤分为以下几个步骤:1、建立索引器IndexWriter2、创建文档对象Document3、建立信息对象字段Field4、将Field对象添加到Document5、将Document对象添加到Inde
- lucene学习-创建索引
gyouxu
本文的lucene是基于lucene3.5版本. 使用lucene实现搜索引擎开发,核心的部分是建立索引和搜索。本节主要是记录创建索引部分的内容。 创建的索引结构如图所示。 创建索引的步骤分为以下几个步骤:1、建立索引器IndexWriter2、创建文档对象Document3、建立信息对象字段Field4、将Field对象添加到Document5、将Document对象添加到Inde
- lucene可视化工具luke
hbiao68
Lucene
由于我自己是在网上下载的视频,学习的是lucene3.5,因此也提供下载链接:http://pan.baidu.com/s/1mgr6CcC luke是一个查询索引的工具,使用时必须注意:版本要与lucene的版本完全一致,否则可能打不开索引信息。 java-jarluke-xx-xx.jar可以打开索引 选择索引所存储的目录,就可以使用luke查询和操作相应的索引信息,并且可以在search中根
- lucene可视化工具luke
hbiao68
Lucene
由于我自己是在网上下载的视频,学习的是lucene3.5,因此也提供下载链接:http://pan.baidu.com/s/1mgr6CcC luke是一个查询索引的工具,使用时必须注意:版本要与lucene的版本完全一致,否则可能打不开索引信息。 java-jarluke-xx-xx.jar可以打开索引 选择索引所存储的目录,就可以使用luke查询和操作相应的索引信息,并且可以在search中根
- lucene可视化工具luke
hbiao68
Lucene
由于我自己是在网上下载的视频,学习的是lucene3.5,因此也提供下载链接:http://pan.baidu.com/s/1mgr6CcC luke是一个查询索引的工具,使用时必须注意:版本要与lucene的版本完全一致,否则可能打不开索引信息。 java-jarluke-xx-xx.jar可以打开索引 选择索引所存储的目录,就可以使用luke查询和操作相应的索引信息,并且可以在search中根
- lucene可视化工具luke
hbiao68
Lucene
由于我自己是在网上下载的视频,学习的是lucene3.5,因此也提供下载链接:http://pan.baidu.com/s/1mgr6CcC luke是一个查询索引的工具,使用时必须注意:版本要与lucene的版本完全一致,否则可能打不开索引信息。 java-jarluke-xx-xx.jar可以打开索引 选择索引所存储的目录,就可以使用luke查询和操作相应的索引信息,并且可以在search中根
- lucene3.5 solr1.8.5 tomcat6.0
qq1013712290
lucene3.5
solr:
1.建立solr目录:E:\ProgramData\solr\home,并把apache-solr-3.5.0\example\solr目录下的所有文件复制过来
2.建立solr目录:E:\ProgramData\solr\server\solr,并把E:\Program Files (x86)\tomcats\apache-solr-3.5.0\example\webapps\s
- 三、lucene3.5的分词语法[停用词扩展、同义词搜索等]
wxwzy738
1、2、语汇单元的结构解释3、同义词的设计思路4、分词器的比较和测试packageorg.lucene.test;
importjava.io.File;
importjava.io.IOException;
importorg.apache.lucene.analysis.Analyzer;
importorg.apache.lucene.analysis.SimpleAnalyzer;
im
- 二、lucene3.5的查询语法
wxwzy738
1、工程结构2、查询语法代码packageorg.itat.index;
importjava.io.File;
importjava.io.IOException;
importjava.io.StringReader;
importjava.text.ParseException;
importjava.text.SimpleDateFormat;
importjava.util.Date;
- 一、lucene3.5的创建和增删改查
wxwzy738
1、工程结构2、索引创建时的属性:Field.Store.YES或者NO(存储域选项)设置为YES表示或把这个域中的内容完全存储到文件中,方便进行文本的还原设置为NO表示把这个域的内容不存储到文件中,但是可以被索引,此时内容无法完全还原(doc.get)Field.Index(索引选项)Index.ANALYZED:进行分词和索引,适用于标题、内容等Index.NOT_ANALYZED:进行索引,
- lucene3.5 中文分解IKAnalyzer 和 元分解 StandardAnalyzer
sungang_1120
Lucene
lucene3.5 中文分解IKAnalyzer 和 元分解 StandardAnalyzer
[size=large][/size][align=center][/align]
package com.txt.test2;
import java.io.IOException;
import java.io.Reader;
import ja
- lucene3.5 中文分解IKAnalyzer 和 元分解 StandardAnalyzer
sungang_1120
Lucene
lucene3.5 中文分解IKAnalyzer 和 元分解 StandardAnalyzer
[size=large][/size][align=center][/align]
package com.txt.test2;
import java.io.IOException;
import java.io.Reader;
import ja
- 用lucene3.6搜索数据库和txt文件内容
zjhh
lucene3站内搜索
我们以前经常碰到搜索数据库的内容;用like%的sql语句;如果数据量大而且多表查询时;速度实在让人难以忍受。。。如果用lucene3.6那就可以把这个恼人的问题解决了。lucene3.6搜索photo表的title,username,tagname,desr内容;用一个例题来说明更直观;此例题能搜索中文分词;(需要mysql5的jdbc包和lucene3.5的包):1、数据库我用mysql5;建
- lucene3.5以上版本jar包模块的用处(分词+分组+高亮+搜索提示)
yjflinchong
JOINjarLucenequery全文检索
lucene3.5以上版本jar包模块的用处(分词+分组+高亮+搜索提示)免费的源码demo http://download.csdn.net/detail/yjflinchong/4291818analyzers: 各种分词器以国家、语言、功能进行分类http://download.csdn.net/detail/yjflinchong/4291723http://download.csdn.
- 我对Lucene3.5实时搜索的一点儿整理
寒冰蓝血
Lucene3.5实时搜索
lucene3.5中,对于其近实时搜索,主要包括了两个核心的东西,NRTManager,SearcherManager,记录下自己的理解和认知。。。。。。构建NRTManager,利用NRTManager,SearcherManager来实现近实时搜索 其原理是: 首先要说明2个问题,实时搜索包含两部分: 1能够将索引实时的提交commit,也就是我们用到的IndexWriter对象的commit
- JAVA基础
灵静志远
位运算加载Date字符串池覆盖
一、类的初始化顺序
1 (静态变量,静态代码块)-->(变量,初始化块)--> 构造器
同一括号里的,根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况,那就在父类到子类交替初始化。
二、String
1 String a = "abc";
JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象,根
- keepalived实现redis主从高可用
bylijinnan
redis
方案说明
两台机器(称为A和B),以统一的VIP对外提供服务
1.正常情况下,A和B都启动,B会把A的数据同步过来(B is slave of A)
2.当A挂了后,VIP漂移到B;B的keepalived 通知redis 执行:slaveof no one,由B提供服务
3.当A起来后,VIP不切换,仍在B上面;而A的keepalived 通知redis 执行slaveof B,开始
- java文件操作大全
0624chenhong
java
最近在博客园看到一篇比较全面的文件操作文章,转过来留着。
http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html
转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html
一.获得控制台用户输入的信息
&nbs
- android学习任务
不懂事的小屁孩
工作
任务
完成情况 搞清楚带箭头的pupupwindows和不带的使用 已完成 熟练使用pupupwindows和alertdialog,并搞清楚两者的区别 已完成 熟练使用android的线程handler,并敲示例代码 进行中 了解游戏2048的流程,并完成其代码工作 进行中-差几个actionbar 研究一下android的动画效果,写一个实例 已完成 复习fragem
- zoom.js
换个号韩国红果果
oom
它的基于bootstrap 的
https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序
<link rel="stylesheet" href="style/zoom.css">
<script src=&q
- 详解Oracle云操作系统Solaris 11.2
蓝儿唯美
Solaris
当Oracle发布Solaris 11时,它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是,这些说法没有告诉我们为什么Solaris是配得上云的。幸好,我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用:OpenStack、内核域、统一存档(UA)和弹性虚拟交换(EVS)。
- spring学习——springmvc(一)
a-john
springMVC
Spring MVC基于模型-视图-控制器(Model-View-Controller,MVC)实现,能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。
1,跟踪Spring MVC的请求
请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样,Spring MVC所有的请求都会通过一个前端控制器Servlet。前
- hdu4342 History repeat itself-------多校联合五
aijuans
数论
水题就不多说什么了。
#include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
- EJB和javabean的区别
asia007
beanejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了
1.EJB用于服务端应用开发, 而JavaBeans
- Struts的action和Result总结
百合不是茶
strutsAction配置Result配置
一:Action的配置详解:
下面是一个Struts中一个空的Struts.xml的配置文件
<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE struts PUBLIC
&quo
- 如何带好自已的团队
bijian1013
项目管理团队管理团队
在网上看到博客"
怎么才能让团队成员好好干活"的评论,觉得写的比较好。 原文如下: 我做团队管理有几年了吧,我和你分享一下我认为带好团队的几点:
1.诚信
对团队内成员,无论是技术研究、交流、问题探讨,要尽可能的保持一种诚信的态度,用心去做好,你的团队会感觉得到。 2.努力提
- Java代码混淆工具
sunjing
ProGuard
Open Source Obfuscators
ProGuard
http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
- 【Redis三】基于Redis sentinel的自动failover主从复制
bit1129
redis
在第二篇中使用2.8.17搭建了主从复制,但是它存在Master单点问题,为了解决这个问题,Redis从2.6开始引入sentinel,用于监控和管理Redis的主从复制环境,进行自动failover,即Master挂了后,sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作,如果Master醒来再次加入集群,只能以从服务器的形式工作。
什么是Sentine
- 使用代理实现Hibernate Dao层自动事务
白糖_
DAOspringAOP框架Hibernate
都说spring利用AOP实现自动事务处理机制非常好,但在只有hibernate这个框架情况下,我们开启session、管理事务就往往很麻烦。
public void save(Object obj){
Session session = this.getSession();
Transaction tran = session.beginTransaction();
try
- maven3实战读书笔记
braveCS
maven3
Maven简介
是什么?
Is a software project management and comprehension tool.项目管理工具
是基于POM概念(工程对象模型)
[设计重复、编码重复、文档重复、构建重复,maven最大化消除了构建的重复]
[与XP:简单、交流与反馈;测试驱动开发、十分钟构建、持续集成、富有信息的工作区]
功能:
- 编程之美-子数组的最大乘积
bylijinnan
编程之美
public class MaxProduct {
/**
* 编程之美 子数组的最大乘积
* 题目: 给定一个长度为N的整数数组,只允许使用乘法,不能用除法,计算任意N-1个数的组合中乘积中最大的一组,并写出算法的时间复杂度。
* 以下程序对应书上两种方法,求得“乘积中最大的一组”的乘积——都是有溢出的可能的。
* 但按题目的意思,是要求得这个子数组,而不
- 读书笔记-2
chengxuyuancsdn
读书笔记
1、反射
2、oracle年-月-日 时-分-秒
3、oracle创建有参、无参函数
4、oracle行转列
5、Struts2拦截器
6、Filter过滤器(web.xml)
1、反射
(1)检查类的结构
在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。
2、oracle年月日时分秒
s
- [求学与房地产]慎重选择IT培训学校
comsci
it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题
培训学校的教学楼和宿舍的环境和稳定性问题
我们大家都知道,房子是一个比较昂贵的东西,特别是那种能够当教室的房子...
&nb
- RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系
daizj
oraclermanfilespersetPARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 转
PARALLELISM ---
我们还可以通过parallelism参数来指定同时"自动"创建多少个通道:
RMAN > configure device type disk parallelism 3 ;
表示启动三个通道,可以加快备份恢复的速度。
- 简单排序:冒泡排序
dieslrae
冒泡排序
public void bubbleSort(int[] array){
for(int i=1;i<array.length;i++){
for(int k=0;k<array.length-i;k++){
if(array[k] > array[k+1]){
- 初二上学期难记单词三
dcj3sjt126com
sciet
concert 音乐会
tonight 今晚
famous 有名的;著名的
song 歌曲
thousand 千
accident 事故;灾难
careless 粗心的,大意的
break 折断;断裂;破碎
heart 心(脏)
happen 偶尔发生,碰巧
tourist 旅游者;观光者
science (自然)科学
marry 结婚
subject 题目;
- I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码 收藏代码
dcj3sjt126com
redis
wget http://download.redis.io/redis-stable.tar.gz
tar xvzf redis-stable.tar.gz
cd redis-stable
make
前面3步应该没有问题,主要的问题是执行make的时候,出现了异常。
异常一:
make[2]: cc: Command not found
异常原因:没有安装g
- 并发容器
shuizhaosi888
并发容器
通过并发容器来改善同步容器的性能,同步容器将所有对容器状态的访问都串行化,来实现线程安全,这种方式严重降低并发性,当多个线程访问时,吞吐量严重降低。
并发容器ConcurrentHashMap
替代同步基于散列的Map,通过Lock控制。
&nb
- Spring Security(12)——Remember-Me功能
234390216
Spring SecurityRemember Me记住我
Remember-Me功能
目录
1.1 概述
1.2 基于简单加密token的方法
1.3 基于持久化token的方法
1.4 Remember-Me相关接口和实现
- 位运算
焦志广
位运算
一、位运算符C语言提供了六种位运算符:
& 按位与
| 按位或
^ 按位异或
~ 取反
<< 左移
>> 右移
1. 按位与运算 按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时,结果位才为1 ,否则为0。参与运算的数以补码方式出现。
例如:9&am
- nodejs 数据库连接 mongodb mysql
liguangsong
mongodbmysqlnode数据库连接
1.mysql 连接
package.json中dependencies加入
"mysql":"~2.7.0"
执行 npm install
在config 下创建文件 database.js
- java动态编译
olive6615
javaHotSpotjvm动态编译
在HotSpot虚拟机中,有两个技术是至关重要的,即动态编译(Dynamic compilation)和Profiling。
HotSpot是如何动态编译Javad的bytecode呢?Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器,即Profile Monitor,专门监视
- Storm0.9.5的集群部署配置优化
roadrunners
优化storm.yaml
nimbus结点配置(storm.yaml)信息:
# Licensed to the Apache Software Foundation (ASF) under one
# or more contributor license agreements. See the NOTICE file
# distributed with this work for additional inf
- 101个MySQL 的调节和优化的提示
tomcat_oracle
mysql
1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。 2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的,它的速度很慢。 3. 使用电池供电的RAM(注:RAM即随机存储器)。 4. 使用高级的RAID(注:Redundant Arrays of Inexpensive Disks,即磁盘阵列
- zoj 3829 Known Notation(贪心)
阿尔萨斯
ZOJ
题目链接:zoj 3829 Known Notation
题目大意:给定一个不完整的后缀表达式,要求有2种不同操作,用尽量少的操作使得表达式完整。
解题思路:贪心,数字的个数要要保证比∗的个数多1,不够的话优先补在开头是最优的。然后遍历一遍字符串,碰到数字+1,碰到∗-1,保证数字的个数大于等1,如果不够减的话,可以和最后面的一个数字交换位置(用栈维护十分方便),因为添加和交换代价都是1