- Lucene中索引的删除,更新与查找以及恢复(lucene3.5)
LvesLi
Lucene
packageorg.itat.text1;importjava.io.File;importjava.io.IOException;importjavax.management.Query;importorg.apache.lucene.analysis.standard.StandardAnalyzer;importorg.apache.lucene.document.Document;imp
- Lucene3.5 之 索引删除和更新
doymm2008
Java技术
packagecom.ethan.index;importjava.io.File;importjava.io.IOException;importorg.apache.commons.io.FileUtils;importorg.apache.lucene.analysis.standard.StandardAnalyzer;importorg.apache.lucene.document.Do
- ElasticSearch之深度分页
球球T爸爸
Lucene3.5提供深度分页支持searchAfter方法(http://www.cnblogs.com/yuanermen/archive/2012/02/09/2343993.html)@OverridepublicListsearchBlogsList(Stringcontent,StringbTypeId,StringsDate,StringeDate,Pagepage)throwsIO
- Lucene3.5例子
ld_flex
java
原文地址:http://www.juziku.com/sunlightcs/wiki/4205.htmLucene3.5+IK分词器的例子,Lucene3.5改动有点大,很多方法都不推荐使用了。示例代码如下所示:?123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051
- 19、学习Lucene3.5索引之高亮搜索
咸鱼最牛逼
全文搜索引擎lucene3.5
/***Lucene高亮显示:*1.引入“lucene-highlighter”包*/publicclassHighLighter{privateIndexReaderindexReader;publicvoidhighLightTest(){try{Stringstr="我是一只丑小鸭,咿呀咿呀呦!门前一只鸭,四五六七八;鹅鹅鹅,曲项向天歌,白毛浮绿水,红掌拨清波";QueryParserque
- lucene初探(二):中文分词,以及系统自带分词简单比较
都市桃源
lucene
lucene学习我不得不承认这门技术是我目前接触的最有难度的一门技术,也许是因为我最近比较浮躁吧,也也是因为我没有找到,官方的说明文档和网络上比较不错的视频教程,不是有的讲解人普通话说得跟方言似的,英文读的跟3岁小孩似的,比如宋亮,他的lucene3.5的教程简直让我难以忍受所以还是自己摸索摸索吧上一篇lucene初探(一),讲解了简单的lucene文件查询,貌似lucene和solr配合更能发挥
- Lucene教程
万古情仇一梦中
一:简单的示例
1.1:生成索引1.1.1:Field.Store和Field.Index1.1.2:为数字生成索引1.1.3:为索引加权1.1.4:为日期生成索引1.2:查询1.2.1:介绍IndexReader1.3:删除1.3.1:还原删除的文档1.3.2:清空回收站时面的数据1.4:更新 前言:本教程用于Lucene3.5,Maven地址为
org.apache.lucene
lu
- lucene两种分页,在solr我还没测试过
fengyong7723131
基于lucene的分页有两种: lucene3.5之前分页提供的方式为再查询方式(每次查询全部记录,然后取其中部分记录,这种方式用的最多),lucene官方的解释:由于我们的速度足够快。处理海量数据时,内存容易内存溢出。 lucene3.5以后提供一个searchAfter,这个是在特大数据量采用(亿级数据量),速度相对慢一点,像google搜索图片的时候,点击更多,然后再出来一批。这种方式就
- lucene学习-创建索引
Lucene
本文的lucene是基于lucene3.5版本.
使用lucene实现搜索引擎开发,核心的部分是建立索引和搜索。本节主要是记录创建索引部分的内容。
创建的索引结构如图所示。
创建索引的步骤分为以下几个步骤:
1、建立索引器IndexWriter
2、创建
- lucene的两种分页操作
m635674608
Lucene
基于lucene的分页有两种:
lucene3.5之前分页提供的方式为再查询方式(每次查询全部记录,然后取其中部分记录,这种方式用的最多),lucene官方的解释:由于我们的速度足够快。处理海量数据时,内存容易内存溢出。
lucene3.5以后提供一个searchAfter,这个是在特大数据量采用(亿级数据量),速度相对慢一点,像google
- lucene的两种分页操作
lucene分页
基于lucene的分页有两种:lucene3.5之前分页提供的方式为再查询方式(每次查询全部记录,然后取其中部分记录,这种方式用的最多),lucene官方的解释:由于我们的速度足够快。处理海量数据时,内存容易内存溢出。lucene3.5以后提供一个searchAfter,这个是在特大数据量采用(亿级数据量),速度相对慢一点,像google搜索图片的时候,点击更多,然后再出来一批。这种方式就是把数据
- lucene3.5通过NRTManager和SearchManager实现近实时搜索
Victor_Cindy1
搜索Lucene
实时搜索(近实时搜索) 完全的实时搜索:只要数据库一变动,马上要更新索引,writer.commit来操作 近实时搜索:当用户修改了信息之后,先把索引保存到内存中,然后在一个统一的时间对内存中的所有的索引进行提交操作。reopen,NRTManager(near-real-time)lucene通过NRTManager这个类来实现近实时搜索,所谓近实时搜索即在索引发生改变时,通过线程跟踪,在
- lucene3.5实现自定义同义词分词器
Victor_Cindy1
搜索Lucene扩展
最近一直在学Lucene3.5,感觉里面的知识真的很棒。今天就和大家一起分享一下我们自己来实现一个同义词的分词器。一个分词器由多个Tokenizer和TokenFilter组成,这篇文章讲解的就是我们利用这两个特性实现自己的一个简单的同义词分词器,不妥之处请大家指出。一、设计思路什么叫同义词搜索呢?比如我们在搜”中国“这个词的时候,我们也可以搜索”大陆“这个词,后者搜索的要包含”中国“这个单词的文
- Lucene3.5自定义评分以及根据域进行自定义评分设定
Victor_Cindy1
一、首先来综述一下Lucene自定义评分的步骤:1、创建一个评分域FieldScoreQueryfd=newFieldScoreQuery("score",Type.INT);2、根据评分域和原有的query创建自定义的query对象MyCustomScoreQueryquery=newMyCustomScoreQuery(q,fd);@SuppressWarnings("serial")
pri
- lucene4.0入门1
明舞
Lucene主要分为三大块:1、创建索引2、分词3、读取并查询索引前提:由于本人目前看的是3.5的视频材料,所以可能里面有的写法还是3.5的写法,我能保证demo能跑通,能运营,能明白意思。发现在lucene3.5里,lucene的主要jar都在core包里,但是在4.0以后好像被拆分成了多个jar,需要根据项目需要,一点一点自己往上加jar包。所用jar: lucene4.10.2教学视频:lu
- lucene学习-创建索引
gyouxu
本文的lucene是基于lucene3.5版本. 使用lucene实现搜索引擎开发,核心的部分是建立索引和搜索。本节主要是记录创建索引部分的内容。 创建的索引结构如图所示。 创建索引的步骤分为以下几个步骤:1、建立索引器IndexWriter2、创建文档对象Document3、建立信息对象字段Field4、将Field对象添加到Document5、将Document对象添加到Inde
- lucene学习-创建索引
gyouxu
本文的lucene是基于lucene3.5版本. 使用lucene实现搜索引擎开发,核心的部分是建立索引和搜索。本节主要是记录创建索引部分的内容。 创建的索引结构如图所示。 创建索引的步骤分为以下几个步骤:1、建立索引器IndexWriter2、创建文档对象Document3、建立信息对象字段Field4、将Field对象添加到Document5、将Document对象添加到Inde
- lucene可视化工具luke
hbiao68
Lucene
由于我自己是在网上下载的视频,学习的是lucene3.5,因此也提供下载链接:http://pan.baidu.com/s/1mgr6CcC luke是一个查询索引的工具,使用时必须注意:版本要与lucene的版本完全一致,否则可能打不开索引信息。 java-jarluke-xx-xx.jar可以打开索引 选择索引所存储的目录,就可以使用luke查询和操作相应的索引信息,并且可以在search中根
- lucene可视化工具luke
hbiao68
Lucene
由于我自己是在网上下载的视频,学习的是lucene3.5,因此也提供下载链接:http://pan.baidu.com/s/1mgr6CcC luke是一个查询索引的工具,使用时必须注意:版本要与lucene的版本完全一致,否则可能打不开索引信息。 java-jarluke-xx-xx.jar可以打开索引 选择索引所存储的目录,就可以使用luke查询和操作相应的索引信息,并且可以在search中根
- lucene可视化工具luke
hbiao68
Lucene
由于我自己是在网上下载的视频,学习的是lucene3.5,因此也提供下载链接:http://pan.baidu.com/s/1mgr6CcC luke是一个查询索引的工具,使用时必须注意:版本要与lucene的版本完全一致,否则可能打不开索引信息。 java-jarluke-xx-xx.jar可以打开索引 选择索引所存储的目录,就可以使用luke查询和操作相应的索引信息,并且可以在search中根
- lucene可视化工具luke
hbiao68
Lucene
由于我自己是在网上下载的视频,学习的是lucene3.5,因此也提供下载链接:http://pan.baidu.com/s/1mgr6CcC luke是一个查询索引的工具,使用时必须注意:版本要与lucene的版本完全一致,否则可能打不开索引信息。 java-jarluke-xx-xx.jar可以打开索引 选择索引所存储的目录,就可以使用luke查询和操作相应的索引信息,并且可以在search中根
- lucene3.5 solr1.8.5 tomcat6.0
qq1013712290
lucene3.5
solr:
1.建立solr目录:E:\ProgramData\solr\home,并把apache-solr-3.5.0\example\solr目录下的所有文件复制过来
2.建立solr目录:E:\ProgramData\solr\server\solr,并把E:\Program Files (x86)\tomcats\apache-solr-3.5.0\example\webapps\s
- 三、lucene3.5的分词语法[停用词扩展、同义词搜索等]
wxwzy738
1、2、语汇单元的结构解释3、同义词的设计思路4、分词器的比较和测试packageorg.lucene.test;
importjava.io.File;
importjava.io.IOException;
importorg.apache.lucene.analysis.Analyzer;
importorg.apache.lucene.analysis.SimpleAnalyzer;
im
- 二、lucene3.5的查询语法
wxwzy738
1、工程结构2、查询语法代码packageorg.itat.index;
importjava.io.File;
importjava.io.IOException;
importjava.io.StringReader;
importjava.text.ParseException;
importjava.text.SimpleDateFormat;
importjava.util.Date;
- 一、lucene3.5的创建和增删改查
wxwzy738
1、工程结构2、索引创建时的属性:Field.Store.YES或者NO(存储域选项)设置为YES表示或把这个域中的内容完全存储到文件中,方便进行文本的还原设置为NO表示把这个域的内容不存储到文件中,但是可以被索引,此时内容无法完全还原(doc.get)Field.Index(索引选项)Index.ANALYZED:进行分词和索引,适用于标题、内容等Index.NOT_ANALYZED:进行索引,
- lucene3.5 中文分解IKAnalyzer 和 元分解 StandardAnalyzer
sungang_1120
Lucene
lucene3.5 中文分解IKAnalyzer 和 元分解 StandardAnalyzer
[size=large][/size][align=center][/align]
package com.txt.test2;
import java.io.IOException;
import java.io.Reader;
import ja
- lucene3.5 中文分解IKAnalyzer 和 元分解 StandardAnalyzer
sungang_1120
Lucene
lucene3.5 中文分解IKAnalyzer 和 元分解 StandardAnalyzer
[size=large][/size][align=center][/align]
package com.txt.test2;
import java.io.IOException;
import java.io.Reader;
import ja
- 用lucene3.6搜索数据库和txt文件内容
zjhh
lucene3站内搜索
我们以前经常碰到搜索数据库的内容;用like%的sql语句;如果数据量大而且多表查询时;速度实在让人难以忍受。。。如果用lucene3.6那就可以把这个恼人的问题解决了。lucene3.6搜索photo表的title,username,tagname,desr内容;用一个例题来说明更直观;此例题能搜索中文分词;(需要mysql5的jdbc包和lucene3.5的包):1、数据库我用mysql5;建
- lucene3.5以上版本jar包模块的用处(分词+分组+高亮+搜索提示)
yjflinchong
JOINjarLucenequery全文检索
lucene3.5以上版本jar包模块的用处(分词+分组+高亮+搜索提示)免费的源码demo http://download.csdn.net/detail/yjflinchong/4291818analyzers: 各种分词器以国家、语言、功能进行分类http://download.csdn.net/detail/yjflinchong/4291723http://download.csdn.
- 我对Lucene3.5实时搜索的一点儿整理
寒冰蓝血
Lucene3.5实时搜索
lucene3.5中,对于其近实时搜索,主要包括了两个核心的东西,NRTManager,SearcherManager,记录下自己的理解和认知。。。。。。构建NRTManager,利用NRTManager,SearcherManager来实现近实时搜索 其原理是: 首先要说明2个问题,实时搜索包含两部分: 1能够将索引实时的提交commit,也就是我们用到的IndexWriter对象的commit
- 戴尔笔记本win8系统改装win7系统
sophia天雪
win7戴尔改装系统win8
戴尔win8 系统改装win7 系统详述
第一步:使用U盘制作虚拟光驱:
1)下载安装UltraISO:注册码可以在网上搜索。
2)启动UltraISO,点击“文件”—》“打开”按钮,打开已经准备好的ISO镜像文
- BeanUtils.copyProperties使用笔记
bylijinnan
java
BeanUtils.copyProperties VS PropertyUtils.copyProperties
两者最大的区别是:
BeanUtils.copyProperties会进行类型转换,而PropertyUtils.copyProperties不会。
既然进行了类型转换,那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
- MyEclipse中文乱码问题
0624chenhong
MyEclipse
一、设置新建常见文件的默认编码格式,也就是文件保存的格式。
在不对MyEclipse进行设置的时候,默认保存文件的编码,一般跟简体中文操作系统(如windows2000,windowsXP)的编码一致,即GBK。
在简体中文系统下,ANSI 编码代表 GBK编码;在日文操作系统下,ANSI 编码代表 JIS 编码。
Window-->Preferences-->General -
- 发送邮件
不懂事的小屁孩
send email
import org.apache.commons.mail.EmailAttachment;
import org.apache.commons.mail.EmailException;
import org.apache.commons.mail.HtmlEmail;
import org.apache.commons.mail.MultiPartEmail;
- 动画合集
换个号韩国红果果
htmlcss
动画 指一种样式变为另一种样式 keyframes应当始终定义0 100 过程
1 transition 制作鼠标滑过图片时的放大效果
css
.wrap{
width: 340px;height: 340px;
position: absolute;
top: 30%;
left: 20%;
overflow: hidden;
bor
- 网络最常见的攻击方式竟然是SQL注入
蓝儿唯美
sql注入
NTT研究表明,尽管SQL注入(SQLi)型攻击记录详尽且为人熟知,但目前网络应用程序仍然是SQLi攻击的重灾区。
信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明,目前黑客攻击网络应用程序方式中最流行的,要数SQLi攻击。报告对去年发生的60亿攻击 行为进行分析,指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中,SQLi攻击占
- java笔记2
a-john
java
类的封装:
1,java中,对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节(尤其是私有数据)
2,目的:使对象以外的部分不能随意存取对象的内部数据(如属性),从而使软件错误能够局部化,减少差错和排错的难度。
3,简单来说,“隐藏属性、方法或实现细节的过程”称为——封装。
4,封装的特性:
4.1设置
- [Andengine]Error:can't creat bitmap form path “gfx/xxx.xxx”
aijuans
学习Android遇到的错误
最开始遇到这个错误是很早以前了,以前也没注意,只当是一个不理解的bug,因为所有的texture,textureregion都没有问题,但是就是提示错误。
昨天和美工要图片,本来是要背景透明的png格式,可是她却给了我一个jpg的。说明了之后她说没法改,因为没有png这个保存选项。
我就看了一下,和她要了psd的文件,还好我有一点
- 自己写的一个繁体到简体的转换程序
asialee
java转换繁体filter简体
今天调研一个任务,基于java的filter实现繁体到简体的转换,于是写了一个demo,给各位博友奉上,欢迎批评指正。
实现的思路是重载request的调取参数的几个方法,然后做下转换。
- android意图和意图监听器技术
百合不是茶
android显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递
显式意图:调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图,显式意图明确指定了Intent应该传递给哪个组件。
隐式意图;不指明调用的名称,根据设
- spring3中新增的@value注解
bijian1013
javaspring@Value
在spring 3.0中,可以通过使用@value,对一些如xxx.properties文件中的文件,进行键值对的注入,例子如下:
1.首先在applicationContext.xml中加入:
<beans xmlns="http://www.springframework.
- Jboss启用CXF日志
sunjing
logjbossCXF
1. 在standalone.xml配置文件中添加system-properties:
<system-properties> <property name="org.apache.cxf.logging.enabled" value=&
- 【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码
bit1129
centos
编译必需的软件
Firebugs3.0.0
Maven3.2.3
Ant
JDK1.7.0_67
protobuf-2.5.0
Hadoop 2.5.2源码包
Firebugs3.0.0
http://sourceforge.jp/projects/sfnet_findbug
- struts2验证框架的使用和扩展
白糖_
框架xmlbeanstruts正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验,通常有两种方式:
1、在Action类中通过validatexx方法验证,这种方式很简单,在此不再赘述;
2、通过编写xx-validation.xml文件执行表单验证,当用户提交表单请求后,struts会优先执行xml文件,如果校验不通过是不会让请求访问指定action的。
本文介绍一下struts2通过xml文件进行校验的方法并说
- 记录-感悟
braveCS
感悟
再翻翻以前写的感悟,有时会发现自己很幼稚,也会让自己找回初心。
2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了;
2. 要改变自己,不能这样一直在原来区域,要突破安全区舒适区,才能提高自己,往好的方面发展;
3. 多反省多思考;要会用工具,而不是变成工具的奴隶;
4. 一天内集中一个定长时间段看最新资讯和偏流式博
- 编程之美-数组中最长递增子序列
bylijinnan
编程之美
import java.util.Arrays;
import java.util.Random;
public class LongestAccendingSubSequence {
/**
* 编程之美 数组中最长递增子序列
* 书上的解法容易理解
* 另一方法书上没有提到的是,可以将数组排序(由小到大)得到新的数组,
* 然后求排序后的数组与原数
- 读书笔记5
chengxuyuancsdn
重复提交struts2的token验证
1、重复提交
2、struts2的token验证
3、用response返回xml时的注意
1、重复提交
(1)应用场景
(1-1)点击提交按钮两次。
(1-2)使用浏览器后退按钮重复之前的操作,导致重复提交表单。
(1-3)刷新页面
(1-4)使用浏览器历史记录重复提交表单。
(1-5)浏览器重复的 HTTP 请求。
(2)解决方法
(2-1)禁掉提交按钮
(2-2)
- [时空与探索]全球联合进行第二次费城实验的可能性
comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验
至今给我们大家留下很多迷团.....
关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了
在这里,我的意思是,现在
- easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符
daizj
oracleORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误,如下:
C:\Users\Administrator>sqlplus username/
[email protected]:1521/orcl
SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012
Copyright (c) 198
- 简单排序:归并排序
dieslrae
归并排序
public void mergeSort(int[] array){
int temp = array.length/2;
if(temp == 0){
return;
}
int[] a = new int[temp];
int
- C语言中字符串的\0和空格
dcj3sjt126com
c
\0 为字符串结束符,比如说:
abcd (空格)cdefg;
存入数组时,空格作为一个字符占有一个字节的空间,我们
- 解决Composer国内速度慢的办法
dcj3sjt126com
Composer
用法:
有两种方式启用本镜像服务:
1 将以下配置信息添加到 Composer 的配置文件 config.json 中(系统全局配置)。见“例1”
2 将以下配置信息添加到你的项目的 composer.json 文件中(针对单个项目配置)。见“例2”
为了避免安装包的时候都要执行两次查询,切记要添加禁用 packagist 的设置,如下 1 2 3 4 5
- 高效可伸缩的结果缓存
shuizhaosi888
高效可伸缩的结果缓存
/**
* 要执行的算法,返回结果v
*/
public interface Computable<A, V> {
public V comput(final A arg);
}
/**
* 用于缓存数据
*/
public class Memoizer<A, V> implements Computable<A,
- 三点定位的算法
haoningabc
c算法
三点定位,
已知a,b,c三个顶点的x,y坐标
和三个点都z坐标的距离,la,lb,lc
求z点的坐标
原理就是围绕a,b,c 三个点画圆,三个圆焦点的部分就是所求
但是,由于三个点的距离可能不准,不一定会有结果,
所以是三个圆环的焦点,环的宽度开始为0,没有取到则加1
运行
gcc -lm test.c
test.c代码如下
#include "stdi
- epoll使用详解
jimmee
clinux服务端编程epoll
epoll - I/O event notification facility在linux的网络编程中,很长的时间都在使用select来做事件触发。在linux新的内核中,有了一种替换它的机制,就是epoll。相比于select,epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中,它是采用轮询来处理的,轮询的fd数目越多,自然耗时越多。并且,在linu
- Hibernate对Enum的映射的基本使用方法
linzx0212
enumHibernate
枚举
/**
* 性别枚举
*/
public enum Gender {
MALE(0), FEMALE(1), OTHER(2);
private Gender(int i) {
this.i = i;
}
private int i;
public int getI
- 第10章 高级事件(下)
onestopweb
事件
index.html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/
- 孙子兵法
roadrunners
孙子兵法
始计第一
孙子曰:
兵者,国之大事,死生之地,存亡之道,不可不察也。
故经之以五事,校之以计,而索其情:一曰道,二曰天,三曰地,四曰将,五
曰法。道者,令民于上同意,可与之死,可与之生,而不危也;天者,阴阳、寒暑
、时制也;地者,远近、险易、广狭、死生也;将者,智、信、仁、勇、严也;法
者,曲制、官道、主用也。凡此五者,将莫不闻,知之者胜,不知之者不胜。故校
之以计,而索其情,曰
- MySQL双向复制
tomcat_oracle
mysql
本文包括:
主机配置
从机配置
建立主-从复制
建立双向复制
背景
按照以下简单的步骤:
参考一下:
在机器A配置主机(192.168.1.30)
在机器B配置从机(192.168.1.29)
我们可以使用下面的步骤来实现这一点
步骤1:机器A设置主机
在主机中打开配置文件 ,
- zoj 3822 Domination(dp)
阿尔萨斯
Mina
题目链接:zoj 3822 Domination
题目大意:给定一个N∗M的棋盘,每次任选一个位置放置一枚棋子,直到每行每列上都至少有一枚棋子,问放置棋子个数的期望。
解题思路:大白书上概率那一张有一道类似的题目,但是因为时间比较久了,还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子,并且消耗k步的概率(k≤i∗j),因为放置在i+1~n上等价与放在i+1行上,同理