我相信慢思考的力量

lucene全文检索对数据库表进行增删改查之入门小白必看篇

我的qq 2038373094

Lucene全文搜索最主要的就是索引

它把数据库表里的数据都通过分词器做成了索引，程序只要执行索引的一些增删改查操作就可以实现对数据库的增删改查了

1、搜索模块的核心 IndexSearcher类

2、添加模块的核心 IndexWriter类

3、删除模块的核心

4、修改模块的核心

搜索模块 IndexWriter类

要执行搜索功能，是不是应该知道这个索引文件的路径，不然怎么查询？

但是一般都不用 IndexSearch(Directory path);而是用IndexReader r 为什么呢？

indexReader比起直接用Directory path打开更快速，不浪费资源；而且indexReader还可以删除资源，比较全能！

如何实现对某个字段进行搜索？

选择合适的sql语句

普遍用TermQuery,这个是精准查询

Query query=new TermQuery(new Term("字段名","搜索的词"));

踩坑：这个一般用于字段是Field.Index.NOT_ANALYZED，如果字段是Field.Index.ANALYZED，采用TermQuery查询是不会有结果的！

建议使用QueryParser

QueryParser parser = new QueryParser("areas",new StandardAnalyzer());

org.apache.lucene.search.Query query = parser.parse(keyword)

选择好搜索语句以后，可以开始进行查询了

查询的结果也有很多形式，如下所示

一般都是TopDocs

TopDocs tds = searcher.search(query, 10);

获取排名靠前的数据

一个小栗子

	public void searchFile() {
		IndexSearcher searcher = new IndexSearcher(this.getIndexReader());
		Query query = new TermQuery(new Term("content", "my")); // 精确搜索:搜索"content"中包含"my"的文档
		try {
			TopDocs tds = searcher.search(query, 10);
			for (ScoreDoc sd : tds.scoreDocs) {
				Document doc = searcher.doc(sd.doc); // sd.doc得到的是文档的序号
				System.out.print("(" + sd.doc + "|" + sd.score + ")"
				+ doc.get("name") + "[" + doc.get("email") + "]-->");
			}
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

添加模块

先创建文档 Document doc=new Document();

给文档添加字段 doc.add(new Field("字段名","值",是否解析));

增量索引类 IndexWriter in=new IndexWriter(path,new IndexWriterConfig(Version.LUCENE_41, new StandardAnalyzer(Version.LUCENE_41)));

然后为数据添加索引

in.addDocument(doc);

以下是一个对数据库表的lucene搜索

记住一句话，term是精准查询，是针对与未分词的字段才有效的！

package cn.com.lucene;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
import java.io.PrintWriter;
import java.util.List;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.Term;
import org.apache.lucene.queryparser.classic.ParseException;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;
import org.hibernate.Query;
import org.hibernate.Session;
import org.hibernate.SessionFactory;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.context.annotation.Scope;
import org.springframework.stereotype.Repository;
import org.springframework.transaction.annotation.Transactional;

import com.sun.corba.se.impl.ior.WireObjectKeyTemplate;

import cn.com.bean.Teacher;
@Repository(value = "teacherIndex")
@Scope("prototype")
public class TeacherIndex {
/*author:命运的信徒
 * arm:为表teacher建立索引
 * 并且进行查询
 */
	String indexpath="D:/index/index";
	String idpath="D:/index/id/1.txt";
	private static IndexReader reader = null;
	private Directory directory = null;
	@Autowired
	private SessionFactory sf;
	private String content;
	private String key;
	public String getContent() {
		return content;
	}
	public void setContent(String content) {
		this.content = content;
	}
	public String getKey() {
		return key;
	}
	public void setKey(String key) {
		this.key = key;
	}
	//对数据库中的表建立索引
	@Transactional
	public String CreateIndex(){
		//1.查找idpath里面的数据，如果是null的或者不存在的话，就创建，然后输入0进去
		String storeId=getStoreId(idpath);
		//2.如果有数据，然后就开始查询数据库中大于这个数据的结果集
		Session session=sf.getCurrentSession();
		List list=getResult(storeId,session);
		//3.为这个结果集建立索引，把这个结果集中最大的id，写到idpath里面去
		System.out.println("集合的长度是:"+list.size());
		if(list.size()>0){
			indexBuilding(indexpath,idpath,list);
		}
		//4.开始搜索功能了
		searchFile(content,key);
		return null;
	}
	/**
	 * 获取IndexReader实例
	 */
	private IndexReader getIndexReader() {
		try {
			directory=FSDirectory.open(new File(indexpath));
			if (reader == null) {
				reader = IndexReader.open(directory);
			} else {
				IndexReader ir = IndexReader.open(directory);
				if (ir != null) {
					reader.close(); // 关闭原reader
					reader = ir; // 赋予新reader
				}
			}
			return reader;
		} catch (Exception e) {
			e.printStackTrace();
		}
		return null; // 发生异常则返回null
	}
	/**
	 * 搜索文件
	 */
	public void searchFile(String content,String keyword) {
		IndexSearcher searcher = new IndexSearcher(this.getIndexReader());
	    //创建一个查询条件解析器
        QueryParser parser = new QueryParser(content,new StandardAnalyzer());
        org.apache.lucene.search.Query query=null;
		try {
			query = parser.parse(keyword);
		} catch (ParseException e1) {
			// TODO Auto-generated catch block
			e1.printStackTrace();
		}
		try {
			TopDocs tds = searcher.search(query, 10);
			 System.out.println(tds.totalHits);
			for (ScoreDoc sd : tds.scoreDocs) {
				Document doc = searcher.doc(sd.doc); // sd.doc得到的是文档的序号
				Teacher tt=parse(doc);
				System.out.println("符合条件的心理咨询师:"+tt.getUsername());
			}
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
	
	
	
	//获取存储的id
		public static String getStoreId(String path) {
			String storeId = "";
			try {
				File file = new File(path);
				if (!file.exists()) {
					file.createNewFile();
				}
				FileReader fr = new FileReader(path);
				BufferedReader br = new BufferedReader(fr);
				storeId = br.readLine();
				if (storeId == null || storeId == ""){
					storeId = "0";
				}
					
				br.close();
				fr.close();
			} catch (Exception e) {
				e.printStackTrace();
			}
			return storeId;
		}
		//查询新增的数据
		public  List getResult(String storeId,Session session){
			String sql="from Teacher where tid > ? order by tid asc";
			Query query=session.createQuery(sql);
			int tid=Integer.parseInt(storeId);
			query.setInteger(0, tid);
			List list=query.list();
			return list;
		}
		//把新增的数据建立索引文件
		public static boolean indexBuilding(String path, String storeIdPath,
				List list) {
			try {
				Analyzer luceneAnalyzer = new StandardAnalyzer();
				Directory directory = FSDirectory.open(new File(path));
				IndexWriter writer = new IndexWriter(directory,
						new IndexWriterConfig(Version.LUCENE_41,luceneAnalyzer));
				int id = 0;
				 Document doc = null;
				 for (Teacher t : list) {
					 doc=TeacherIndex.addIndex(t);
					 writer.addDocument(doc);
					 id=t.getTid();
				}
				 System.out.println("最新的id:"+id);
				 //获取新的id
				writer.commit();
				writer.close();
				writeStoreId(storeIdPath,Integer.toString(id));
				return true;
			} catch (Exception e) {
				e.printStackTrace();
				System.out.println("出错了" + e.getClass() + "\n   错误信息为:   "
						+ e.getMessage());
				return false;
			}

		}
        //增加索引的类,把对象转换成文本类型
		@SuppressWarnings("deprecation")
		public static  Document  addIndex(Teacher t){
			Document doc=new Document();
			doc.add(new Field("areas",t.getAreas(),Field.Store.YES,Field.Index.ANALYZED));
			doc.add(new Field("imageUrl",t.getImageUrl(),Field.Store.YES,Field.Index.NOT_ANALYZED));
			doc.add(new Field("indentity",t.getIndentity(),Field.Store.YES,Field.Index.NOT_ANALYZED));
			doc.add(new Field("instroduce",t.getInstroduce(),Field.Store.YES,Field.Index.ANALYZED));
			doc.add(new Field("number",t.getNumber(),Field.Store.YES,Field.Index.NOT_ANALYZED));
			doc.add(new Field("quality",t.getQuality(),Field.Store.YES,Field.Index.NOT_ANALYZED));
			doc.add(new Field("tell",t.getTell(),Field.Store.YES,Field.Index.NOT_ANALYZED));
			doc.add(new Field("time",t.getTime(),Field.Store.YES,Field.Index.NOT_ANALYZED));
			doc.add(new Field("username",t.getUsername(),Field.Store.YES,Field.Index.ANALYZED));
			return doc;
		}
		//把文本类型转换为对象
		public static Teacher parse(Document doc){
			Teacher tea=new Teacher();
			System.out.println("开始转换了....");
			tea.setImageUrl(doc.get("imageUrl"));
			tea.setUsername(doc.get("username"));
			tea.setTell(doc.get("tell"));
			tea.setIndentity(doc.get("indentity"));
			tea.setAreas(doc.get("areas"));
			tea.setQuality(doc.get("quality"));
			tea.setNumber(doc.get("number"));
			tea.setInstroduce(doc.get("instroduce"));
			tea.setTime(doc.get("time"));
			System.out.println(tea.getUsername());
			return tea;
		}
		//写id入1.txt文件
		public static boolean writeStoreId(String path, String storeId) {
			boolean b = false;
			try {
				File file = new File(path);
				if (!file.exists()) {
					file.createNewFile();
				}
				FileWriter fw = new FileWriter(path);
				PrintWriter out = new PrintWriter(fw);
				System.out.println("要存储的id:"+storeId);
				out.write(storeId);
				out.close();
				fw.close();
				b = true;
			} catch (IOException e) {
				e.printStackTrace();
			}
			return b;
		}

		//删除操作
		public void delete(String key,String value){
			try {
				Analyzer luceneAnalyzer = new StandardAnalyzer();
				Directory directory = FSDirectory.open(new File(indexpath));
				IndexWriter writer;
				writer = new IndexWriter(directory,
						new IndexWriterConfig(Version.LUCENE_41,luceneAnalyzer));
				//精准删除-对应的字段一定不能是分词的
				writer.deleteDocuments(new Term(key,value));
				writer.commit();
				writer.close();
			} catch (IOException e) {
				// TODO Auto-generated catch block
				e.printStackTrace();
			}
			
		}
		//修改操作
		public void update(String key,String value,Teacher tt){
			try {
				Analyzer luceneAnalyzer = new StandardAnalyzer();
				Directory directory = FSDirectory.open(new File(indexpath));
				IndexWriter writer;
				writer = new IndexWriter(directory,
						new IndexWriterConfig(Version.LUCENE_41,luceneAnalyzer));
				Document doc=addIndex(tt);
				writer.updateDocument(new Term(key,value), doc);
				writer.commit();
				writer.close();
			} catch (IOException e1) {
				// TODO Auto-generated catch block
				e1.printStackTrace();
			}
		}

public static void main(String[] args) {
	TeacherIndex in=new TeacherIndex();
//	in.delete("tell", "110");
	Teacher tea=new Teacher();
	tea.setTid(2);
	tea.setUsername("田江南");
	tea.setImageUrl("xxxx");
	tea.setTell("110");
	tea.setIndentity("00000");
	tea.setAreas("人际关系");
	tea.setQuality("iiiiiiii");
	tea.setNumber("123456");
	tea.setTime("5");
	tea.setInstroduce("我是中国人");
	in.update("time","5",tea);
}
}

在前台输入人际关系关键字，contet是搜索的区域；

控制台出现合适结果

我花了好长时间，才会用lucene搜索，整个人都压抑了！

你可能感兴趣的:(java编程专栏)

jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发

lucene全文检索 对数据库表进行增删改查之入门小白必看篇