黯雅悸动

Lucene建立索引库

问题？Lucene如何建立索引库，lucene所需要的jar包是那些， lucene如何使用索引库，lucene的核心原理

一、Lucene是什么？

全文检索只是一个概念，而具体实现有很多框架，lucene是其中的一种方式。本文将以lucene3.0进行开发

官兵与Luncne的jar包可以去官网下载：点击打开链接，不过好像Lucene已经更新到6.1了。

二、建立索引库

1.互联网搜索全文搜索引擎结构图：

2.Lucene的结构图：

说明：

(1)在数据库中，数据库中的数据文件存储在磁盘上。索引库也是同样，索引库中的索引数据也在磁盘上存在，我们用 Directory 这个类来描述.

(2)我们可以通过API的 IndexWrite 来实现对索引库的增、删、改、查的操作.

(3)在数据库中，各种数据形式都可以概括为一种：表。在索引库中，各种数据形式也可以抽象出一种数据格式为 Document .

(4)Document的结构为：Document(List).

(5)Field里存放一个键值对。键值对都为字符串的形式.

(6)对索引库中索引的操作实际上也就是对Document的操作.

3.准备lucene的开发环境

在挂窝囊下载好压缩包后，至少要准备四个包：

lucene-core-3.1.0.jar( 核心包 )、

lucene-analyzers-3.1.0.jar( 分词器 )、

lucene-highlighter-3.1.0.jar( 高亮器 )、

lucene-memory-3.1.0.jar( 内存器)

4.索引结构

5.第一个索引例子：

实体类：Article

package com.itcast.ldp.domain;

import java.io.Serializable;

public class Article implements Serializable{

	private Long aid;
	private String title;
	private String content;
	public Long getAid() {
		return aid;
	}
	public void setAid(Long aid) {
		this.aid = aid;
	}
	public String getTitle() {
		return title;
	}
	public void setTitle(String title) {
		this.title = title;
	}
	public String getContent() {
		return content;
	}
	public void setContent(String content) {
		this.content = content;
	}
	@Override
	public String toString() {
		return "Article [aid=" + aid + ", title=" + title + ", content="
				+ content + "]";
	}
	
}

(1)创建索引库

package com.itcast.ldp.lucene;

import java.io.File;
import java.util.ArrayList;
import java.util.List;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.Field.Index;
import org.apache.lucene.document.Field.Store;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriter.MaxFieldLength;
import org.apache.lucene.queryParser.MultiFieldQueryParser;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;
import org.junit.Test;

import com.itcast.ldp.domain.Article;

/**
 * 
 * 把Article对象放入到索引库中去
 * 在索引库中把Article对象拿出来
 * @author Administrator
 *
 */
public class CreateLucene1 {

	/**
	 * 
	 * 创建索引
	 * @throws Exception 
	 */
	@Test
	public void createIndex() throws Exception{
		/**
		 * 创建Article对象
		 */
		Article article = new Article();
		article.setAid(1L);
		article.setTitle("lucene是一个全文检索引擎");
		article.setContent("taobao");
		
		
		/**
		 * //创建一个indexWriter对象 参数(1:索引库位置,2:分词器,3:代表文档中的属性最大长度)
		 */
		//1.索引库位置
		Directory directory = FSDirectory.open(new File("./DirIndex"));
		//2.分词器:讲一段内容分成关键词的作用
		Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_30);
		//3.表示文档属性的最大长度 MaxFieldLength.LIMITED限制索引库汇总字段的大小，必须限制.源码中只能放10K
		IndexWriter indexWriter = new IndexWriter(directory, analyzer, MaxFieldLength.LIMITED);
		
		/**
		 * 把Article对象转化doucument对象
		 * Field.Index.*:详解如下
		 *Index.ANALYZED : 使用分析器将域值分解成独立的词汇单元流，并使用每个语汇单元能被搜索。该选项适用于普通文本域(正文、标题、摘要等);
		 *Index.NOT_ANALYZED : 对域进行索引，但不对String值进行分析。该操作实际上将域值作为单一语汇单元使之能够被搜索。该选项适用于索引那些不能被分解的域值(URL、文件路径、日期、人名、社保号码、手机号码等。)该选项尤其适用于"精确匹配"搜索;
		 *Index.ANALYZED_NO_NORMS : 这是Index.ANALYZED选项的一个变体，它不会在索引里面存储norms信息。norms记录了索引中的index-time boost信息，但是当你进行搜索时可能会比较耗费内存;
		 *Index.NOT_ANALYZED_NO_NORMS ： 与Index.NOT_ANALYZED选项类似，但是也不存储norms。该选项用于搜索期间节省索引空间和减少内存消耗，因为single-token域并不需要norms信息，除非它们已被进行加权操作;
		 *Index.NO : 使对应的域值不被搜索;
		 */
		
		//创建文档
		Document document = new Document();
	    //1.表示在索引库中的字段 2.存储在索引库中的值
		Field idField = new Field("aid", article.getAid().toString(), Store.YES, Index.NOT_ANALYZED);
		Field titleField = new Field("title", article.getTitle(), Store.YES, Index.ANALYZED);
		Field contentField = new Field("content", article.getContent(), Store.YES, Index.ANALYZED);
		//2.把field放入document中
		document.add(idField);
		document.add(titleField);
		document.add(contentField);
		
		/**
		 * 把document对象放入到索引库中
		 */
		indexWriter.addDocument(document);
		/**
		 * 关闭资源(因为是存放磁盘上的，就有IO流，那就需要关闭)
		 */
		/*indexWriter.optimize();合并多个indexWriter对象产生的cfs文件合并，也可以不写，底层到达一定数量了，自动优化*/
		indexWriter.close();
	}    }

结果:

(2)查询索引库

package com.itcast.ldp.lucene;

import java.io.File;
import java.util.ArrayList;
import java.util.List;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.Field.Index;
import org.apache.lucene.document.Field.Store;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriter.MaxFieldLength;
import org.apache.lucene.queryParser.MultiFieldQueryParser;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;
import org.junit.Test;

import com.itcast.ldp.domain.Article;

/**
 * 
 * 把Article对象放入到索引库中去
 * 在索引库中把Article对象拿出来
 * @author Administrator
 *
 */
public class CreateLucene1 {
	/**
	 * 从索引库中根据关键词检索出来
	 * @throws Exception 
	 * 
	 */
	
	@Test
	public void findIndex() throws Exception{
		/**
		 * 1.创建insercher对象
		 */
		Directory directory = FSDirectory.open(new File("./DirIndex"));
		IndexSearcher indexSearcher = new IndexSearcher(directory);
		Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_30);
		//规定检索字段 1:版本号 2:字段 3:分词器
		/*QueryParser queryParser = new QueryParser(Version.LUCENE_30, "title", analyzer);*/
		QueryParser queryParser = new MultiFieldQueryParser(Version.LUCENE_30, new String[]{"title","content"}, analyzer);
		//指定关键词
		Query query = queryParser.parse("lucene");
		//第二个参数：检索索引库中的前几个目录
		TopDocs topDocs = indexSearcher.search(query, 20);
		int count = topDocs.totalHits;//根据关键词得到目录中中总的条目数
		System.out.println("共查询到条目数:"+count);
		//ScoreDoc得到关键词所在的哪一行，得到总的索引号数组
		ScoreDoc[] scoreDocs = topDocs.scoreDocs;
		List articles = new ArrayList();
		for(ScoreDoc scoreDoc:scoreDocs){
			//关键词的索引号
			int doc= scoreDoc.doc;
			//根据索引号，得到文档，相当于得到书的页数
			Document document = indexSearcher.doc(doc);
			Article article = new Article();
			article.setAid(Long.parseLong(document.get("aid")));
			article.setTitle(document.get("title"));
			article.setContent(document.get("content"));
			articles.add(article);
		}
		
		for(Article article:articles){
			System.out.println("索引库中得到:"+article.toString());
		}
		
		
	}
}

结果:

代码说明步骤：

注意:因为分词器把输入的关键字都变成小写。

1) 创建IndexSearch

2) 创建Query对象

3) 进行搜索

4) 获得总结果数和前N行记录ID列表

5) 根据目录ID列表把Document转为为JavaBean并放入集合中。

6) 循环出要检索的内容

6.保持数据库与索引库的同步

说明:

在一个系统中，如果索引功能存在，那么数据库和索引库应该是同时存在的。

这个时候需要保证索引库的数据和数据库中的数据保持一致性。可以在对数据库进行增、删、改操作的同时对索引库也进行相应的操作。

这样就可以保证数据库与索引库的一致性。

7.Document和实体相互转化工具类

说明：在对索引库进行操作时，增、删、改过程要把一个JavaBean(这里是指Article)封装成Document，而查询的过程是要把一个Document转化成JavaBean。在进行维护的工作中，要反复进行这样的操作，所以我们有必要建立一个工具类来重用代码。

package com.itcast.ldp.util;

import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.Field.Index;
import org.apache.lucene.document.Field.Store;

import com.itcast.ldp.domain.Article;

public class DocumentArticleUtil {

	public Document ArticleToDocument(Article article){
		Document document = new Document();
		//创建文档
		//1.表示在索引库中的字段 2.存储在索引库中的值
		/*NumericUtils.longToPrefixCoded(article.getAid());//要使用专业工具转化类型放入文档Long类型转化为String类型*/		
		Field idField = new Field("aid", article.getAid().toString(), Store.YES, Index.NOT_ANALYZED);
		Field titleField = new Field("title", article.getTitle(), Store.YES, Index.ANALYZED);//Index.NO:
		Field contentField = new Field("content", article.getContent(), Store.YES, Index.ANALYZED);
		//2.把field放入document中
		document.add(idField);
		document.add(titleField);
		document.add(contentField);
		return document;
	}
	
	public Article DocumentToArticle(Document document){
		Article article = new Article();
		/*NumericUtils.prefixCodedToLong(document.get("aid"));//String类型转化为long类型*/
		article.setAid(Long.parseLong(document.get("aid")));
		article.setTitle(document.get("title"));
		article.setContent(document.get("content"));
		return article;
	}
}

说明：

什么情况下使用Index.NOT_ANALYZED
当这个属性的值代表的是一个不可分割的整体，例如 ID
什么情况下使用Index.ANALYZED
当这个属性的值代表的是一个可分割的整体。

package com.itcast.ldp.util;

import java.io.File;
import java.io.IOException;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;

public class DirectorAndAnalyzerUtile {

	public static Directory directory;
	public static Analyzer analyzer;
	static{
		try {
			directory=FSDirectory.open(new File("./DirIndex"));
			analyzer = new StandardAnalyzer(Version.LUCENE_30);
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
	}
}

8.索引库的增删改查(crud操作)

package com.itcast.ldp.lucene;

import java.util.ArrayList;
import java.util.List;

import org.apache.lucene.document.Document;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriter.MaxFieldLength;
import org.apache.lucene.index.Term;
import org.apache.lucene.queryParser.MultiFieldQueryParser;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.util.Version;
import org.junit.Test;

import com.itcast.ldp.domain.Article;
import com.itcast.ldp.util.DirectorAndAnalyzerUtile;
import com.itcast.ldp.util.DocumentArticleUtil;

public class CrudLucene {

	/**
	 * 创建索引
	 * @throws Exception  
	 */
	@Test
	public void createIndex() throws Exception{
		Article article = new Article();
		article.setAid(1L);
		article.setTitle("lucene是一个全文检索引擎");
		article.setContent("Oracle,google,baidu,taobao");
		IndexWriter indexWriter = new IndexWriter(DirectorAndAnalyzerUtile.directory, DirectorAndAnalyzerUtile.analyzer, MaxFieldLength.LIMITED);
		DocumentArticleUtil util = new DocumentArticleUtil();
		Document document = util.ArticleToDocument(article);
		indexWriter.addDocument(document);
		indexWriter.optimize();//优化，将多个indexWriter对象产生的cfs文件合并，也可以不写，底层到达一定数量了，自动优化
		indexWriter.close();
	}
	/**
	 * 
	 * 从索引库中得到索引
	 * @throws Exception 
	 */
	
	@Test
	public void findIndex() throws Exception{
		IndexSearcher indexSearcher = new IndexSearcher(DirectorAndAnalyzerUtile.directory);
		QueryParser queryParser = new MultiFieldQueryParser(Version.LUCENE_30, new String[]{"title","content"}, DirectorAndAnalyzerUtile.analyzer);
		//指定关键词
		Query query = queryParser.parse("taobao11");
		TopDocs topDocs = indexSearcher.search(query, 1);
		int count = topDocs.totalHits;//得到含有lucene关键字的索引条目
		System.out.println("总条数:"+count);
		ScoreDoc[] scoreDocs = topDocs.scoreDocs;
		DocumentArticleUtil documentArticleUtil = new DocumentArticleUtil();
		List articles = new ArrayList();
		for(ScoreDoc scoreDoc:scoreDocs){
			int doc = scoreDoc.doc;
			Document document = indexSearcher.doc(doc);
			Article article = documentArticleUtil.DocumentToArticle(document);
			articles.add(article);
		}
		
		for(Article article:articles){
			System.out.println("索引库索引得到:"+article.toString());
		}
	}
	
	/**
	 * 
	 * 删除关键词
	 * @throws Exception
	 */
	@Test
	public void deleteIndex() throws Exception{
		//创建关键词对象,字段名称为title，字段名称中含有lucene的关键字
		Term term = new Term("title","lucene");
		IndexWriter indexWriter = new IndexWriter(DirectorAndAnalyzerUtile.directory, DirectorAndAnalyzerUtile.analyzer, MaxFieldLength.LIMITED);
		//删除关键词对象term是用来删除的
		indexWriter.deleteDocuments(term);
		indexWriter.close();
	}
	
	/**
	 * 
	 * 更新关键字,先删除后更新
	 * @throws Exception
	 */
	@Test
	public void updateIndex() throws Exception{
		//创建关键词对象,字段名称为title，字段名称中含有lucene的关键字
		Term term = new Term("title","lucene");
		IndexWriter indexWriter = new IndexWriter(DirectorAndAnalyzerUtile.directory, DirectorAndAnalyzerUtile.analyzer, MaxFieldLength.LIMITED);
		Article article = new Article();
		article.setAid(1L);
		article.setTitle("lucene是一个全文检索引擎1");
		article.setContent("Oracle,google,baidu,taobao11");
		DocumentArticleUtil util = new DocumentArticleUtil();
		Document doc = util.ArticleToDocument(article);
		//更新关键词 term是用来删除的，doc是用来增加的
		indexWriter.updateDocument(term, doc);
		indexWriter.close();
	}
}

9.IndexWrite详解

Hibernate中的SessionFactory 说明：在Hibernate中，一般保持一个数据库就只有一个SessionFactory。因为在SessionFactory中维护二级缓存，而SessionFactory又是线程安全的。所以SessionFactory是共享的。

同理：在索引库汇总如果同时有两个Indexwite去操作同一个索引库，就会造成错误。

如：

错误：

相应的在Luncen索引库中会出现write.lock这个文件。因为当一个IndexWriter在进行读索引库操作的时候，lucene会为索引库，以防止其他IndexWriter访问索引库而导致数据不一致，直到IndexWriter关闭为止。

注意：所以对IndexWrite的操作最好是单例模式，不然会抛出异常。

10.优化部分

当我们执行多次索引的时候，会出现索引库的文件如图所示：(索引里内容是一样的)，会出现多个cfs文件，执行多少次，就会出现多少个cfs文件

当执行delete操作时，会生成如图所示的结构：也是一样的都会出现多个del文件

从图中可以看出来，lucene在执行删除的时候，是先把要删除的元素形成了一个文件del文件，然后再和cfs文件进行整合得出最后结果。

如果增加、删除反复操作很多次，就会造成文件大量增加，这样检索的速度也会下降，所以我们有必要去优化索引结构。Lucen有自动优化的功能，当文件数目到达一定量的时候，会自动合并cfs和del文件。但是我们可以手工去合并该文件。就一条语句：

indexWriter.optimize();//优化，将多个indexWriter对象产生的cfs文件合并，也可以不写，底层到达一定数量了，自动优化

合并后的结果如下。而且把del文件彻底全部删除掉了：

注意使用内置工具类:LuceneUtils.getIndexWriter().setMergeFactor(3)意思为当文件的个数达到3的时候，合并成一个文件。如果没有设置这个值，则使用默认的情况：10个

11.内存索引库

前面介绍了索引库的特征及使用方法，这里我们提出一个问题，索引库是放在本地磁盘上的，如果我们将索引库放到内存当中，无疑速度将提升数倍。当然程序退出的时候，内存当中的索引自然也清除了，如果索引库很大，就得保证有足够的内存空间。

没有在磁盘上出现索引库。所以单独使用内存索引库没有任何意义。然后又要保证内存索引库中的内容和索引库中的内容保持一致，就得把内存索引库加入到本地索引库中。

实验代码：

package com.itcast.ldp.memory;

import java.io.File;
import java.util.ArrayList;
import java.util.List;

import org.apache.lucene.document.Document;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriter.MaxFieldLength;
import org.apache.lucene.queryParser.MultiFieldQueryParser;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.store.RAMDirectory;
import org.apache.lucene.util.Version;
import org.junit.Test;

import com.itcast.ldp.domain.Article;
import com.itcast.ldp.util.DirectorAndAnalyzerUtile;
import com.itcast.ldp.util.DocumentArticleUtil;

public class DirectoryMemoryTest {

	/**
	 * 
	 * 内存索引库的建立RAMDirectory()
	 * @throws Exception
	 */
	@Test
	public void testMemory() throws Exception{
		/*Directory directory = FSDirectory.open(new File("./MemoryTest"));这是创建池畔索引库*/
		Directory directory = new RAMDirectory();//这是创建内存索引库
		IndexWriter indexWriter = new IndexWriter(directory, DirectorAndAnalyzerUtile.analyzer,MaxFieldLength.LIMITED);
		Article article = new Article();
		article.setAid(1L);
		article.setTitle("lucene是一个全文检索引擎");
		article.setContent("Oracle,google,baidu,taobao");
		DocumentArticleUtil util = new DocumentArticleUtil();
		Document document = util.ArticleToDocument(article);
		indexWriter.addDocument(document);
		indexWriter.close();
		this.inserchDirectory(directory);
	}
	
	public void inserchDirectory(Directory directory) throws Exception{
		IndexSearcher indexSearcher = new IndexSearcher(directory);
		QueryParser queryParser = new MultiFieldQueryParser(Version.LUCENE_30, new String[]{"title","content"}, DirectorAndAnalyzerUtile.analyzer);
		Query query = queryParser.parse("lucene");
		TopDocs docs = indexSearcher.search(query, 1);
		ScoreDoc[] scoreDocs = docs.scoreDocs;
		List articles = new ArrayList();
		DocumentArticleUtil articleUtil = new DocumentArticleUtil();
		for(ScoreDoc scoreDoc:scoreDocs){
			int doc = scoreDoc.doc;
			Document document = indexSearcher.doc(doc);
			 Article article = articleUtil.DocumentToArticle(document);
			 articles.add(article);
		}
		for(Article article:articles){
			System.out.println(article.toString());
		}
	}
	
	/**
	 * 
	 * 内存索引库与文件索引库的建立
	 * 保证文件索引库的持久性
	 * 保证内存索引库的性能
	 * @throws Exception
	 */
	@Test
	public void testMemoryDirectoryAndFileDirectory() throws Exception{
		//1.建立两个索引库
		//2.把文件索引库放入到内存索引库当中
		Directory fileDirectory = FSDirectory.open(new File("./DirCrud"));
		Directory memoryDirectory = new RAMDirectory(fileDirectory);
		
		//3.建立两个indexWritter,这里的true代表内存索引库的内容到文件索引库中覆盖，默认false表示追加
		IndexWriter fileWriter = new IndexWriter(fileDirectory, DirectorAndAnalyzerUtile.analyzer, true,MaxFieldLength.LIMITED);
		IndexWriter memoryWriter = new IndexWriter(memoryDirectory, DirectorAndAnalyzerUtile.analyzer, MaxFieldLength.LIMITED);
		
		//4.让内存索引库和客户端交互
		Article article = new Article();
		article.setAid(1L);
		article.setTitle("lucene是一个全文检索引擎");
		article.setContent("Oracle,google,baidu,taobao");
		
		DocumentArticleUtil util = new DocumentArticleUtil();
		Document document = util.ArticleToDocument(article);
		
		memoryWriter.addDocument(document);
		
		//5.把内存索引库内容放入到文件索引库当中
		fileWriter.addIndexesNoOptimize(memoryDirectory);
		memoryWriter.close();
		fileWriter.close();
		this.inserchDirectory(fileDirectory);
	}
}

12.分词器

(1).分词器的作用

在前面创建是索引库的时候，就已经用到分词器了，它的作用主要是将数据进行分词(英文内置，中文自定义)，然后在放到索引库中，方便进行索引。这就是它的作用

(2).英文分词器的步骤

切分关键词——>去除停用词——>转化为小写

Eg1:

I am a Person of China

切分：I、am、a、Person、of、China 去除停用词：Person、China 转化小写：person、china

这就是因为分词器的全过程。

(3).中文分词器

但是英文分词器对中文分割就不行，若强制使用该方式，最后将分割成一个一个字符，那很明显不是我们中国人要的关键字啊，中文中有词语，四字词语，古汉语等，所以又中国人开发了一款分词器IKAnalyzer(开源的，可以在网上下载，这个包需要导入的)，在里面可自定义一些需要分割的汉字和需要停用的用词。

导入包后：

包要导入，然后有一个xml配置文件要导入，在这个jar包中本身已经写好了许多的词语，就可以分割了，但是有一些词语需要自己自定义进行分割才行，所以就需要在配置文件中进行配置：


  
  
	IK Analyzer 扩展配置
	 
	/mydict.dic;

ext_stopword.dic：这个是停用词的文件，需要停用的都可以写在当中，这个工具会自动停用该文件出现的词语

mydict.dic：这个是用户自定义需要分割的词语。

(4).代码

package com.itcast.ldp.Analyzed;

import java.io.StringReader;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.cjk.CJKAnalyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.analysis.tokenattributes.TermAttribute;
import org.apache.lucene.util.Version;
import org.junit.Test;
import org.wltea.analyzer.lucene.IKAnalyzer;

public class AnalyzedTest {

	/**
	 * 英文分词器三个步骤
	 * @throws Exception
	 */
	@Test
	public void englishDirectoryTest() throws Exception{
		//1.拆分
		//2.停用词
		//3.大写转化为小写
		String text = "I'm a the customer among all customers!";
		Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_30);
		this.coverContent(analyzer, text);
	}
	
	//英文分词
	private void coverContent(Analyzer analyzer,String text) throws Exception{
		TokenStream tokenStream = analyzer.tokenStream("content", new StringReader(text));
		tokenStream.addAttribute(TermAttribute.class);
		while(tokenStream.incrementToken()){
			TermAttribute termAttribute = tokenStream.getAttribute(TermAttribute.class);
			System.out.println(termAttribute.term());
		}
	}
	
	//中文分词器最麻烦，外国人提供的那套就不适用了
	@Test
	public void ChineseDirectoryTest_1() throws Exception{
		String text = "我是一名中国人!";
		Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_30);
		this.coverContent(analyzer, text);
	}
	
	//二分法分词器
	@Test
	public void ChineseDirectoryTest_2() throws Exception{
		String text = "我是一名中国人!";
		Analyzer analyzer = new CJKAnalyzer(Version.LUCENE_30);
		this.coverContent(analyzer, text);
	}
	
	//使用中国人开发的一套分词器  IKAnalyzer3.2.0Stable.jar该词库不就支持中文分词同时支持英文分词
	//使用扩展词典的时候，必须保证编码格式相同
	@Test
	public void ChineseDirectoryTest_3() throws Exception{
		String text = "am the english 赵东 我是一名中国人!";
		Analyzer analyzer = new IKAnalyzer();
		this.coverContent(analyzer, text);
	}
	
	
}

13.相关度排名，及高亮

这个的定义看表面意思都可理解，百度是全文检索，它检索到的内容会根据在这个内容中关键字出现的次数进行排名然后将数据显示给用户看，而高亮则是管家会加红，会把主要的关键字区分出来。

package com.itcast.ldp.highlight;

import java.util.ArrayList;
import java.util.List;

import org.apache.lucene.document.Document;
import org.apache.lucene.queryParser.MultiFieldQueryParser;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.search.highlight.Formatter;
import org.apache.lucene.search.highlight.Fragmenter;
import org.apache.lucene.search.highlight.Highlighter;
import org.apache.lucene.search.highlight.QueryScorer;
import org.apache.lucene.search.highlight.Scorer;
import org.apache.lucene.search.highlight.SimpleFragmenter;
import org.apache.lucene.search.highlight.SimpleHTMLFormatter;
import org.apache.lucene.util.Version;
import org.junit.Test;

import com.itcast.ldp.domain.Article;
import com.itcast.ldp.util.DirectorAndAnalyzerUtile;
import com.itcast.ldp.util.DocumentArticleUtil;

public class HighLightTest {

	public void inserchTest(int min,int max) throws Exception{
		IndexSearcher indexSearcher = new IndexSearcher(DirectorAndAnalyzerUtile.directory);
		QueryParser queryParser = new MultiFieldQueryParser(Version.LUCENE_30,new String[]{"title","content"},DirectorAndAnalyzerUtile.analyzer);
		Query query = queryParser.parse("lucene");
		TopDocs topDocs = indexSearcher.search(query, 30);
		
		//创建和配置高亮器
		Formatter formatter = new SimpleHTMLFormatter("", "");
		Scorer scorer =new QueryScorer(query);//得到高亮的关键词
		Highlighter highlighter = new Highlighter(formatter, scorer);//给指定的关键词加前缀和后缀
		//创建摘要器
		Fragmenter fragmenter = new SimpleFragmenter(10);//指定索引库中的字段摘要大小，如果是无参构造器，则默认大小为150
		highlighter.setTextFragmenter(fragmenter);//设置摘要
		
		int count = topDocs.totalHits;
		System.out.println("查询总的记录条目数:"+count);
		ScoreDoc[] scoreDocs = topDocs.scoreDocs;
		int pageSize = Math.min(count, min+max);
		List articles = new ArrayList();
		DocumentArticleUtil util = new DocumentArticleUtil();
		for(int i=min;i   luence
			 * 2.分词器的作用就是提取高亮器高亮的关键字
			 */
			
			
			String text = highlighter.getBestFragment(DirectorAndAnalyzerUtile.analyzer, "title", document.get("title"));
			article.setTitle(text);
			articles.add(article);
		}
		indexSearcher.close();
		
		for(Article article:articles){
			System.out.println(article.toString());
		}
	}
	
	@Test
	public void highLightTest()throws Exception{
		inserchTest(0, 40);
	}
}

13.Lucene的核心API介绍

IndexWriter

1) 利用这个类可以对索引库进行增、删、改操作。
2) 利用构造方法IndexWriter indexWriter = new IndexWriter(directory,LuceneConfig.analyzer,MaxFieldLength.LIMITED)可以构造一个IndexWriter的对象。
3) addDocument向索引库中添加一个Document
4) updateDocument更新一个Document
5) deleteDocuments删除一个Document
Directory指向索引库的位置，有两种Directory

FSDirectory
1) 通过FSDirectory.open(new File("./indexDir"))建立一个indexDir的文件夹，而这个文件夹就是索引库存放的位置。
2) 通过这种方法建立索引库时如果indexDire文件夹不存在，程序将自动创建一个，如果存在就用原来的这个。
3) 通过这个类可以知道所建立的索引库在磁盘上，能永久性的保存数据。这是优点
4) 缺点为因为程序要访问磁盘上的数据，这个操作可能引发大量的IO操作，会降低性能。

RAMDirectory
1) 通过构造函数的形式Directory ramdirectory = new RAMDirectory(fsdirectory)可以建立RAMDirectory。
2) 这种方法建立的索引库会在内存中开辟一定的空间，通过构造函数的形式把fsdirectory移动到内存中。
3) 这种方法索引库中的数据是暂时的，只要内存的数据消失，这个索引库就跟着消失了。
4) 因为程序是在内存中跟索引库交互，所以利用这种方法创建的索引的好处就在效率比较高，访问速度比较快。

Document
1) 通过无参的构造函数可以创建一个Document对象。Document doc = new Document();
2) 一个Directory是由很多Document组成的。用户从客户端输入的要搜索的关键内容被服务器端包装成JavaBean，然后再转化为Document。这个转化过程的代码如下：

Field
1) Field相当于JavaBean的属性。
2) Field的用法为：
new Field("title",article.getTitle(),Store.YES,Index.ANALYZED)
a) 第一个参数为属性
b) 第二个参数为属性值
c) 第三个参数为是否往索引库里存储
d) 第四个参数为是否更新引索
1) NO 不进行引索
2) ANALYZED 进行分词引索
3) NOT_ANALYZED 进行引索，把整个输入作为一个词对待。

MaxFieldLength
a) 能存储的最大长度
b) 在IndexWriter的构造方法里使用
c) 值为：
1) LIMITED 限制的最大长度值为10000
2) UNLIMITED 没有限制的最大长度(一般不使用)

三、资源的下载及总结：下载地址：点击下载链接

你可能感兴趣的:(--------《索引库》)

element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
mysql禁用远程登录 igotyback mysql
去mysql库中的user表里，将host都改成localhost之后刷新权限FLUSHPRIVILEGES;
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
高级 ECharts 技巧：自定义图表主题与样式 SnowMan1993 echarts 信息可视化数据分析
ECharts是一个强大的数据可视化库，提供了多种内置主题和样式，但你也可以根据项目的设计需求，自定义图表的主题与样式。本文将介绍如何使用ECharts自定义图表主题，以提升数据可视化的吸引力和一致性。1.什么是ECharts主题？ECharts的主题是指定义图表样式的配置项，包括颜色、字体、线条样式等。通过预设主题，你可以快速更改图表的整体风格，而自定义主题则允许你在此基础上进行个性化设置。2.
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
数据结构之哈希表 X同学的开始数据结构数据结构散列表
哈希表(散列表)出现的原因在顺序表中查找时，需要从表头开始，依次遍历比较a[i]与key的值是否相等，直到相等才返回索引i；在有序表中查找时，我们经常使用的是二分查找，通过比较key与a[i]的大小来折半查找，直到相等时才返回索引i。最终通过索引找到我们要找的元素。但是，这两种方法的效率都依赖于查找中比较的次数。我们有一种想法，能不能不经过比较，而是直接通过关键字key一次得到所要的结果呢？这时，
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
STM32中的计时与延时 lupinjia STM32 stm32 单片机
前言在裸机开发中，延时作为一种规定循环周期的方式经常被使用，其中尤以HAL库官方提供的HAL_Delay为甚。刚入门的小白可能会觉得既然有官方提供的延时函数，而且精度也还挺好，为什么不用呢？实际上HAL_Delay中有不少坑，而这些也只是HAL库中无数坑的其中一些。想从坑里跳出来还是得加强外设原理的学习和理解，切不可只依赖HAL库。除了延时之外，我们在开发中有时也会想要确定某段程序的耗时，这就需要
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
Python神器！WEB自动化测试集成工具 DrissionPage 亚丁号 python 开发语言
一、前言用requests做数据采集面对要登录的网站时，要分析数据包、JS源码，构造复杂的请求，往往还要应付验证码、JS混淆、签名参数等反爬手段，门槛较高。若数据是由JS计算生成的，还须重现计算过程，体验不好，开发效率不高。使用浏览器，可以很大程度上绕过这些坑，但浏览器运行效率不高。因此，这个库设计初衷，是将它们合而为一，能够在不同须要时切换相应模式，并提供一种人性化的使用方法，提高开发和运行效率
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他