luncene 查询字符串的解析－QueryParser类

搜索流程中的第二步就是构建一个Query。下面就来介绍Query及其构建。

当用户输入一个关键字，搜索引擎接收到后，并不是立刻就将它放入后台开始进行关键字的检索，而应当首先对这个关键字进行一定的分析和处理，使之成为一种后台可以理解的形式，只有这样，才能提高检索的效率，同时检索出更加有效的结果。那么，在Lucene中，这种处理，其实就是构建一个Query对象。

就Query对象本身言，它只是Lucene的search包中的一个抽象类，这个抽象类有许多子类，代表了不同类型的检索。如常见的TermQuery就是将一个简单的关键字进行封装后的对象，类似的还有BooleanQuery，即布尔型的查找。

IndexSearcher对象的search方法中总是需要一个Query对象（或是Query子类的对象），本节就来介绍各种Query类。

11.4.1 按词条搜索—TermQuery

TermQuery是最简单、也是最常用的Query。TermQuery可以理解成为“词条搜索”，在搜索引擎中最基本的搜索就是在索引中搜索某一词条，而TermQuery就是用来完成这项工作的。

在Lucene中词条是最基本的搜索单位，从本质上来讲一个词条其实就是一个名/值对。只不过这个“名”是字段名，而“值”则表示字段中所包含的某个关键字。

要使用TermQuery进行搜索首先需要构造一个Term对象，示例代码如下：

Term aTerm = new Term("contents", "java")；

然后使用aTerm对象为参数来构造一个TermQuery对象，代码设置如下：

Query query = new TermQuery(aTerm)；

这样所有在“contents”字段中包含有“java”的文档都会在使用TermQuery进行查询时作为符合查询条件的结果返回。

下面就通过代码11.4来介绍TermQuery的具体实现过程。

代码11.4 TermQueryTest.java

package ch11;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.document.Field;

import org.apache.lucene.index.IndexWriter;

import org.apache.lucene.index.Term;

import org.apache.lucene.search.Hits;

import org.apache.lucene.search.IndexSearcher;

import org.apache.lucene.search.Query;

import org.apache.lucene.search.TermQuery;

public class TermQueryTest

{

public static void main(String[] args) throws Exception

{

//生成Document对象

Document doc1 = new Document();

//添加“name”字段的内容

doc1.add(Field.Text("name", "word1 word2 word3"));

//添加“title”字段的内容

doc1.add(Field.Keyword("title", "doc1"));

//生成索引书写器

IndexWriter writer = new IndexWriter("c:""index", new StandardAnalyzer(), true);

//将文档添加到索引中

writer.addDocument(doc1);

//关闭索引

writer.close();

//生成查询对象query

Query query = null;

//生成hits结果对象，保存返回的检索结果

Hits hits = null;

//生成检索器

IndexSearcher searcher = new IndexSearcher("c:""index");

// 构造一个TermQuery对象

query = new TermQuery(new Term("name","word1"));

//开始检索，并返回检索结果到hits中

hits = searcher.search(query);

//输出检索结果中的相关信息

printResult(hits, "word1");

// 再次构造一个TermQuery对象，只不过查询的字段变成了"title"

query = new TermQuery(new Term("title","doc1"));

//开始第二次检索，并返回检索结果到hits中

hits = searcher.search(query);

//输出检索结果中的相关信息

printResult(hits, "doc1");

}

public static void printResult(Hits hits, String key) throws Exception

{

System.out.println("查找 """ + key + """ :");

if (hits != null)

{

if (hits.length() == 0)

{

System.out.println("没有找到任何结果");

}

else

{

System.out.println("找到" + hits.length() + "个结果");

for (int i = 0; i < hits.length(); i++)

{

Document d = hits.doc(i);

String dname = d.get("title");

System.out.print(dname + " ");

}

System.out.println();

}

在代码11.4中使用TermQuery进行检索的运行结果如图11-8所示。

注意：字段值是区分大小写的，因此在查询时必须注意大小写的匹配。

从图11-8中可以看出，代码11.4两次分别以“word1”和“doc1”为关键字进行检索，并且都只得到了一个检索结果。

在代码11.4中通过构建TermQuery的对象，两次完成了对关键字的查找。两次查找过程中不同的是，第一次构建的TermQuery是查找“name”这个字段，而第二次构建的TermQuery则查找的是“title”这个字段。

11.4.2 “与或”搜索—BooleanQuery

BooleanQuery也是实际开发过程中经常使用的一种Query。它其实是一个组合的Query，在使用时可以把各种Query对象添加进去并标明它们之间的逻辑关系。在本节中所讨论的所有查询类型都可以使用BooleanQuery综合起来。BooleanQuery本身来讲是一个布尔子句的容器，它提供了专门的API方法往其中添加子句，并标明它们之间的关系，以下代码为BooleanQuery提供的用于添加子句的API接口：

public void add(Query query, boolean required, boolean prohibited)；

注意：BooleanQuery是可以嵌套的，一个BooleanQuery可以成为另一个BooleanQuery的条件子句。

下面以11.5为例来介绍进行“与”操作的布尔型查询。

代码11.5 BooleanQueryTest1.java

package ch11;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.document.Field;

import org.apache.lucene.index.IndexWriter;

import org.apache.lucene.index.Term;

import org.apache.lucene.search.BooleanQuery;

import org.apache.lucene.search.Hits;

import org.apache.lucene.search.IndexSearcher;

import org.apache.lucene.search.Query;

import org.apache.lucene.search.TermQuery;

public class BooleanQueryTest1

{

public static void main (String [] args) throws Exception {

//生成新的Document对象

Document doc1 = new Document();

doc1.add(Field.Text("name", "word1 word2 word3"));

doc1.add(Field.Keyword("title", "doc1"));

Document doc2 = new Document();

doc2.add(Field.Text("name", "word1 word4 word5"));

doc2.add(Field.Keyword("title", "doc2"));

Document doc3 = new Document();

doc3.add(Field.Text("name", "word1 word2 word6"));

doc3.add(Field.Keyword("title", "doc3"));

//生成索引书写器

IndexWriter writer = new IndexWriter("c:""index", new StandardAnalyzer(), true);

//添加到索引中

writer.addDocument(doc1);

writer.addDocument(doc2);

writer.addDocument(doc3);

writer.close();

Query query1 = null;

Query query2 = null;

BooleanQuery query = null;

Hits hits = null;

//生成IndexSearcher对象

IndexSearcher searcher = new IndexSearcher("c:""index");

query1 = new TermQuery(new Term("name","word1"));

query2 = new TermQuery(new Term("name","word2"));

// 构造一个布尔查询

query = new BooleanQuery();

// 添加两个子查询

query.add(query1, true, false);

query.add(query2, true, false);

hits = searcher.search(query);

printResult(hits, "word1和word2");

}

public static void printResult(Hits hits, String key) throws Exception

{

System.out.println("查找 """ + key + """ :");

if (hits != null)

{

if (hits.length() == 0)

{

System.out.println("没有找到任何结果");

}

else

{

System.out.println("找到" + hits.length() + "个结果");

for (int i = 0; i < hits.length(); i++)

{

Document d = hits.doc(i);

String dname = d.get("title");

System.out.print(dname + " ");

}

System.out.println();

}

代码11.5首先构造了两个TermQuery，然后构造了一个BooleanQuery的对象，并将两个TermQuery当成它的查询子句加入Boolean查询中。

再来看一下BooleanQuery的add方法，除了它的第一个参数外，它还有另外两个布尔型的参数。第1个参数的意思是当前所加入的查询子句是否必须满足，第2个参数的意思是当前所加入的查询子句是否不需要满足。这样，当这两个参数分别选择true和false时，会有4种不同的组合。

true ＆false：表明当前加入的子句是必须要满足的。

false＆true：表明当前加入的子句是不可以被满足的。

false＆false：表明当前加入的子句是可选的。

true＆true：错误的情况。

由前面的示例可以看出由于加入的两个子句都选用了true＆false的组合，因此它们两个都是需要被满足的，也就构成了实际上的“与”关系，运行效果如图11-9所示。

如果是要进行“或”运算，则可按如下代码来构建查询子句：

query.add(query1, false, false);

query.add(query2, false, false);

代码的运行效果如图11-10所示。

图11-9 BooleanQuery测试1 图11-10 BooleanQuery测试2

由于布尔型的查询是可以嵌套的，因此可以表示多种条件下的组合。不过，如果子句的数目太多，可能会导致查找效率的降低。因此，Lucene给出了一个默认的限制，就是布尔型Query的子句数目不能超过1024。

11.4.3 在某一范围内搜索—RangeQuery

有时用户会需要一种在一个范围内查找某个文档，比如查找某一时间段内的所有文档，此时，Lucene提供了一种名为RangeQuery的类来满足这种需求。

RangeQuery表示在某范围内的搜索条件，实现从一个开始词条到一个结束词条的搜索功能，在查询时“开始词条”和“结束词条”可以被包含在内也可以不被包含在内。它的具体用法如下：

RangeQuery query = new RangeQuery(begin, end, included);

在参数列表中，最后一个boolean值表示是否包含边界条件本身，即当其为TRUE时，表示包含边界值，用字符可以表示为“[begin TO end]”；当其为FALSE时，表示不包含边界值，用字符可以表示为“{begin TO end}”。

下面通过代码11.6介绍RangeQuery使用的方法。

代码11.6 RangeQueryTest.java

package ch11;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.document.Field;

import org.apache.lucene.index.IndexWriter;

import org.apache.lucene.index.Term;

import org.apache.lucene.search.Hits;

import org.apache.lucene.search.IndexSearcher;

import org.apache.lucene.search.RangeQuery;

public class RangeQueryTest {

public static void main (String [] args) throws Exception {

//生成文档对象，下同

Document doc1 = new Document();

//添加“time”字段中的内容，下同

doc1.add(Field.Text("time", "200001"));

//添加“title”字段中的内容，下同

doc1.add(Field.Keyword("title", "doc1"));

Document doc2 = new Document();

doc2.add(Field.Text("time", "200002"));

doc2.add(Field.Keyword("title", "doc2"));

Document doc3 = new Document();

doc3.add(Field.Text("time", "200003"));

doc3.add(Field.Keyword("title", "doc3"));

Document doc4 = new Document();

doc4.add(Field.Text("time", "200004"));

doc4.add(Field.Keyword("title", "doc4"));

Document doc5 = new Document();

doc5.add(Field.Text("time", "200005"));

doc5.add(Field.Keyword("title", "doc5"));

//生成索引书写器

IndexWriter writer = new IndexWriter("c:""index", new StandardAnalyzer(), true);

//设置为混合索引格式

writer.setUseCompoundFile(true);

//将文档对象添加到索引中

writer.addDocument(doc1);

writer.addDocument(doc2);

writer.addDocument(doc3);

writer.addDocument(doc4);

writer.addDocument(doc5);

//关闭索引

writer.close();

//生成索引搜索器

IndexSearcher searcher = new IndexSearcher("c:""index");

//构造词条

Term beginTime = new Term("time","200001");

Term endTime = new Term("time","200005");

//用于保存检索结果

Hits hits = null;

//生成RangeQuery对象，初始化为null

RangeQuery query = null;

//构造RangeQuery对象，检索条件中不包含边界值

query = new RangeQuery(beginTime, endTime, false);

//开始检索，并返回检索结果

hits = searcher.search(query);

//输出检索结果的相关信息

printResult(hits, "从200001～200005的文档，不包括200001和200005");

//再构造一个RangeQuery对象，检索条件中包含边界值

query = new RangeQuery(beginTime, endTime, true);

//开始第二次检索

hits = searcher.search(query);

//输出检索结果的相关信息

printResult(hits, "从200001～200005的文档，包括200001和200005");

}

public static void printResult(Hits hits, String key) throws Exception

{System.out.println("查找 """ + key + """ :");

if (hits != null) {

if (hits.length() == 0) {

System.out.println("没有找到任何结果");

} else {

System.out.print("找到");

for (int i = 0; i < hits.length(); i++) {

Document d = hits.doc(i);

String dname = d.get("title");

System.out.print(dname + " " );

}

System.out.println();

}

在上述代码中首先构造了两个Term词条，然后构造了一个RangeQuery对象。在初始化RangeQuery对象的时候，使用构造的两个Term词条作为RangeQuery构造函数的参数。前面已经说过，RangeQuery的构造函数中的两个参数分别称为“开始词条”和“结束词条”，它的含义也就是查找介于这两者之间的所有Document。

构建的Document的“time”字段值均介于200001～200005之间，其检索结果如图11-11所示。

图11-11 RangeQuery测试结果

从图11-11中可以看出，在代码11.6中使用RangeQuery共进行了两次检索，第一次的检索条件中不包括边界值，第二次的检索条件中包括边界值。

从代码11.6和图11-11中可以看出，第1次使用FALSE参数构造的RangeQuery对象不包括2个边界值，因此只返回3个Document，而第2次使用TRUE参数构造的RangeQuery则包括2个边界值，因此将5个Document全部返回了。

11.4.4 使用前缀搜索—PrefixQuery

PrefixQuery就是使用前缀来进行查找的。通常情况下，首先定义一个词条Term。该词条包含要查找的字段名以及关键字的前缀，然后通过该词条构造一个PrefixQuery对象，就可以进行前缀查找了。

下面以代码11.7为例来介绍使用PrefixQuery进行检索的运行过程。

代码11.7 PrefixQueryTest.java

package ch11;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.document.Field;

import org.apache.lucene.index.IndexWriter;

import org.apache.lucene.index.Term;

import org.apache.lucene.search.Hits;

import org.apache.lucene.search.IndexSearcher;

import org.apache.lucene.search.PrefixQuery;

import org.apache.lucene.search.RangeQuery;

public class PrefixQueryTest {

public static void main(String[] args) throws Exception {

//生成Document对象，下同

Document doc1 = new Document();

//添加“name”字段的内容，下同

doc1.add(Field.Text("name", "David"));

//添加“title”字段的内容，下同

doc1.add(Field.Keyword("title", "doc1"));

Document doc2 = new Document();

doc2.add(Field.Text("name", "Darwen"));

doc2.add(Field.Keyword("title", "doc2"));

Document doc3 = new Document();

doc3.add(Field.Text("name", "Smith"));

doc3.add(Field.Keyword("title", "doc3"));

Document doc4 = new Document();

doc4.add(Field.Text("name", "Smart"));

doc4.add(Field.Keyword("title", "doc4"));

//生成索引书写器

IndexWriter writer = new IndexWriter("c:""index",

new StandardAnalyzer(), true);

//设置为混合索引模式

writer.setUseCompoundFile(true);

//依次将文档添加到索引中

writer.addDocument(doc1);

writer.addDocument(doc2);

writer.addDocument(doc3);

writer.addDocument(doc4);

//关闭索引书写器

writer.close();

//生成索引搜索器对象

IndexSearcher searcher = new IndexSearcher("c:""index");

//构造词条

Term pre1 = new Term("name", "Da");

Term pre2 = new Term("name", "da");

Term pre3 = new Term("name", "sm");

//用于保存检索结果

Hits hits = null;

//生成PrefixQuery类型的对象，初始化为null

PrefixQuery query = null;

query = new PrefixQuery(pre1);

//开始第一次检索，并返回检索结果

hits = searcher.search(query);

//输出相应的检索结果

printResult(hits, "前缀为'Da'的文档");

query = new PrefixQuery(pre2);

//开始第二次检索，并返回检索结果

hits = searcher.search(query);

//输出相应的检索结果

printResult(hits, "前缀为'da'的文档");

query = new PrefixQuery(pre3);

//开始第二次检索，并返回检索结果

hits = searcher.search(query);

//输出相应的检索结果

printResult(hits, "前缀为'sm'的文档");

}

public static void printResult(Hits hits, String key) throws Exception

{System.out.println("查找 """ + key + """ :");

if (hits != null) {

if (hits.length() == 0) {

System.out.println("没有找到任何结果");

System.out.println();

} else {

System.out.print("找到");

for (int i = 0; i < hits.length(); i++) {

//取得文档

Document d = hits.doc(i);

//取得“title”字段的内容

String dname = d.get("title");

System.out.print(dname + " ");

}

System.out.println();

}

在上述代码中，首先构造了4个不同的Document。每个Document都有一个名为“name”的字段，其中存储了人物的名称。然后，代码构建了3个不同的词条，分别为“Da”、“da”和“sm”，可以看到，它们正好都是“name”字段中关键字的前缀。

代码的运行结果如图11-12所示。

从图11-12中可以看出，使用PrefixQuery共进行了3次检索，关键字分别为“Da”、“da”和“sm”，返回的检索结果情况在图中已经有明确的说明。不过，如果使用“Da”作为关键字会没有任何的检索结果，而使用“da”就有检索结果，这个问题将在后面作详细介绍。

从代码11.7和图11-12中可以看出，“da”前缀和“sm”前缀都顺利地找到了它们所在的文档，可是为什么与文档中关键字大小写一致的“Da”却没有找到呢？这是因为Lucene的标准分析器在进行分词过滤时将所有的关键字一律转成了小写，所以才会出现这样的结果。这也是开发者应当引起注意的地方。

11.4.5 多关键字的搜索—PhraseQuery

除了普通的TermQuery外，Lucene还提供了一种Phrase查询的功能。用户在搜索引擎中进行搜索时，常常查找的并非是一个简单的单词，很有可能是几个不同的关键字。这些关键字之间要么是紧密相联，成为一个精确的短语，要么是可能在这几个关键字之间还插有其他无关的关键字。此时，用户希望将它们找出来。不过很显然，从评分的角度看，这些关键字之间拥有与查找内容无关短语所在的文档的分值一般会较低一些。

PhraseQuery正是Lucene所提供的满足上述需求的一种Query对象。它的add方法可以让用户往其内部添加关键字，在添加完毕后，用户还可以通过setSlop()方法来设定一个称之为“坡度”的变量来确定关键字之间是否允许、允许多少个无关词汇的存在。

下面以代码11.8为例对PhraseQuery进行介绍。

代码11.8 PhraseQueryTest.java

package ch11;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.document.Field;

import org.apache.lucene.index.IndexWriter;

import org.apache.lucene.index.Term;

import org.apache.lucene.search.Hits;

import org.apache.lucene.search.IndexSearcher;

import org.apache.lucene.search.PhraseQuery;

import org.apache.lucene.search.PrefixQuery;

public class PhraseQueryTest {

public static void main(String[] args) throws Exception {

//生成Document对象

Document doc1 = new Document();

//添加“content”字段的内容

doc1.add(Field.Text("content", "david mary smith robert"));

//添加“title”字段的内容

doc1.add(Field.Keyword("title", "doc1"));

//生成索引书写器

IndexWriter writer = new IndexWriter("c:""index",

new StandardAnalyzer(), true);

//设置为混合索引格式

writer.setUseCompoundFile(true);

//将文档添加到索引中

writer.addDocument(doc1);

//关闭索引

writer.close();

//生成索引搜索器

IndexSearcher searcher = new IndexSearcher("c:""index");

//构造词条

Term word1 = new Term("content", "david");

Term word2 = new Term("content","mary");

Term word3 = new Term("content","smith");

Term word4 = new Term("content","robert");

//用于保存检索结果

Hits hits = null;

//生成PhraseQuery对象，初始化为null

PhraseQuery query = null;

// 第一种情况，两个词本身紧密相连，先设置坡度为0，再设置坡度为2

query = new PhraseQuery();

query.add(word1);

query.add(word2);

//设置坡度

query.setSlop(0);

//开始检索，并返回检索结果

hits = searcher.search(query);

//输出检索结果的相关信息

printResult(hits, "'david'与'mary'紧紧相隔的Document");

//再次设置坡度

query.setSlop(2);

//开始第二次检索

hits = searcher.search(query);

//输出检索结果

printResult(hits, "'david'与'mary'中相隔两个词的短语");

// 第二种情况，两个词本身相隔两个词，先设置坡度为0，再设置坡度为2

query = new PhraseQuery();

query.add(word1);

query.add(word4);

//设置坡度

query.setSlop(0);

//开始第三次检索，并返回检索结果

hits = searcher.search(query);

//输出检索结果

printResult(hits, "'david'与'robert'紧紧相隔的Document");

//设置坡度

query.setSlop(2);

//开始第四次检索，并返回检索结果

hits = searcher.search(query);

//输出检索结果

printResult(hits, "'david'与'robert'中相隔两个词的短语");

}

public static void printResult(Hits hits, String key) throws Exception

{System.out.println("查找 """ + key + """ :");

if (hits != null) {

if (hits.length() == 0) {

System.out.println("没有找到任何结果");

System.out.println();

} else {

System.out.print("找到");

for (int i = 0; i < hits.length(); i++) {

//取得文档对象

Document d = hits.doc(i);

//取得“title”字段的内容

String dname = d.get("title");

//输出相关的信息

System.out.print(dname + " ");

}

System.out.println();

}

在上述代码中创建了一个Document，这个Document的“content”域中含有4个关键字。接下来，代码创建了一个PhraseQuery对象，首先将前两个紧紧相连关键字放入其中，并设置它们的坡度值分别为0和2，接下来，又将第一个和最后一个关键字放入其中，同样设置它们的坡度值为0和2。

代码11.8的运行效果，如图11-13所示。

从图11.8中可以看出，代码11.8共进行了4次检索测试，并且分两组分别对检索结果进行对比。

从代码11.8和图11-13中可以看出，对两个紧连的关键字来说无论将坡度设置为多少，Lucene总能找到它所在的文档，而对两个不紧连的关键字，如果坡度值小于它们之间无关词的数量，那么则无法找到。其实，当两个关键字之间的无关词数小于等于坡度值时，总是可以被找到。

11.4.6 使用短语缀搜索—PhrasePrefixQuery

PhrasePrefixQuery与Phrase有些类似。在PhraseQuery中，如果用户想查找短语“david robert”，又想查找短语“mary robert”。那么，他就只能构建两个PhraseQuery，然后再使用BooleanQuery将它们作为其中的子句，并使用“或”操作符来连接，这样就能达到需要的效果。PhrasePrefixQuery可以让用户很方便地实现这种需要。

接下来看看在代码11.9中是如何使用PhrasePrefixQuery来实现的。

代码11.9 PhrasePrefixQueryTest.java

package ch11;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.document.Field;

import org.apache.lucene.index.IndexWriter;

import org.apache.lucene.index.Term;

import org.apache.lucene.search.Hits;

import org.apache.lucene.search.IndexSearcher;

import org.apache.lucene.search.PhrasePrefixQuery;

import org.apache.lucene.search.PhraseQuery;

import org.apache.lucene.search.RangeQuery;

public class PhrasePrefixQueryTest {

public static void main(String[] args) throws Exception {

//生成Document对象

Document doc1 = new Document();

//添加“content”字段的内容

doc1.add(Field.Text("content", "david mary smith robert"));

//添加“title”字段的内容

doc1.add(Field.Keyword("title", "doc1"));

//生成索引书写器对象

IndexWriter writer = new IndexWriter("c:""index",

new StandardAnalyzer(), true);

//将文档添加到索引中

writer.addDocument(doc1);

//关闭索引书写器

writer.close();

//生成索引检索器

IndexSearcher searcher = new IndexSearcher("c:""index");

//构造词条

Term word1 = new Term("content", "david");

Term word2 = new Term("content", "mary");

Term word3 = new Term("content", "smith");

Term word4 = new Term("content", "robert");

//用于保存检索结果

Hits hits = null;

//生成PhrasePrefixQuery对象，初始化为null

PhrasePrefixQuery query = null;

query = new PhrasePrefixQuery();

// 加入可能的所有不确定的词

query.add(new Term[]{word1, word2});

// 加入确定的词

query.add(word4);

//设置坡度

query.setSlop(2);

//开始检索，并返回检索结果

hits = searcher.search(query);

//输出检索结果的相关信息

printResult(hits, "存在短语'david robert'或'mary robert'的文档");

}

public static void printResult(Hits hits, String key) throws Exception

{System.out.println("查找 """ + key + """ :");

if (hits != null) {

if (hits.length() == 0) {

System.out.println("没有找到任何结果");

System.out.println();

} else {

System.out.print("找到");

for (int i = 0; i < hits.length(); i++) {

//获取文档对象

Document d = hits.doc(i);

//取得“title”字段内容

String dname = d.get("title");

System.out.print(dname + " ");

}

System.out.println();

}

在上述代码中，首先构建了一个Document，它的“content”字段中包含4个关键字。接下来，构建了一个PhrasePrefixQuery的对象，调用它的add(Term [])方法设定出现在短语中的第一个关键词。由于这个方法的参数类型为一个Term型的数组，所以，它可以设置多个Term，即出现在短语中的第一个词就在这个数组中进行选择。然后，再使用add(Term)方法设置出现在短语中的后一个词。代码的运行结果如图11-14所示。

图11-14 PhrasePrefixQuery的测试结果

从图11-14中可以看出，使用PhrasePrefixQuery可以非常容易的实现相关短语的检索功能。

11.4.7 相近词语的搜索—FuzzyQuery

FuzzyQuery是一种模糊查询，它可以简单地识别两个相近的词语。下面以11.10为例进行详细介绍。

代码11.10 FuzzyQueryTest.java

package ch11;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.document.Field;

import org.apache.lucene.index.IndexWriter;

import org.apache.lucene.index.Term;

import org.apache.lucene.search.FuzzyQuery;

import org.apache.lucene.search.Hits;

import org.apache.lucene.search.IndexSearcher;

public class FuzzyQueryTest {

public static void main(String[] args) throws Exception {

//生成Document对象

Document doc1 = new Document();

//添加“content”字段的内容

doc1.add(Field.Text("content", "david"));

//添加“title”字段的内容

doc1.add(Field.Keyword("title", "doc1"));

Document doc2 = new Document();

doc2.add(Field.Text("content", "sdavid"));

doc2.add(Field.Keyword("title", "doc2"));

Document doc3 = new Document();

doc3.add(Field.Text("content", "davie"));

doc3.add(Field.Keyword("title", "doc3"));

//生成索引书写器

IndexWriter writer = new IndexWriter("c:""index",

new StandardAnalyzer(), true);

//将文档添加到索引中

writer.addDocument(doc1);

writer.addDocument(doc2);

writer.addDocument(doc3);

//关闭索引写器

writer.close();

//生成索引搜索器

IndexSearcher searcher = new IndexSearcher("c:""index");

Term word1 = new Term("content", "david");

//用于保存检索结果

Hits hits = null;

//生成FuzzyQuery对象，初始化为null

FuzzyQuery query = null;

query = new FuzzyQuery(word1);

//开始检索，并返回检索结果

hits = searcher.search(query);

//输出检索结果的相关信息

printResult(hits,"与'david'相似的词");

}

public static void printResult(Hits hits, String key) throws Exception

{System.out.println("查找 """ + key + """ :");

if (hits != null) {

if (hits.length() == 0) {

System.out.println("没有找到任何结果");

System.out.println();

} else {

System.out.print("找到");

for (int i = 0; i < hits.length(); i++) {

//取得文档对象

Document d = hits.doc(i);

//取得“title”字段的内容

String dname = d.get("title");

System.out.print(dname + " ");

}

System.out.println();

}

在上述代码中，首先构建了3个Document，这3个Document的“content”字段中都有一个与“david”较为相似的关键字（其中第一个就是david）。然后使用FuzzyQuery来对其进行检索。运行效果如图11-15所示。

从图11-15中可以看出，使用FuzzyQuery可以检索到索引中所有包含与“david”相近词语的文档。

11.4.8 使用通配符搜索—WildcardQuery

Lucene也提供了通配符的查询，这就是WildcardQuery。下面以代码11.11为例进行介绍。

代码11.11 WildcardQueryTest.java

package ch11;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.document.Field;

import org.apache.lucene.index.IndexWriter;

import org.apache.lucene.index.Term;

import org.apache.lucene.search.Hits;

import org.apache.lucene.search.IndexSearcher;

import org.apache.lucene.search.WildcardQuery;

public class WildcardQueryTest {

public static void main(String[] args) throws Exception {

//生成Document对象，下同

Document doc1 = new Document();

//添加“content”字段的内容，下同

doc1.add(Field.Text("content", "whatever"));

//添加“title”字段的内容，下同

doc1.add(Field.Keyword("title", "doc1"));

Document doc2 = new Document();

doc2.add(Field.Text("content", "whoever"));

doc2.add(Field.Keyword("title", "doc2"));

Document doc3 = new Document();

doc3.add(Field.Text("content", "however"));

doc3.add(Field.Keyword("title", "doc3"));

Document doc4 = new Document();

doc4.add(Field.Text("content", "everest"));

doc4.add(Field.Keyword("title", "doc4"));

//生成索引书写器

IndexWriter writer = new IndexWriter("c:""index",

new StandardAnalyzer(), true);

//将文档对象添加到索引中

writer.addDocument(doc1);

writer.addDocument(doc2);

writer.addDocument(doc3);

writer.addDocument(doc4);

//关闭索引书写器

writer.close();

//生成索引书写器

IndexSearcher searcher = new IndexSearcher("c:""index");

//构造词条

Term word1 = new Term("content", "*ever");

Term word2 = new Term("content", "wh?ever");

Term word3 = new Term("content", "h??ever");

Term word4 = new Term("content", "ever*");

//生成WildcardQuery对象，初始化为null

WildcardQuery query = null;

//用于保存检索结果

Hits hits = null;

query = new WildcardQuery(word1);

//开始第一次检索，并返回检索结果

hits = searcher.search(query);

//输出检索结果的相关信息

printResult(hits, "*ever");

query = new WildcardQuery(word2);

//开始第二次检索，并返回检索结果

hits = searcher.search(query);

//输出检索结果的相关信息

printResult(hits, "wh?ever");

query = new WildcardQuery(word3);

//开始第三次检索，并返回检索结果

hits = searcher.search(query);

//输出检索结果的相关信息

printResult(hits, "h??ever");

query = new WildcardQuery(word4);

//开始第四次检索，并返回检索结果

hits = searcher.search(query);

//输出检索结果的相关信息

printResult(hits, "ever*");

}

public static void printResult(Hits hits, String key) throws Exception

{System.out.println("查找 """ + key + """ :");

if (hits != null) {

if (hits.length() == 0) {

System.out.println("没有找到任何结果");

System.out.println();

} else {

System.out.print("找到");

for (int i = 0; i < hits.length(); i++) {

//取得文档对象

Document d = hits.doc(i);

//取得“title”字段的内容

String dname = d.get("title");

System.out.print(dname + " ");

}

System.out.println();

}

代码11.11 的运行结果如图11-16 所示。

由上述代码可以看出，通配符“?”代表1个字符，而“*”则代表0至多个字符。不过通配符检索和上面的FuzzyQuery由于需要对字段关键字进行字符串匹配，所以，在搜索的性能上面会受到一些影响。

对于搜索引擎（比如Google和百度）来讲，很多情况下只需要用户在输入框内输入所需查询的内容，然后再单击“搜索”就可以了，其余的事情全部交给搜索引擎去处理，最后搜索引擎会把检索到的结果显示出来。那么搜索引擎是怎样处理用户输入得符号串的呢？

在Lucene中，这项工作就交给了QueryParser类来完成，它的作用就是把各种用户输入的符号串转为一个内部的Query或者一个Query组。虽然Lucene提供的API允许使用者创建各种各样的Query（查询语句），但它同时也允许通过QueryParser（查询分析器）生成各种各样的Query子对象。这使得Lucene的查询功能更加灵活和强大。

11.5.1 QueryParser的简单用法

QueryParser实际上就是一个解析用户输入的工具，可以通过扫描用户输入的字符串，生成Query对象，以下是一个代码示例：

Query query = null;

query = QueryParser.parse(keywords,fieldName,new StandardAnalyzer());

由上面代码可以看出，当使用QueryParser构建用户Query时，不仅需要用户输入关键字文本，还需要告诉QueryParser默认将在哪个字段内查找该关键字信息。当然，这并不是说用户只能在这个字段内查找关键字信息（例如可以在关键字中使用“content:david”这样的方式指定搜索字段“content”中的关键字），但是如果用户在输入的关键字中没有给出检索字段信息时，QueryParser就将在默认字段内进行检索。

用户输入关键字的格式以及QueryParser所理解的含义如表11-2所示。

表11-2 输入关键字格式和QueryParser理解的含义

格式	含义
“David”	在默认的字段中检索“David”关键字
“content：David”	在“content”字段中检索“David”关键字
“David Mary”或“David OR Mary”	在默认字段中检索David和Mary关键字，它们是“或”关系
“+David +Mary”或“David AND Mary”	在默认字段中检索David和Mary关键字，它们是“与”关系
“content：David –title：Manager”或“content：David AND NOT title：Manager”	在content字段中包括关键字David但在title字段中不包含关键字Manager
“(David OR Mary) AND Robert”	在默认字段中包含David或Mary关键字，但一定要包含Robert关键字
Davi*	在默认字段中检索前缀为Davi
“content："David is a manager"”	在“content”字段中包含短语“David is a manager”

另外很重要的一点，就是在使用QueryParser对用户的输入进行扫描时，还需要给它一个分析器。有关分析器的概念将在后面的章节中介绍。不过，当对用户输入的关键字进行分析时的分析器应当与建立索引时的分析器一样，这样才能保证分析成功。

11.5.2 QueryParser的“与”和“或”

通过表11-1可以了解，当用户输入两个关键字时，QueryParser默认它们之间的关系为“或”关系。如果用户需要改变这种逻辑关系，则可采用下面的方法：

QueryParser parser = new QueryParser(fieldName, new StandardAnalyzer());

parser.setOperator(QueryParser.DEFAULT_OPERATOR_AND);

这样构建的QueryParser实例在对用户输入进行扫描时，就会用空格分开的关键字理解为“与”，其实也就是构建了一个“与”关系的布尔型查询。

你可能感兴趣的:(QueryParser)

Lucene硬核解析专题系列（三）：查询解析与执行 yinlongfei_love lucene mybatis 全文检索
Lucene的索引构建为高效搜索奠定了基础，而查询解析与执行则是将用户意图转化为实际结果的关键环节。本篇将从查询的解析开始，逐步深入到查询类型、评分模型和执行流程，揭示Lucene搜索能力的底层原理。一、查询语法与QueryParser的工作原理Lucene的查询过程始于用户输入的搜索字符串，例如“人工智能AND机器学习”。这一字符串需要被解析为Lucene能够理解的结构化对象。QueryPars
restify框架半梅芒果干 nodejs 前端 javascript 开发语言 node.js
参考文档：这篇文章废话不多说，直接上代码啦varrestify=require('restify');constserver=restify.createServer({name:'myapp',version:'1.0.0'});server.use(restify.plugins.queryParser());//设置接受getquery返回server.use(restify.plugins
Lucene源码分析 - queryparser > flexible 机器智能
FlexibleThisprojectcontainsthenewLucenequeryparserimplementation,whichmatchesthesyntaxofthecoreQueryParserbutoffersamoremodulararchitecturetoenablecustomization.ThisprojectcontainsthenewLucenequerypar
Elasticsearch源码分析九--查询解析器QueryParser注册过程 Nireus_LOVE Elasticsearch 源码分析 elasticsearch
QueryParser及其子类用于对输入的查询query进行解析，返回Query类的对象，代表具体的查询类。Elasticsearch为每种类型的Query提供了单独的查询解析器；而Lucene的QueryParser对所有类型的Query使用相同的查询解析器。Lucene的解析器使用如下：'''在构造QueryParser对象时传入分析器,此过程涉及JavaCC、分词器、查询语法等'''Quer
Spring Boot 中集成 Lucence Myovlmx Spring Boot spring boot java lucene
2.1依赖导入首先需要导入Lucene的依赖，它的依赖有好几个，如下：org.apache.lucenelucene-core5.3.1org.apache.lucenelucene-queryparser5.3.1org.apache.lucenelucene-analyzers-common5.3.1org.apache.lucenelucene-highlighter5.3.1org.apa
springboot整合lucene的基本使用：实现索引查询并显示高亮 BC君 lucene spring boot java
前言本文记录了笔者将springboot整合lucene的过程和踩坑，是对lucene最粗浅的运用，主要实现了从数据库查询并写入索引文件，查询结果高亮显示等。引入依赖JDKLucene1.8.0_2918.11.2在pom.xml中加入以下依赖。org.apache.lucenelucene-core8.11.2org.apache.lucenelucene-queryparser8.11.2or
SpringBoot整合Lucene实现全文检索好诡异 lucene 全文检索 apache
记录一下Lucene的简单使用，首先我的boot是2.x版本的。Lucene依赖如下：org.apache.lucenelucene-core7.6.0org.apache.lucenelucene-queryparser7.6.0org.apache.lucenelucene-analyzers-common7.6.0org.apache.lucenelucene-highlighter7.6.
Lucene bm25 结合 jieba中文分词搜索三印 Python和JAVA 搜索引擎大数据 lucene java
2021.10.20：增加依赖包，防止版本问题导致代码不可用org.apache.lucenelucene-core6.2.0org.apache.lucenelucene-test-framework6.2.0junitjunit4.12org.apache.lucenelucene-queryparser6.2.0org.jsoupjsoup1.9.2com.huabanjieba-analy
《lucene in action》笔记：分析过程 Devops_cheers
分析（Analysis），在Lucene中指的是将域Field文本转换成最基本的索引表示单元-项（Term）的过程。在搜索过程中，这些项用于决定什么样的文档能够匹配查询条件。1.使用分析器使用Lucene时，选择一个合适的分析器是非常关键的。分析操作将出现在任何需要将文本转换成项的时刻，而对于Lucene核心来说，分析操作会出现在两个时间点：建立索引期间和使用QueryParser对象进行搜索时。
Lucene的全文搜索及高亮显示天真吖415 java lucene
目录测试的效果如下1.引入maven依赖2.索引目录存放数据3.controller4.处理类测试的效果如下1.引入maven依赖org.apache.lucenelucene-core8.2.0org.apache.lucenelucene-analyzers-common8.2.0org.apache.lucenelucene-queryparser8.2.0org.apache.lucene
Lucene源码分析 - queryparser 机器智能
Thismoduleprovidesanumberofqueryparsers:这个module提供了这些queryparsers：classic：一个简单的用javacc实现的LucenequeryparseranalyzingQueryParserthatpassesFuzzy-,Prefix-,Range-,andWildcardQuerysthroughthegivenanalyzer.处
Lucene基础学习程序员的人生K 搜索技术 lucene
一、基础知识1.Lucene简介2.入门实例3.内建Query对象4.分析器Analyzer5.QueryParser6.索引7.排序8.过滤9.概念简介10.Lucene入门实例二、Lucene的基础三、索引建立1.lucene索引_创建_域选项2.lucene索引_的删除和更新3.lucene索引_加权操作和Luke的简单演示4.对日期和数字进行索引5.IndexReader的设计6.Dire
Lucene（7）：Lucene高级搜索不死鸟.亚历山大.狼崽子 Lucene lucene 全文检索搜索引擎
1文本搜索QueryParser支持默认搜索域,第一个参数为默认搜索域。如果在执行parse方法的时候,查询语法中包含域名则从指定的这个域名中搜索,如果只有查询的关键字,则从默认搜索域中搜索结果。需求描述:查询名称中包含华为手机关键字的结果。测试代码@TestpublicvoidtestTextSearch()throwsException{//1.创建Query搜索对象//创建分词器Analyz
数据治理篇-元数据-血缘分析: queryparser概述严国华
转载：https://www.codenong.com/jse7df02c3f366/前言数据字典DataDictionary数据血缘DataLineage元数据触发器MetaTrigger一.血缘分析的导推形式sqlkafkastreamssparkrddflinkdatastream二.血缘分析的技术方案分析。通过调度器反向推导血缘关系。通过计算引擎系统提供的血缘分析接口进行收集。通过计算引擎
搜索学习--Lucene中搜索的排序、范围区间搜索、分页搜索、多条件搜索 _时间海
依赖org.apache.lucenelucene-core4.7.2org.apache.lucenelucene-queryparser4.7.2org.apache.lucenelucene-analyzers-common4.7.2org.apache.lucenelucene-highlighter4.7.2建立索引本次增加了Float、Int类型的域packagetop.yuyufen
kibana使用Lucene语法续哥儿
以下Kibana搜索栏中搜索(lucene语法)。。。。。从印象笔记贴过来变形了。。。。。。。。。。。6.2.1的Elasticsearch"lucene_version":"7.2.1"http://lucene.apache.org/core/7_2_1/queryparser/org/apache/lucene/queryparser/classic/package-summary.html
10、自定义QueryParser（lucene笔记） yjaal
一、自定义QueryParser1、有些时候我们需要自定义一些QueryParser，一般原因为两个：（1）对于某些QueryParser在查询时会使得性能降低，所以考虑将这些查询取消，比如FuzzyQuery和WildcardQuery。（2）在具体的查询时，很有可能有这样一种需求：需要获取的是一个数字的范围查询。所以必须扩展原有的QueryParser才能进行查询。说明：就是有些默认的Quer
搜索引擎Lucene-01 LCXU_0928 lucene 搜索引擎
第一步,引入JAR包org.apache.lucenelucene-core7.3.1org.apache.lucenelucene-analyzers-common7.3.1org.apache.lucenelucene-queryparser7.3.1org.apache.lucenelucene-highlighter7.3.1commons-iocommons-io2.4第二步，生撸代码p
LUCENE-学习一叶文 IAVA lucene 信息检索
1.lucene简介lucene主要的功能是用来全文检索。他可以搜索出非结构性的数据，比如WORD文档等。2.lucene使用1）pom文件引入4.7.2UTF-8UTF-8org.apache.lucenelucene-core${lucene.version}org.apache.lucenelucene-queryparser${lucene.version}org.apache.lucen
(精华)2020年8月18日 C#基础知识点搜索引擎Lucene的使用愚公搬代码 C#lucene
lucene的基本说明///lucene.net：全文检索的工具包，不是应用，只是个类库，完成了全文检索的功能///就是把数据拆分—存起来—查询时—拆分—匹配—结果//////Analysis–分词器，负责把字符串拆分成原子，包含了标准分词，直接空格拆分///项目中用的是盘古中文分词，///Document–数据结构，定义存储数据的格式///Index–索引的读写类///QueryParser–查
solr介绍和项目示例 Colin-hu 技术
什么是SolrLucene复习：1、什么是lucene：全文检索工具包2、Lucene的工作原理：索引数据的创建从原始文件中提取一些可以用来搜索的数据（封装成各种Field），把各field再封装成document，然后对document进行分析（对各字段分词），得到一些索引目录写入索引库，document本身也会被写入一个文档信息库；索引数据的查询根据关键词解析（queryParser）出查询条
lucene7.3 使用报org.apache.lucene.queryparser.classic.ParseException错误 huachuan520
搜索代码运行时出现如下异常org.apache.lucene.queryparser.classic.ParseException:Encountered""atline1,column0.Wasexpectingoneof:..."+"..."-"......"("..."*".................."["..."{".........atorg.apache.lucene.quer
Lucene查询语法详解 zfsn7722483 Lucene
Lucene提供了丰富的API来组合定制你所需要的查询器，同时也可以利用QueryParser提供的强大的查询语法解析来构造你想要的查询器。本文章详细的介绍了Lucene的查询语法。通过Java语法分析器把一个查询字符串解析成Lucene的查询器。在你选择使用QueryParser前，请考虑以下事项：如果你打算在程序中拼接查询语法串然后再利用QueryParser转换，那么强烈建议你利用相应的AP
Lucene教程--入门程序详解欧阳思海 √lucene
Lucene入门程序1需求实现一个歌词搜索系统，通过关键字搜索，凡是文件名或文件内容包括关键字的文件都要找出来。注意：该入门程序只对文本文件(.txt)搜索。2开发环境Jdk：1.7.0_72开发工具：eclipseindigoLucene包：lucene-core-4.10.3.jarlucene-analyzers-common-4.10.3.jarlucene-queryparser-4.1
关于Lucene的详细说明和操作使用方式 qd_zheng java技术
Lucene提供了方便您创建自建查询的API，也通过QueryParser提供了强大的查询语言。本文讲述Lucene的查询语句解析器支持的语法，Lucene的查询语句解析器是使用JavaCC工具生成的词法解析器，它将查询字串解析为LuceneQuery对象。项（Term）一条搜索语句被拆分为一些项（term）和操作符（operator）。项有两种类型：单独项和短语。单独项就是一个单独的单词，例如"
基于lucene的检索的简单的例子张大鹏的博客检索
需要的jar包：compilegroup:'org.apache.lucene',name:'lucene-core',version:'8.3.0'compilegroup:'org.apache.lucene',name:'lucene-queryparser',version:'8.3.0'compilegroup:'org.apache.lucene',name:'lucene-highl
lucene_7.1_demo liu975123 lucene入门demo
lucene7.1demo1、基于maven；废话不多说，如下org.apache.lucenelucene-core7.1.0org.apache.lucenelucene-analyzers-smartcn7.1.0org.apache.lucenelucene-queryparser7.1.0org.apache.lucenelucene-highlighter7.1.0junitjunit
jsoup select 通过属性选择器选择内容，索引值选择活在大染缸中 jsoup
jsoup属性选择器跟jquery的写法一致。1.在QueryParser类中有定义的属性匹配规则privatestaticfinalString[]AttributeEvals=newString[]{"=","!=","^=","$=","*=","~="}调用select方法的时候，写法还是有点区别的select("body>div[class*='top']")在匹配的时候，"=","!=
中文检索(分词、同义词、权重) 吴帝永 Lucene
1、首先导入Lucene相关包：lucene-analyzers-common-4.7.1.jarlucene-core-4.7.1.jarlucene-facet-4.7.1.jarlucene-highlighter-4.7.1.jarlucene-queries-4.7.1.jarlucene-queryparser-4.7.1.jar2、然后把分词源码IK复制到项目的src文件夹下。IK是
lucene4.5 demo 配置王盟
1.安装JDK1.6。2.Java开发环境配置解压下载的lucene-4.5.0.zip，可以看到core、demo、analysis、queryparser这几个文件夹。本文解压目录为：D:\Lucene\lucene-4.5.0将lucene-core-4.5.0.jar、lucene-demo-4.5.0.jar、lucene-queryparser-4.5.0.jar和lucene-ana
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag