梦朝思夕

第五章高级搜索

5.1 搜索排序

public void seacher(String queryContion,intnum,Sort sort) {
    try {
      IndexSearcher searcher=new IndexSearcher(indexReader);
      QueryParser parser = newQueryParser(Version.LUCENE_35,"contents",analyzer);
      Query query=parser.parse(queryContion);
      System.out.println("使用的Query："+query.getClass().getName());
      TopDocs  topDocs=searcher.search(query, num,sort);
       intlength= topDocs.totalHits;
      System.out.println("总共查询出来总数:"+length);
      ScoreDoc[] scoreDocs= topDocs.scoreDocs;
       for(ScoreDoc scoreDoc : scoreDocs) {
        Document doc=searcher.doc(scoreDoc.doc);
        System.out.println(doc.get("id") + "---->"
            + doc.get("filename") + "[" +doc.get("fullpath")
            + "]-->\n" + doc.get("contents").substring(0,40));
       }
    } catch(CorruptIndexException e) {
      e.printStackTrace();
    } catch(IOException e) {
      e.printStackTrace();
    } catch(ParseException e) {
      e.printStackTrace();
    }
    
  }

5.2 搜索过滤

@Test
public void searchByQueryParse(){
      SearchFilterOperaopera=new SearchFilterOpera("D:/luceneIndex/index", analyzer, true);
      //Filterfilter=newTermRangeFilter("id","3","6",true,true);
      //Filterfilter=newTermRangeFilter("filename","b","d",true,true);
      //NumericRangeFilterfilter=NumericRangeFilter.newLongRange("size", 200L, 4700L, true,true);
      QueryWrapperFilterfilter=new QueryWrapperFilter(new TermQuery(newTerm("id","3")));
      //opera.searchByQueryParse("filename:[aTO z]",null,10);
      //opera.searchByQueryParse("filename:[aTO g]",termFilter,10);
      opera.searchByQueryParse("id:{1TO 9}",filter,20);
      //opera.searchByQueryParse("filename:{aTO g}",10);
      //没有办法匹配数字范围（自己扩展Parser）
      //opera.searchByQueryParse("size:[200TO 13000]",10);
 
      //完全匹配
      //opera.searchByQueryParse("contents:\"完全是宠溺\"",10);
      //距离为1匹配
      //opera.searchByQueryParse("contents:\"完全宠溺\"~1",10);
      //模糊查询
      //opera.searchByQueryParse("contents:*",10);
}

public void searchByQueryParse(StringqueryContion,Filter filter,int num) {
           try{
                 IndexSearchersearcher=new IndexSearcher(indexReader);
                 QueryParserparser = new QueryParser(Version.LUCENE_35,"contents",analyzer);
                 Queryquery=parser.parse(queryContion);
                 System.out.println("query类型："+query.getClass().getName()+"====>"+query.toString());
                 TopDocs  topDocs= searcher.search(query,filter, num);
                 intlength= topDocs.totalHits;
                 System.out.println("总共查询出来总数:"+length);
                 ScoreDoc[]scoreDocs= topDocs.scoreDocs;
                 for(ScoreDoc scoreDoc : scoreDocs) {
                      Documentdoc=searcher.doc(scoreDoc.doc);
                      System.out.println(doc.get("id")+ "---->"
                                  +doc.get("filename") + "[" + doc.get("fullpath")
                                  +"]-->\n" );
                 }
           }catch (CorruptIndexException e) {
                 e.printStackTrace();
           }catch (IOException e) {
                 e.printStackTrace();
           }catch (ParseException e) {
                 e.printStackTrace();
           }
      }

5.3 自定义评分

过程：

(1).创建一个类继承于CustomScoreQuery

(2).覆盖getCustomScoreProvider方法

(3).创建CustomScoreProvider类

(4).覆盖customScore方法

(5).根据field进行评分

注：Similarity模块--Lucene的搜索结果打分控制模块。

权重的控制：这是在建索引的时候就写入索引的，查询时只是读取出来，用乘的方式来对一些检索结果加分。

Controller 模块：Lucene的排序流程控制模块，里面提供的一些接口能让你对打分后的搜索结果进行一些筛选和调整。

package com.mzsx.custom.score;
 
import java.io.IOException;
import java.text.SimpleDateFormat;
import java.util.Date;
 
import org.apache.lucene.document.Document;
import org.apache.lucene.index.CorruptIndexException;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.FieldCache;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.search.TermRangeQuery;
import org.apache.lucene.search.TopDocs;
importorg.apache.lucene.search.function.CustomScoreProvider;
import org.apache.lucene.search.function.CustomScoreQuery;
importorg.apache.lucene.search.function.FieldScoreQuery;
importorg.apache.lucene.search.function.FieldScoreQuery.Type;
importorg.apache.lucene.search.function.ValueSourceQuery;
import org.apache.lucene.store.Directory;
 
import com.google.gson.Gson;
import com.mzsx.write.DirectoryConext;
 
public class MyScoreQuery {
 @SuppressWarnings("deprecation")
  publicvoid searchByFileSizeQuery() {
     try {
       IndexSearchersearcher = newIndexSearcher(DirectoryConext.getDirectory("D:\\luceneIndex\\index"));
       Query q = newTermRangeQuery("id","1","8",true,true);
       //1、创建一个评分域
      FilenameSizeQuery query = new FilenameSizeQuery(q);
       TopDocs tds =null;
       tds =searcher.search(query, 100);
      SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd hh:mm:ss");
       for(ScoreDocsd:tds.scoreDocs) {
         Document d = searcher.doc(sd.doc);
         System.out.println(sd.doc+":("+sd.score+")" +
              "["+d.get("filename")+"【"+d.get("path")+"】--->"+
              d.get("size")+"-----"+sdf.format(newDate(Long.valueOf(d.get("date"))))+"]");
       }
      searcher.close();
     } catch(CorruptIndexException e) {
      e.printStackTrace();
     } catch (IOException e) {
      e.printStackTrace();
     }
  }
 //--------------文件大小评分--------------------
  privateclass FilenameSizeQuery extends CustomScoreQuery{
 
     publicFilenameSizeQuery(Query subQuery) {
       super(subQuery);
     }
     
     @Override
     protectedCustomScoreProvider getCustomScoreProvider(IndexReader reader)
         throws IOException {
       return newFilenameSizeProvider(reader);
     }
     
  }
  
  privateclass FilenameSizeProvider extends CustomScoreProvider{
     long[] sizes=null;
     private Gson gson=newGson();
     publicFilenameSizeProvider(IndexReader reader) {
       super(reader);
       try {
         sizes=FieldCache.DEFAULT.getLongs(reader, "size");
       } catch(IOException e) {
         // TODO Auto-generated catch block
         e.printStackTrace();
       }
     }
     
     @Override
     public floatcustomScore(int doc, float subQueryScore, float valSrcScore)
         throws IOException {
       //如何根据doc获取相应的field的值
       /*
       * 在reader没有关闭之前，所有的数据会存储要一个域缓存中，可以通过域缓存获取很多有用的信息
       * filenames =FieldCache.DEFAULT.getStrings(reader, "filename");可以获取所有的filename域的信息
       */
      System.out.println(gson.toJson(sizes));
      System.out.println("doc:"+doc+",subQueryScore："+subQueryScore+",valSrcScore:"+valSrcScore);
      if(sizes[doc]>14064){
         return subQueryScore*1.5F;
       }
       returnsubQueryScore/1.2F;
    }
  }
}

测试

package com.mzsx.test;
import org.junit.Test;
 
import com.mzsx.custom.score.MyScoreQuery;
 
public class CustomScoreTest {
  @Test
  public void searchByFileSizeQuery(){
    MyScoreQuery myScoreQuery=newMyScoreQuery();
    myScoreQuery.searchByFileSizeQuery();
  }
}

结果

==================directory实例化=====================
[4919,1377,14064,735,4747,20107,278973,66596,224899,8348,1731,4322,12311,1011713,453783]
doc:1,subQueryScore：1.0,valSrcScore:1.0
[4919,1377,14064,735,4747,20107,278973,66596,224899,8348,1731,4322,12311,1011713,453783]
doc:2,subQueryScore：1.0,valSrcScore:1.0
[4919,1377,14064,735,4747,20107,278973,66596,224899,8348,1731,4322,12311,1011713,453783]
doc:3,subQueryScore：1.0,valSrcScore:1.0
[4919,1377,14064,735,4747,20107,278973,66596,224899,8348,1731,4322,12311,1011713,453783]
doc:4,subQueryScore：1.0,valSrcScore:1.0
[4919,1377,14064,735,4747,20107,278973,66596,224899,8348,1731,4322,12311,1011713,453783]
doc:5,subQueryScore：1.0,valSrcScore:1.0
[4919,1377,14064,735,4747,20107,278973,66596,224899,8348,1731,4322,12311,1011713,453783]
doc:6,subQueryScore：1.0,valSrcScore:1.0
[4919,1377,14064,735,4747,20107,278973,66596,224899,8348,1731,4322,12311,1011713,453783]
doc:7,subQueryScore：1.0,valSrcScore:1.0
[4919,1377,14064,735,4747,20107,278973,66596,224899,8348,1731,4322,12311,1011713,453783]
doc:8,subQueryScore：1.0,valSrcScore:1.0
[4919,1377,14064,735,4747,20107,278973,66596,224899,8348,1731,4322,12311,1011713,453783]
doc:10,subQueryScore：1.0,valSrcScore:1.0
[4919,1377,14064,735,4747,20107,278973,66596,224899,8348,1731,4322,12311,1011713,453783]
doc:11,subQueryScore：1.0,valSrcScore:1.0
[4919,1377,14064,735,4747,20107,278973,66596,224899,8348,1731,4322,12311,1011713,453783]
doc:12,subQueryScore：1.0,valSrcScore:1.0
[4919,1377,14064,735,4747,20107,278973,66596,224899,8348,1731,4322,12311,1011713,453783]
doc:13,subQueryScore：1.0,valSrcScore:1.0
[4919,1377,14064,735,4747,20107,278973,66596,224899,8348,1731,4322,12311,1011713,453783]
doc:14,subQueryScore：1.0,valSrcScore:1.0
5:(1.5)[JOHN.txt【null】--->20107-----2014-05-17 02:57:03]
6:(1.5)[yinwen.txt【null】--->278973-----2014-01-19 09:13:14]
7:(1.5)[【项目管理】项目应用系统开发安全管理规范(等保三级).txt【null】--->66596-----2014-07-05 12:29:38]
8:(1.5)[凤凰台.txt【null】--->224899-----2014-07-0309:48:19]
13:(1.5)[湖边有棵许愿树.txt【null】--->1011713-----2014-07-0512:29:15]
14:(1.5)[顾城诗歌全集_雨枫轩Rain8.com.txt【null】--->453783-----2014-07-03 09:48:36]
1:(0.8333333)[B+树.txt【null】--->1377-----2010-05-0804:13:18]
2:(0.8333333)[hadoop.txt【null】--->14064-----2014-01-1712:03:30]
3:(0.8333333)[hydra.txt【null】--->735-----2014-05-0407:08:33]
4:(0.8333333)[ImbaMallLog.txt【null】--->4747-----2014-07-0309:54:46]
10:(0.8333333)[无标题1.txt【null】--->1731-----2014-06-2212:08:48]
11:(0.8333333)[树的基本概念.txt【null】--->4322-----2014-07-0309:49:07]
12:(0.8333333)[汪国真诗集-雨枫轩Rain8.com.txt【null】--->12311-----2014-07-03 09:49:23]

5.4 自定义QueryParser

1.限制性能低的QueryParser

2.扩展居于数字和日期的查询

import java.text.SimpleDateFormat;
import java.util.regex.Pattern;
 
import org.apache.lucene.analysis.Analyzer;
importorg.apache.lucene.queryParser.ParseException;
import org.apache.lucene.queryParser.QueryParser;
importorg.apache.lucene.search.NumericRangeQuery;
import org.apache.lucene.search.TermRangeQuery;
import org.apache.lucene.util.Version;
 
public class CustomParser extends QueryParser {
 
  publicCustomParser(Version matchVersion, String f, Analyzer a) {
    super(matchVersion, f, a);
  }
  
  @Override
  protectedorg.apache.lucene.search.Query getWildcardQuery(String field,
      String termStr) throws ParseException {
     thrownew ParseException("由于性能原因，已经禁用了通配符查询，请输入更精确的信息进行查询");
  }
  
  @Override
  protectedorg.apache.lucene.search.Query getFuzzyQuery(String field,
      String termStr, float minSimilarity) throws ParseException {
     thrownew ParseException("由于性能原因，已经禁用了模糊查询，请输入更精确的信息进行查询");
  }
  
  @Override
  protectedorg.apache.lucene.search.Query getRangeQuery(String field,
      String part1, String part2, boolean inclusive)
      throws ParseException {
     
    if(field.equals("size")) {
      return NumericRangeQuery.newIntRange(field,Integer.parseInt(part1),Integer.parseInt(part2), inclusive, inclusive);
     } elseif(field.equals("date")) {
      String dateType = "yyyy-MM-dd";
      Pattern pattern = Pattern.compile("\\d{4}-\\d{2}-\\d{2}");
      if(pattern.matcher(part1).matches()&&pattern.matcher(part2).matches()){
         SimpleDateFormat sdf = new SimpleDateFormat(dateType);
         try {
           long start = sdf.parse(part1).getTime();
           long end = sdf.parse(part2).getTime();
           return NumericRangeQuery.newLongRange(field, start, end, inclusive,inclusive);
          }catch (java.text.ParseException e) {
           e.printStackTrace();
          }
       }else {
         throw new ParseException("要检索的日期格式不正确，请使用"+dateType+"这种格式");
       }
     }
     returnsuper.newRangeQuery(field, part1, part2, inclusive);
  }
}

5.5 自定义过滤器

过程：

(1).定义一个Filter继承Filter类

(2).覆盖getDocIdSet方法

(3).设置DocIdSet

package com.mzsx.custom.filter;
 
public interface FilterAccessor {
 
      publicString[] values();
      
      publicString getField();
      
      publicboolean set();
}

package com.mzsx.custom.filter;
 
public class FilterAccessorImpl implementsFilterAccessor {
 
      @Override
      publicString[] values() {
           returnnew String[]{"3","5","7"};
      }
      @Override
      publicboolean set() {
           returntrue;
      }
      @Override
      publicString getField() {
           return"id";
      }
 
}

package com.mzsx.custom.filter;
 
 
import java.io.IOException;
 
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.Term;
import org.apache.lucene.index.TermDocs;
import org.apache.lucene.search.DocIdSet;
import org.apache.lucene.search.Filter;
import org.apache.lucene.util.OpenBitSet;
 
import com.google.gson.Gson;
 
public class MyIDFilter extends Filter {
      
      privateFilterAccessor accessor;
      
      publicMyIDFilter(FilterAccessor accessor) {
           this.accessor= accessor;
      }
 
      @Override
      publicDocIdSet getDocIdSet(IndexReader reader) throws IOException {
           //创建一个bit,默认所有的元素都是0
           OpenBitSetobs = new OpenBitSet(reader.maxDoc());
           /*System.out.println("IndexReader:"+reader.document(1));
           System.out.println("OpenBitSet:"+newGson().toJson(obs));
           System.out.println("OpenBitSet:"+newGson().toJson(obs.getBits()));*/
           if(accessor.set()){
                 set(reader,obs);
           }else {
                 clear(reader,obs);
           }
           returnobs;
      }
      
      privatevoid set(IndexReader reader,OpenBitSet obs) {
           try{
                 int[]docs = new int[1];
                 int[] freqs = new int[1];
                 //获取id所在的doc的位置，并且将其设置为0
                 for(StringdelId:accessor.values()) {
                      //获取TermDocs
                      TermDocstds = reader.termDocs(new Term(accessor.getField(),delId));
                      //会见查询出来的对象的位置存储到docs中，出现的频率存储到freqs中，返回获取的条数
                      intcount = tds.read(docs, freqs);
                      if(count==1){
                            obs.set(docs[0]);
                      }
                 }
           }catch (IOException e) {
                 e.printStackTrace();
           }
      }
      
      privatevoid clear(IndexReader reader,OpenBitSet obs) {
           try{
                 //先把元素填满
                 obs.set(0,reader.maxDoc());
                 int[]docs = new int[1];
                 int[] freqs = new int[1];
                 //获取id所在的doc的位置，并且将其设置为0
                 for(StringdelId:accessor.values()) {
                      //获取TermDocs
                      TermDocstds = reader.termDocs(new Term(accessor.getField(),delId));
                      System.out.println("----->"+tds.doc());
                      //会见查询出来的对象的位置存储到docs中，出现的频率存储到freqs中，返回获取的条数
                      intcount = tds.read(docs, freqs);
                      if(count==1){
                            //将这个位置的元素删除
                            obs.clear(docs[0]);
                      }
                 }
           }catch (IOException e) {
                 e.printStackTrace();
           }
      }
 
}

package com.mzsx.custom.filter;
 
import java.io.IOException;
import java.text.SimpleDateFormat;
import java.util.Date;
 
import org.apache.lucene.document.Document;
importorg.apache.lucene.index.CorruptIndexException;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.search.TermRangeQuery;
import org.apache.lucene.search.TopDocs;
import org.junit.Test;
 
import com.mzsx.write.DirectoryConext;
 
public class CustomFilter {
 
      @SuppressWarnings("deprecation")
      @Test
      publicvoid searchByCustomFilter() {
           try{
                 IndexSearchersearcher = new IndexSearcher(DirectoryConext.getDirectory("D:\\luceneIndex\\index"));
                 //Queryq = new TermQuery(new Term("contents","台"));
                 TermRangeQuery  range=new TermRangeQuery("id","1", "8", true, true);
                 TopDocstds = null;
                 tds= searcher.search(range, new MyIDFilter(new FilterAccessorImpl())/*newMyIDFilter(new FilterAccessor() {
                      @Override
                      publicString[] values() {
                            returnnew String[]{"3","5","7"};
                      }
                      @Override
                      publicboolean set() {
                            returnfalse;
                      }
                      @Override
                      publicString getField() {
                            return"id";
                      }
                 })*/,200);
                 SimpleDateFormatsdf = new SimpleDateFormat("yyyy-MM-dd hh:mm:ss");
                 for(ScoreDocsd:tds.scoreDocs) {
                      Documentd = searcher.doc(sd.doc);
                      System.out.println(sd.doc+":("+sd.score+")"+
                                  "["+d.get("filename")+"【"+d.get("path")+"】--->"+
                                  d.get("size")+"------------>"+d.get("id"));
                 }
                 searcher.close();
           }catch (CorruptIndexException e) {
                 e.printStackTrace();
           }catch (IOException e) {
                 e.printStackTrace();
           }
      }
}

5.6 近实时搜索

如对索引进行更改后没有commit或者close操作，是不能实现近实时索引的。此时我们需要使用到NrtManager.

package com.mzsx.nrtmanager;
 
import java.io.File;
import java.io.IOException;
 
import org.apache.commons.io.FileUtils;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.NumericField;
importorg.apache.lucene.index.CorruptIndexException;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.Term;
importorg.apache.lucene.queryParser.ParseException;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.BooleanQuery;
import org.apache.lucene.search.Filter;
import org.apache.lucene.search.FuzzyQuery;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.NRTManager;
importorg.apache.lucene.search.NRTManagerReopenThread;
import org.apache.lucene.search.NumericRangeQuery;
import org.apache.lucene.search.PhraseQuery;
import org.apache.lucene.search.PrefixQuery;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.SearcherManager;
import org.apache.lucene.search.SearcherWarmer;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.search.TermRangeQuery;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.search.WildcardQuery;
import org.apache.lucene.search.BooleanClause.Occur;
import org.apache.lucene.store.Directory;
import org.apache.lucene.util.Version;
 
import com.mzsx.index.IndexReaderContext;
import com.mzsx.write.DirectoryConext;
import com.mzsx.write.IndexWriterContext;
 
public class NRTManagerOpera {
      privateString fileName = "";
      privateDirectory directory = null;
      privateIndexWriter indexWriter = null;
      privateIndexReader indexReader = null;
      privateAnalyzer analyzer = null;
      privateNRTManager nrtManager = null;
      privateint id = 0;
      privateNRTManagerReopenThread nReopenThread = null;
      privateSearcherManager searcherManager = null;
 
      publicNRTManagerOpera(String fileName, Analyzer analyzer) {
           this.fileName= fileName;
           this.analyzer= analyzer;
           directory= DirectoryConext.getDirectory(fileName);
 
           indexWriter= IndexWriterContext.getIndexWrite(directory, analyzer);
 
           try{
                 //indexWriter= new IndexWriter(directory, new IndexWriterConfig(Version.LUCENE_35,analyzer));
                 nrtManager= new NRTManager(indexWriter, new SearcherWarmer() {
 
                      @Override
                      publicvoid warm(IndexSearcher s) throws IOException {
                            System.out.println("reopenIndexSearcher");
                      }
                 });
 
                 //启动NRTManager的Reopen线程
                 nReopenThread= new NRTManagerReopenThread(nrtManager, 5.0D, 0.025D);
                 nReopenThread.setDaemon(true);
                 nReopenThread.setName("nReopenThread");
                 //启动线程不然不会有效果的
                 nReopenThread.start();
                 searcherManager= nrtManager.getSearcherManager(true);
           }catch (IOException e) {
                 e.printStackTrace();
           }
 
      }
 
      // 创建索引
      publicvoid createdIndex(String fName) {
           try{
                 nrtManager.deleteAll();
 
                 Filefile = new File(fName);
                 if(!file.isDirectory()) {
                      try{
                            thrownew Exception("您传入的不是一个目录路径。。。");
                      }catch (Exception e) {
                            e.printStackTrace();
                      }
                 }
                 for(File f : file.listFiles()) {
 
                      Documentdoc = getDocument(f);
                      nrtManager.addDocument(doc);
 
                 }
                 //indexWriter.commit();
           }catch (CorruptIndexException e) {
                 e.printStackTrace();
           }catch (IOException e) {
                 e.printStackTrace();
           }catch (Exception e) {
                 e.printStackTrace();
           }
 
      }
 
      // 删除指定ID
      publicvoid deleteByIndexWriter(String field, String value) {
           try{
                 nrtManager.deleteDocuments(newTerm(field, value));
                 //indexWriter.commit();
                 // indexWriter.close();
           }catch (CorruptIndexException e) {
                 e.printStackTrace();
           }catch (IOException e) {
                 e.printStackTrace();
           }
      }
 
      // 更新索引
      publicvoid update(String field, String name) {
           Documentdocu = new Document();
           docu.add(newField("id", "2222", Field.Store.YES,
                      Field.Index.NOT_ANALYZED));
           docu.add(newField("contents", "修改后的文件内容",Field.Store.NO,
                      Field.Index.ANALYZED_NO_NORMS));
           docu.add(newField("filename", "这是修改后的文件名", Field.Store.YES,
                      Field.Index.NOT_ANALYZED));
           docu.add(newField("fullpath", "这是修改后的文件后的文件路径", Field.Store.YES,
                      Field.Index.NOT_ANALYZED));
 
           try{
                 nrtManager.updateDocument(newTerm(field, name), docu, analyzer);
                 //indexWriter.commit();
           }catch (CorruptIndexException e) {
                 e.printStackTrace();
           }catch (IOException e) {
                 e.printStackTrace();
           }
 
      }
 
      publicvoid commit() {
           try{
                 indexWriter.commit();
           }catch (CorruptIndexException e) {
                 e.printStackTrace();
           }catch (IOException e) {
                 e.printStackTrace();
           }
      }
 
      // 范围查询
      publicvoid searchByTermRange(String field, String lowerTerm,
                 StringupperTerm, int num) {
           IndexSearchersearcher = searcherManager.acquire();
           try{
 
                 TermRangeQueryrange = new TermRangeQuery(field, lowerTerm,
                            upperTerm,true, true);
                 TopDocstopDocs = searcher.search(range, num);
                 intlength = topDocs.totalHits;
                 System.out.println("总共查询出来总数:" + length);
                 ScoreDoc[]scoreDocs = topDocs.scoreDocs;
                 for(ScoreDoc scoreDoc : scoreDocs) {
                      Documentdoc = searcher.doc(scoreDoc.doc);
                      System.out.println(doc.get("id")+ "---->"
                                  +doc.get("filename") + "[" + doc.get("fullpath")
                                  +"]-->\n");
                 }
           }catch (CorruptIndexException e) {
                 e.printStackTrace();
           }catch (IOException e) {
                 e.printStackTrace();
           }finally {
                 try{
                      searcherManager.release(searcher);
                 }catch (IOException e) {
                      e.printStackTrace();
                 }
           }
      }
 
      // 遍历文件生产document
      protectedDocument getDocument(File f) throws Exception {
           //System.out.println(FileUtils.readFileToString(f));
           Documentdoc = new Document();
           doc.add(newField("id", ("" + (id++)), Field.Store.YES,
                      Field.Index.NOT_ANALYZED));
           doc.add(newField("contents", FileUtils.readFileToString(f),
                      Field.Store.YES,Field.Index.ANALYZED_NO_NORMS));
           doc.add(newField("filename", f.getName(), Field.Store.YES,
                      Field.Index.ANALYZED));
           doc.add(newField("fullpath", f.getCanonicalPath(), Field.Store.YES,
                      Field.Index.NOT_ANALYZED));
           doc.add(newNumericField("size", Field.Store.YES, true).setLongValue(f
                      .length()));
           doc.add(newNumericField("date", Field.Store.YES, true).setLongValue(f
                      .lastModified()));
           returndoc;
      }
 
}

你可能感兴趣的:(Lucene,高级搜索)

QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
高级 ECharts 技巧：自定义图表主题与样式 SnowMan1993 echarts 信息可视化数据分析
ECharts是一个强大的数据可视化库，提供了多种内置主题和样式，但你也可以根据项目的设计需求，自定义图表的主题与样式。本文将介绍如何使用ECharts自定义图表主题，以提升数据可视化的吸引力和一致性。1.什么是ECharts主题？ECharts的主题是指定义图表样式的配置项，包括颜色、字体、线条样式等。通过预设主题，你可以快速更改图表的整体风格，而自定义主题则允许你在此基础上进行个性化设置。2.
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
容易满足的小孩洒在心头的阳光
去年买的榨汁机没有用几次就坏了，前些时间答应娃儿给他买个，天天没事就问我，啥时候买，还自己淘宝上比较，加入购物车，这不前几天赶紧给他买了，省的每天叨叨在我耳边念叨着。今天终于到货了，因为他一直想和喝芒果汁，顺便买了芒果在家，放学回来兴奋的，赶紧要榨芒果汁，还特意搜索一下芒果汁的做法，我说他要是学习能有吃这般如此认真，我也就没有那么操心了。今晚喝到了芒果汁，他很开心，是阿，孩子就是这么容易满足，得到
母亲节如何做小红书营销美橙传媒
小红书的一举一动引起了外界的高度关注。通过爆款笔记和流行话题，我们可以看到“干货”类型的内容在小红书中偏向实用的生活经验共享和生活指南非常受欢迎。根据运营社的分析，这种现象是由小红书用户心智和内容社区背后机制共同决定的。首先，小红书将使用“强搜索”逻辑为用户提供特定的“搜索场景”。在“我必须这样生活”中，大量使用了满足小红书站用户喜好和需求的内容。内容社区自制的高质量内容也吸引了寻找营销新途径的品
2024.9.6 Python，华为笔试题总结，字符串格式化，字符串操作，广度优先搜索解决公司组织绩效互评问题，无向图 RaidenQ python 华为 leetcode 算法力扣广度优先无向图
1.字符串格式化name="Alice"age=30formatted_string="Name:{},Age:{}".format(name,age)print(formatted_string)或者name="Alice"age=30formatted_string=f"Name:{name},Age:{age}"print(formatted_string)2.网络健康检查第一行有两个整数m
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
2023-08-20 圆梦菌
魔力宝贝最详细新手教程，新手该如何完美开局，建议收藏转发2023-08-2010:34《魔力宝贝》手游体力是什么?魔力宝贝体力恢复机制是每10分钟回复1点；体力作用：挑战关卡需消耗体力体力获取方式1、好友每天可以赠送15次，也就是15点体力2、系统每天中午12点以及下午6点赠送25体3、在商城使用神石购买《魔力宝贝》手游战斗力如何提升?1、宠物强化宠物通过融合进阶后可以大幅度提升战力，最高级的宠物
《 C++ 修炼全景指南：九》打破编程瓶颈！掌握二叉搜索树的高效实现与技巧 Lenyiin C++修炼全景指南技术指南 c++算法 stl
摘要本文详细探讨了二叉搜索树（BinarySearchTree,BST）的核心概念和技术细节，包括插入、查找、删除、遍历等基本操作，并结合实际代码演示了如何实现这些功能。文章深入分析了二叉搜索树的性能优势及其时间复杂度，同时介绍了前驱、后继的查找方法等高级功能。通过自定义实现的二叉搜索树类，读者能够掌握其实际应用，此外，文章还建议进一步扩展为平衡树（如AVL树、红黑树）以优化极端情况下的性能退化。
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
Table列表复现框实现【勾选-搜索-再勾选】～四时春～ java 开发语言 elementui vue
Table列表复现框实现【勾选-搜索-再勾选】概要整体架构流程代码实现技术细节注意参考文献概要最近在开发时遇到一个问题，在进行表单渲染时，正常选中没有问题，单如果需要搜索选中时，一个是已选中的不会回填，二是在搜索的结果中进行选中，没有实现，经过排查，查找资料后实现。例如：整体架构流程具体的实现效果如下：代码实现{{scope.row.userName}}已选区{{userItem.userName
《 C++ 修炼全景指南：十》自平衡的艺术：深入了解 AVL 树的核心原理与实现 Lenyiin C++修炼全景指南技术指南 c++数据结构 stl
摘要本文深入探讨了AVL树（自平衡二叉搜索树）的概念、特点以及实现细节。我们首先介绍了AVL树的基本原理，并详细分析了其四种旋转操作，包括左旋、右旋、左右双旋和右左双旋，阐述了它们在保持树平衡中的重要作用。接着，本文从头到尾详细描述了AVL树的插入、删除和查找操作，配合完整的代码实现和详尽的注释，使读者能够全面理解这些操作的执行过程。此外，我们还提供了AVL树的遍历方法，包括中序、前序和后序遍历，
2024春节微信红包封面序列号大全一览帮忙赚赏金
2024微信红包封面序列号哪里领取红包封面领取微信搜索公众号：【艺间封面】千万红包封面等你领取2024微信红包封面免费序列号如何设置微信红包封面？1.打开微信，点击好友选择红包。2.单击红包封面。3.单击“添加红包封面”。4.输入接收序列号。来一波免费的微信红包封面序列号微信红包封面序列号红包封面领取微信搜索公众号：艺间封面千万红包封面等你领取微信红包封面序列号kGnkrbw5a7N微信红包封面序
天猫返利网哪个最好?天猫返利网站有哪些? 优惠券高省
关于哪个返利网站好用，今天汐儿给大家介绍以下十大网站，可以作为参考：1、高省网【高省APP】（邀请码：668666）全网佣金最高。手机应用商店搜索“高省”即可免费下载安装，填写高省邀请码：668666，直升2皇冠，享更高佣金及分红奖励。高省APP全网佣金最高，手机应用商店搜索“高省”即可下载，高省邀请码：668666，此码注册，直升2皇冠，佣金更高！送万元推广大礼包，教你如何1年做到百万团队。其实
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
绝招曝光！3小时高效利用ChatGPT写出精彩论文 kkai人工智能 chatgpt 人工智能 ai 学习媒体
在这份指南中，我将深入解析如何利用ChatGPT4.0的高级功能，指导整个学术研究和写作过程。从初步探索研究主题，到撰写结构严谨的学术论文，我将一步步展示如何在每个环节中有效运用ChatGPT。如果您还未使用PLUS版本，可以参考相关教程。**初步探索与主题的确定**起初，我处于庞大的知识领域中，寻找一个可深入研究的领域。ChatGPT如同灯塔，通过深入分析最新研究趋势和领域热点，帮助我在广阔的学
ChatGPT 高效学习套路揭秘：让知识获取事半功倍的秘诀 kkai人工智能 chatgpt 人工智能学习媒体 ai
最近这段时间，AI热潮因ChatGPT的火爆再次掀起。如今，网上大部分内容都在调侃AI，但很少有人探讨如何正经使用ChatGPT做事情。作为一名靠搜索引擎和GitHub自学编程的开发者，第一次和ChatGPT深度交流后，我就确信：ChatGPT能够极大提高程序员学习新技术的效率。使用ChatGPT一个月后，我越发感受到它的颠覆性。因此，我想从工作和学习的角度，分享它的优势及我的一些使用技巧，而非娱
MyBatis 详解阿贾克斯的黎明 java mybatis
目录目录一、MyBatis是什么二、为什么使用MyBatis（一）灵活性高（二）性能优化（三）易于维护三、怎么用MyBatis（一）添加依赖（二）配置MyBatis（三）创建实体类和接口（四）使用MyBatis一、MyBatis是什么MyBatis是一个优秀的持久层框架，它支持自定义SQL、存储过程以及高级映射。MyBatis免除了几乎所有的JDBC代码以及设置参数和获取结果集的工作。它可以通过简
使用由 Python 编写的 lxml 实现高性能 XML 解析 hunyxv python 笔记 python xml
转载自：文章lxml简介Python从来不出现XML库短缺的情况。从2.0版本开始，它就附带了xml.dom.minidom和相关的pulldom以及SimpleAPIforXML(SAX)模块。从2.4开始，它附带了流行的ElementTreeAPI。此外，很多第三方库可以提供更高级别的或更具有python风格的接口。尽管任何XML库都足够处理简单的DocumentObjectModel(DOM
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
Python编程 - 函数进阶易辰君 Python核心编程 python 开发语言
目录前言一、函数参数的高级用法（一）缺省参数（二）命名参数（三）不定长参数二、拆包（一）函数返回值拆包（二）通过星号拆包（三）总结三、匿名函数（一）函数定义（二）使用匿名函数四、递归函数（一）简介（二）基本结构（三）简单示例（四）优缺点总结前言上篇文章主要了解了函数基础，如何定义函数，函数种类以及局部变量和全局变量的差异等，接下来就讲解python函数较为进阶的知识点，若有任何想法欢迎一起沟通讨论
HarmonyOS开发实战（ Beta5.0）搜索框热搜词自动切换让开，我要吃人了 OpenHarmony HarmonyOS 鸿蒙开发 harmonyos 华为鸿蒙移动开发鸿蒙系统前端开发语言
鸿蒙HarmonyOS开发往期必看：HarmonyOSNEXT应用开发性能实践总结最新版！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）介绍本示例介绍使用TextInput组件与Swiper组件实现搜索框内热搜词自动切换。效果图预览使用说明页面顶部搜索框内热搜词条自动切换，编辑搜索框时自动隐藏。实现思路使用TextInput实现搜索框TextInput({te
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR

第五章 高级搜索