lxwt909

Lucene5学习之评分Scoring

评分机制是Lucene的核心部分之一。Lucene默认是按照评分机制对每个Document进行打分，然后在返回结果中按照得分进行降序排序。内部的打分机制是通过Query,Weight,Scorer,Similarity这几个协作完成的。想要根据自己的业务对默认的评分机制进行干预来影响最终的索引文档的评分，那你必须首先对Lucene的评分公式要了解：

coord(q,d):这里q即query,d即document，表示指定查询项在document中出现的频率，频率越大说明该document匹配度越大，评分就越高，默认实现是：

/** Implemented as <code>overlap / maxOverlap</code>. */
  @Override
  public float coord(int overlap, int maxOverlap) {
    return overlap / (float)maxOverlap;
  }

queryNorm(q):用来计算每个查询的权重的，从它的参数只有一个q就知道，它只是用来衡量每个查询的权重的，使每个Query之间也可以比较，注意：它的计算结果会影响最终document的得分值，但它不会影响每个文档的得分排序，因为每个document都会应用这个query权重值。默认它的实现数学公式是这样的：

queryNorm实现代码在DefaultSimilarity类中：

/** Implemented as <code>1/sqrt(sumOfSquaredWeights)</code>. */
  @Override
  public float queryNorm(float sumOfSquaredWeights) {
    return (float)(1.0 / Math.sqrt(sumOfSquaredWeights));
  }

tf(t,d):用来统计指定Term t在document d中的出现频率，出现次数越多说明匹配度越高，得分自然就越高，默认实现是

/** Implemented as <code>sqrt(freq)</code>. */
  @Override
  public float tf(float freq) {
    return (float)Math.sqrt(freq);
  }

idf(t):统计出现Term t的document的频率docFreq,docFreq越小，idf越大，则得分越高(一个Term若只在几个document中出现，说明这几个document稀有，物以稀为贵，所以你懂的)。

t.getBoot():就是给Term设置权重值，比如使用QueryParser语法表达式时可以这样：java^1.2

norm(t,d):主要分两部分：一部分是Document的权重，不过在Lucene5中Document的权重已经被取消了

一部分是Field的boot，刚才说过了，一部分是field中分词器分出来的Token个数因素，个数越多，匹配度越低，就好比你在1000000个字符中匹配到一个关键字和在10个字符中匹配到一个关键字，lucene认为后者权重更大应该排在前面。

上面各个子函数计算出来的分值再相乘求积得到最终得分。

演示域权重对评分的影响：

package com.yida.framework.lucene5.score;

import java.io.IOException;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.Field.Store;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.IndexWriterConfig.OpenMode;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.RAMDirectory;
import org.wltea.analyzer.lucene.IKAnalyzer;
/**
 * 为域设置权重从而影响索引文档的最终评分[为Document设置权重的API已经被废弃了]
 * @author Lanxiaowei
 *
 */
public class FieldBootTest {
	public static void main(String[] args) throws IOException {
		RAMDirectory directory = new RAMDirectory();
		Analyzer analyzer = new IKAnalyzer();
		IndexWriterConfig config = new IndexWriterConfig(analyzer);
		config.setOpenMode(OpenMode.CREATE_OR_APPEND);
		IndexWriter writer = new IndexWriter(directory, config);
		Document doc1 = new Document();
		Field f1 = new TextField("title", "Java, hello world!",Store.YES);
		doc1.add(f1);
		writer.addDocument(doc1);

		Document doc2 = new Document();
		Field f2 = new TextField("title", "Java ,I like it.",Store.YES);
		//第二个文档的title域权重
		f2.setBoost(100);
		doc2.add(f2);
		writer.addDocument(doc2);
		writer.close();
		
		
		IndexReader reader = DirectoryReader.open(directory);
		IndexSearcher searcher = new IndexSearcher(reader);
		Query query = new TermQuery(new Term("title","java"));
		TopDocs topDocs = searcher.search(query, Integer.MAX_VALUE);
		ScoreDoc[] docs = topDocs.scoreDocs;
		if(null == docs || docs.length == 0) {
			System.out.println("No results for this query.");
			return;
		}
		for (ScoreDoc scoreDoc : docs) {
			int docID = scoreDoc.doc;
			float score = scoreDoc.score;
			Document document = searcher.doc(docID);
			String title = document.get("title");
			System.out.println("docId:" + docID);
			System.out.println("title:" + title);
			System.out.println("score:" + score);
			System.out.println("\n");
		}
		reader.close();
		directory.close();
	}
}

测试域值长度对评分的影响：

package com.yida.framework.lucene5.score;

import java.io.IOException;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.IndexWriterConfig.OpenMode;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.RAMDirectory;
import org.wltea.analyzer.lucene.IKAnalyzer;

/**
 * 测试域值长度对评分的影响
 * @author Lanxioawei
 *
 */
public class FileValueLengthBootTest {
	public static void main(String[] args) throws IOException {
		RAMDirectory directory = new RAMDirectory();
		Analyzer analyzer = new IKAnalyzer();
		IndexWriterConfig config = new IndexWriterConfig(analyzer);
		config.setOpenMode(OpenMode.CREATE_OR_APPEND);
		IndexWriter writer = new IndexWriter(directory, config);
		Document doc1 = new Document();
		//Field f1 = new Field("title", "Java, hello world!", Field.Store.YES, Field.Index.ANALYZED_NO_NORMS);
		Field f1 = new Field("title", "Java, hello world!", Field.Store.YES, Field.Index.ANALYZED);
		doc1.add(f1);
		writer.addDocument(doc1);

		Document doc2 = new Document();
		//Field.Index.ANALYZED_NO_NORMS表示禁用Norms
		//Field f2 = new Field("title", "Hello hello hello hello hello Java Java.", Field.Store.YES, Field.Index.ANALYZED_NO_NORMS);
		Field f2 = new Field("title", "Hello hello hello hello hello Java Java.", Field.Store.YES, Field.Index.ANALYZED);
		doc2.add(f2);
		writer.addDocument(doc2);
		writer.close();
		
		//因为第二个索引文档的title域值比第一个的Term个数要多，所以第二个索引文档评分比第一个低
		//但如果禁用Norms,不考虑索引域值的长度因素，因为第二个文档匹配到了两个Term,所以评分较高
		
		IndexReader reader = DirectoryReader.open(directory);
		IndexSearcher searcher = new IndexSearcher(reader);
		Query query = new TermQuery(new Term("title","java"));
		TopDocs topDocs = searcher.search(query, Integer.MAX_VALUE);
		ScoreDoc[] docs = topDocs.scoreDocs;
		if(null == docs || docs.length == 0) {
			System.out.println("No results for this query.");
			return;
		}
		for (ScoreDoc scoreDoc : docs) {
			int docID = scoreDoc.doc;
			float score = scoreDoc.score;
			Document document = searcher.doc(docID);
			String title = document.get("title");
			System.out.println("docId:" + docID);
			System.out.println("title:" + title);
			System.out.println("score:" + score);
			System.out.println("\n");
		}
		reader.close();
		directory.close();
	}
}

设置Term权重对评分的影响：

package com.yida.framework.lucene5.score;

import java.io.IOException;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.Field.Store;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.IndexWriterConfig.OpenMode;
import org.apache.lucene.queryparser.classic.ParseException;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.RAMDirectory;
import org.wltea.analyzer.lucene.IKAnalyzer;

/**
 * Term权重对评分的影响测试
 * @author Lanxiaowei
 *
 */
public class QueryBootTest {
	public static void main(String[] args) throws IOException, ParseException {
		RAMDirectory directory = new RAMDirectory();
		Analyzer analyzer = new IKAnalyzer();
		IndexWriterConfig config = new IndexWriterConfig(analyzer);
		config.setOpenMode(OpenMode.CREATE_OR_APPEND);
		IndexWriter writer = new IndexWriter(directory, config);
		Document doc1 = new Document();
		Field f1 = new TextField("title", "Java, hello hello!",Store.YES);
		doc1.add(f1);
		writer.addDocument(doc1);

		Document doc2 = new Document();
		Field f2 = new TextField("title", "Python Python Python hello.",Store.YES);
		doc2.add(f2);
		writer.addDocument(doc2);
		writer.close();
		
		
		IndexReader reader = DirectoryReader.open(directory);
		IndexSearcher searcher = new IndexSearcher(reader);
		QueryParser parser = new QueryParser("title",analyzer);
		//Query query = parser.parse("java hello");
		
		//不设置权重之前，Python出现了3次，所以文档2的评分较高
		//增加java关键字的权重，使文档1的评分大于文档2
		Query query = parser.parse("java^100 Python");
		TopDocs topDocs = searcher.search(query, Integer.MAX_VALUE);
		ScoreDoc[] docs = topDocs.scoreDocs;
		if(null == docs || docs.length == 0) {
			System.out.println("No results for this query.");
			return;
		}
		for (ScoreDoc scoreDoc : docs) {
			int docID = scoreDoc.doc;
			float score = scoreDoc.score;
			Document document = searcher.doc(docID);
			String title = document.get("title");
			System.out.println("docId:" + docID);
			System.out.println("title:" + title);
			System.out.println("score:" + score);
			System.out.println("\n");
		}
		reader.close();
		directory.close();
	}
}

自定义Similarity来重写上述几个子函数的实现，从而更细粒度的干预评分：

package com.yida.framework.lucene5.score;

import org.apache.lucene.search.similarities.DefaultSimilarity;

public class CustomSimilarity extends DefaultSimilarity {
	@Override
	public float idf(long docFreq, long numDocs) {
		//docFreq表示某个Term在哪几个文档中出现过，numDocs表示总的文档数
		System.out.println("docFreq：" + docFreq);
		System.out.println("numDocs：" + numDocs);
		return super.idf(docFreq, numDocs);
	}
}

继承DefaultSimilarity类，重写里面的相关函数即可，来看看DefaultSimilarity的源码：

package org.apache.lucene.search.similarities;

/*
 * Licensed to the Apache Software Foundation (ASF) under one or more
 * contributor license agreements.  See the NOTICE file distributed with
 * this work for additional information regarding copyright ownership.
 * The ASF licenses this file to You under the Apache License, Version 2.0
 * (the "License"); you may not use this file except in compliance with
 * the License.  You may obtain a copy of the License at
 *
 *     http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

import org.apache.lucene.index.FieldInvertState;
import org.apache.lucene.util.BytesRef;
import org.apache.lucene.util.SmallFloat;

/**
 * Expert: Default scoring implementation which {@link #encodeNormValue(float)
 * encodes} norm values as a single byte before being stored. At search time,
 * the norm byte value is read from the index
 * {@link org.apache.lucene.store.Directory directory} and
 * {@link #decodeNormValue(long) decoded} back to a float <i>norm</i> value.
 * This encoding/decoding, while reducing index size, comes with the price of
 * precision loss - it is not guaranteed that <i>decode(encode(x)) = x</i>. For
 * instance, <i>decode(encode(0.89)) = 0.75</i>.
 * <p>
 * Compression of norm values to a single byte saves memory at search time,
 * because once a field is referenced at search time, its norms - for all
 * documents - are maintained in memory.
 * <p>
 * The rationale supporting such lossy compression of norm values is that given
 * the difficulty (and inaccuracy) of users to express their true information
 * need by a query, only big differences matter. <br>
 * &nbsp;<br>
 * Last, note that search time is too late to modify this <i>norm</i> part of
 * scoring, e.g. by using a different {@link Similarity} for search.
 */
public class DefaultSimilarity extends TFIDFSimilarity {
  
  /** Cache of decoded bytes. */
  private static final float[] NORM_TABLE = new float[256];

  static {
    for (int i = 0; i < 256; i++) {
      NORM_TABLE[i] = SmallFloat.byte315ToFloat((byte)i);
    }
  }

  /** Sole constructor: parameter-free */
  public DefaultSimilarity() {}
  
  /** Implemented as <code>overlap / maxOverlap</code>. */
  @Override
  public float coord(int overlap, int maxOverlap) {
    return overlap / (float)maxOverlap;
  }

  /** Implemented as <code>1/sqrt(sumOfSquaredWeights)</code>. */
  @Override
  public float queryNorm(float sumOfSquaredWeights) {
    return (float)(1.0 / Math.sqrt(sumOfSquaredWeights));
  }
  
  /**
   * Encodes a normalization factor for storage in an index.
   * <p>
   * The encoding uses a three-bit mantissa, a five-bit exponent, and the
   * zero-exponent point at 15, thus representing values from around 7x10^9 to
   * 2x10^-9 with about one significant decimal digit of accuracy. Zero is also
   * represented. Negative numbers are rounded up to zero. Values too large to
   * represent are rounded down to the largest representable value. Positive
   * values too small to represent are rounded up to the smallest positive
   * representable value.
   * 
   * @see org.apache.lucene.document.Field#setBoost(float)
   * @see org.apache.lucene.util.SmallFloat
   */
  @Override
  public final long encodeNormValue(float f) {
    return SmallFloat.floatToByte315(f);
  }

  /**
   * Decodes the norm value, assuming it is a single byte.
   * 
   * @see #encodeNormValue(float)
   */
  @Override
  public final float decodeNormValue(long norm) {
    return NORM_TABLE[(int) (norm & 0xFF)];  // & 0xFF maps negative bytes to positive above 127
  }

  /** Implemented as
   *  <code>state.getBoost()*lengthNorm(numTerms)</code>, where
   *  <code>numTerms</code> is {@link FieldInvertState#getLength()} if {@link
   *  #setDiscountOverlaps} is false, else it's {@link
   *  FieldInvertState#getLength()} - {@link
   *  FieldInvertState#getNumOverlap()}.
   *
   *  @lucene.experimental */
  @Override
  public float lengthNorm(FieldInvertState state) {
    final int numTerms;
    if (discountOverlaps)
      numTerms = state.getLength() - state.getNumOverlap();
    else
      numTerms = state.getLength();
    return state.getBoost() * ((float) (1.0 / Math.sqrt(numTerms)));
  }

  /** Implemented as <code>sqrt(freq)</code>. */
  @Override
  public float tf(float freq) {
    return (float)Math.sqrt(freq);
  }
    
  /** Implemented as <code>1 / (distance + 1)</code>. */
  @Override
  public float sloppyFreq(int distance) {
    return 1.0f / (distance + 1);
  }
  
  /** The default implementation returns <code>1</code> */
  @Override
  public float scorePayload(int doc, int start, int end, BytesRef payload) {
    return 1;
  }

  /** Implemented as <code>log(numDocs/(docFreq+1)) + 1</code>. */
  @Override
  public float idf(long docFreq, long numDocs) {
    return (float)(Math.log(numDocs/(double)(docFreq+1)) + 1.0);
  }
    
  /** 
   * True if overlap tokens (tokens with a position of increment of zero) are
   * discounted from the document's length.
   */
  protected boolean discountOverlaps = true;

  /** Determines whether overlap tokens (Tokens with
   *  0 position increment) are ignored when computing
   *  norm.  By default this is true, meaning overlap
   *  tokens do not count when computing norms.
   *
   *  @lucene.experimental
   *
   *  @see #computeNorm
   */
  public void setDiscountOverlaps(boolean v) {
    discountOverlaps = v;
  }

  /**
   * Returns true if overlap tokens are discounted from the document's length. 
   * @see #setDiscountOverlaps 
   */
  public boolean getDiscountOverlaps() {
    return discountOverlaps;
  }

  @Override
  public String toString() {
    return "DefaultSimilarity";
  }
}

看到里面的idf,tf,coord等函数，你们应该已经知道他们的作用了，你只要重写他们实现自己的统计算法即可。

细心的你，应该会发现里面还有个scorePayload，计算payload分值。那什么是payload呢？Payload

其实在Lucene2.x时代就有了，它跟位置索引，位置增量作用类似，就是为Document提供一些额外的信息，实现一些特殊的功能，比如位置索引用来实现PhraseQuery短语查询以及关键字高亮功能。Payload可以用来实现更加灵活的索引技术，为了更加形象点，有助于你们理解payload,请认真仔细观摩看懂这张图：

比如你有这样两个文档：

what is your trouble?

What the fucking up?

第二个what加粗了，你想加大它的权重，你可以这样实现：
What> the fucking up?

然后分词的时候把What>当作一个Term,然后判断如果有标记就记录下是否有加粗信息存入payload。但注意要想把XXXXXX>当一个整体，需要自定义分词器，因为<>这些符号会被剔除掉。不一定是在Term两头加来附带额外信息，你也可以term{1.2}如java{1.2}表示把这个Term权重乘以1.2，我只是举个例子，关键是你要把term{1.2}能通过分词器当作一个整体给分出来，默认{}会被剔除，分词才是重点。

下面是一个简单的Payload示例，直接上代码了：

package com.yida.framework.lucene5.score.payload;

import java.io.IOException;

import org.apache.lucene.analysis.TokenFilter;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
import org.apache.lucene.analysis.tokenattributes.PayloadAttribute;
import org.apache.lucene.util.BytesRef;

import com.yida.framework.lucene5.util.Tools;

public class BoldFilter extends TokenFilter {
	public static int IS_NOT_BOLD = 0;
	public static int IS_BOLD = 1;
	private CharTermAttribute termAtt;
	private PayloadAttribute payloadAtt;

	protected BoldFilter(TokenStream input) {
		super(input);
		termAtt = addAttribute(CharTermAttribute.class);
		payloadAtt = addAttribute(PayloadAttribute.class);
	}

	@Override
	public boolean incrementToken() throws IOException {
		if (input.incrementToken()) {
			final char[] buffer = termAtt.buffer();
			final int length = termAtt.length();
			String tokenstring = new String(buffer, 0, length).toLowerCase();
			//System.out.println("token:" + tokenstring);
			if (tokenstring.startsWith("<b>") && tokenstring.endsWith("</b>")) {
				tokenstring = tokenstring.replace("<b>", "");
				tokenstring = tokenstring.replace("</b>", "");
				termAtt.copyBuffer(tokenstring.toCharArray(), 0, tokenstring.length());
				//在分词阶段，设置payload信息
				payloadAtt.setPayload(new BytesRef(Tools.int2bytes(IS_BOLD)));
			} else {
				payloadAtt.setPayload(new BytesRef(Tools.int2bytes(IS_NOT_BOLD)));
			}
			return true;
		} else
			return false;
	}
}

package com.yida.framework.lucene5.score.payload;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.Tokenizer;
import org.apache.lucene.analysis.core.LowerCaseFilter;
import org.apache.lucene.analysis.core.StopAnalyzer;
import org.apache.lucene.analysis.core.StopFilter;
import org.apache.lucene.analysis.core.WhitespaceTokenizer;

public class BoldAnalyzer extends Analyzer {
	@Override
	protected TokenStreamComponents createComponents(String fieldName) {
		Tokenizer tokenizer = new WhitespaceTokenizer();
		TokenStream tokenStream = new BoldFilter(tokenizer);
		tokenStream = new LowerCaseFilter(tokenStream);
		tokenStream = new StopFilter(tokenStream,StopAnalyzer.ENGLISH_STOP_WORDS_SET);
		return new TokenStreamComponents(tokenizer, tokenStream);
	}
}

package com.yida.framework.lucene5.score.payload;

import org.apache.lucene.search.similarities.DefaultSimilarity;
import org.apache.lucene.util.BytesRef;

import com.yida.framework.lucene5.util.Tools;

public class PayloadSimilarity extends DefaultSimilarity {
	@Override
	public float scorePayload(int doc, int start, int end, BytesRef payload) {
		int isbold = Tools.bytes2int(payload.bytes);
		if (isbold == BoldFilter.IS_BOLD) {
			return 100f;
		}
		return 1f;
	}
}

package com.yida.framework.lucene5.score.payload;

import java.io.IOException;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.Field.Store;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.IndexWriterConfig.OpenMode;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.search.payloads.MaxPayloadFunction;
import org.apache.lucene.search.payloads.PayloadNearQuery;
import org.apache.lucene.search.spans.SpanQuery;
import org.apache.lucene.search.spans.SpanTermQuery;
import org.apache.lucene.store.RAMDirectory;
/**
 * Payload测试
 * @author Lanxiaowei
 *
 */
public class PayloadTest {
	public static void main(String[] args) throws IOException {
		RAMDirectory directory = new RAMDirectory();
		//Analyzer analyzer = new IKAnalyzer();
		Analyzer analyzer = new BoldAnalyzer();
		IndexWriterConfig config = new IndexWriterConfig(analyzer);
		config.setOpenMode(OpenMode.CREATE_OR_APPEND);
		IndexWriter writer = new IndexWriter(directory, config);
		Document doc1 = new Document();
		Field f1 = new TextField("title", "Java <B>hello</B> world",Store.YES);
		doc1.add(f1);
		writer.addDocument(doc1);

		Document doc2 = new Document();
		Field f2 = new TextField("title", "Java ,I like it.",Store.YES);
		doc2.add(f2);
		writer.addDocument(doc2);
		writer.close();
		
		
		IndexReader reader = DirectoryReader.open(directory);
		IndexSearcher searcher = new IndexSearcher(reader);
		searcher.setSimilarity(new PayloadSimilarity());
		SpanQuery queryStart = new SpanTermQuery(new Term("title","java"));
        SpanQuery queryEnd = new SpanTermQuery(new Term("title","hello"));
		Query query = new PayloadNearQuery(new SpanQuery[] {
				queryStart,queryEnd},2,true,new MaxPayloadFunction());
		TopDocs topDocs = searcher.search(query, Integer.MAX_VALUE);
		ScoreDoc[] docs = topDocs.scoreDocs;
		if(null == docs || docs.length == 0) {
			System.out.println("No results for this query.");
			return;
		}
		for (ScoreDoc scoreDoc : docs) {
			int docID = scoreDoc.doc;
			float score = scoreDoc.score;
			Document document = searcher.doc(docID);
			String title = document.get("title");
			System.out.println("docId:" + docID);
			System.out.println("title:" + title);
			System.out.println("score:" + score);
			System.out.println("\n");
		}
		reader.close();
		directory.close();
	}
}

上述所有示例代码我都会上传到底下的附件里。好了，有关Lucene的评分机制就说这么多了，关键还是要看懂Lucene的那个评分公式，当然，如果你想要完全推倒Lucene的默认评分计算公式，实现一套自己的评分公式，那你恐怕要实现一套自己的Query,Weight,Scorer,Similarity.

如果你还有什么问题请加我Ｑ-Q：7-3-6-0-3-1-3-0-5，

或者加裙
一起交流学习！

你可能感兴趣的:(Lucene,score,Payload)

倾向得分匹配的stata命令_R语言系列1：倾向得分匹配 weixin_39995108 倾向得分匹配的stata命令
1PSM简介倾向评分匹配(PropensityScoreMatching，简称PSM)是一种统计学方法，用于处理观察研究(ObservationalStudy)的数据。在观察研究中，由于种种原因，数据偏差(bias)和混杂变量(confoundingvariable)较多，倾向评分匹配的方法正是为了减少这些偏差和混杂变量的影响，以便对实验组和对照组进行更合理的比较。这种方法最早由PaulRosen
R语言倾向性匹配得分（PSM）分析后端工程实践 r语言 java 开发语言 R语言
R语言倾向性匹配得分（PSM）分析倾向性匹配得分（PropensityScoreMatching,PSM）是一种常用的统计方法，用于处理观察研究中的选择性偏倚。它通过建立一个倾向性得分模型，将受试者分为处理组和对照组，以实现类似于随机对照试验的效果。本文将介绍如何使用R语言进行倾向性匹配得分分析，并提供相应的源代码。导入所需的R包在进行PSM分析之前，首先需要导入所需的R包。常用的包包括Match
Redis ZSet 数据结构深度解析：原理、实现与实战全揭密！程序猿Mr.wu Redis redis 数据结构缓存
一、前言：为什么要学习ZSet？在Redis的五大基础数据类型中，ZSet（SortedSet，有序集合）是一种非常强大而灵活的数据结构，广泛应用于排行榜、延时队列、权重排名等场景。如果说String是Redis的“最小原子”，那么ZSet就是Redis的“重量级选手”——不仅能存数据，还能排序查询，这正是它的魅力所在！二、ZSet是什么？和Set有啥区别？ZSet=Set+Score+排序！特性
Python打卡：Day24 剑桥折刀s python打卡 python
importpandasaspdimportnumpyasnpimportreimportxgboostasxgbfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportclassification_report,confusion_matrix,accuracy_score,precision_score
【云原生】Docker 部署 Elasticsearch 9 操作详解逆风飞翔的小叔运维 Docker 部署es9 Docker部署es Docker搭建es9 Elasticsearch9 Docker搭建es
目录一、前言二、Elasticsearch9新特性介绍2.1基于Lucene10重大升级2.2BetterBinaryQuantization（BBQ）2.3ElasticDistributionsofOpenTelemetry（EDOT）2.4LLM可观测性2.5攻击发现与自动导入2.6ES|QL增强2.7语义检索三、基于Docker部署Elasticsearch93.1Elasticsearc
我也不知道 Ttcoffee_2048 经验分享笔记灌灌灌灌
'答题程序-VBScript实现OptionExplicit'定义问题和答案Dimquestions(4),answers(4),userAnswers(4)Dimscore,totalQuestions,i,userName'初始化问题和正确答案questions(0)="1.中国的首都是哪里？"answers(0)="北京"questions(1)="2.一年有多少个月？"answers(1)
【FAQ】HarmonyOS SDK 闭源开放能力 —Account Kit (6)
1.问题描述：在单框架HarmonyOS拿到的openid与双框架HMSCore拿到的openid是相同的吗？解决方案：相同的吗？不相同。首先用户openid的生成规则是：由用户账号和应用ID加密生成的；在这个基础上单框架和双框架的应用ID是一定不相同的，所以单双的openid也不会相同。推荐使用unionid，其生成规则是：由用户账号和应用开发者账号签名而成，如果开发者账号下管理了多个应用，并且
深度解析Lucene IndexWriter 性能优化微笑听雨。 java 进阶教程 lucene indexWriter 全文检索性能调优内存缓冲
深度解析LuceneIndexWriter性能优化目标：在大规模写入、频繁更新的场景下，既保持吞吐量，又兼顾搜索实时性与系统稳定性。关键调优点内存缓冲：将RAMBufferSizeMB提升至128–1024MB，减少flush次数；必要时配合maxBufferedDocs。合并策略：使用TieredMergePolicy，典型参数为maxMergeAtOnce4–8、segmentsPerTier
VINS_MONO视觉导航算法【三】ROS基础知识介绍凳子花❀ SLAM 立体视觉 SLAM VINS_Mono
文章目录其他文章说明ROSlaunch文件基本概念定义用途文件结构根标签常用标签\\\\\\\示例基本示例嵌套示例使用方法启动*.launch文件传递参数总结ROStopicTopic的基本概念Topic的工作原理常用命令示例总结ROS常用命令rosrunroslaunchrosbag主要功能roscorerosnoderostopicrosservicerosparamrqtros::spin(
C++ vector 最全入门指南：新手轻松掌握
作为C++开发者，std::vector是你必须掌握的神器！它就像会自动变大的魔法数组，无论存储游戏角色数据、处理传感器信息还是管理用户输入，都是最佳选择。本文用最易懂的方式，带你20分钟玩转vector！一、快速入门：创建你的第一个vector1.1基础创建方式#include//方式1：创建空vector（最常用）std::vectorscores;//方式2：创建含初始值的vector（类似
[QMT量化交易小白入门]-六十六、加入评分阈值后，历史回测收益率达到74% python自动化工具量化交易小白入门数据库 redis 缓存
本专栏主要是介绍QMT的基础用法，常见函数，写策略的方法，也会分享一些量化交易的思路，大概会写100篇左右。QMT的相关资料较少，在使用过程中不断的摸索，遇到了一些问题，记录下来和大家一起沟通，共同进步。文章目录相关阅读系统的核心逻辑详细解析评分函数`calculate_etf_scores`技术指标计算函数定义2.5综合评分计算2.6负值过滤与评分数据记录评分数据转换为DataFrame数据归一
Spring Boot 集成 Elasticsearch（含 ElasticsearchRestTemplate 示例）超级小忍 SpringBoot spring boot elasticsearch
Elasticsearch是一个基于Lucene的分布式搜索服务器，具有高效的全文检索能力。在现代应用中，尤其是需要强大搜索功能的系统中，Elasticsearch被广泛使用。SpringBoot提供了对Elasticsearch的集成支持，使得开发者可以轻松地将Elasticsearch集成到SpringBoot应用中，实现高效的搜索、分析等功能。本文将详细介绍如何在SpringBoot中集成E
2025.06.16【Ribo-seq】|sORF翻译能力预测：ORFscore计算与解读穆易青 RNA-seq 读书笔记数据处理读书笔记信息可视化
文章目录1.前言2.ORFscore原理Ribo-seq数据分析：ORFscore计算与解读1.前言2.ORFscore原理2.1计算公式Ribo-seq数据分析：ORFscore计算与解读1.前言2.ORFscore原理2.1计算公式2.2计算原理2.3阈值设定3.分析流程3.1数据准备所需文件3.2提取ORF信息3.3计算ORFscore4.结果解读4.1ORFscore分布4.2功能注释分析
LSY_C结构体学习夏日威龙潼 LSY_CProgram c语言学习服务器
下列关于结构体变量操作中正确的是_____。structstudent{charnum[10];charname[20],sex;intage;floatscore[3];floatave;};A、stu2={"2008002","GaoPing",'M',18,86.3,80.5,89.4,85.4};B、structstudentstu1={"2008001","LiNing",'M',19,
使用 RedisVL 进行复杂查询 Hello.Reader 缓存技术数据库运维 java 算法人工智能 redis
一、前置条件在开始之前，请确保：已安装redisvl并激活相应的Python环境。运行Redis实例，且RediSearch版本>2.4。二、初始化与数据加载我们将使用一个包含用户信息的数据集，字段包括user、age、job、credit_score、office_location、user_embedding和last_updated。以下是初始化索引和加载数据的代码：importpickle
Java集合框架初识我爱Jack java python 算法
一、集合框架概述：为什么需要集合？想象你正在管理一个班级的学生信息：学生名单（有序列表）学生成绩（键值对）不重复的学号（唯一集合）待批改的作业（队列）如果用基本数据类型表示：//混乱的管理方式String[]names=newString[50];//学生姓名int[]scores=newint[50];//学生成绩//添加学生删除学生查找学生集合框架就是为解决这类问题而生的工具箱，它提供：动态大
9.结构体+冒泡排序 Ivan_fay C 结构体 C c语言冒泡排序
【结构体】1.为什么需要结构体为了表示一些复杂的事物，而普通的基本类型无法满足实际要求2.什么叫结构体把一些基本数据类型组合在一起形成的一个新的复合数据类型叫做结构体3.如何定义结构体：有三种方式：第一种方式：//这只是定义了一个新的数据类型，并没有定义变量structStudent{intage;floatscore;charsex;};//最好也最常用的是第一种方式第二种方式：structSt
结构体的嵌套问题我不是呆头 C++c++c语言
问题描述：学校正在做毕设，每名老师带领5个学生，共3名老师，设计老师和学生的结构体，在老师的结构体中包含老师的姓名和存放5个学生的数组作为成员，学生的成员有姓名和考试分数，创建数组存放三名老师，通过函数给每个老师及所带的学生赋值。最终打印老师数据以及老师所带学生数据。定义学生结构体structStudent//学生结构体的定义{stringsname;//学生名字intscore;//学生分数};
linux系统的ros从18.04升级到20.04（大学经验分享） tp-try linux 运维服务器 ubuntu 经验分享笔记
我是已经试过，更新完了才发的，所以师弟师妹们大胆冲吧！！！！！建议特别熟悉18.04了再更新，不然很可能出错！！！！首先建议把自己的代码和必要的东西备份一下，可以直接考到win11里面去目录更新18.04到20.04更新melodic到Noetic更新失败换源重新更新Noetic检查完整版的是否更新成功第八步：输入roscore运行一下，如果你看到了那个似曾相识的背影，那就恭喜你成功啦！！！！注意
Redis八股文莱茵不哈哈 redis 数据库缓存
一.基于redis实现限流功能，有哪几种方式？1.限流一段时间内，某行为允许操作的最大次数2.限流类型截断限流，固定时间窗口限流，固定窗口内的行为统计，实现方式:setlimits0nxex10incrlimits滑动时间窗口限流，滑动窗口行为统计，解决窗口间统计异常，容量固定的，速率也是固定的实现方式:zaddlimitsnownowzremrangebyscorelimits0periodzc
华为开发者平台测试相关功能汇总 harmonyos
一、沙盒测试（SandboxTesting）文档链接：文档中心核心目的：通过配置测试账号模拟华为应用内支付、付费下载、游戏等服务的真实环境，实现免费测试。1.前提条件应用需集成HMSCoreSDK3.0及以上版本。不同服务的沙盒测试说明：应用内支付：参见应用内支付沙盒测试。付费下载：参见测试付费下载应用。游戏服务：参见游戏功能测试。2.操作步骤登录与进入页面：登录AppGalleryConnect
Web防火墙深度实战：从漏洞修补到CC攻击防御群联云防护小杜安全问题汇总前端人工智能重构 ddos 安全服务器
惊魂一刻：百万数据泄露事件某银行系统被利用SQL注入漏洞：#攻击Payload示例'UNIONSELECTuser,passwordFROMusers--基础加固：Nginx安全配置#/etc/nginx/nginx.confhttp{#关闭服务器版本信息server_tokensoff;#防止点击劫持add_headerX-Frame-Options"SAMEORIGIN";#XSS防护add_
C语言之结构体中“ . ”和“ -> ”的区别
相同点：两个操作符都是二元操作符，且其有操作符是结构体成员的名称。不同点：“.”操作符左边的操作数是一个“结构体”的表达式，而“->”操作符左边的操作数是一个指向结构体的指针。例：typedefstruct{intnum;floatscore;charname[10];}STUDENT;STUDENTtemp;STUDENT*p=&temp;在这里temp.score代表的是结构体temp里的成员
关于metrics.classification_report报告中指标解读 junjunzai123 人工智能
函数的应用主要是对类目分类相关的业务做评测使用主要介绍一下:macroavg和weightedavg区别指标解释1.macroavg（宏平均）定义：对每个类别的指标（如精确率、召回率、F1-score）取算术平均值，不考虑类别样本数量。计算公式：macro_avg=(指标_类别1+指标_类别2+...+指标_类别N)/N特点：平等对待每个类别：无论类别样本数量多少，每个类别的权重相同。适用场景：当
学生成绩管理系统晨曦543210 python 开发语言
目录一、代码结构优点二、代码块分析1.类定义和初始化2.添加学生功能(add_student)3.删除学生功能(remove_student)4.修改成绩功能(modify_scores)5.计算平均分功能(calculate_average)6.查询单个学生信息(show_student)7.显示所有学生信息(show_all)8.课程统计功能(course_statistics)9.主运行循环
Spring Boot 和 Spring Security 实现 JWT 认证 weixin_43833540 spring spring boot 网络
一、JWT（JSONWebToken）1.JWT基本概念JWT是一种开放标准（RFC7519），用于在网络应用间安全传递JSON格式的声明信息。其核心特点包括：紧凑性：通过Base64URL编码生成字符串，可通过URL、HTTPHeader或POST参数传输。自包含：负载（Payload）直接携带用户信息（如ID、角色），减少服务端查询数据库的开销。数字签名：使用密钥（HMAC）或公钥/私钥（RS
机器学习中常用的数据预处理方法 C7211BA 机器学习人工智能
1.数据清洗方法：处理异常值、重复数据、噪声数据。异常值处理：通过统计方法（如Z-Score、IQR）或可视化检测，选择删除、替换（均值/中位数）或保留。重复数据：直接删除重复样本。优点：提升数据质量，减少模型偏差。缺点：可能误删有用信息或引入人为偏差。场景：金融风控（异常交易检测）、传感器数据清洗。2.特征缩放归一化（Min-MaxScaling）将数据缩放到[0,1]区间。优点：加速梯度下降，
从源码角度了解Elasticsaerch(分布式协调排序、深分页问题)
引文Elasticsearch基于Lucene所以很多系统实现都在其中,所以可以先看看Lucene的实现:https://blog.csdn.net/qq_35040959/article/details/147931034项目组件不像Kafka这种顶级项目核心性能组件全自己实现,ELK中有很多引用至第三方开放库;网络模型-Netty网络模型多重要不必多说,Elasticsearch基于Netty
华为OD-2024年E卷-跳格子三[200分] -- python m0_64074356 华为od python 开发语言
问题描述：小明和朋友们一起玩跳格子游戏，每个格子上有特定的分数，score[]=[1-1-67-177]，从起点score[0]开始，每次最大跳的步长为k，请你返回小明跳到终点score[n-1]时，能得到的最大得分。注:·格子的总长度和步长的区间在[1，100000];·每个格子的分数在[-10000,10000]区间中;输入描述：6//第一行输入总的格子数量1-1-67-177//第二行输入每
C++ 数组
一、数组的本质：连续存储的同类型数据集合在C++中，数组是一种内置的数据结构，用于存储固定大小的同类型元素，这些元素在内存中连续排列。这种存储特性使得数组具有以下关键特点：随机访问高效：通过下标（索引）可直接定位元素，时间复杂度为O(1)。内存占用固定：声明时需指定大小，一经创建长度不可改变。1.1数组的声明与初始化语法格式数据类型数组名[元素个数];示例：intscores[5];//声明一个包
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>