xiangxingchina

lucene入门

最近一直再研究lucene，把入门的程序和大家分享：

对索引的操作类：

Java代码

public class IndexDao {
public IndexDao() {
try {
indexWriter = new IndexWriter(Constants.INDEX_STORE_PATH,
Constants.analyzer, MaxFieldLength.LIMITED);
} catch (Exception e) {
e.printStackTrace();
}
}
public IndexDao(Directory dir) {
try {
indexWriter = new IndexWriter(dir,Constants.analyzer,MaxFieldLength.LIMITED);
} catch (Exception e) {
e.printStackTrace();
}
}
public IndexDao( boolean isCreate) {
try {
indexWriter = new IndexWriter(Constants.INDEX_STORE_PATH,Constants.analyzer, isCreate,MaxFieldLength.LIMITED);
} catch (Exception e) {
e.printStackTrace();
}
}
// 索引器
private IndexWriter indexWriter = null ;
/**
* 添加/创建索引
*
* @param folder
* @throws IOException
* @throws CorruptIndexException
*/
public void saveIndex(File folder, String[] unIndeies)
throws CorruptIndexException, IOException {
if (folder.isDirectory()) {
String[] files = folder.list();
for ( int i = 0 ; i < files.length; i++) {
File f = new File(folder, files[i]);
if (!f.isHidden()) {
if (f.isDirectory()) {
saveIndex(f, unIndeies);// ② 递归
}
String fileTyep = ReadFile.validateFile(f);
for ( int j = 0 ; j < unIndeies.length; j++) {
if (fileTyep.equalsIgnoreCase(unIndeies[j])) {
System.out.println("正在建立索引 : " + f.getName() + "" );
Document doc = ReadFile.indexFile(f);
indexWriter.addDocument(doc);
}
}
}
}
}
}
/**
* Term是搜索的最小单位，代表某个 Field 中的一个关键词，如：<title, lucene> new Term( "title",
* "lucene" ); new Term( "id", "5" ); new Term( "id", UUID );
*
* @param term
*/
public void deleteIndex(Term term) {
try {
indexWriter.deleteDocuments(term);
} catch (Exception e) {
throw new RuntimeException(e);
} finally {
try {
indexWriter.close();
} catch (Exception e) {
e.printStackTrace();
}
}
}
/**
* 更新索引 indexWriter.deleteDocuments(term); indexWriter.addDocument(doc);
*
* @param term
* @param doc
*/
public void updateIndex(Term term, Document doc) {
try {
indexWriter.updateDocument(term, doc);
} catch (Exception e) {
throw new RuntimeException(e);
} finally {
try {
indexWriter.close();
} catch (Exception e) {
e.printStackTrace();
}
}
}
/**
* 查询 totalPage = recordCount / pageSize; if (recordCount % pageSize > 0)
* totalPage++;
*
* @param queryString
* @param firstResult
* @param maxResults
* @return
*/
public QueryResult search(String queryString, int firstResult,
int maxResults) {
try {
// 1，把要搜索的文本解析为 Query
String[] fields = { "name" , "content" };
Map<String, Float> boosts = new HashMap<String, Float>();
boosts.put("name" , 2f);
boosts.put("content" , 3f); //默认为1.0f
QueryParser queryParser = new MultiFieldQueryParser(fields,
Constants.analyzer, boosts);
Query query = queryParser.parse(queryString);
// Query query = IKQueryParser.parse("content", queryString);
Date start = new Date();
QueryResult result = search(query, firstResult, maxResults);
Date end = new Date();
System.out.println("检索完成，用时" + (end.getTime() - start.getTime())
+ "毫秒" );
return result;
} catch (Exception e) {
throw new RuntimeException(e);
}
}
public QueryResult search(Query query, int firstResult, int maxResults) {
IndexSearcher indexSearcher = null ;
try {
// 2，进行查询
indexSearcher = new IndexSearcher(Constants.INDEX_STORE_PATH);
Filter filter = new RangeFilter( "size" ,
NumberTools.longToString(0 ), NumberTools
.longToString(1000000 ), true , true );
// 排序
Sort sort = new Sort();
sort.setSort(new SortField( "size" )); // 默认为升序
// sort.setSort(new SortField("size", true));
TopDocs topDocs = indexSearcher.search(query, filter, 10000 , sort);
int recordCount = topDocs.totalHits;
List<Document> recordList = new ArrayList<Document>();
// 准备高亮器
Formatter formatter = new SimpleHTMLFormatter( "<font color='red'>" ,
"</font>" );
Scorer scorer = new QueryScorer(query);
Highlighter highlighter = new Highlighter(formatter, scorer);
Fragmenter fragmenter = new SimpleFragmenter( 50 );
highlighter.setTextFragmenter(fragmenter);
// 3，取出当前页的数据
int end = Math.min(firstResult + maxResults, topDocs.totalHits);
for ( int i = firstResult; i < end; i++) {
ScoreDoc scoreDoc = topDocs.scoreDocs[i];
int docSn = scoreDoc.doc; // 文档内部编号
Document doc = indexSearcher.doc(docSn); // 根据编号取出相应的文档
// 高亮返回高亮后的结果，如果当前属性值中没有出现关键字，会返回 null
String hc = highlighter.getBestFragment(Constants.analyzer,
"content" , doc.get( "content" ));
if (hc == null ) {
String content = doc.get("content" );
int endIndex = Math.min( 50 , content.length());
hc = content.substring(0 , endIndex); // 最多前50个字符
}
doc.getField("content" ).setValue(hc);
recordList.add(doc);
}
// 返回结果
return new QueryResult(recordCount, recordList);
} catch (Exception e) {
throw new RuntimeException(e);
} finally {
try {
indexSearcher.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
public void close() {
// 对索引进行优化
try {
indexWriter.optimize();
indexWriter.close();
} catch (CorruptIndexException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
public void readIndex(String key, String value) {
IndexReader reader;
try {
// Directory fsDir = FSDirectory.getDirectory(
// Constants.INDEX_STORE_PATH, false);
// if (IndexReader.isLocked(fsDir)) {
// System.out.println("------unlock-----");
// IndexReader.unlock(fsDir);
// }
reader = IndexReader.open(Constants.INDEX_STORE_PATH);
for ( int i = 0 ; i < reader.numDocs(); i++)
// System.out.println(reader.document(i));
System.out.println("版本：" + reader.getVersion());
System.out.println("索引内的文档数量：" + reader.numDocs());
Term term = new Term(key, value);
TermDocs docs = reader.termDocs(term);
IndexSearcher indexSearcher = null ;
indexSearcher = new IndexSearcher(Constants.INDEX_STORE_PATH);
while (docs.next()) {
int docSn = docs.doc(); // 文档内部编号
Document doc = indexSearcher.doc(docSn); // 根据编号取出相应的文档
System.out.println("文档路径 " + doc.get( "path" ));
System.out.println("含有所查找的 " + term + "的Document的编号为: " + docs.doc());
System.out.println("Term在文档中的出现 " + docs.freq()+ " 次" );
}
} catch (CorruptIndexException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}

public class IndexDao {

	public IndexDao() {
		try {
			indexWriter = new IndexWriter(Constants.INDEX_STORE_PATH,
					Constants.analyzer, MaxFieldLength.LIMITED);
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
	public IndexDao(Directory dir) {
		try {
			indexWriter = new IndexWriter(dir,Constants.analyzer,MaxFieldLength.LIMITED);
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
	public IndexDao(boolean isCreate) {
		try {
			indexWriter = new IndexWriter(Constants.INDEX_STORE_PATH,Constants.analyzer, isCreate,MaxFieldLength.LIMITED);
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

	// 索引器
	private IndexWriter indexWriter = null;

	/**
	 * 添加/创建索引
	 * 
	 * @param folder
	 * @throws IOException
	 * @throws CorruptIndexException
	 */
	public void saveIndex(File folder, String[] unIndeies)
			throws CorruptIndexException, IOException {
		if (folder.isDirectory()) {
			String[] files = folder.list();
			for (int i = 0; i < files.length; i++) {
				File f = new File(folder, files[i]);
				if (!f.isHidden()) {
					if (f.isDirectory()) {
						saveIndex(f, unIndeies);// ② 递归
					}
					String fileTyep = ReadFile.validateFile(f);
					for (int j = 0; j < unIndeies.length; j++) {
						if (fileTyep.equalsIgnoreCase(unIndeies[j])) {
							System.out.println("正在建立索引 : " + f.getName() + "");
							Document doc = ReadFile.indexFile(f);
							indexWriter.addDocument(doc);
						}
					}
				}
			}
		}
	}

	/**
	 * Term是搜索的最小单位，代表某个 Field 中的一个关键词，如：<title, lucene> new Term( "title",
	 * "lucene" ); new Term( "id", "5" ); new Term( "id", UUID );
	 * 
	 * @param term
	 */
	public void deleteIndex(Term term) {
		try {
			indexWriter.deleteDocuments(term);
		} catch (Exception e) {
			throw new RuntimeException(e);
		} finally {
			try {
				indexWriter.close();
			} catch (Exception e) {
				e.printStackTrace();
			}
		}
	}

	/**
	 * 更新索引 indexWriter.deleteDocuments(term); indexWriter.addDocument(doc);
	 * 
	 * @param term
	 * @param doc
	 */
	public void updateIndex(Term term, Document doc) {
		try {
			indexWriter.updateDocument(term, doc);
		} catch (Exception e) {
			throw new RuntimeException(e);
		} finally {
			try {
				indexWriter.close();
			} catch (Exception e) {
				e.printStackTrace();
			}
		}
	}

	/**
	 * 查询 totalPage = recordCount / pageSize; if (recordCount % pageSize &gt; 0)
	 * totalPage++;
	 * 
	 * @param queryString
	 * @param firstResult
	 * @param maxResults
	 * @return
	 */
	public QueryResult search(String queryString, int firstResult,
			int maxResults) {
		try {
			// 1，把要搜索的文本解析为 Query
			String[] fields = { "name", "content" };
			Map<String, Float> boosts = new HashMap<String, Float>();
			boosts.put("name", 2f);
			boosts.put("content", 3f); //默认为1.0f
			QueryParser queryParser = new MultiFieldQueryParser(fields,
					Constants.analyzer, boosts);
			Query query = queryParser.parse(queryString);
//			Query query = IKQueryParser.parse("content", queryString);
			Date start = new Date();
			QueryResult result = search(query, firstResult, maxResults);
			Date end = new Date();
			System.out.println("检索完成，用时" + (end.getTime() - start.getTime())
					+ "毫秒");
			return result;
		} catch (Exception e) {
			throw new RuntimeException(e);
		}
	}

	public QueryResult search(Query query, int firstResult, int maxResults) {
		IndexSearcher indexSearcher = null;
		try {
			// 2，进行查询
			indexSearcher = new IndexSearcher(Constants.INDEX_STORE_PATH);
			Filter filter = new RangeFilter("size",
					NumberTools.longToString(0), NumberTools
							.longToString(1000000), true, true);
			// 排序
			Sort sort = new Sort();
			sort.setSort(new SortField("size")); // 默认为升序
			// sort.setSort(new SortField("size", true));
			TopDocs topDocs = indexSearcher.search(query, filter, 10000, sort);
			int recordCount = topDocs.totalHits;
			List<Document> recordList = new ArrayList<Document>();
			// 准备高亮器
			Formatter formatter = new SimpleHTMLFormatter("<font color='red'>",
					"</font>");
			Scorer scorer = new QueryScorer(query);
			Highlighter highlighter = new Highlighter(formatter, scorer);
			Fragmenter fragmenter = new SimpleFragmenter(50);
			highlighter.setTextFragmenter(fragmenter);
			// 3，取出当前页的数据
			int end = Math.min(firstResult + maxResults, topDocs.totalHits);
			for (int i = firstResult; i < end; i++) {
				ScoreDoc scoreDoc = topDocs.scoreDocs[i];
				int docSn = scoreDoc.doc; // 文档内部编号
				Document doc = indexSearcher.doc(docSn); // 根据编号取出相应的文档
				// 高亮 返回高亮后的结果，如果当前属性值中没有出现关键字，会返回 null
				String hc = highlighter.getBestFragment(Constants.analyzer,
						"content", doc.get("content"));
				if (hc == null) {
					String content = doc.get("content");
					int endIndex = Math.min(50, content.length());
					hc = content.substring(0, endIndex);// 最多前50个字符
				}
				doc.getField("content").setValue(hc);
				recordList.add(doc);
			}
			// 返回结果
			return new QueryResult(recordCount, recordList);
		} catch (Exception e) {
			throw new RuntimeException(e);
		} finally {
			try {
				indexSearcher.close();
			} catch (IOException e) {
				e.printStackTrace();
			}
		}
	}

	public void close() {
		// 对索引进行优化
		try {
			indexWriter.optimize();
			indexWriter.close();
		} catch (CorruptIndexException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}
	}

	public void readIndex(String key, String value) {
		
		IndexReader reader;
		try {
//			Directory fsDir = FSDirectory.getDirectory(
//					Constants.INDEX_STORE_PATH, false);
//			if (IndexReader.isLocked(fsDir)) {
//				System.out.println("------unlock-----");
//				IndexReader.unlock(fsDir);
//			}
			reader = IndexReader.open(Constants.INDEX_STORE_PATH);
			for (int i = 0; i < reader.numDocs(); i++)
//		    System.out.println(reader.document(i));
		    System.out.println("版本：" + reader.getVersion());
			System.out.println("索引内的文档数量：" + reader.numDocs());
			Term term = new Term(key, value);
			TermDocs docs = reader.termDocs(term);
			IndexSearcher indexSearcher = null;
			indexSearcher = new IndexSearcher(Constants.INDEX_STORE_PATH);
			while (docs.next()) {
				int docSn = docs.doc(); // 文档内部编号
				Document doc = indexSearcher.doc(docSn); // 根据编号取出相应的文档
				System.out.println("文档路径 " + doc.get("path"));
				System.out.println("含有所查找的 " + term + "的Document的编号为: "+ docs.doc());
				System.out.println("Term在文档中的出现 " + docs.freq()+" 次");
			}
		} catch (CorruptIndexException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
}

读取文件工具类：

Java代码

public class ReadFile {
public static String readWord(File f) {
StringBuffer content = new StringBuffer( "" ); // 文档内容
try {
HWPFDocument doc = new HWPFDocument( new FileInputStream(f));
Range range = doc.getRange();
int paragraphCount = range.numParagraphs(); // 段落
for ( int i = 0 ; i < paragraphCount; i++) { // 遍历段落读取数据
Paragraph pp = range.getParagraph(i);
content.append(pp.text());
}
// System.out.println("-------word--------"+content.toString());
} catch (Exception e) {
System.out.println("建立索引出错 : " + f.getAbsolutePath() + "" );
e.printStackTrace();
}
return content.toString().trim();
}
public static String readPdf(File f){
StringBuffer content = new StringBuffer( "" ); // 文档内容
PDDocument pdfDocument = null ;
try {
if (f.length()> 10048576 ){
DecimalFormat df = new DecimalFormat( "#.00" );
System.out.println("---------------------文件大小------" +df.format(( double ) f.length() / 1048576 ) + "M" );
return f.getName();
}
FileInputStream fis = new FileInputStream(f);
PDFTextStripper stripper = new PDFTextStripper();
pdfDocument = PDDocument.load(fis);
if (pdfDocument.isEncrypted()){
return f.getName();
}
StringWriter writer = new StringWriter();
stripper.writeText(pdfDocument, writer);
content.append(writer.getBuffer().toString());
fis.close();
} catch (IOException e) {
System.out.println("建立索引出错 : " + f.getAbsolutePath() + "" );
System.err.println("IOException=" + e);
//System.exit(1);
} finally {
if (pdfDocument != null ) {
// System.err.println("Closing document " + f + "...");
org.pdfbox.cos.COSDocument cos = pdfDocument.getDocument();
try {
cos.close();
// System.err.println("Closed " + cos);
pdfDocument.close();
} catch (IOException e) {
System.out.println("建立索引出错 : " + f.getAbsolutePath() + "" );
e.printStackTrace();
}
}
}
// System.out.println("-------pdf--------"+content.toString());
return content.toString().trim();
}
public static String readHtml(File f) {
StringBuffer content = new StringBuffer( "" );
FileInputStream fis = null ;
try {
fis = new FileInputStream(f);
// 读取页面这里的字符编码要注意，要对上html头文件的一致，否则会出乱码
BufferedReader reader = new BufferedReader( new InputStreamReader(fis, "gb2312" ));
String line = null ;
while ((line = reader.readLine()) != null ) {
content.append(line + "\n" );
}
reader.close();
} catch (Exception e) {
System.out.println("建立索引出错 : " + f.getAbsolutePath() + "" );
e.printStackTrace();
}
String contentString = content.toString();
// System.out.println("---------htm索引----"+contentString);
return contentString;
}
public static String readTxt(File f) {
StringBuffer content = new StringBuffer( "" );
try {
BufferedReader reader = new BufferedReader( new InputStreamReader(
new FileInputStream(f)));
for (String line = null ; (line = reader.readLine()) != null ;) {
content.append(line).append("\n" );
}
} catch (IOException e) {
System.out.println("建立索引出错 : " + f.getAbsolutePath() + "" );
e.printStackTrace();
}
return content.toString().trim();
}
public static String readExcel(File f,String fileType){
StringBuffer content = new StringBuffer( "" );
try {
ExcelReader er=new ExcelReader(f,fileType);
String line=er.readLine();
content.append(line).append("\n" );
while (line!= null ){
line=er.readLine();
content.append(line).append("\n" );
}
er.close();
}catch (Exception e){
System.out.println("建立索引出错 : " + f.getAbsolutePath() + "" );
e.printStackTrace();
}
return content.toString();
}
public static String validateFile(File f) {
String fileType = "otherType" ;
String fileName = f.getName();
if (fileName.lastIndexOf( '.' ) == - 1 ) {
fileType = "dir" ;
return fileType;
}
fileName = fileName.substring(fileName.lastIndexOf('.' ) + 1 , fileName
.length());
int i = 0 ;
String [] extension=Constants.EXTENSION;
for (i = 0 ; i < extension.length; i++) {
if (fileName.equalsIgnoreCase(extension[i])) {
fileType = extension[i];
break ;
}
}
return fileType;
}
public static Document indexFile(File f) {
Document doc = new Document();
try {
doc.add(new Field( "name" , f.getName(), Store.YES, Index.ANALYZED));
doc.add(new Field( "size" , NumberTools.longToString(f.length()),
Store.YES, Index.NOT_ANALYZED));
doc.add(new Field( "path" , f.getAbsolutePath(), Store.YES,
Index.NOT_ANALYZED));
String fileType = validateFile(f);
if (fileType.equals( "txt" )) {
doc.add(new Field( "content" , ReadFile.readTxt(f), Store.YES,
Index.ANALYZED));
} else if (fileType.equals( "pdf" )) {
doc.add(new Field( "content" , ReadFile.readPdf(f), Store.YES,
Index.ANALYZED));
} else if (fileType.equals( "doc" )) {
doc.add(new Field( "content" , ReadFile.readWord(f), Store.YES,
Index.ANALYZED));
} else if (fileType.equals( "htm" )) {
doc.add(new Field( "content" , ReadFile.readHtml(f), Store.YES,
Index.ANALYZED));
} else if (fileType.equals( "xls" )){
doc.add(new Field( "content" , ReadFile.readExcel(f, fileType), Store.YES,
Index.ANALYZED));
}else {
doc.add(new Field( "content" , f.getName(), Store.YES, Index.ANALYZED));
}
} catch (Exception e) {
System.out.println("建立索引出错 : " + f.getAbsolutePath() + "" );
e.printStackTrace();
}
return doc;
}
}

public class ReadFile {

	public static String readWord(File f) {
		StringBuffer content = new StringBuffer("");// 文档内容
		try {
			 HWPFDocument doc = new HWPFDocument(new FileInputStream(f));
			 Range range = doc.getRange();
			 int paragraphCount = range.numParagraphs();// 段落
			 for (int i = 0; i < paragraphCount; i++) {// 遍历段落读取数据
			 Paragraph pp = range.getParagraph(i);
			 content.append(pp.text());
			 }
//			 System.out.println("-------word--------"+content.toString());
		} catch (Exception e) {
			System.out.println("建立索引出错 : " + f.getAbsolutePath() + "");
			e.printStackTrace();
		}
		return content.toString().trim();
	}

	public static String readPdf(File f){
		StringBuffer content = new StringBuffer("");// 文档内容
		PDDocument pdfDocument = null;
		try {
			if(f.length()>10048576){
				DecimalFormat df = new DecimalFormat("#.00");
				System.out.println("---------------------文件大小------"+df.format((double) f.length() / 1048576) + "M");
				return f.getName();
			}
			FileInputStream fis = new FileInputStream(f);
			PDFTextStripper stripper = new PDFTextStripper();
			pdfDocument = PDDocument.load(fis);
			if(pdfDocument.isEncrypted()){
				return f.getName();
			}
			
			StringWriter writer = new StringWriter();
			stripper.writeText(pdfDocument, writer);
			content.append(writer.getBuffer().toString());
			fis.close();
		} catch (IOException e) {
			System.out.println("建立索引出错 : " + f.getAbsolutePath() + "");
			System.err.println("IOException=" + e);
			//System.exit(1);
		} finally {
			if (pdfDocument != null) {
				// System.err.println("Closing document " + f + "...");
				org.pdfbox.cos.COSDocument cos = pdfDocument.getDocument();
				try {
					cos.close();
					// System.err.println("Closed " + cos);
					pdfDocument.close();
				} catch (IOException e) {
					System.out.println("建立索引出错 : " + f.getAbsolutePath() + "");
					e.printStackTrace();
				}
			}
		}
//		 System.out.println("-------pdf--------"+content.toString());
		return content.toString().trim();
	}
	
	public static String readHtml(File f) {
		StringBuffer content = new StringBuffer("");
		FileInputStream fis = null;
		try {
			fis = new FileInputStream(f);
			// 读取页面 这里的字符编码要注意，要对上html头文件的一致，否则会出乱码
			BufferedReader reader = new BufferedReader(new InputStreamReader(fis, "gb2312"));
			String line = null;
			while ((line = reader.readLine()) != null) {
				content.append(line + "\n");
			}
			reader.close();
		} catch (Exception e) {
			System.out.println("建立索引出错 : " + f.getAbsolutePath() + "");
			e.printStackTrace();
		}
		String contentString = content.toString();
//		System.out.println("---------htm索引----"+contentString);
		return contentString;
	}

	public static String readTxt(File f) {
		StringBuffer content = new StringBuffer("");
		try {
			BufferedReader reader = new BufferedReader(new InputStreamReader(
					new FileInputStream(f)));
			for (String line = null; (line = reader.readLine()) != null;) {
				content.append(line).append("\n");
			}
		} catch (IOException e) {
			System.out.println("建立索引出错 : " + f.getAbsolutePath() + "");
			e.printStackTrace();
		}
		return content.toString().trim();
	}
	
	public static String readExcel(File f,String fileType){
		StringBuffer content = new StringBuffer("");
			try{
				ExcelReader er=new ExcelReader(f,fileType);	
				String line=er.readLine();
				content.append(line).append("\n");
				while(line!=null){
					line=er.readLine();
					content.append(line).append("\n");
				}
				er.close();
			}catch(Exception e){
				System.out.println("建立索引出错 : " + f.getAbsolutePath() + "");
				e.printStackTrace();
			}
			return content.toString();
	}

	public static String validateFile(File f) {
		String fileType = "otherType";
		String fileName = f.getName();
		if (fileName.lastIndexOf('.') == -1) {
			fileType = "dir";
			return fileType;
		}
		fileName = fileName.substring(fileName.lastIndexOf('.') + 1, fileName
				.length());
		
		int i = 0;
		String [] extension=Constants.EXTENSION;
		for (i = 0; i < extension.length; i++) {
			if (fileName.equalsIgnoreCase(extension[i])) {
				fileType = extension[i];
				break;
			}
		}
		return fileType;
	}

	public static Document indexFile(File f) {
		Document doc = new Document();
		try {
			doc.add(new Field("name", f.getName(), Store.YES, Index.ANALYZED));
			doc.add(new Field("size", NumberTools.longToString(f.length()),
					Store.YES, Index.NOT_ANALYZED));
			doc.add(new Field("path", f.getAbsolutePath(), Store.YES,
					Index.NOT_ANALYZED));
			String fileType = validateFile(f);
			if (fileType.equals("txt")) {
				doc.add(new Field("content", ReadFile.readTxt(f), Store.YES,
						Index.ANALYZED));
			} else if (fileType.equals("pdf")) {
				doc.add(new Field("content", ReadFile.readPdf(f), Store.YES,
						Index.ANALYZED));
			} else if (fileType.equals("doc")) {
				doc.add(new Field("content", ReadFile.readWord(f), Store.YES,
						Index.ANALYZED));
			} else if (fileType.equals("htm")) {
				doc.add(new Field("content", ReadFile.readHtml(f), Store.YES,
						Index.ANALYZED));
			} else if(fileType.equals("xls")){
				doc.add(new Field("content", ReadFile.readExcel(f, fileType), Store.YES,
						Index.ANALYZED));
			}else {
				doc.add(new Field("content", f.getName(), Store.YES, Index.ANALYZED));
			}
		} catch (Exception e) {
			System.out.println("建立索引出错 : " + f.getAbsolutePath() + "");
			e.printStackTrace();
		}
		return doc;
	}
}

Java代码

public class ExcelReader {
// 创建文件输入流
private BufferedReader reader = null ;
// 文件类型
private String filetype;
// 文件二进制输入流
private InputStream is = null ;
// 当前的Sheet
private int currSheet;
// 当前位置
private int currPosition;
// Sheet数量
private int numOfSheets;
// HSSFWorkbook
HSSFWorkbook workbook = null ;
// 设置Cell之间以空格分割
private static String EXCEL_LINE_DELIMITER = " " ;
// 设置最大列数
// private static int MAX_EXCEL_COLUMNS = 64;
// 构造函数创建一个ExcelReader
public

分享到：

SQL基础实例（学生课程系统） | lucene 单机 io性能提高策略

2010-11-17 16:20
浏览 355
评论(0)
分类:编程语言
相关推荐

发表评论

您还没有登录,请您登录后再发表评论

你可能感兴趣的:(F#,Excel,Lucene,J#)

pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
【Golang】实现 Excel 文件下载功能 RumIV Golang golang excel 开发语言
在当今的网络应用开发中，提供数据导出功能是一项常见的需求。Excel作为一种广泛使用的电子表格格式，通常是数据导出的首选格式之一。在本教程中，我们将学习如何使用Go语言和GinWeb框架来创建一个Excel文件，并允许用户通过HTTP请求下载该文件。准备工作在开始之前，请确保您的开发环境中已经安装了Go语言和相关的开发工具。此外，您还需要安装GinWeb框架和excelize包，这两个包都将用于我
【Golang】使用 Golang 语言和 excelize 库将数据写入Excel 不爱洗脚的小滕 golang excel 开发语言
文章目录前言一、Excelize简介二、代码实现1.获取依赖2.示例代码三、总结前言在数据处理和分析中，Excel作为一种常见的电子表格格式，被广泛应用于各种场景。然而，如何在Go语言中有效地处理Excel文件呢？在这篇博客中，我将介绍如何使用Go语言和excelize库将数据写入Excel文件。一、Excelize简介Excelize是一个用于读取和写入MicrosoftExcel™(XLSX)
python编写直方图和饼图 2301_80421078 python 开发语言
1.直方图#直方图的绘制#语法格式：plt.hist(x,bins),其中x:数据集；bins:统计数据的分布区间importmatplotlib.pyplotaspltimportpandasaspd#导入文件excel=pd.read_excel('成绩.xlsx')#print(excel)#避免乱码plt.rcParams['font.sans-serif']=['SimHei']x=ex
如何在Excel中使用COLUMN函数 Excel客旅
一、COLUMN函数介绍1.COLUMN函数是用来得到指定单元格的列号。比如“=COLUMN(B1)”，得到的就是B1的列号为“2”。2.如果括号里面为空，什么都不引用，则默认引用公式所在单元格的列号。3.COLUMN函数还可以引用区域。首先我们选中B1至F1的单元格区域，然后输入公式“=COLUMN(B:F)”或者“=COLUMN(B1:F1)”，然后按Ctrl+Shift+Enter键。二、用
听学长学姐录音有感 dd7ac5aef048
在听学长学姐的录音时，我记下了一些关键词来帮助自己做出总结。首先，办公软件的应用能力是个高频词，无论是税务部门还是企业、银行等，都需要对办公软件的熟练应用来提升办事效率，比较常规的Excel、PS其实是有基础在的，但要更加重视，不要慢慢丢失了这些能力，还要加强使用能力。读写能力、沟通能力也是不断被强调。对于这方面的能力，大学就是最好的训练场，重视每一次写作的锻炼机会，在过程中，你的检索能力、自我学
Python办公自动化案例（二）：对比两个Excel数据内容并标出不同衍生星球 python excel 高阶办公办公自动化
案例：对比两个word文档并找出不同。在数据处理和分析的日常工作中，我们经常需要比较两个Excel文件的差异。这可能是为了验证数据的一致性、检查数据的准确性，或者在版本控制中追踪更改。手动比较这些文件不仅耗时，而且容易出错。幸运的是，Python的openpyxl库提供了一种自动化这一过程的方法。步骤1：安装openpyxl在命令行中输入以下命令来安装pipinstallopenpyxl步骤2:编
【python版】示波器输出的csv文件（时间与电压数据）如何转换为频率与幅值【方法②】 cxylay python python 开发语言示波器 csv文件频谱频域时域
要将示波器输出的CSV文件中包含的时间与电压数据转换为频率与幅值数据，你可以按照以下步骤进行处理。这里假设你的数据是一个周期性信号，可以通过傅里叶变换来实现这种转换。1、准备数据①导入CSV文件首先，使用Python、Excel或任何数据处理工具导入你的CSV文件。CSV文件中应该有两列数据，分别为时间（time）和电压（voltage）。②检查数据确保时间列的单位是一致的（例如秒），电压列是以伏
用html打开dbf文件,dbf文件怎么打开？dbf是什么文件？今天也要开心呢用html打开dbf文件
dbf文件怎么打开？dbf文件是一种数据库格式文件，用于存储数据库的数据。一些用户在工作的过程中，可能会碰到后缀名为dbf的文件，正常双击是无法打开的，我们需要借助软件才能打开dbf文件。下面给大家推荐一些软件来打开dbf文件，具体请看下文。工具/原料：1、Exceldbf是什么文件？dbf文件是一种数据库格式文件，Foxbase，Dbase，VisualFoxPro等数据库处理系统会运用到dbf
excel打开html非常慢,解决EXCEL表格打开缓慢，文件异常臃肿庞大史文林 excel打开html非常慢
相信很多每天在操作EXCEL的朋友，会觉得自己的表格一天比一天大，一天比一天打开慢，但表格里面实际也没多少内容。这其中的主要原因之一，就是你喜欢在多个表格之间互相复制来复制去，粘贴的时候也不是使用选择性粘贴。把原来表格里面的所有样式设置内容和不必要的数据都复制过来了，导致整个工作薄变得异常臃肿庞大。接下来我们就来分析下具体发生了什么情况和如何解决这个问题吧！1.看这个“源文件”，文件大小居然达到了
html打开本地excel文件夹,html使用excel表格数据库-html读取本地excel文件并展示睿理
html表格如何导入到excel中在vs里面用添加数据源就可以啊,再使用数据控件,就可以操作.添加数据源可以用odbc数据源,两种方式1,是在控制面板的管理工具里在ODBC里先设置好.2,是使用连接字符串.用vs的添加数据源向导做.html中有没有类似excel表格，可以填数的表格控件？首先html不能读取本地excel文件其次就算是javascript也是不允许的这是为了安全考虑如果前端脚本可以
Java在Controller生成Excel供前端直接下载 pengjunlee SpringBoot重点详解导出文件 POI excel Controller
在许多企业办公系统中，经常会有用户要求，需要对数据进行统计并且可以直接下载Excel文件，这样子的话，既然客户提出了要求，我们就应该去满足吖，毕竟客户是上帝嘛，那么我们如何去实现呢？且看我为你一一道来。POI简介JakartaPOI是一套用于访问微软格式文档的JavaAPI。JakartaPOI有很多组件组成，其中有用于操作Excel格式文件的HSSF和用于操作Word的HWPF，在各种组件中目前
解决前端导出excel文件，打开为乱码荔枝，你让我拿什么荔枝！ vue 前端 elementui vue.js
前端开发中，导入和导出文件是比较常见的业务场景，常见的情况是：后端返回一个二进制的流文件，前端将其转化为excel文件即可。但是往往会出现转化后的excel文件内容位乱码的情况，本文中提供了两个解决方案：方案一：用户自定义上传方法添加附件添加附件代码解读：上述代码采用了element-ui的el-upload文件上传的组件。改组件有两种文件上传的方式：1.组件自带的上传方法，只需要给其设置acti
SpringBoot2：web开发常用功能实现及原理解析-整合EasyExcel实现Excel导入导出功能生产队队长 Spring All excel spring boot
1、工程包结构主要是这5个Java类2、导入EasyExcel包这里同时贴出其他相关springboot的基础包org.springframework.bootspring-boot-starter-weborg.springframework.bootspring-boot-devtoolsruntimetrueorg.springframework.bootspring-boot-config
大数据新视界 --大数据大厂之揭秘大数据时代 Excel 魔法：大厂数据分析师进阶秘籍青云交大数据新视界 Excel 数据分析函数公式数据透视表图表功能规划求解数据分析工具库大数据新视界数据库
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
Python进阶之Openpyxl详解夏天Aileft Python python 开发语言 openpyxl
✨前言openpyxl是一个用于读取和编辑Excel文件（即.xlsx格式文件）的Python库。以下是openpyxl的详细介绍及常见操作示例✨安装在使用openpyxl之前，需要先安装它。可以通过以下命令安装：pipinstallopenpyxl✨加载工作簿#加载已经存在的工作簿wb=openpyxl.load_workbook('example.xlsx')#创建一个新的工作簿wb=open
python 标准库之openpyxl的常规操作真的学不了一点。。。 Python学习 python
目录openpyxl（Excel文件处理模块）读sheet读sheet中单元格合并单元格openpyxl模块基本用法安装方法基本使用读取Excel文档（一）获取工作表（二）获取单元格（三）获取行和列写入Excel文档（一）写入单元格（二）保存文件设置单元格样式（一）字体（二）对齐方式（三）边框（四）设置行高和列宽（五）合并和拆分单元格openpyxl(Excel文件处理模块)读sheet读取Exc
EasyExcel实现复杂Excel的导入小卡车555 java处理excel excel
最近项目中遇到一个复杂的Excel的导入，并且数据量较大。因为数据不规则，所以只能使用POI进行自定义读取，但是发现数据量大之后，读取数据非常耗时。后面换成EasyExcel，性能起飞。1.Excel样板如上图，需要导入学校学生信息。前面三列，固定为学校班级信息，可以理解为主表。从第四列开始，为学生信息，其中一列为一条子表信息。2.具体实现引入EasyExcel的依赖com.alibabaeasy
pandas读取xlsx文件使用sqlachemy写到数据库 hzw0510 pandas pandas 数据库
pandas读取xlsx文件使用sqlachemy写到数据库要使用pandas和SQLAlchemy将Excel文件中的数据读取到数据库中，你可以按照以下步骤进行操作：安装必要的库：确保你已经安装了pandas、SQLAlchemy和openpyxl（用于读取Excel文件）。可以使用以下命令安装：pipinstallpandassqlalchemyopenpyxl如果你使用的是特定的数据库（如S
Apache POI用法 JH3073 apache
一、ApachePOI是什么ApachePOI是用Java编写的免费开源的跨平台的JavaAPI，ApachePOI提供API给Java程序对MicrosoftOffice格式档案读和写的功能，其中使用最多的就是使用POI操作Excel文件。二、POI结构HSSF－提供读写MicrosoftExcelXLS格式档案的功能XSSF－提供读写MicrosoftExcelOOXMLXLSX格式档案的功能
python 问题 ‘list‘ object cannot be interpreted as an integer 和‘int‘ object is not iterable annekqiu python
访问同一个excel表格（含有多个sheet）importnumpyasnpimportpandasaspdimportxlrd#读取excel的库importxlwt#写excel的库data=xlrd.open_workbook('./161005.xlsx')#打开excel文件读取数据table=data.sheets()[0]#读取sheet1h=table.ncols#获得列表数目a1
2021-07-31 阿诗玛_6209
姓名：赵丽娟【日精进打卡第1262天】【知～学习】《六项精进》大纲0遍，共407遍；《六项精进》通篇0遍，共172遍；《大学》0遍；共607遍【今年计划读6本书】《从总帐到总监》结束《理解人性》26《“偷懒”的技术，财务excel》26《活法》ok.《干法》ok《可复制的领导力》ok《把信送给加西亚》008-011《避税：无限接近但不逾越》076【经典名句】向日葵说，只要你朝着阳光努力向上，生活便
多表逐级关联报表，使用poi方法导出excel LCF_全博
难点要求多表关联导出，简单介绍：有A1表，A2表，B表，C表，A1和A2是一对多的关系，B表和A1表也是一对多的关系，C表和B表是一对多的关系。这是简化的业务逻辑，表之间的关系就类似这种。完成对关联导出。实现思路熟悉poi导出的可能会知道，报表的导出总体思路是将数据按照excel的每一行去写入数据的，假如是有序的数据还好说点，比如单表的导出，直接单表查询出来，循环写入每一个excel行就行，这种做
查找与替换那些你不知道的事我是荷叶田田
今天学习的内容是查找和替换，又get到不少新知识。接着我先向大家介绍下今天的复盘成果。回顾目标：1、查找和替换的不同玩法2、晚上的分享做两张图3、联系小伙伴做逐字稿评估结果：Excel学习实践完成、图片提前做了出来、跟小伙伴的沟通也很愉快分析过程：1、查找和替换的应用又有新的收获，比如快速制作目录，不用借助超链接哦！比如查找新神器everthing，我用了一下，简直不要太好用。有一点耽误了太多时间
excel表格解析数据摸鱼的张三 excel java 前端
varpersons=[];functionexcelChange(e){varfiles=e.filesvarfileReader=newFileReader();fileReader.onload=function(ev){console.log(ev);vardata=ev.target.resultvarworkbook=XLSX.read(data,{type:'binary'})var
我的两周~E战到底训练营花睡
Office职场大学的EXCEL训练营，已经两周了，这短短的十几天，我真是冰火两重天，抓狂后的欣喜，想要放弃后的坚持，并且深深的体会了一把"学渣"的感受……从这么几个方面来说吧。首先，是制度。开始建群的时候，各种规则，各种改名等一堆的事情，队长每次耐心沟通。我那两天正好忙的翻天，一肚子火，心想安安静静学知识就好了呗，想要直接放弃，不学了，又觉得这个群这样叽叽歪歪，喊口号啥的，到底是个啥名堂，还有点
vba把excel导入mysql_VBA将Excel数据表格直接导入SQL Server数据库 weixin_39757040
[vb]代码库'把当前Excel工作簿的所有工作表的数据表格转换为Insert语句并导入SQLServer数据库中。OptionExplicitPublicSubCreateAllSheetsInsertScript()OnErrorGoToErrorHandler'recordsetandconnectionvariablesDimRowAsLongDimColAsInteger'Tostore
VBA 把Excel表当做一个大数据库来操作码猩 excelVBA专栏 excel 数据库
VBA把Excel表当做一个大数据库来操作SubSqlQueryBJD(strBillNoAsString)DimstrSqlAsStringDimarrCol()AsStringDimstrLineWhereDimarrWhere()AsStringDimstrWhereValAsStringDimstrResultShowRngAsStringDimstrWhereRngAsStringDim
Excel插件，批量生成含二维码和条形码的产品标签罗刚君
Excel插件，批量生成含二维码和条形码的产品标签Excel中批量生成产品标签，标签中同时包含二维码和条形码。工厂出货时必备，有了此标签可以扫码入库，效率提升数几倍。
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，