jsjrjz08

Lucene(5.3.1) demo

Lucene包含两部分内容：创建索引、检索。

package demo.mytest.lucene;

import java.io.IOException;
import java.nio.file.FileSystems;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
import org.apache.lucene.analysis.tokenattributes.OffsetAttribute;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.IndexWriterConfig.OpenMode;
import org.apache.lucene.index.Term;
import org.apache.lucene.queryparser.classic.MultiFieldQueryParser;
import org.apache.lucene.queryparser.classic.ParseException;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.search.TermRangeQuery;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.search.highlight.Encoder;
import org.apache.lucene.search.highlight.Formatter;
import org.apache.lucene.search.highlight.Fragmenter;
import org.apache.lucene.search.highlight.Highlighter;
import org.apache.lucene.search.highlight.QueryScorer;
import org.apache.lucene.search.highlight.Scorer;
import org.apache.lucene.search.highlight.SimpleFragmenter;
import org.apache.lucene.search.highlight.SimpleHTMLEncoder;
import org.apache.lucene.search.highlight.SimpleHTMLFormatter;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.store.IOContext;
import org.apache.lucene.store.RAMDirectory;
import org.apache.lucene.util.BytesRef;
import org.junit.Test;

import demo.mytest.lucene.utils.LuceneUtils;

public class HelloWorld {
	
	public static final String dataDir = "F:\\workspace\\luceneDemo\\dataDir\\CHANGES.txt";//文档所在路径 CHANGES.txt
	public static final String dataDir2 = "F:\\workspace\\luceneDemo\\dataDir\\bye.txt";
	public static final String indexDir = "F:\\workspace\\luceneDemo\\indexDir";//索引文件存储位置
	public static final Analyzer analyzer = new StandardAnalyzer();

	/**
	 * 
	 * testCreateIndex 创建索引库
	 * 
	 * @Description 
	 * @throws Exception void
	 * @see
	 */
	@Test
	public void testCreateIndex() throws Exception {
		
		IndexWriterConfig config = new IndexWriterConfig(analyzer);
		config.setOpenMode(OpenMode.CREATE);//设置indexWriter的打开方式，是新建或覆盖（CREATE）？是追加(APPEND)？还是两者结合(CREATE_OR_APPEND)？
		Directory directory = this.getFsIndexDirectory();//将索引文件保存的指定路径
		IndexWriter indexWriter = new IndexWriter(directory, config);//创建indexWriter对象
//		indexWriter.deleteAll();//删除索引库的所有文件
		
		Document doc = LuceneUtils.file2Document(dataDir);//处理、转换。将文件转换成文档对象
		indexWriter.addDocument(doc);
		
		Document doc2 = LuceneUtils.file2Document(dataDir2);//处理、转换。将文件转换成文档对象
		indexWriter.addDocument(doc2);
		
		indexWriter.close();//用完一定要关闭！
		/*
		 * 新添加一个Document并不会马上将它的索引写入最终的索引大文件,它的索引会暂时存于缓存。
		 * 当关闭时，会将缓存中的索引归并到索引大文件。如果此处没有关闭操作，那么刚刚添加的Document的索引不会保存到最终的索引大文件。
		 */
		directory.close();
	}

	/**
	 * 
	 * testTermQuery 关键词查询
	 * @throws IOException 
	 * 
	 * @Description 
	 * @see
	 */
	@Test
	public void testTermQuery() throws IOException {
		String queryStr = "bye.txt";
		Term term = new Term("fileName", queryStr);
		Query query = new TermQuery(term) ;
		
		this.queryAndPrintResult(query);
	}

	/**
	 * 
	 * testTermRangeQuery 范围查询
	 * 
	 * @Description
	 * @throws IOException void
	 * @see
	 */
	@Test
	public void testTermRangeQuery() throws IOException {
		Query query = new TermRangeQuery("fileSize",new BytesRef(10),new BytesRef(2000), true, true);
		this.queryAndPrintResult(query);
	}
	
	/**
	 * 
	 * queryAndPrintResult 测试查询对象用到的方法
	 * 
	 * @Description 
	 * @throws IOException void
	 * @see
	 */
	private void queryAndPrintResult(Query query) throws IOException {
		Directory directory = this.getFsIndexDirectory();//获取索引文件的存储路径
		IndexReader indexReader = DirectoryReader.open(directory);
		IndexSearcher indexSearcher = new IndexSearcher(indexReader);//从指定的路径的索引库检索指定的文本
		
		
		
		TopDocs topDocs = indexSearcher.search(query, 100000);
		
		ScoreDoc[] scoreDocs = topDocs.scoreDocs;

		System.out.println("共有【"+ topDocs.totalHits+"】条查询结果。\n----------------");
		//打印文档对象信息
		for(int i=0;i<scoreDocs.length;i++) {
			Document document = indexSearcher.doc(scoreDocs[i].doc);//按照文档编号取出相应的文档对象
			LuceneUtils.printDocumentInfo(document);
		}
		
		indexReader.close();//用完一定要关闭！
		directory.close();
	}
	
	/**
	 * 
	 * testSearch 检索
	 * 
	 * @Description 
	 * @throws IOException
	 * @throws ParseException void
	 * @see
	 */
	@Test
	public void testSearch() throws IOException, ParseException {
		String queryStr = "ok";//ok,Ok,OK,oK都能检索到文档中的OK关键字

		Directory directory = this.getFsIndexDirectory();//获取索引文件的存储路径
		IndexReader indexReader = DirectoryReader.open(directory);
		IndexSearcher indexSearcher = new IndexSearcher(indexReader);//从指定的路径的索引库检索指定的文本
		
		String[] fields = {"fileName","content"};
		QueryParser parser = new MultiFieldQueryParser(fields,analyzer);//在多个文本域中检索的解析器
//		QueryParser parser = new QueryParser("content", analyzer);//在content域中检索的解析器
		Query query = parser.parse(queryStr);//通过解析器将待检索的字符串转化成Query对象
//		System.out.println(",,,,,,,,,,,"+query.);
		//Filter filter = null;
		//indexSearcher.search(query, filter, 2000);//5.3.1中已经废止该方法
		
		TopDocs topDocs = indexSearcher.search(query, 100000);
		
		ScoreDoc[] scoreDocs = topDocs.scoreDocs;
		System.out.println("共有【"+ topDocs.totalHits+"】条查询结果。\n----------------");
		
		//打印文档对象信息
		for(int i=0;i<scoreDocs.length;i++) {
			Document document = indexSearcher.doc(scoreDocs[i].doc);//按照文档编号取出相应的文档对象
//			document.getField("content").
			LuceneUtils.printDocumentInfo(document);
		}
		
		
		indexReader.close();//用完一定要关闭！
		directory.close();
	}
	
	/**
	 * 
	 * testHighlighter 将搜索结果中的关键字高亮显示，并生成摘要文本
	 * @throws Exception 
	 * 
	 * @Description 
	 * @see
	 */
	@Test
	public void testHighlighter() throws Exception {
		String queryStr = "bye.txt";
		Directory directory = this.getFsIndexDirectory();//获取索引文件的存储路径
		IndexReader indexReader = DirectoryReader.open(directory);
		IndexSearcher indexSearcher = new IndexSearcher(indexReader);//从指定的路径的索引库检索指定的文本
		
		String[] fields = {"fileName","content"};
		QueryParser parser = new MultiFieldQueryParser(fields,analyzer);//在多个文本域中检索的解析器
		Query query = parser.parse(queryStr);//通过解析器将待检索的字符串转化成Query对象
		
		//1.获得查询结果-文档集合
		ScoreDoc[] scoreDocs = indexSearcher.search(query, 100000).scoreDocs;
		
		//2.高亮处理（构造高亮器+使用高亮器-高亮关键词），并打印文档对象信息
		//2.1 构造高亮器
		//--------------------
		Formatter formatter = new SimpleHTMLFormatter("<font color='red'>","</font>");
		
		Encoder encoder = new SimpleHTMLEncoder();
		
		Scorer fragmentScorer = new QueryScorer(query);
		Highlighter highlighter = new Highlighter(formatter, encoder, fragmentScorer);
		//设置高亮器
		final int FRAGMENT_SIZE = 50;
		Fragmenter fragmenter = new SimpleFragmenter(FRAGMENT_SIZE);//每一个fragment的字符长度
		highlighter.setTextFragmenter(fragmenter);
		//--------------------
		
		for(int i=0;i<scoreDocs.length;i++) {
			Document document = indexSearcher.doc(scoreDocs[i].doc);//按照文档编号取出相应的文档对象
			//2.2生成摘要文本，并将摘要中的关键词高亮显示
			//--------------------
			//抽取与关键词最相近的文本片段作为摘要文本
			String text = document.get("content");
			String ht = highlighter.getBestFragment(analyzer, "content", text);
			if(ht == null) {//若fileName域中包含关键词，而content域中没有关键词，ht则为空
				//显示文档从头开始的部分文本
				ht = text.substring(0, Math.min(text.length(), FRAGMENT_SIZE));
			}
			System.out.println("ht.length()="+ht.length());
			//将标记过关键词的信息重新设置到文档对象中
			//document.getField("content").setValue(ht);//没有setValue方法
			document.removeField("content");
			document.add(new Field("content", ht,TextField.TYPE_STORED));
			//--------------------
			
			LuceneUtils.printDocumentInfo(document);
		}
		
		
		indexReader.close();//用完一定要关闭！
		directory.close();
	}
	
	/**
	 * 
	 * test 
	 * @throws IOException 
	 * 
	 * @Description 
	 * 1.当应用启动时，将磁盘中的索引文件读入内存。
	 * 2.应用运行过程中，只对内存中的索引文件进行操作。保证运行速度
	 * 3.在应用关闭前，将内存中的索引文件同步到磁盘。保证数据不丢失
	 * void
	 * @see
	 */
	@Test 
	public void test() throws Exception {
		//1.当应用启动时，将磁盘中的索引文件读入内存。
		//获取磁盘上的索引库路径
		Directory fsDir = this.getFsIndexDirectory();
		
		//2.应用运行过程中，只对内存中的索引文件进行操作
		//创建基于内存的IndexWriter
		Directory ramDir = new RAMDirectory((FSDirectory)fsDir, new IOContext() );//创建对象的同时，将磁盘上的索引文件加载到内存
		IndexWriterConfig ramConfig = new IndexWriterConfig(analyzer);
		ramConfig.setOpenMode(OpenMode.CREATE);
		IndexWriter ramIndexWriter = new IndexWriter(ramDir,ramConfig);
		
		//应用程序运行过程中，添加Document对象
		String tmpDir = "F:\\workspace\\luceneDemo\\dataDir\\CHANGES.txt";//1.txt   CHANGES.txt
		Document doc = LuceneUtils.file2Document(tmpDir);//处理、转换。将文件转换成文档对象
		ramIndexWriter.addDocument(doc);

		ramIndexWriter.close();//操作完毕，一定要关闭！！！
		
		//3.在应用关闭前，将内存中的索引文件同步到磁盘。
		//创建基于磁盘的IndexWriter
		IndexWriterConfig fsConfig = new IndexWriterConfig(analyzer);
		fsConfig.setOpenMode(OpenMode.CREATE_OR_APPEND);
		IndexWriter fsIndexWriter = new IndexWriter(fsDir,fsConfig);
		fsIndexWriter.addIndexes(new Directory[] {ramDir});
		
		fsIndexWriter.close();//操作完毕，一定要关闭！！！
		
	}
	
	/**
	 * 
	 * testForceMerge 合并索引文件
	 * 
	 * @Description 优化操作
	 * @throws Exception void
	 * @see
	 */
	@Test
	public void testForceMerge() throws Exception {
		Directory fsDir = this.getFsIndexDirectory();
		IndexWriterConfig fsConfig = new IndexWriterConfig(analyzer);
		fsConfig.setOpenMode(OpenMode.CREATE_OR_APPEND);
		IndexWriter fsIndexWriter = new IndexWriter(fsDir,fsConfig);
		
		fsIndexWriter.commit();
		fsIndexWriter.forceMerge(2);//forceMerge()内部有flush操作
		fsIndexWriter.close();//操作完毕，一定要关闭！！！
	}
	
	/**
	 * 
	 * testAnalyzer 分词器的使用
	 * 
	 * @Description 英文有英文分词器，中文有中文分词器。根据语言不同，选择相应的分词器（第三方jar）
	 * @throws IOException void
	 * @see
	 */
	@Test
	public void testAnalyzer() throws IOException {
		String enText = "This house builds well.She really wants to live in.";
		String zhText = "这个房子真好，她很想住进来。再见";
		Analyzer en1 = new StandardAnalyzer();
//		Analyzer zh1 = new SimpleAnalyzer();
		this.analyze(en1, enText);
		System.out.println("--------------------");
		this.analyze(en1, zhText);
		
		
	}
	
	/**
	 * 
	 * analyze 分词
	 * 
	 * @Description
	 * @param analyzer 分词器
	 * @param text 文本
	 * @throws IOException void
	 * @see
	 */
	private void analyze(Analyzer analyzer, String text) throws IOException {
		TokenStream tokenStream = analyzer.tokenStream("content", text);
		
		//addAttribute()：检查AttributeSource是否存在指定类的实例，如果存在，则返回该实例；不存在，则在AttributeSource中添加实例，并返回实例。
		OffsetAttribute offsetAtt = tokenStream.addAttribute(OffsetAttribute.class);//OffsetAttribute：token的开始、结束偏移量属性。

		//从tokenStream中获取CharTermAttribute
	    CharTermAttribute termAtt = tokenStream.addAttribute(CharTermAttribute.class);//CharTermAttribute：token的词语（term）属性。
	     
		try {
			tokenStream.reset(); //清除状态，已到TokenStream的开始位置。在调用incrementToken()之前一定要调用reset()。 Resets this stream to the beginning. (Required)
			while(tokenStream.incrementToken()) {//移动到下一个token。已到TokenStream末尾，返回false
				System.out.println("----------CharTermAttribute----------");
				System.out.println("词语："+termAtt.toString());
				System.out.println("----------OffsetAttribute----------");
				System.out.println("token: " + tokenStream.reflectAsString(false));
		        System.out.println("\ttoken开始偏移量: " + offsetAtt.startOffset());
		        System.out.println("\ttoken结束偏移量: " + offsetAtt.endOffset());
			}
		} catch (Exception e) {
			e.printStackTrace();
		} finally {
			tokenStream.end();//到达TokenStream末尾后调用end(). Perform end-of-stream operations, e.g. set the final offset.
			tokenStream.close();//释放与流有关的资源
		}
		
	}
	
	/**
	 * 
	 * getFsIndexDirectory 获取索引库的Directory
	 * 
	 * @Description 
	 * @return Directory
	 * @see
	 */
	private Directory getFsIndexDirectory() {
		try {
			return FSDirectory.open(FileSystems.getDefault().getPath(indexDir));//基于磁盘的索引库，也可以基于内存：Directory directory = new RAMDirectory();
		} catch (IOException e) {
			throw new RuntimeException(e);
		}
	}
}

使用到的工具类：

package demo.mytest.lucene.utils;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;

import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.TextField;

/**
 * 
 * LuceneUtils 工具类
 * 
 */
public class LuceneUtils {
	
	/**
	 * 
	 * file2Document 将文件转换成文档对象
	 * 
	 * @Description 
	 * @param path
	 * @return
	 * @throws Exception Document
	 * @see
	 */
	public static Document file2Document(String path) throws Exception {
		File file = new File(path);
		Document doc = new Document();
		doc.add(new Field("fileName", file.getName(), TextField.TYPE_STORED));
		doc.add(new Field("content", getFileContent(file),TextField.TYPE_STORED));
		doc.add(new Field("fileSize", String.valueOf(file.getTotalSpace()), TextField.TYPE_STORED));
		doc.add(new Field("path", file.getAbsolutePath(),TextField.TYPE_STORED));
		//doc.add(new Field("fileName",String.valueOf(file.getName()),Store.YES, Index.ANALYZED));
		System.out.println(file.getAbsolutePath()+"\t"+file.isDirectory()+"\n"+getFileContent(file));
		doc.add(new Field("isDirectory",String.valueOf(file.isDirectory()),TextField.TYPE_STORED));
		
		return doc;
	}
	
	/**
	 * 
	 * printDocumentInfo 打印文档对象信息
	 * 
	 * @Description 打印文档对象信息
	 * @param document 文档对象
	 * void
	 * @see
	 */
	public static void printDocumentInfo(Document document) {
//		IndexableField field = document.getField("fileName");	
//		System.out.println(field.name() + ":" +field.stringValue());//结果---fileName:CHANGES.txt。此处的document.getField("fileName").stringValue()相当于document.get("fileName")
		//打印文档对象信息
		System.out.println("文档（"+document.get("fileName")+"）的信息-"
		+"内容："+document.get("content")+"\t存储位置："+document.get("path")
		+"\t文件大小：" + document.get("fileSize") +"\t是否为文件夹："+ document.get("isDirectory"));
	}
	
	/**
	 * 
	 * getFileContent 取得文件内容
	 * 
	 * @Description 
	 * @param file
	 * @return
	 * @throws Exception String
	 * @see
	 */
	private static String getFileContent(File file) throws Exception {
		StringBuffer sbf = new StringBuffer();
		BufferedReader br = new BufferedReader(new FileReader(file));
		String line = null;
		while ((line = br.readLine()) != null) {
			sbf.append(line).append("\n");
		}
		br.close();
		return sbf.toString();
	}
}

使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
数据结构之哈希表 X同学的开始数据结构数据结构散列表
哈希表(散列表)出现的原因在顺序表中查找时，需要从表头开始，依次遍历比较a[i]与key的值是否相等，直到相等才返回索引i；在有序表中查找时，我们经常使用的是二分查找，通过比较key与a[i]的大小来折半查找，直到相等时才返回索引i。最终通过索引找到我们要找的元素。但是，这两种方法的效率都依赖于查找中比较的次数。我们有一种想法，能不能不经过比较，而是直接通过关键字key一次得到所要的结果呢？这时，
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
ExpRe[25] bash外的其它shell：zsh和fish tritone ExpRe bash linux ubuntu shell
文章目录zsh基础配置实用特性插件`autojump`语法高亮自动补全fish优点缺点时效性本篇撰写时间为2021.12.15，由于计算机技术日新月异，博客中所有内容都有时效和版本限制，具体做法不一定总行得通，链接可能改动失效，各种软件的用法可能有修改。但是其中透露的思想往往是值得学习的。本篇前置：ExpRe[10]Ubuntu[2]准备神秘软件、备份恢复软件https://www.cnblogs
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
ChatGPT 高效学习套路揭秘：让知识获取事半功倍的秘诀 kkai人工智能 chatgpt 人工智能学习媒体 ai
最近这段时间，AI热潮因ChatGPT的火爆再次掀起。如今，网上大部分内容都在调侃AI，但很少有人探讨如何正经使用ChatGPT做事情。作为一名靠搜索引擎和GitHub自学编程的开发者，第一次和ChatGPT深度交流后，我就确信：ChatGPT能够极大提高程序员学习新技术的效率。使用ChatGPT一个月后，我越发感受到它的颠覆性。因此，我想从工作和学习的角度，分享它的优势及我的一些使用技巧，而非娱
代码的执行效果高天
packagecom20210409;publicclassdemo04{publicstaticvoidmain(String[]args){//////&&当前的条件不满足,则最后结果一定不满足,后面的条件不再执行////&不管条件是否满足所有条件均作判断//intx=1,y=1;//if(++y==2&&x++==2){//x=7;//}//System.out.println("x="+x
非关系型数据库天秤-white nosql
一、为什么要用Nosql1.单机MySQL的时代。一个基本的网站访问量一般不会太大，单个数据库完全足够。那时候更多使用的静态网页html，服务器根本没有太大压力。这时候网站的瓶颈是什么？-数据量如果太大，一个机器放不下。-数据量太大需要建立数据的索引（B+Tree），一个服务器内存放不下。-访问量读写混合，一个服务器承受不了。2.memcached缓存+MySQL+垂直拆分（读写分离）。网站80%
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
Python程序打包指南：手把手教你一步步完成 Python_P叔 python 数据库开发语言
最近感兴趣想将开发的项目转成Package，研究了一下相关文章，并且自己跑通了，走了一下弯路，这里记录一下如何打包一个简单的Python项目，展示如何添加必要的文件和结构来创建包，如何构建包，以及如何将其上传到Python包索引（PyPI）。首先要确保安装最新版本：#Unix/macOSpython3-mpipinstall--upgradepip#windowspy-mpipinstall--u
网站推广爬虫 Bearjumpingcandy 爬虫
网站推广爬虫是一种用于升网站曝光度和推广效果的工具。它通过自动化地访问和收集网站信息，从而实现对目标网站的广告、关键词、排名等数据进行分析和优化。以下是网站推广爬虫的一些介绍：数据收集：网站推广爬虫可以自动访问目标网站，并收集相关的数据，如网站流量、关键词排名、竞争对手信息等。这些数据可以帮助网站推广人员了解网站的现状和竞争环境，从而制定相应的推广策略。关键词优化：通过分析搜索引擎的关键词排名情况
1013. 将数组分成和相等的三个部分软饭王
题目：将数组分成和相等的三个部分给你一个整数数组A，只有可以将其划分为三个和相等的非空部分时才返回true，否则返回false。形式上，如果可以找出索引i+1
LCR 078. 合并 K 个升序链表装B且挨揍の LeetCode 链表算法数据结构经验分享笔记 java
https://leetcode.cn/problems/vvXgSW/description/https://leetcode.cn/problems/vvXgSW/description/解题思路方法一：每个链表维护一个索引，每次找到值最小的节点，索引加一。可以采用优先队列实现。/***Definitionforsingly-linkedlist.*publicclassListNode{*i
梧桐数据库（WuTongDB）：数据库技术中都有哪些常见的优化器鲁鲁517 梧桐数据库梧桐数据库
以下是一些常见的数据库优化器：1.CBO（Cost-BasedOptimizer）应用场景：广泛应用于关系型数据库中，如Oracle、PostgreSQL、MySQL等。工作原理：通过计算不同执行计划的代价（如CPU、I/O等资源消耗），选择最低代价的执行计划。代表数据库：Oracle、PostgreSQL、MySQL。特点：CBO使用统计信息（如表大小、索引分布）来评估查询的代价。2.RBO（R
18068 选择排序蠢蠢的打码高级应用程序设计算法数据结构
###思路1.**初始化**：定义变量`i`,`j`,`k`和临时变量`tmp`。2.**外层循环**：遍历数组的每个元素，`i`从0到`n-2`。3.**内层循环**：从`i+1`到`n-1`，找到最小元素的索引`k`。4.**交换**：将最小元素与当前元素交换。###伪代码1.初始化`i`,`j`,`k`和`tmp`。2.外层循环从`i=0`到`n-2`：-设置`k=i`。-内层循环从`j=i
18061 数的交换蠢蠢的打码高级应用程序设计算法 c++数据结构
**思路**:1.**输入函数**:从用户输入中读取10个整数并存储在数组中。2.**交换函数**:找到数组中的最小值和最大值，分别与第一个和最后一个元素交换。3.**输出函数**:输出数组中的所有元素。**伪代码**:1.**输入函数**:-使用循环读取10个整数并存储在数组中。2.**交换函数**:-初始化最小值和最大值的索引为0。-遍历数组，找到最小值和最大值的索引。-交换最小值与第一个元素
C# 开发教程-入门基础天马3798 教程系列整理 c#开发语言
1.C#简介、环境，程序结构2.C#基本语法，变量，控制局域，数据类型，类型转换3.C#数组、循环，Linq4.C#类，封装，方法5.C#枚举、字符串6.C#面相对象，继承，封装，多态7.C#特性、属性、反射、索引器8.C#委托，事件，集合，泛型9.C#匿名方法10.C#多线程更多：JQuery开发教程入门基础Vue开发基础入门教程Vue开发高级学习教程
MySQL锁沉着冷静2024 MySQL mysql 数据库
MySQL锁文章目录MySQL锁MySQL中锁的分类创建索引时会锁表吗线上修改表结构会加什么锁Innodb存储引擎的行级锁有哪些Update语句中，不带where条件，加什么锁？MySQL实现乐观锁MySQL死锁MySQL死锁是怎么发生的？检查死锁如何避免死锁MySQL中锁的分类全局锁：主要用于全库逻辑备份表级锁：表锁、元数据锁、意向锁表锁：通过locktables语句对表进行加锁，它不仅限制其他
多表查询_关联查询活跃家族 sql
innerjoin:通常关联项on后面的是主外键，两个表都有的才显示leftjoin:左连，select*fromSleftjoinBons.字段=B.字段，一定会将左边表的数据全部查询出来rightjoin:select*fromSrightjoinBons.字段=B.字段一定会将右边表的数据全部查询出来索引：增加查询效率，数据量很大的时候，提高查询速度，当给表加索引之后，重新插入数据，就会让索
SpringBoot整合ES搜索引擎实现网站热搜词及热度计算码踏云端 springboot Elasticsearch spring boot elasticsearch 后端热搜词热度计算 java
博主简介：历代文学网（PC端可以访问：https://literature.sinhy.com/#/literature?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于
Python(PyTorch)和MATLAB及Rust和C++结构相似度指数测量导图亚图跨际 Python 交叉知识算法量化检查图像压缩质量低分辨率多光谱峰值信噪比端到端优化图像压缩手术机器人三维实景实时可微分渲染重建三维可视化
要点量化检查图像压缩质量低分辨率多光谱和高分辨率图像实现超分辨率分析图像质量图像索引/多尺度结构相似度指数和光谱角映射器及视觉信息保真度多种指标峰值信噪比和结构相似度指数测量结构相似性图像分类PNG和JPEG图像相似性近似算法图像压缩，视频压缩、端到端优化图像压缩、神经图像压缩、GPU变速图像压缩手术机器人深度估计算法重建三维可视化推理图像超分辨率算法模型三维实景实时可微分渲染算法MATLAB结构
听学长学姐录音有感 dd7ac5aef048
在听学长学姐的录音时，我记下了一些关键词来帮助自己做出总结。首先，办公软件的应用能力是个高频词，无论是税务部门还是企业、银行等，都需要对办公软件的熟练应用来提升办事效率，比较常规的Excel、PS其实是有基础在的，但要更加重视，不要慢慢丢失了这些能力，还要加强使用能力。读写能力、沟通能力也是不断被强调。对于这方面的能力，大学就是最好的训练场，重视每一次写作的锻炼机会，在过程中，你的检索能力、自我学
day12 控制流程 if switch while do...while 猜数字游戏卓越小Y JAVA学习日志游戏 java 开发语言
控制流程顺序结构所有的程序都是按顺序执行if语句选择结构单选择语句if(a>0){System.out.println(“hello”);}packagecom.ckw.blog.select;importjava.util.Scanner;publicclassdemo01{publicstaticvoidmain(String[]args){intscore=0;Scannerscanner=
Vector和Stack的用法蟹道人 JavaSe java
/***作者：*日期：*功能：vector的用法*/packagecom.cg;importjava.util.*;publicclassDemo5{publicstaticvoidmain(String[]args){//Vector的使用Vectorvec=newVector();Empemp=newEmp("2011",25,"zhang");vec.add(emp);for(inti=0;
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &

Lucene(5.3.1) demo

你可能感兴趣的:(索引,demo,高亮,检索,Luncene)