isam

Lucene学习总结

Lucene是当下十分流行的开源全文检索工具，在很多网站和系统中都得到了广泛应用（开源中国就是使用Lucene）。本人学习Lucene时间不长，水平有限，目前也还在学习探索阶段。现在将学习ucene过程中的知识点做以总结和归纳，期待和大家共同交流。Lucene并不是现成的搜索引擎，只算的上是Java开发的全文索引工具包。与传统的数据库查询比，全文索引技术更具有优势。Lucene不仅可以对数据库记录进行索引，也可以对磁盘文件进行索引（txt，word，excel，pdf等）。Lucene学习资料汇总 点击这里。

Lucene学习总结系列打算从以下几个方面介绍。

Lucene概述
入门实例
索引创建、更新和删除
分词
搜索结果排序
高亮关键字

第一部分：为什么使用Lucene

举个栗子，比如用户想查询博客系统中与“Lucene”相关的博客，在没有全文检索之前，我们可能只能依赖于数据库查询语句like来实现我们上述所说的功能，但这样做有几个明显的弊端：

当数据量大的时候，查询的速度很慢，效率很低，每次查询都得执行全表扫描，相同的查询无法复用；
查询的结果无法根据关键字相关性进行排序，设想一下如果查询结果数据量很大的情况下，让用户人工去筛选结果无疑是灾难性的；
现实中的数据可能是html，word，excel等文件格式的，而这类非结构化数据的查询则是数据库查询无法完成的。而Lucene通过其强大的索引体系很好的解决了问题。

此外，Lucene还具有以下几个优点：

索引文件格式独立于应用平台。Lucene自定义了一套以8字节为基础的索引文件格式，使得不同系统或者不同平台应用能够共享建立的索引文件；
在倒序索引的基础上实现了分块索引。能够针对新的文件建立小块的索引，提升索引速度，然后通过与原有索引的合并达到优化的目的；
优秀的面向对象设计，使得Lucene很容易学习和扩展，例如分词组件；
免费开源，适合各种平台，有各种语言的实现版本。例如C语言版本的：CLucene等等。

第二部分：Lucene的工作原理

Lucene的工作原理就是全文检索的基本原理。全文检索的原理可以查看这篇博客。下面这张图来自《Lucene in Action》是对Lucene工作原理的简明阐述。我把它划分为了左右两个部分以方便理解。

如上图所示，Lucene的工作原理可以简要的概括为两步：

第一步，切词入库，建立索引。Lucene对各类文档数据进行切词入库并建立索引，记录下各个词在各个文件中出现的次数和位置，生成独立的索引文件（索引库），这种索引称为倒序索引；

第二步，查询索引，返回结果。Lucene接收用户提交的查询，对查询进行分析然后去查询索引库，查询完成后返回结果给客户端。这两个过程中其实涉及了很多的细节，但为了方便理解我们先不涉及，后面会一一详细讲解。

第三部分：Lucene核心API

在使用Lucene前，我们先大致熟悉一下Lucene的几个核心类。

核心索引类：

public class IndexWriter
索引过程的中心组件，把它想象成一个可以对索引进行写操作的对象。
public abstract class Directory
Directory代表索引所在的位置，该抽象类有两个具体的子类实现。FSDirectory表示存储在文件系统的索引位置，RAMDirectory表示存储在内存中的索引的位置。
public abstract class Analyzer
分词组件。在建立索引前首先要对文档进行分词，Lucene默认有一些分词类的实现，自己实现的分词要继承该类。
public final class Document
Document类似于数据库中的一条记录，它由好几个字段Field组成。
public final class Field
Field用来描述文档的某个属性，例如文章的标题，内容等等。

核心搜索类：

public class IndexSeacher
用来在已经建好的索引上进行搜索操作
public final class Term
搜索的基本单元。Term对象有两个域组成。Term term = new Term("fieldName","queryWord");
public abstract class Query
抽象类，有很多具体实现类。该类主要作用把用户输入的查询语句转换为Lucene能够是别的query。
public final class Hits（TopDocs）
Hits是用来保存查询得到的结果的。最新版的Lucene中，TopDocs已代替了Hits。

第四部分：Lucene入门实例

第二节Lucene简介中有一张Lucene工作原理的图大家应该印象深刻。Lucene的实现原理其实就体现在这两个方面：

切词入库，建立索引；
查询索引，返回结果。

因此，使用Lucene去实现查询功能的过程也是按照上述过程进行的，这样理解了以后，写起来就很简单。

下面我们来看第一个简单的Lucene实现索引的例子（Lucene版本为4.10.1）。

public class LuceneDemo {

	public static void main(String[] args){
	
	    //RAMDirectory（内存路径）继承自Directory抽象类，另一个继承自该类的是FSDirectory(文件系统路径),Directory dir = FSDirectory.open(new File("此处写索引存储的位置，"));
	    Directory dir = new RAMDirectory();
	        
	    //SimpleAnalyzer继承自抽象类Analyzer，是分词组件，不同语言有不同的分词组件包，也可以自己定义实现该抽象类
	    Analyzer analyzer = new SimpleAnalyzer();
		
		//定义IndexWriterConfig
		IndexWriterConfig iwc = new IndexWriterConfig(Version.LATEST, analyzer);
		
		//定义document对象
		Document doc = new Document();
		
		try {
		
		    //第一步，切词入库，创建索引。定义IndexWriter对索引进行“写”操作
		    IndexWriter iw = new IndexWriter(dir, iwc);
		    
		    //Field对象的构造方法有四个参数，前两个参数表示要建立索引的name和value，name指索引的名称，value指要建立索引的“文档对象”，例如博客的标题、正文
		    //Field.Store有YES和NO两个值，表示是否存储该Field
		    //Field.Index有5个不同的取值,ANALYZED，ANALYZED_NO_NORMS，NOT_ANALYZED，NOT_ANALYZED_NO_NORMS，NO,根据不同情况选择是否分词
		    doc.add(new Field("title", "james bonde", Field.Store.YES, Field.Index.ANALYZED));
		    doc.add(new Field("content","He want to go to school next year.",Field.Store.YES,Field.Index.ANALYZED));
		    doc.add(new Field("doc","He will go to his mother's home.",Field.Store.YES,Field.Index.ANALYZED));
		    iw.addDocument(doc);
		    iw.close();
		    
		    //第二步，查询索引，返回结果
		    IndexReader ir = DirectoryReader.open(dir);
		    
		    //定义IndexSearcher
		    IndexSearcher is = new IndexSearcher(ir);
		    
		    //定义Term，new Term("doc", "home")，第一个值表示要搜索的域，第二个则表示搜索值
		    Term term = new Term("doc", "home");
		    
		    //TermQuery继承自Query抽象类，是Lucene最基本的查询
		    Query query = new TermQuery(term);
		    
		    //执行查询，返回TopDocs对象结果集
		    TopDocs td = is.search(query, 10);
		    
		    for(int i=0;i<td.scoreDocs.length;i++){
		    	Document d = is.doc(td.scoreDocs[i].doc);
		    	System.out.println("----------"+d.getField("title"));
		    	System.out.println("----------"+d.getField("content"));
		    	System.out.println("----------"+d.getField("doc"));
		    }
		    dir.close();
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}	
	}

}

Lucene官方关于Field的几个属性值的用法：点击这里

第五部分：索引的创建、修改和删除

首先，我们来看一个例子：开源中国社区每天都有人发布新的博客，同时也有很多人在进行修改和删除博客的操作。如果我们只更新博客数据而不更新对应的索引数据，这会带来那些问题呢？

新增的博客信息不能够及时被用户搜索到；
修改的博客信息查询时依然显示之前的内容；
删除的博客信息查询时存在但实际已被删除。

因此，为了提高系统搜索的准确性和实时性，我们在进行数据更新的同时，也会更新与之对应的索引数据，这样业务数据就可以保持与索引数据的一致，上面的几个问题也就随之解决了。

首先，我们来看新增索引的操作，这个比较简单，之前的例子里面已经有讲到：

//当新增博客时，索引也增量更新
public void addLuceneIndex(Blog blog){

    try {
        IndexWriter writer = new IndexWriter(directory, config);
        Document doc = new Document();
      
        //文章id，需要存储，查询结果的链接需要，但不需要检索
        doc.add(new Field("id",blog.getString("id"),Field.Store.YES,Field.Index.NO));
      
        //文章标题，需要存储也需要切词索引
        doc.add(new Field("title",blog.getString("title"),Field.Store.YES,Field.Index.ANALYZED));
      
        //文章内容一般会比较长，所以不需要存储，但需要切词索引
        doc.add(new Field("content",blog.getString("content"),Field.Store.NO,Field.Index.ANALYZED));
      
        //文章作者，需要存储，整体索引但不切词
        doc.add(new Field("author",blog.getString("author"),Field.Store.YES,Field.Index.NOT_ANALYZED));
        writer.addDocument(doc);
        writer.forceMerge(1);
        writer.commit();
  } catch (IOException e) {
      // TODO Auto-generated catch block
      e.printStackTrace();
  }
}

当博客被修改时，对应索引也执行更新操作，实际后台代码执行的是先删除再新增操作。

//索引更新操作
public void updateLuceneIndex(Blog blog){
    try {
        IndexWriter writer = new IndexWriter(directory, config);
        Document doc = new Document();
        writer.updateDocument(new Term("id", blog.getString("id")), doc);
        writer.forceMerge(1);
        writer.commit();
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }
}

当文章删除时，对应索引也执行删除操作

//索引删除操作
public void delLuceneIndex(Blog blog){
    try {
        indexWriter.deleteDocuments(new Term("id", blog.getString("id")));  // Document删除
    } catch (IOException e) {
        e.printStackTrace();
    }
}

最后说明一下，索引文件的增、删、改在实际应用过程中也是有很多策略的。比如对于搜索实时性要求比较高的系统，可以采取实时更新的策略，在更新记录时同时更新索引；如果系统对搜索的实时性要求不高，且服务器资源有限，可以设置一个定时任务，把白天更新的记录都标记出来，在凌晨服务器空闲的时候批量更新。总之，可以根据自己的需要去灵活的应用。

第六部分：分词（切词）

分词也叫作切词，是指把文档的内容按照一定的规则切分成一个个独立的词语，通俗的说就是把句子切分成词语。分词是影响Lucene查询效率和查询准确率的关键因素。所有的分词器都继承自Lucene的Analyzer，今天介绍最流行和通用的中文分词器IKAnalyzer的使用。

Lucene默认实现的有英文分词。英文分词相对简单，主要是对每个单词的单复数，时态等做转换即可。而中文分词相对更复杂一些。因为中文的词库本身就非常庞杂，同一个句子可能有好几种分词法，不同的分词法可能就会导致不同的查询结果。IKAnalyzer为我们解决以上问题提供了很好的方案，它允许我们可以个性化定义扩展词库，而且分词效率极高。

下面我们来看下IKAnalyzer的配置文件IKAnalyzer.cfg.xml，把它放置到源文件根目录下面，系统会自动加载进来。

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  
<properties>  
	<comment>IKAnalyzer扩展配置</comment>
	
	<!--用户可以在这里配置自己的扩展字典-->
	<entry key="ext_dict">
		/com/jfinal/lucene/ext.dic; 
		/com/jfinal/lucene/ft_main2012.dic; 
		/com/jfinal/lucene/ft_quantifier.dic; 
	</entry>
	
	<!--用户可以在这里配置自己的扩展停止词字典-->
	<entry key="ext_stopwords">
		/com/jfinal/lucene/stop.dic
	</entry>
	
</properties>

ext.dic用来定义自己的扩展词库。比如特定的地名，人名，就相当于告诉分词器如果遇到这些词汇就把它们做单独分词；

stop.dic用来定义自己的扩展停止词字典，停止词就是指那些最普通的，没有特定含义的词。比如英语里面的a ，the，汉语里面的了，又等等。

把IKAnalyzer的jar包拷贝到lib下，使用时新建对象即可。

Analyzer analyzer = new IKAnalyzer()

使用AI python实现将前端angularjs工程转换成vue工程案例银行金融科技前端人工智能 python
以下是一个结合Python和AI技术实现AngularJS到Vue工程迁移的完整案例，包含关键转换策略和代码实现：案例背景目标：将使用AngularJS1.x的电商后台管理系统转换为Vue3工程，主要转换以下部分：模板语法控制器逻辑服务依赖路由配置状态管理原始AngularJS代码片段：javascript//app.jsangular.module('app',['ui.router']).co
python爬虫 Selenium库安装与使用范哥来了 python 爬虫 selenium
Selenium是一个强大的自动化测试工具，它也可以用来进行网页抓取。与传统的请求库（如requests）不同，Selenium可以模拟真实用户的行为，比如点击按钮、填写表单等，这对于那些依赖于JavaScript动态加载内容的网站来说非常有用。安装Selenium首先确保你的环境中已经安装了Python和pip。然后通过pip安装Selenium：pipinstallselenium如果你使用的
如何针对大Excel做文件读取？ F_windy excel
针对大Excel文件（如超过百万行）的读取，传统的一次性加载到内存的方式会导致内存溢出（OOM），需采用流式读取（Streaming）或分块读取（Chunk）的策略。以下是具体方案及优化建议：一、核心解决方案1.使用ApachePOI的SAX模式（事件驱动）适用场景：处理.xlsx文件（不支持.xls），逐行解析避免内存溢出。代码示例（Java）：importorg.apache.poi.open
Java常用API EmbodiedTech Java架构栈 java dubbo 开发语言
一、今日内容介绍、API概述常用API（全称是ApplicationProgramInterface应用程序接口），说人话就是：别人写好的一些程序，给咱们程序员直接拿去调用。Java官方其实已经给我们写好了很多很多类，每一个类中又提供了一系列方法来解决与这个类相关的问题。比如String类，表示字符串，提供的方法全都是对字符串操作的。比如ArrayList类，表示一个容器，提供的方法都是对容器中的
超越传统！wangEditor编辑器如何实现excel、ppt、pdf及word一键导入？ 2501_90699780 编辑器 excel powerpoint umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片
要求：开源，免费，技术支持编辑器：wangEditor前端：vue2,vue3,vue-cli,html5后端：java,jsp,springboot,asp.net,php,asp,.netcore,.netmvc,.netform群体：学生,个人用户,外包,自由职业者,中小型网站,博客,场景：数字门户,数字中台,站群,内网，外网，信创国产化环境，web截屏行业：医疗，教育，建筑，政府，党政，国
并发编程面试题四 2301_76231794 面试
1、ReentrantLock和synchronized的区别及使用的场景synchronized关键字（是悲观锁）：自动管理：synchronized是Java提供的一种内置锁机制，使用简单，不需要显式地获取和释放锁。可重入性：同一个线程可以多次获取同一个锁而不被阻塞。不可中断：一旦一个线程开始等待获取锁，它不能被其他线程中断。内存可见性：synchronized块或方法提供了内存可见性的保证，
提到一个项目的“验证LOV”属性？提到lov和list项目有什么区别？思维导图代码示例（java 架构) 用心去追梦 list java 架构
验证LOV（ListofValues）属性在OracleForms中，LOV(ListofValues)是一种用于显示可供选择的值列表的组件。它通常与字段或项关联，允许用户从预定义的选项列表中选择一个值，而不是手动输入。验证LOV属性确保用户只能从LOV提供的选项中选择值，从而增强了数据输入的准确性和一致性。验证LOV属性定义：当设置为“是”时，表示该字段必须从LOV中选择值；如果用户尝试输入不在
Java8中如何使用Stream对列表进行去重？上官美丽 java java
在现代Java开发中，Java8引入的StreamAPI给我们带来了许多便利，尤其是在处理集合数据时。去重是数据处理中一个常见的需求，今天我们就来聊聊如何使用Stream对列表进行去重。这个过程其实并不复杂，只要掌握一些基本的操作，就能轻松实现。首先，大家可能会问，什么是Stream？Stream是一种对集合的抽象，可以让我们以声明性方式处理集合数据，比如过滤、映射、归约等。Stream的一个重要
Java 大视界 -- 基于 Java 的大数据实时流处理中的窗口操作与时间语义详解（135）青云交大数据新视界 Java 大视界 java 大数据大数据实时流处理窗口操作时间语义滚动窗口滑动窗口
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
Redis查看所有key的命令 abckingaa Bee DB redis 数据库 database
Redis查看所有key的命令keys*启动了Redis服务器和客户端,在客户端输入keys*即可(若需要密码登录,先输入密码)Bee，互联网新时代的JavaORM工具，更快、更简单、更自动，开发速度快，运行快，更智能！Bee让程序员/软件工程师，从手工编码中解放出来，Bee更适合智能软件制造时代！十分钟即可入门!立志做最懂用户的软件!
深入解析Java跨平台原理 KBkongbaiKB java 开发语言
一、操作系统屏障的本质挑战源代码编译方式直接编译为机器码Windows的可执行文件.exeLinux的可执行文件.elfmacOS的可执行文件.machJava独特的中间格式字节码文件.classJVM虚拟机1.1传统语言的平台困局语言类型编译方式执行依赖跨平台能力C/C++直接生成机器码特定操作系统❌不可直接移植Python解释型执行Python解释器✅但性能较低Java字节码中间件JVM虚拟机
linux zk服务关闭_linux – 如何在Ubuntu上停止ZooKeeper？童广 linux zk服务关闭
我按照建议here在ubuntu14.04上安装了zookeeperd：不幸的是,这个过程在某种程度上是不可停止的.我甚至试过杀了-9user@node1:/opt/zookeeper-3.4.6$ps-ef|grepzookeeperzookeep+40081801:07?00:00:00/usr/bin/java-cp/etc/zookeeper/conf:/usr/share/java/jl
ubuntu20.04 zookeeper安装 Yue9v zookeeper linux 分布式
安装ZooKeeper之前，请确保你已经安装了Java，因为ZooKeeper需要Java运行环境。java安装sudoapt-getupdatesudoapt-get-yinstallopenjdk-11-jdkjava--version设置JAVA_HOME环境变量gedit~/.bashrc添加如下行来设置JAVA_HOME：exportJAVA_HOME=/usr/lib/jvm/java
一、【脚本命令】build_chain.sh 区块链节点生成(ubuntu18.04/FISCO BCOS)-JAVA kknacl FISCO BCOS 金联盟区块链区块链 java ubuntu
目录环境依赖1、下载【build_chain.sh】2、脚本命令参数3、生成区块链配置文件ip_list:4、调用build_chain.sh脚本构建区块链节点：5、启动节点6、查看节点进程总结：环境依赖名称版本FISCOBCOS2.0openssl>=1.0.2curl未知1、下载【build_chain.sh】执行命令，安装openssl、curl（如果系统上已经安装好了，可以不用安装）apt
华为OD机试真题----日志采集(java) 努力努力再努力呐算法华为od 算法数据结构 java
华为OD机试真题中的“日志采集”是一个重要的题目，它主要考察的是如何在满足特定条件下，优化日志上报策略以获取最大积分。以下是对该题目的详细解析：一、题目背景日志采集是运维系统的核心组件，日志是按行生成，每行记做一条，由采集系统分批上报。上报策略的设计需要平衡多个因素：上报频率、服务端压力、用户体验以及避免超时失败。二、上报策略根据题目描述，项目组设计了以下上报策略：奖励机制：每成功上报一条日志，奖
docker 安装elasticsearch kibana，设置密码 biguojun docker elasticsearch kibana
安装elasticsearchdockerpulldocker.elastic.co/elasticsearch/elasticsearch:7.17.28dockerrun-d--namedocker-es-e"ES_JAVA_OPTS=-Xms512m-Xmx512m"-e"discovery.type=single-node"-vD:\docker\es\data:/usr/share/el
在Ubuntu上安装MEAN Stack的4个步骤 Kaede6 技术文章-Linux服务部署 ubuntu linux 运维
在Ubuntu上安装MEANStack的4个步骤为：1.安装MEAN；2.安装MongoDB；3.安装NodeJS，Git和NPM；4.安装剩余的依赖项。什么是MEANStack？平均堆栈一直在很大程度上升高为基于稳健的基于JavaScript的开发堆栈。名称的意思是指其组件;MongoDB，ExpressJS，Angularjs和NodeJS。第1步：安装MEAN对于此安装，我们将在本指南中使用
TypeScript语言的网络编程俞嫦曦包罗万象 golang 开发语言后端
TypeScript语言的网络编程引言随着现代网络应用程序的不断发展，对编程语言的需求也在不断提高。JavaScript作为前端开发的主要语言，凭借其动态特性和广泛的应用，成为了Web开发的中坚力量。而TypeScript作为JavaScript的超集，逐渐在开发社区中获得了越来越多的关注。其静态类型的特性使得开发者在编写大型应用程序时能够更加得心应手。尤其是在网络编程方面，TypeScript展
大疆无人机航点飞行KMZ文件提取航点坐标程序员南飞无人机 macos java spring
一、需要插件jaxenjaxen1.1.4dom4jdom4j1.6.1二、KMZ解压成KMLpackagecom.dji.sample.common.util;importorg.dom4j.Document;importorg.dom4j.io.SAXReader;importjava.io.File;importjava.io.FileInputStream;importjava.io.In
Java删除特定下标数组元素程序员南飞 Java 数组删除元素字符串遍历
15:16:06publicstaticvoidmain(String[]args){//数组创建以后长度不变，定义新的数组添加长度//删除特定下标数组String[]array1=newString[]{"a","b","b","c","d"};//删除第二个bintkey=2;String[]array2=newString[array1.length-1];for(inti=0;i=key)
深度解析ECharts.js：构建现代化数据可视化的利器斯~内克 WebGL echarts 信息可视化前端
引言：数据可视化的新时代挑战在数字化转型浪潮中，数据可视化已成为企业决策和用户体验的关键环节。面对海量数据的呈现需求，传统表格已无法满足用户对直观洞察的渴求。作为百度开源的JavaScript可视化库，ECharts.js凭借其强大的功能和灵活的扩展性，正在成为前端开发者的首选工具。本文将从核心技术解析、实践指南到性能优化，带您全面掌握这个可视化利器。一、ECharts核心技术架构剖析1.1分层渲
Java基础知识三（运算符）浪迹天涯的贺 Java基础系列上 java 开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档前言更新第三篇文章，这篇文章讲一下Java的运算符相关的知识，对于Java中所有的运算符的种类和内容做一个总结在Java编程中，运算符（Operators）是执行特定操作的符号，它们用于操作变量和数据。本文将详细介绍Java中的运算符种类、用法以及其作用。1.算术运算符（ArithmeticOperators）算术运算符用于执行基本的
JAVA：网络编程 Socket 的技术指南拾荒的小海螺 JAVA java 网络开发语言
1、简述JavaNIO（Non-blockingI/O）是一种基于通道（Channel）和缓冲区（Buffer）的I/O模型，支持非阻塞通信和多路复用，适合高并发场景。相比传统的阻塞I/O（BIO），NIO更高效，因为它避免了线程被阻塞，降低了系统资源消耗。代码样例：https://gitee.com/lhdxhl/springboot-example.git核心组件：Channel（通道）：数据
三分钟让你搞懂云计算中的CDN是什么？云上的阿七云计算
随着互联网的快速发展，网站的访问速度和稳定性越来越受到重视。而在众多提升网站性能的技术中，CDN（内容分发网络）无疑是一个非常重要的工具。今天，我们就来聊聊云计算中的CDN是什么，以及它是如何为网站带来显著好处的。CDN是什么？CDN，全称ContentDeliveryNetwork，翻译过来就是“内容分发网络”。它是一种分布式的网络架构，通过将网站的静态资源（如图片、视频、JavaScript文
pyspark 遇到**Py4JJavaError** Traceback (most recent call last) ~\AppData\ 2pi spark python
Py4JJavaErrorTraceback(mostrecentcalllast)~\AppData\Local\Temp/ipykernel_22732/1401292359.pyin---->1feat_df.show(5,vertical=True)D:\Anaconda3\envs\recall-service-cp4\lib\site-packages\pyspark\sql\data
MyBatis-Plus整合SpringBoot及使用 kkk1622245 mybatis spring boot 后端
MyBatis-Plus是一个为简化开发而生的MyBatis增强工具，在Java开发领域广受欢迎。它继承了MyBatis的所有特性，并且通过引入强大的功能增强，极大减少了开发者的工作量。对于使用SpringBoot开发的项目，整合MyBatis-Plus能够使数据访问层的代码更加简洁，增强开发效率。在本文中，我们将详细探讨如何在SpringBoot项目中整合MyBatis-Plus并简要介绍其使用
xxl-job 执行器端服务器的简单搭建一切随缘～～～ xxl-job xxljob
xxl-job执行器端服务器的简单搭建先讲一下我们平时怎么使用xxl-job的，再引出背后是如何实现的。我觉得对于一款成功的框架来说，好用，是非常重要的一个特性。框架要便于接入，便于使用。对于用户来说，不要有太多的使用成本，最好是能够开箱即用，快速上手的。Java为什么这么流行呢？因为它的生态好。说是生态好，其实就是Spring那一套嘛，后面又有了SpringBoot。你想要使用什么组件，市面上基
3.14学习总结 2402_88131930 学习
今天完成了几道关于二叉树的算法题关于二叉树的最小最大深度和数据流中的第k大元素，用到优先队列，学习了有关java的基础知识，学习了双指针法。
基于 SSM 架构的 JAVA 网络直播带货查询系统设计与 JSP 实践成果 2401_85702623 架构 java 开发语言
第二章关键技术的研究2.1JSP技术介绍JSP技术本身是一种脚本语言，但它的功能是十分强大的，因为它可以使用所有的JAVA类。当它与JavaBeans类进行结合时，它可以使显示逻辑和内容分开，这就极大的方便了用户的需求。JavaBeans可以对JSP技术的程序进行扩展，从而形成新的应用程序，而且JavaBeans的代码可以重复使用，所以就便于对程序进行维护。JavaBean组件有内部的接口，可以帮
springboot毕设电脑销售管理系统程序+论文真纯Django毕设程序 spring boot 课程设计后端
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景随着信息技术的飞速发展和普及，电脑已经成为现代生活和工作中不可或缺的重要工具。电脑销售行业也随之迎来了前所未有的发展机遇，但同时也面临着激烈的市场竞争和不断变化的客户需求。传统的销售管理模式已难以满足当前市场的快速响应和精细化管理要求。因此，开发一套高效、便捷、全面的电脑销售管
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa

Lucene学习总结

你可能感兴趣的:(java,Lucene,全文检索)