pavel

Lucene-2.2.0 源代码阅读学习(31)

关于前缀查询PrefixQuery(前缀查询)。

准备工作就是为指定的数据源文件建立索引。这里，我使用了ThesaurusAnalyzer分析器，该分析器有自己特定的词库，这个分词组件可以从网上下载。

PrefixQuery其实就是指定一个词条的前缀，不如以前缀“文件”作为前缀的词条有很多：文件系统、文件管理、文件类型等等。但，是在你要检索一个有指定的前缀构成的词条(只有一个前最也是一个词条)时，必须保证你在建立索引的时候，也就是分词生成的词条要有具有这个前缀构成的词条，否则什么也检索不出来。

Lucene中，指定某个前缀，检索过程中会以该前缀作为一个词条进行检索，比如“文件”前缀，如果词条文件中包含“文件”这个词条，而且有一个文件中只有一个句子：“我们要安全地管理好自己的文件。”使用PrefixQuery是也是可以检索出该文件的。

当然了，可以使用BooleanQuery对若干个查询子句进行组合，子句可以是TermQuery子句，可以是PrefixQuery子句，实现复杂查询。

先做个简单的例子，使用一下PrefixQuery。

测试主函数如下所示：

package org.apache.lucene.shirdrn.main;

import java.io.IOException;
import java.util.Date;
import java.util.Iterator;

import org.apache.lucene.document.Field;
import org.apache.lucene.index.CorruptIndexException;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.Hit;
import org.apache.lucene.search.Hits;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.PrefixQuery;
import org.apache.lucene.search.Query;

public class PrefixQuerySearcher {

public static void main(String[] args) {

   String indexPath = "E:\\Lucene\\myindex";
   try {
    IndexSearcher searcher = new IndexSearcher(indexPath);

    String keywordPrefix = "文件";    //   就以“文件”作为前缀
    Term prefixTerm = new Term("contents",keywordPrefix);
    Query prefixQuery = new PrefixQuery(prefixTerm);
    Date startTime = new Date();
    Hits hits = searcher.search(prefixQuery);
    Iterator it = hits.iterator();
    System.out.println("********************************************************************");
    while(it.hasNext()){
     Hit hit = (Hit)it.next();
     System.out.println("Hit的ID 为： "+hit.getId());
     System.out.println("Hit的score 为： "+hit.getScore());
     System.out.println("Hit的boost 为： "+hit.getBoost());
     System.out.println("Hit的toString 为： "+hit.toString());
     System.out.println("Hit的Dcoment 为： "+hit.getDocument());
     System.out.println("Hit的Dcoment 的 Fields 为： "+hit.getDocument().getFields());
     for(int i=0;i<hit.getDocument().getFields().size();i++){
      Field field = (Field)hit.getDocument().getFields().get(i);
      System.out.println("      -------------------------------------------------------------");
      System.out.println("      Field的Name为： "+field.name());
      System.out.println("      Field的stringValue为： "+field.stringValue());
     }
     System.out.println("********************************************************************");
    }
    System.out.println("满足指定前缀的Hits长度为： "+hits.length());
    Date finishTime = new Date();
    long timeOfSearch = finishTime.getTime() - startTime.getTime();
    System.out.println("本次搜索所用的时间为 "+timeOfSearch+" ms");
   } catch (CorruptIndexException e) {
    e.printStackTrace();
   } catch (IOException e) {
    e.printStackTrace();
   }
}
}

测试结果输出如下所示：

********************************************************************
Hit的ID 为： 41
Hit的score 为： 0.3409751
Hit的boost 为： 1.0
Hit的toString 为： Hit<org.apache.lucene.search.Hits@1a05308 [0] resolved>
Hit的Dcoment 为： Document<stored/uncompressed,indexed<path:E:\Lucene\txt1\mytxt\Update.txt> stored/uncompressed,indexed<modified:200707050028>>
Hit的Dcoment 的 Fields 为： [stored/uncompressed,indexed<path:E:\Lucene\txt1\mytxt\Update.txt>, stored/uncompressed,indexed<modified:200707050028>]
      -------------------------------------------------------------
      Field的Name为： path
      Field的stringValue为： E:\Lucene\txt1\mytxt\Update.txt
      -------------------------------------------------------------
      Field的Name为： modified
      Field的stringValue为： 200707050028
********************************************************************
Hit的ID 为： 46
Hit的score 为： 0.3043366
Hit的boost 为： 1.0
Hit的toString 为： Hit<org.apache.lucene.search.Hits@1a05308 [1] resolved>
Hit的Dcoment 为： Document<stored/uncompressed,indexed<path:E:\Lucene\txt1\mytxt\使用技巧集萃.txt> stored/uncompressed,indexed<modified:200511210413>>
Hit的Dcoment 的 Fields 为： [stored/uncompressed,indexed<path:E:\Lucene\txt1\mytxt\使用技巧集萃.txt>, stored/uncompressed,indexed<modified:200511210413>]
      -------------------------------------------------------------
      Field的Name为： path
      Field的stringValue为： E:\Lucene\txt1\mytxt\使用技巧集萃.txt
      -------------------------------------------------------------
      Field的Name为： modified
      Field的stringValue为： 200511210413
********************************************************************
Hit的ID 为： 24
Hit的score 为： 0.25827435
Hit的boost 为： 1.0
Hit的toString 为： Hit<org.apache.lucene.search.Hits@1a05308 [2] resolved>
Hit的Dcoment 为： Document<stored/uncompressed,indexed<path:E:\Lucene\txt1\mytxt\FAQ.txt> stored/uncompressed,indexed<modified:200604130754>>
Hit的Dcoment 的 Fields 为： [stored/uncompressed,indexed<path:E:\Lucene\txt1\mytxt\FAQ.txt>, stored/uncompressed,indexed<modified:200604130754>]
      -------------------------------------------------------------
      Field的Name为： path
      Field的stringValue为： E:\Lucene\txt1\mytxt\FAQ.txt
      -------------------------------------------------------------
      Field的Name为： modified
      Field的stringValue为： 200604130754
********************************************************************
Hit的ID 为： 44
Hit的score 为： 0.23094007
Hit的boost 为： 1.0
Hit的toString 为： Hit<org.apache.lucene.search.Hits@1a05308 [3] resolved>
Hit的Dcoment 为： Document<stored/uncompressed,indexed<path:E:\Lucene\txt1\mytxt\Visual Studio 2005注册升级.txt> stored/uncompressed,indexed<modified:200801300512>>
Hit的Dcoment 的 Fields 为： [stored/uncompressed,indexed<path:E:\Lucene\txt1\mytxt\Visual Studio 2005注册升级.txt>, stored/uncompressed,indexed<modified:200801300512>]
      -------------------------------------------------------------
      Field的Name为： path
      Field的stringValue为： E:\Lucene\txt1\mytxt\Visual Studio 2005注册升级.txt
      -------------------------------------------------------------
      Field的Name为： modified
      Field的stringValue为： 200801300512
********************************************************************
Hit的ID 为： 57
Hit的score 为： 0.16743648
Hit的boost 为： 1.0
Hit的toString 为： Hit<org.apache.lucene.search.Hits@1a05308 [4] resolved>
Hit的Dcoment 为： Document<stored/uncompressed,indexed<path:E:\Lucene\txt1\mytxt\新建文本文档.txt> stored/uncompressed,indexed<modified:200710270258>>
Hit的Dcoment 的 Fields 为： [stored/uncompressed,indexed<path:E:\Lucene\txt1\mytxt\新建文本文档.txt>, stored/uncompressed,indexed<modified:200710270258>]
      -------------------------------------------------------------
      Field的Name为： path
      Field的stringValue为： E:\Lucene\txt1\mytxt\新建文本文档.txt
      -------------------------------------------------------------
      Field的Name为： modified
      Field的stringValue为： 200710270258
********************************************************************
Hit的ID 为： 12
Hit的score 为： 0.14527147
Hit的boost 为： 1.0
Hit的toString 为： Hit<org.apache.lucene.search.Hits@1a05308 [5] resolved>
Hit的Dcoment 为： Document<stored/uncompressed,indexed<path:E:\Lucene\txt1\mytxt\CustomKeyInfo.txt> stored/uncompressed,indexed<modified:200406041814>>
Hit的Dcoment 的 Fields 为： [stored/uncompressed,indexed<path:E:\Lucene\txt1\mytxt\CustomKeyInfo.txt>, stored/uncompressed,indexed<modified:200406041814>]
      -------------------------------------------------------------
      Field的Name为： path
      Field的stringValue为： E:\Lucene\txt1\mytxt\CustomKeyInfo.txt
      -------------------------------------------------------------
      Field的Name为： modified
      Field的stringValue为： 200406041814
********************************************************************
Hit的ID 为： 63
Hit的score 为： 0.091877736
Hit的boost 为： 1.0
Hit的toString 为： Hit<org.apache.lucene.search.Hits@1a05308 [6] resolved>
Hit的Dcoment 为： Document<stored/uncompressed,indexed<path:E:\Lucene\txt1\疑问即时记录.txt> stored/uncompressed,indexed<modified:200711141408>>
Hit的Dcoment 的 Fields 为： [stored/uncompressed,indexed<path:E:\Lucene\txt1\疑问即时记录.txt>, stored/uncompressed,indexed<modified:200711141408>]
      -------------------------------------------------------------
      Field的Name为： path
      Field的stringValue为： E:\Lucene\txt1\疑问即时记录.txt
      -------------------------------------------------------------
      Field的Name为： modified
      Field的stringValue为： 200711141408
********************************************************************
Hit的ID 为： 59
Hit的score 为： 0.08039302
Hit的boost 为： 1.0
Hit的toString 为： Hit<org.apache.lucene.search.Hits@1a05308 [7] resolved>
Hit的Dcoment 为： Document<stored/uncompressed,indexed<path:E:\Lucene\txt1\mytxt\汉化说明.txt> stored/uncompressed,indexed<modified:200708210247>>
Hit的Dcoment 的 Fields 为： [stored/uncompressed,indexed<path:E:\Lucene\txt1\mytxt\汉化说明.txt>, stored/uncompressed,indexed<modified:200708210247>]
      -------------------------------------------------------------
      Field的Name为： path
      Field的stringValue为： E:\Lucene\txt1\mytxt\汉化说明.txt
      -------------------------------------------------------------
      Field的Name为： modified
      Field的stringValue为： 200708210247
********************************************************************
Hit的ID 为： 14
Hit的score 为： 0.020302303
Hit的boost 为： 1.0
Hit的toString 为： Hit<org.apache.lucene.search.Hits@1a05308 [8] resolved>
Hit的Dcoment 为： Document<stored/uncompressed,indexed<path:E:\Lucene\txt1\mytxt\CustomKeysSample.txt> stored/uncompressed,indexed<modified:200610100451>>
Hit的Dcoment 的 Fields 为： [stored/uncompressed,indexed<path:E:\Lucene\txt1\mytxt\CustomKeysSample.txt>, stored/uncompressed,indexed<modified:200610100451>]
      -------------------------------------------------------------
      Field的Name为： path
      Field的stringValue为： E:\Lucene\txt1\mytxt\CustomKeysSample.txt
      -------------------------------------------------------------
      Field的Name为： modified
      Field的stringValue为： 200610100451
********************************************************************
满足指定前缀的Hits长度为： 9
本次搜索所用的时间为 297 ms

可以看出，包含前缀“文件”的查询结果，一共检索出9项符合条件。

关于以“文件”作为前缀(包含前缀“文件”)，在分析器ThesaurusAnalyzer分词组件的词库中具有下面的一些词条：

文件
文件匯編
文件名
文件夹
文件夾
文件尾
文件汇编
文件精神

假如有这样一种需求：想要检索全部以“文件”作为前缀的词条，而不想要单独出现的以“文件”作为词条的结果。

这时，可以指定一个TermQuery子句，再使用BooleanQuery实现。

在上面的测试主函数的基础上，添加如下代码：

    String keyword = "文件";
    Term term = new Term("contents",keyword);
    Query tQuery = new TermQuery(term);

    BooleanQuery bQuery = new BooleanQuery();
    bQuery.add(tQuery,BooleanClause.Occur.MUST_NOT);
    bQuery.add(prefixQuery,BooleanClause.Occur.MUST);

修改Hits hits = searcher.search(prefixQuery);为：

Hits hits = searcher.search(bQuery);

由于不包含单独的以“文件”作为词条的结果，所以使用MUST_NOT逻辑非运算符。

执行查询后，只匹配出一项，如下所示：

********************************************************************
Hit的ID 为： 44
Hit的score 为： 0.23393866
Hit的boost 为： 1.0
Hit的toString 为： Hit<org.apache.lucene.search.Hits@ab50cd [0] resolved>
Hit的Dcoment 为： Document<stored/uncompressed,indexed<path:E:\Lucene\txt1\mytxt\Visual Studio 2005注册升级.txt> stored/uncompressed,indexed<modified:200801300512>>
Hit的Dcoment 的 Fields 为： [stored/uncompressed,indexed<path:E:\Lucene\txt1\mytxt\Visual Studio 2005注册升级.txt>, stored/uncompressed,indexed<modified:200801300512>]
      -------------------------------------------------------------
      Field的Name为： path
      Field的stringValue为： E:\Lucene\txt1\mytxt\Visual Studio 2005注册升级.txt
      -------------------------------------------------------------
      Field的Name为： modified
      Field的stringValue为： 200801300512
********************************************************************
满足指定前缀的Hits长度为： 1
本次搜索所用的时间为 187 ms

现在看一下PrefixQuery实现的源代码。在PrefixQuery中，只给出了一种构造方法：

private Term prefix;
public PrefixQuery(Term prefix) {
this.prefix = prefix;
}

它是通过一个Term作为参数构造的，非常容易掌握。

在PrefixQuery中有一个重要的rewrite()方法：

public Query rewrite(IndexReader reader) throws IOException {
    BooleanQuery query = new BooleanQuery(true);
    TermEnum enumerator = reader.terms(prefix);
    try {
      String prefixText = prefix.text();
      String prefixField = prefix.field();
      do {
        Term term = enumerator.term();
        if (term != null &&
            term.text().startsWith(prefixText) &&
            term.field() == prefixField)
        {
          TermQuery tq = new TermQuery(term);
          tq.setBoost(getBoost());
          query.add(tq, BooleanClause.Occur.SHOULD);      // 构造了一个BooleanQuery，向其中添加子句，个子句是逻辑或运算
        } else {
          break;
        }
      } while (enumerator.next());
    } finally {
      enumerator.close();
    }
    return query;
}

该方法通过打开一个IndexReader输入流，使用IndexReader的terms()方法获取到，以“给定前缀构造的词条”的所有词条。然后，以返回的这些词条构造多个TermQuery子句，再将这些子句添加到BooleanQuery中，返回一个新的Query(就是BooleanQuery)，这个BooleanQuery中的各个子句是逻辑或的关系，最后使用这个包含了多个子句的BooleanQuery实现复杂查询。

实际上，执行了多个TermQuery，然后将得到的结果集做SHOULD运算。

Lucene中，允许最大的子句上限是1024个，如果超过这个上限就会抛出异常。使用PrefixQuery的主要思想就是向一个BooleanQuery中添加多个参与SHOULD逻辑运算的TermQuery子句，感觉这里面有一个效率问题：对每个子句都进行执行的时候，如果子句的数量小效率还是不错，但是，如果有1000000个甚至更多的TermQuery子句被添加到BooleanQuery中，结果不会很乐观，而且需要重新设定Lucene中默认的最大子句上限，效率应该不能很好。

数据湖和Apache Iceberg，Apache Hudi，Delta Lake 西土城计划 apache big data 大数据
1什么是数据湖？数据湖这个词目前已经流行开来，逐步被数据相关的从业者接受，可能还有很多人不太清楚它和Hadoop，Hive，Spark这些大数据系统的区别，简单说数据湖是个业务概念，主要是为了区别传统数仓这个概念的（传统数仓的定义：datawarehouse，是用于报告和数据分析的系统，被认为是商业智能的核心组件）。为什么说是“传统数仓”，因为Hadoop于2006年诞生至今已有10多年了，在这期
Apache Iceberg 解析，一文了解Iceberg定义、应用及未来发展镜舟科技 apache Iceberg StarRocks 元数据数据湖湖仓一体数据分析
什么是Iceberg？ApacheIceberg是一种开源的表格式（TableFormat），专为超大规模数据分析场景设计，通过标准化数据存储规范与访问协议，解决了传统数据湖在元数据管理、事务控制、查询性能等方面的核心痛点。以下从六个维度全面解析其技术原理、应用场景与最佳实践。一、为什么需要新的表格式？传统数据湖面临的痛点数据治理与管理能力不足：传统数据湖在数据治理和管理方面存在明显短板，缺乏严格
Shiro qq_41701460 java
Shiro简介Shiro概述ApacheShiro是一种功能强大且易于使用的Java安全框架，它执行身份验证、授权、加密和会话管理，可用于保护任何应用程序的安全。Shiro提供了应用程序安全性API来执行以下方面：1）身份验证：证明用户身份，通常称为用户"登录"；2）授权：访问控制；3）密码术：保护或隐藏数据以防窥视；4）会话管理：每个用户的时间敏感状态。上述四个方面也被称为应用程序安全性的四个基
Java动态生成Word终极指南：poi-tl与Aspose.Words性能对比及选型建议天机️灵韵开源项目编程语言 vscode Java word 模板
在Java中实现复杂文档生成（如合同、报表）时，poi-tl、Aspose.Words和docx4j是三个主流的模板技术方案。以下是它们的核心对比和选型建议：1.poi-tl（基于ApachePOI的模板引擎）定位：轻量级开源库，基于ApachePOI封装，简化模板操作。核心优势：模板语法灵活：通过{{@var}}、{{?section}}等标签实现文本、表格、列表、图片的动态插入。代码简洁：相比
springmvc配置dubbo两种方式饿饿好饿 java dubbo java-zookeeper zookeeper linux redis
springmvc配置dubbo两种方式dubbo+zookeeper在读本文前建议先掌握dubbo的基本知识dubbo官网地址：http://dubbo.apache.org/zh/主要步骤：将服务提供者注册到注册中心，暴露服务，消费者引用准备1、在服务器或者本地搭建好zookeeper，启动zoookeeper2、在服务器或者本地搭建好dubbo-admin，启动dubboXML方式配置配置提
WX小程序 Angelyb Java后端小程序
下载packagecom.sky.utils;importcom.alibaba.fastjson.JSONObject;importorg.apache.http.NameValuePair;importorg.apache.http.client.config.RequestConfig;importorg.apache.http.client.entity.UrlEncodedFormEnt
Invalid byte tag in constant pool: 19 Johnny_Cheung 采坑记录 java eclipse jvm
目前在用eclipse启动老项目的时候遇到一个报错，导致tomcat不来，报org.aspectj.apache.bcel.classfile.ClassFormatException:Invalidbytetaginconstantpool:19atorg.aspectj.apache.bcel.classfile.Constant.readConstant(Constant.java:133)
Spring Cloud Stream：打造强大的微服务事件驱动架构 Java爱好狂. java 开发语言
随着云计算、微服务和大数据技术的快速发展，构建可扩展、高性能和弹性的应用程序变得越来越重要。为了满足这些要求，许多开发人员转向了事件驱动架构，它允许应用程序通过基于事件的方式相互通信，从而提高了系统的响应速度和伸缩性。在这个背景下，SpringCloudStream应运而生，它是一个用于构建基于事件驱动的微服务应用程序的框架，可以与现有的消息中间件（如ApacheKafka和RabbitMQ）无缝
基于Zookeeper的微服务配置管理与灰度发布实战指南 Vic10101 zookeeper 微服务分布式
引言在分布式系统中，服务注册与发现、配置管理以及平滑发布是保障系统高可用性的关键。ApacheZookeeper作为一款成熟的分布式协调服务，结合SpringCloud生态，能够有效解决这些挑战。本文将深入探讨Zookeeper的核心配置参数、服务注册机制，并通过一个电商系统的灰度发布案例，展示如何实现流量的平滑迁移。第一部分：Zookeeper核心配置解析1.1基础连接配置spring.clou
1.Kafka介绍小黑要上天 Kafka kafka 分布式
1.关于KafkaKafka是由Apache软件基金会开发的一个开源流处理平台，由Scala和Java编写。Kafka是一种高吞吐量的分布式发布订阅消息系统，它可以处理消费组在网站中的所有动作流数据。这种动作(网页浏览，搜索，注册、订单和其它用户的行动)是在现代网络上的许多社会功能的一个关键因素。这些数据通常是由于吞吐量的要求，通过处理日志和日志聚合来解决。提到Kafka(2.8+版本之前，需使用
Kafka 4.0 发布：KRaft 替代 Zookeeper、新一代重平衡协议、点对点消息模型、移除旧协议 API 野生技术架构师 kafka zookeeper 分布式
KRaft全面替代ZooKeeperApacheKafka4.0是一个重要的里程碑，标志着第一个完全无需ApacheZooKeeper®运行的主要版本。通过默认运行在KRaft模式下，Kafka简化了部署和管理，消除了维护单独ZooKeeper集群的复杂性。这一变化显著降低了运营开销，增强了可扩展性，并简化了管理任务。旧架构痛点回顾在Kafka3.x及更早版本中，ZooKeeper（ZK）是元数据
Kafka3.0版本来了，我们应该注意到什么：能断_nd kafka java 分布式
ApacheKafka是一个分布式开源流平台，被广泛应用于各大互联网公司。Kafka设计之初被用于消息队列，自2011年由LinkedIn开源以来，Kafka迅速从消息队列演变为成熟的事件流处理平台。Kafka具有四个核心API，借助这些API，Kafka可以用于以下两大类应用：建立实时流数据管道，可靠地进行数据传输，在系统或应用程序之间获取数据。构建实时流媒体应用程序，以改变系统或应用程序之间的
Apache Kafka 4.0正式发布，首个默认KRaft模式运行，移除单独维护Zookeeper降低复杂性，从零基础到精通，收藏这篇就够了！ Python_chichi 职业发展科技大模型 apache kafka zookeeper
.markdown-bodypre,.markdown-bodypre>code.hljs{color:#333;background:#f8f8f8}.hljs-comment,.hljs-quote{color:#998;font-style:italic}.hljs-keyword,.hljs-selector-tag,.hljs-subst{color:#333;font-weight:7
Kafka 4.0 发布，彻底移除 ZooKeeper！野生技术架构师 kafka zookeeper 分布式
最近ApacheKafka4.0版本发布，这是Kafka的一个重要里程碑。Kafka移除ZooKeeper早在几年前就开始准备，4.0版本是第一个可以完全不使用ZooKeeper的版本。Kafka4.0默认允许在KRaft模式下，大大简化了集群的部署和管理，消除了集成ZooKeeper的复杂性。在KRaft模式下，一些配置、指标和功能发生了不小的变化，今天我们来看一下都有哪些改变。删除了密码编码相
SpringBoot使用Websocket技术实现聊天功能--后端部分（三） oct1025 Idea websocket spring boot 后端
所需依赖：javax.websocketjavax.websocket-api1.1providedorg.springframework.bootspring-boot-starter-freemarkerorg.springframework.bootspring-boot-starter-websocket-->org.apache.tomcat.embed-->tomcat-embed-w
Apache Paimon：开启实时湖仓存储新时代大数据AI智能圈大数据 apache paimon 实时湖仓大数据
ApachePaimon：开启实时湖仓存储新时代前言ApachePaimon前言在当今数字化浪潮汹涌澎湃的时代，数据已成为企业最为宝贵的资产之一。如何高效地处理、存储和利用这些海量数据，成为了企业在激烈竞争中脱颖而出的关键。而在数据处理的广阔领域中，ApachePaimon宛如一颗冉冉升起的新星，以其强大的功能和创新的技术，为实时湖仓存储带来了全新的变革。随着企业业务的不断发展和数据量的急剧增长，
微信支付功能的实现 cwtlw 微信学习 java
1.阅读官方文档开发指引_Native支付|微信支付商户文档中心1.开发使用安装依赖com.github.wxpaywxpay-sdk0.0.3org.apache.httpcomponentshttpclient4.5.32.配置配置文件#微信的appid，商家id和密钥weixin.appid=wx8087d8...weixin.mch_id=1532...weixin.api_key=Cc1
【2025年春季】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽子凯哥 web安全学习安全 CTF夺旗赛网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
SpringBoot+MybatisPlus+shardingsphere 使用年月分表热诚丶 spring boot mybatis 后端 java
先引入依赖1.2.83.5.18.0.305.0.0org.springframework.bootspring-boot-starter-weborg.apache.shardingsphereshardingsphere-jdbc-core-spring-boot-starter${shardingsphere.version}com.alibabadruid${druid.version}c
Apache HttpClient的用法 98巨人 JavaWeb篇
ApacheHttpClient简介 HttpClient是ApacheJakartaCommon下的子项目，用来提供高效的、最新的、功能丰富的支持HTTP协议的客户端编程工具包，并且它支持HTTP协议最新的版本和建议。ApacheHttpClient使用步骤01添加Jar包未使用Meaven的在项目中添加以下jar包httpclient4.5.5、luent-hc4.5.5、httpmime4
Apache HttpClient使用详解认真的学生 java网络编程 java httpClient http
转载地址：http://eksliang.iteye.com/blog/2191017Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpC
Apache HttpClient总览诗人不写诗三方库使用 apache
一、重大版本ApacheHttpClient4.x系列•HttpClient4.0（发布于2008年左右）：这是一个重要的里程碑，标志着HttpClient从JakartaCommons项目转移到ApacheHttpComponents项目。4.0版进行了大量的重构，引入了新的连接管理模型（基于HttpCore），支持了HTTP/1.1的持久连接、连接池以及更灵活的配置选项。•HttpClient
Java常用中间件（后续更新） m0_74824025 java 中间件开发语言
常用Java中间件总结目录引言什么是中间件常见的Java中间件1.消息队列中间件1.1RabbitMQ1.2ApacheKafka2.数据库中间件2.1MySQLProxy2.2Hibernate3.服务治理中间件3.1SpringCloud3.2Dubbo4.缓存中间件4.1Redis4.2Ehcache总结引言在现代软件开发中，中间件作为连接各个系统组件的基础，起到了至关重要的作用。特别是在J
apache安装脚本使用shell建立 IT乌鸦坐飞机 apache
注意防火墙，yum，网络连接等以下是具体的apache安装脚本#!/bin/bash#SetApacheversiontoinstall##author:yuan#检查外网连接echo"检查外网连接..."pingwww.baidu.com-c3>/dev/null2>&1if[$?-eq0];thenecho"外网通讯良好！"elseecho"网络连接失败，请检查你的网络设置！"exit1fis
Thinkphp框架漏洞（附修复方法） Atopos` web安全安全服务器框架漏洞 thinkphp
ThinkPHP是为了简化企业级应用开发和敏捷WEB应用开发而诞生的，是一个快速、兼容而且简单的轻量级国产PHP开发框架，诞生于2006年初，原名FCS，2007年元旦正式更名为ThinkPHP，遵循Apache2开源协议发布，从Struts结构移植过来并做了改进和完善，同时也借鉴了国外很多优秀的框架和模式，使用面向对象的开发结构和MVC模式，融合了Struts的思想和TagLib(标签库)、Ro
Apache Tomcat RCE漏洞（CVE-2025-24813) 瑜舍 apache tomcat java
一，漏洞描述该漏洞在于Tomcat在处理不完整PUT请求上传时，会使用了一个基于用户提供的文件名和路径生成的临时文件。二，漏洞条件1，默认Servlet启用了写权限（默认禁用）2，启用了部分PUT请求支持（默认启用）3，应用程序使用Tomcat的基于文件的会话持久化（默认存储位置）4，应用程序包含可被利用于反序列化攻击的库三，漏洞的利用过程1，Tomcat的File会话存储默认路径位于：CATAL
SpringBoot整合Redis、ApacheSolr和SpringSession 后端springboot
一、简介SpringBoot自从问世以来，以其方便的配置受到了广大开发者的青睐。它提供了各种starter简化很多繁琐的配置。SpringBoot整合Druid、Mybatis已经司空见惯，在这里就不详细介绍了。今天我们要介绍的是使用SpringBoot整合Redis、ApacheSolr和SpringSession。二、SpringBoot整合RedisRedis是大家比较常用的缓存之一，一般R
Flink CDC 在阿里云实时计算Flink版的云上实践 flink大数据实时计算
摘要：本文整理自阿里云高级开发工程师，ApacheFlinkCommitter阮航老师在FlinkForwardAsia2024生产实践（三）专场中的分享，主要分为以下四个方面：一、FlinkCDC&实时计算Flink二、CDCYAML核心功能三、CDCYAML典型应用场景四、Demo&未来规划一、FlinkCDC&实时计算Flink1.1FlinkCDC简介FlinkCDC在经过多个版本的发布后
Tomcat相关的面试题努力的搬砖人. java 后端面试 tomcat 经验分享
以下是150道Tomcat相关的面试题，涵盖了Tomcat的基础概念、配置管理、部署运行、性能调优、安全机制、日志管理、集群与负载均衡、与其他技术的结合等方面，希望对你有所帮助。Tomcat基础概念1.什么是Tomcat？它的主要功能和特点是什么？Tomcat是Apache软件基金会开发的一款开源的Servlet容器，它实现了JavaServlet和JavaServerPages(JSP)技术规范
常见框架漏洞之二：struts2 执念WRD struts 后端框架漏洞
简介ApacheStruts2最初被称为WebWork2，它是⼀个简洁的、可扩展的框架，可⽤于创建企业级Javaweb应⽤程序。设计这个框架是为了从构建、部署、到应⽤程序维护⽅⾯来简化整个开发周期。■Struts2是⼀个基于MVC设计模式的web应⽤框架：MVC：模型(Model)、视图(View)、控制器(Controller)：■模型---属于软件设计模式的底层基础，主要负责数据维护。■视图-
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

Lucene-2.2.0 源代码阅读学习(31)

你可能感兴趣的:(apache,Lucene)