小旋锋

Lucene7.4 初体验

前言

本文的简要内容：

Lucene简介
体验Lucene Demo
Lucene 核心类介绍
Lucene 索引文件格式

Lucene简介

Lucene是目前最流行的Java开源搜索引擎类库,最新版本为7.4.0。Lucene通常用于全文检索,Lucene具有简单高效跨平台等特点,因此有不少搜索引擎都是基于Lucene构建的,例如:Elasticsearch,Solr等等。

现代搜索引擎的两大核心就是索引和搜索，建立索引的过程就是对源数据进行处理，例如过滤掉一些特殊字符或词语，单词大小写转换，分词，建立倒排索引等支持后续高效准确的搜索。而搜索则是直接提供给用户的功能，尽管面向的用户不同，诸如百度，谷歌等互联网公司以及各种企业都提供了各自的搜索引擎。搜索过程需要对搜索关键词进行分词等处理，然后再引擎内部构建查询，还要根据相关度对搜索结果进行排序，最终把命中结果展示给用户。

Lucene只是一个提供索引和查询的类库，并不是一个应用，程序员需要根据自己的应用场景进行如数据获取、数据预处理、用户界面提供等工作。

搜索程序的典型组件如下所示：

下图为Lucene与应用程序的关系:

体验Lucene Demo

接下来先来看一个简单的demo

note:
代码在 start Lucene

引入 Maven 依赖

    <properties>
        <project.build.sourceEncoding>UTF-8project.build.sourceEncoding>
        <maven.compiler.source>1.8maven.compiler.source>
        <maven.compiler.target>1.8maven.compiler.target>
        <lucene.version>7.4.0lucene.version>
    properties>

    <dependencies>
        <dependency>
            <groupId>junitgroupId>
            <artifactId>junitartifactId>
            <version>4.11version>
            <scope>testscope>
        dependency>

        <dependency>
            <groupId>org.apache.lucenegroupId>
            <artifactId>lucene-coreartifactId>
            <version>${lucene.version}version>
        dependency>

        <dependency>
            <groupId>org.apache.lucenegroupId>
            <artifactId>lucene-queryparserartifactId>
            <version>${lucene.version}version>
        dependency>

    dependencies>

索引类 IndexFiles.java

import org.apache.lucene.analysis.*;
import org.apache.lucene.analysis.standard.*;
import org.apache.lucene.document.*;
import org.apache.lucene.index.*;
import org.apache.lucene.store.*;

import java.io.*;
import java.nio.charset.*;
import java.nio.file.*;
import java.nio.file.attribute.*;

public class IndexFiles {
    public static void main(String[] args) {
        String indexPath = "D:/lucene_test/index"; // 建立索引文件的目录
        String docsPath = "D:/lucene_test/docs"; // 读取文本文件的目录

        Path docDir = Paths.get(docsPath);

        IndexWriter writer = null;
        try {
            // 存储索引数据的目录
            Directory dir = FSDirectory.open(Paths.get(indexPath));
            // 创建分析器
            Analyzer analyzer = new StandardAnalyzer();
            IndexWriterConfig iwc = new IndexWriterConfig(analyzer);
            iwc.setOpenMode(IndexWriterConfig.OpenMode.CREATE);

            writer = new IndexWriter(dir, iwc);
            indexDocs(writer, docDir);

            writer.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    private static void indexDocs(final IndexWriter writer, Path path) throws IOException {
        if (Files.isDirectory(path)) {
            Files.walkFileTree(path, new SimpleFileVisitor() {
                @Override
                public FileVisitResult visitFile(Path file, BasicFileAttributes attrs) {
                    try {
                        indexDoc(writer, file);
                    } catch (IOException ignore) {
                        // 不索引那些不能读取的文件,忽略该异常
                    }
                    return FileVisitResult.CONTINUE;
                }
            });
        } else {
            indexDoc(writer, path);
        }
    }

    private static void indexDoc(IndexWriter writer, Path file) throws IOException {
        try (InputStream stream = Files.newInputStream(file)) {
            // 创建一个新的空文档
            Document doc = new Document();
            // 添加字段
            Field pathField = new StringField("path", file.toString(), Field.Store.YES);
            doc.add(pathField);
            Field contentsField = new TextField("contents",
                    new BufferedReader(new InputStreamReader(stream, StandardCharsets.UTF_8)));
            doc.add(contentsField);
            System.out.println("adding " + file);
            // 写文档
            writer.addDocument(doc);
        }
    }
}

查询类 SearchFiles.java

import org.apache.lucene.analysis.*;
import org.apache.lucene.analysis.standard.*;
import org.apache.lucene.document.*;
import org.apache.lucene.index.*;
import org.apache.lucene.queryparser.classic.*;
import org.apache.lucene.search.*;
import org.apache.lucene.store.*;

import java.io.*;
import java.nio.charset.*;
import java.nio.file.*;

public class SearchFiles {
    public static void main(String[] args) throws Exception {
        String indexPath = "D:/lucene_test/index"; // 建立索引文件的目录
        String field = "contents";
        IndexReader reader = DirectoryReader.open(FSDirectory.open(Paths.get(indexPath)));
        IndexSearcher searcher = new IndexSearcher(reader);
        Analyzer analyzer = new StandardAnalyzer();

        BufferedReader in = null;
        in = new BufferedReader(new InputStreamReader(System.in, StandardCharsets.UTF_8));
        QueryParser parser = new QueryParser(field, analyzer);
        System.out.println("Enter query:");
        // 从Console读取要查询的语句
        String line = in.readLine();
        if (line == null || line.length() == -1) {
            return;
        }
        line = line.trim();
        if (line.length() == 0) {
            return;
        }

        Query query = parser.parse(line);
        System.out.println("Searching for:" + query.toString(field));
        doPagingSearch(searcher, query);
        in.close();
        reader.close();
    }

    private static void doPagingSearch(IndexSearcher searcher, Query query) throws IOException {
        // TopDocs保存搜索结果
        TopDocs results = searcher.search(query, 10);
        ScoreDoc[] hits = results.scoreDocs;
        int numTotalHits = Math.toIntExact(results.totalHits);
        System.out.println(numTotalHits + " total matching documents");
        for (ScoreDoc hit : hits) {
            Document document = searcher.doc(hit.doc);
            System.out.println("文档:" + document.get("path"));
            System.out.println("相关度:" + hit.score);
            System.out.println("================================");
        }

    }
}

测试

首先创建文件夹 D:\lucene_test，在 lucene_test 下再创建 docs 文件夹，用来存储要索引的测试文件

在 docs 下创建3个文件 test1.txt, test2.txt, test3.txt，分别写入 hello world、 hello lucene、 hello elasticsearch

运行索引类 IndexFiles.java，可看到Console输出

adding D:\lucene_test\docs\test1.txt
adding D:\lucene_test\docs\test2.txt
adding D:\lucene_test\docs\test3.txt

运行查询类 SearchFiles.java，搜索 hello ，三个文件相关度一样

Enter query:
hello
Searching for:hello
3 total matching documents
文档:D:\lucene_test\docs\test1.txt
相关度:0.13353139
================================
文档:D:\lucene_test\docs\test2.txt
相关度:0.13353139
================================
文档:D:\lucene_test\docs\test3.txt
相关度:0.13353139
================================

搜索 hello lucene，test2.txt的相关度比其他两个高

Enter query:
hello lucene
Searching for:hello lucene
3 total matching documents
文档:D:\lucene_test\docs\test2.txt
相关度:1.1143606
================================
文档:D:\lucene_test\docs\test1.txt
相关度:0.13353139
================================
文档:D:\lucene_test\docs\test3.txt
相关度:0.13353139
================================

Lucene 核心类介绍

核心索引类

IndexWriter

进行索引写操作的一个中心组件
不能进行读取和搜索

核心搜索类

IndexSearcher

IndexSearcher在建立好的索引上进行搜索
它只能以 只读 的方式打开一个索引，所以可以有多个IndexSearcher的实例在一个索引上进行操作

Term

Term是搜索的基本单元，一个Term由 key:value 组成（类似于mysql中的  字段名称=查询的内容）
例子： Query query = new TermQuery(new Term("filename", "lucene"));

Query

Query是一个抽象类，用来将用户输入的查询字符串封装成Lucene能够识别的Query

TermQuery

Query子类，Lucene支持的最基本的一个查询类
例子：TermQuery termQuery = new TermQuery(new Term("filename", "lucene"));

BooleanQuery

BooleanQUery，布尔查询,是一个组合Query（多个查询条件的组合）
BooleanQuery是可以嵌套的

栗子：
BooleanQuery query = new BooleanQuery();
BooleanQuery query2 = new BooleanQuery();
TermQuery termQuery1 = new TermQuery(new Term("fileName", "lucene"));
TermQuery termQuery2 = new TermQuery(new Term("fileName", "name"));
query2.add(termQuery1, Occur.SHOULD);
query.add(termQuery2, Occur.SHOULD);
query.add(query2, Occur.SHOULD);;       //BooleanQuery是可以嵌套的

Occur枚举：
    MUST
    SHOULD
    FILTER
    MUST_NOT

NumericRangeQuery

数字区间查询
栗子：
Query newLongRange = NumericRangeQuery.newLongRange("fileSize",0l, 100l, true, true);

PrefixQuery

前缀查询，查询分词中含有指定字符开头的内容
栗子：
PrefixQuery query = new PrefixQuery(new Term("fileName","hell"));

PhraseQuery

短语查询
栗子1：
    PhraseQuery query = new PhraseQuery();
    query.add(new Term("fileName","lucene"));

FuzzyQuery

模糊查询
栗子：
FuzzyQuery query = new FuzzyQuery(new Term("fileName","lucene"));

WildcardQuery

通配符查询：
* ：任意字符（0或多个）
? : 一个字符

栗子：
WildcardQuery query = new WildcardQuery(new Term("fileName","*"));

RegexQuery

正则表达式查询
栗子：搜索含有最少1个字符，最多6个字符的
RegexQuery query = new RegexQuery(new Term("fileName","[a-z]{1,6}"));

MultiFieldQueryParser

查询多个field
栗子：
String[] fields = {"fileName","fileContent"};
MultiFieldQueryParser queryParser = new MultiFieldQueryParser(fields, new StandardAnalyzer());
Query query = queryParser.parse("fileName:lucene AND filePath:a");

TopDocs

TopDocs类是一个简单的指针容器,指针一般指向前N个排名的搜索结果,搜索结果即匹配条件的文档
TopDocs会记录前N个结果中每个结果的int docID和浮点数型分数(反映相关度)

栗子：
    TermQuery searchingBooks = new TermQuery(new Term("subject","search")); 
    Directory dir = TestUtil.getBookIndexDirectory();
    IndexSearcher searcher = new IndexSearcher(dir);
    TopDocs matches = searcher.search(searchingBooks, 10);

Lucene 6.0 索引文件格式

倒排索引

谈到倒排索引，那么首先看看正排是什么样子的呢？假设文档1包含【中文、英文、日文】，文档2包含【英文、日文、韩文】，文档3包含【韩文，中文】，那么根据文档去查找内容的话

文档1->【中文、英文、日文】
文档2->【英文、日文、韩文】
文档3->【韩文，中文】

反过来，根据内容去查找文档

中文->【文档1、文档3】
英文->【文档1、文档2】
日文->【文档1、文档2】
韩文->【文档2、文档3】

这就是倒排索引，而Lucene擅长的也正在于此

段（Segments）

Lucene的索引可能是由多个子索引或Segments组成。每个Segment是一个完全独立的索引，可以单独用于搜索，索引涉及

为新添加的documents创建新的segments
合并已经存在的segments

搜索可能涉及多个segments或多个索引，每个索引可能由一组segments组成

文档编号

Lucene通过一个整型的文档编号指向每个文档，第一个被加入索引的文档编号为0，后续加入的文档编号依次递增。
注意文档编号是可能发生变化的，所以在Lucene外部存储这些值时需要格外小心。

索引结构概述

每个segment索引包括信息

Segment info：包含有关segment的元数据，例如文档编号，使用的文件
Field names：包含索引中使用的字段名称集合
Stored Field values：对于每个document，它包含属性-值对的列表，其中属性是字段名称。这些用于存储有关文档的辅助信息，例如其标题、url或访问数据库的标识符
Term dictionary：包含所有文档的所有索引字段中使用的所有terms的字典。字典还包括包含term的文档编号，以及指向term的频率和接近度的指针
Term Frequency data：对于字典中的每个term，包含该term的所有文档的数量以及该term在该文档中的频率，除非省略频率（IndexOptions.DOCS）
Term Proximity data：对于字典中的每个term，term在每个文档中出现的位置。注意，如果所有文档中的所有字段都省略位置数据，则不会存在
Normalization factors：对于每个文档中的每个字段，存储一个值，该值将乘以该字段上的匹配的分数
Term Vectors：对于每个文档中的每个字段，可以存储term vector，term vector由term文本和term频率组成
Per-document values：与存储的值类似，这些也以文档编号作为key，但通常旨在被加载到主存储器中以用于快速访问。存储的值通常用于汇总来自搜索的结果，而每个文档值对于诸如评分因子是有用的
Live documents：一个可选文件，指示哪些文档是活动的
Point values：可选的文件对，记录索引字段尺寸，以实现快速数字范围过滤和大数值（例如BigInteger、BigDecimal（1D）、地理形状交集（2D，3D））

文件命名

属于一个段的所有文件具有相同的名称和不同的扩展名。当使用复合索引文件，这些文件（除了段信息文件、锁文件和已删除的文档文件）将压缩成单个.cfs文件。当任何索引文件被保存到目录时，它被赋予一个从未被使用过的文件名字

文件扩展名摘要

名称	文件扩展名	简短描述
Segments File	segments_N	保存了一个提交点（a commit point）的信息
Lock File	write.lock	防止多个IndexWriter同时写到一份索引文件中
Segment Info	.si	保存了索引段的元数据信息
Compound File	.cfs，.cfe	一个可选的虚拟文件，把所有索引信息都存储到复合索引文件中
Fields	.fnm	保存fields的相关信息
Field Index	.fdx	保存指向field data的指针
Field Data	.fdt	文档存储的字段的值
Term Dictionary	.tim	term词典，存储term信息
Term Index	.tip	到Term Dictionary的索引
Frequencies	.doc	由包含每个term以及频率的docs列表组成
Positions	.pos	存储出现在索引中的term的位置信息
Payloads	.pay	存储额外的per-position元数据信息，例如字符偏移和用户payloads
Norms	.nvd，.nvm	.nvm文件保存索引字段加权因子的元数据，.nvd文件保存索引字段加权数据
Per-Document Values	.dvd，.dvm	.dvm文件保存索引文档评分因子的元数据，.dvd文件保存索引文档评分数据
Term Vector Index	.tvx	将偏移存储到文档数据文件中
Term Vector Documents	.tvd	包含有term vectors的每个文档信息
Term Vector Fields	.tvf	字段级别有关term vectors的信息
Live Documents	.liv	哪些是有效文件的信息
Point values	.dii，.dim	保留索引点，如果有的话

锁文件

默认情况下，存储在索引目录中的锁文件名为 write.lock。如果锁目录与索引目录不同，则锁文件将命名为“XXXX-write.lock”，其中XXXX是从索引目录的完整路径导出的唯一前缀。此锁文件确保每次只有一个写入程序在修改索引。

更多内容请访问我的个人网站：http://laijianfeng.org/
参考：
1. Lucene初识及核心类介绍
2. Lucene核心类
3. Lucene 6.0 索引文件格式
4. Lucene实战.pdf

redis清空缓存奔跑吧邓邓子高效运维缓存 redis 数据库
提示：“奔跑吧邓邓子”的高效运维专栏聚焦于各类运维场景中的实际操作与问题解决。内容涵盖服务器硬件（如IBMSystem3650M5）、云服务平台（如腾讯云、华为云）、服务器软件（如Nginx、Apache、GitLab、Redis、Elasticsearch、Kubernetes、Docker等）、开发工具（如Git、HBuilder）以及网络安全（如挖矿病毒排查、SSL证书配置）等多个方面。无论
数据项目相关的AWS云计算架构设计 weixin_30777913 云计算数据仓库 aws spark python
电商数据平台架构高性能：使用AmazonEC2的计算优化实例处理业务逻辑和数据计算，搭配AmazonElastiCache内存缓存，加速数据读取。应用负载均衡器（ALB）在EC2实例间分发流量，实现负载均衡。高可用性：采用多可用区（Multi-AZ）部署，将EC2实例、数据库等资源分布在多个可用区。使用AmazonRDS并开启多AZ部署，实现数据库自动故障转移。利用AWSAutoScaling根据
Elastic Stack（filebeat/logstash/elasticserarch/kibana）性能分析应用一缕晨光~ Elastic Stack elasticsearch kibana elk 大数据
目录概要：1.待分析日志的格式（1条日志）：2.filebeat设置获取日志的路径：3.logstash匹配日志4.调试5.Elasticsearch插件（方便对es的查询与删除）6.对已有日志进行分析7、Kibana展示概要：使用kibana展示日志分析结果的初衷是性能分析，终于分析出了第一份日志。性能压测情况下，某个日志文件的分析出的响应时间分布。上篇文章请参看：logstashconfigf
数据结构与算法再探（二）栈与队列的应用刀客123 数据结构与算法数据结构算法
目录栈应用举例std::stack的基本操作：队列实现栈c++版单队列方式python3应用实例（一）：括号匹配C++栈C++非栈方式python实现实例(二）：后缀表达式求值c++实现python实现队列的应用队：std::queue基本操作栈实现队列队列应用举例：1、约瑟夫问题数组实现：队列实现：双向链表2、单调队列-滑动窗口里的最大值C++python3总结栈应用举例栈是操作受限的线性表，典
华为OD机试E卷 - 增强的strstr（Java & Python& JS & C++ & C ）算法大师最新华为OD机试 java 华为od python javascript c语言 c++华为OD机试E卷
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述C语言有一个库函数：char*strstr(constchar*haystack,constchar*needle)，实现在字符串haystack中查找第一次出现字符串needle的位置，如果未找到则返回null。现要求实现一个strstr的增强函数，可以使用带可选段的字符串来模糊查询，与strstr一样返回首次查找到
华为OD机试E卷 --增强的strstr--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码题目描述C语言有一个库函数:char*strstr(constchar*haystack,constchar*needle),实现在字符串haystack中查找第一次出现字符串needle的位置，如果未找到则返回null。现要求实现一个strstr的增强函数，可以使用带可选段的字符串来模糊查询，strstr
电商项目-数据同步解决方案（三）商品上架同步更新ES索引库 kong7906928 项目功能 Java框架 elasticsearch 搜索引擎数据同步
一、需求分析和业务逻辑主要应用技术有：Feign远程调用，消息队列-RabbitMQ，分布式搜索引擎-ElasticSearch，Eureka，Canal商品上架将商品的sku列表导入或者更新索引库。数据监控微服务需要定义canal监听器，监听商品表的改变，一旦发现商品表内容改变，需要将商品的SPUID发送到消息队列中。实现思路：（1）在数据监控微服务中监控tb_spu表的数据，当tb_spu发生
windows安装ES 我的棉裤丢了 elasticsearch 大数据搜索引擎
1.下载ES访问ES官网下载DownloadElasticsearch|Elastic2.配置环境变量ES_JAVA_HOME:D:\jdk-17.0.9ES_HOME:D:\elasticsearch-8.17.1-windows-x86_64\elasticsearch-8.17.13.添加一些ES的配置关闭ES安全认证打开elasticsearch-8.17.1\config\elastic
WPF基础 | WPF 布局系统深度剖析：从 Grid 到 StackPanel xcLeigh WPF 从入门到精通 wpf C#
WPF基础|WPF布局系统深度剖析：从Grid到StackPanel一、前言二、Grid布局：万能的布局王者2.1Grid布局基础：构建网格世界2.2子元素定位与跨行列：布局的精细操控2.3自适应布局：灵活应变的秘诀三、StackPanel布局：简约而不简单3.1StackPanel布局基础：有序堆叠之道3.2属性控制：定制堆叠细节3.3自适应与动态布局：智能的布局响应四、Grid与StackPa
ELK介绍小馋喵知识杂货铺性能 elk
ELK是由三个开源项目组成的日志管理解决方案，分别是Elasticsearch、Logstash和Kibana。这三个工具协同工作，提供强大的日志收集、处理、存储和可视化能力。通常，ELK被用于大规模的日志分析和数据监控，帮助开发人员和运维团队快速发现问题、进行故障排查和性能优化。1.Elasticsearch（E）Elasticsearch是一个基于Lucene的开源搜索引擎，提供实时的分布式搜
facebook 获取广告费用的api TerryWater
http://stackoverflow.com/questions/33106651/facebook-graph-api-getting-daily-spend-per-ad-sethttps://developers.facebook.com/docs/marketing-api/reference/adgroup/insights/https://developers.facebook.c
【Elasticsearch】_reindex api请求 risc123456 Elasticsearch elasticsearch
在Elasticsearch中，你可以使用`_tasks`API来检查`_reindex`任务的状态。当你发起一个`_reindex`请求时，Elasticsearch会返回一个任务ID，你可以使用这个任务ID来查询任务的详细状态。以下是如何检查`_reindex`任务状态的步骤：###1.获取任务ID首先，你需要获取`_reindex`任务的ID。当你发送`_reindex`请求时，Elasti
简述 Java 内存模型（JMM），特别是堆与栈的区别？程序员黄同学 Java java
Java内存模型（JMM）是Java平台定义的一种多线程之间的通信规范，它确保了在不同的线程之间能够正确地共享和协调对内存的访问。JMM的关键目标是解决并发编程中的可见性、原子性和有序性问题。简单来说，它规定了如何在硬件内存、操作系统内存与Java程序之间进行有效的交互，确保程序在多线程环境下能够正确执行。堆与栈的区别在Java中，内存主要分为两大区域：堆（Heap）和栈（Stack）。这两个概念
在K8S中，如何使用EFK实现日志的统一管理？ Dusk_橙子 K8S kubernetes 容器云原生
在Kubernetes中，EFK是一种常见的日志统一管理方案。EFK堆栈允许你收集、存储、搜素、分析和可视化容器应用程序的日志。下面是如何在Kubernetes中使用EFK实现日志统一管理的详细步骤：部署Elasticsearchelasticsearch是一个分布式、RESTful风格的搜索和分析引擎，能够解决越来越多用例的查询语言，它通常用于日志和事件数据分析。首先，你需要再kubernete
Elasticsearch 8.17.1 JAVA工具类熟透的蜗牛牛X的开源框架 elasticsearch
一、ElasticSearchUtilspackagecom.wssnail.elasticsearch.util;importco.elastic.clients.elasticsearch.ElasticsearchClient;importco.elastic.clients.elasticsearch._types.FieldValue;importco.elastic.clients.e
CentOS8下安装wget、wget2 奔跑吧邓邓子高效运维 linux centos wget wget2
提示：“奔跑吧邓邓子”的高效运维专栏聚焦于各类运维场景中的实际操作与问题解决。内容涵盖服务器硬件（如IBMSystem3650M5）、云服务平台（如腾讯云、华为云）、服务器软件（如Nginx、Apache、GitLab、Redis、Elasticsearch、Kubernetes、Docker等）、开发工具（如Git、HBuilder）以及网络安全（如挖矿病毒排查、SSL证书配置）等多个方面。无论
Java算法栈王景程 java 开发语言算法数据结构
栈作为编程中一个常见的算法，以下是它的特征以及一个相对应的例子：在编程中，**栈（Stack）**是一种后进先出（LIFO,LastInFirstOut）数据结构。它的特性是：入栈（Push）：将元素添加到栈顶。出栈（Pop）：将栈顶元素移除。查看栈顶元素（Peek/Top）：获取栈顶元素但不移除。Java提供了一个现成的Stack类，它是java.util包的一部分，可以直接用于算法问题中。算法
程序默认栈空间大小 tadus_zeng 操作系统
linuxlinux下线程的默认栈大小是8M$ulimit-s8192#8*1024KB查看单个进程暂用堆栈的信息$strace-f-p{PID}临时改变栈空间的大小ulimit-s102400#改为100MBulimit-sunlimited#不限制永久修改栈空间大大小echo-ne"*softstack102400">>/etc/security/limits.conf或者$sudoecho'
高效使用Alibaba Cloud PAI EAS进行AI模型推理 sagvWSRJHMNEB 人工智能深度学习神经网络 python
技术背景介绍在当今的AI模型开发中，高效的推理服务是将训练好的模型投入实际应用的关键环节。AlibabaCloudPAI平台专为企业级AI开发提供了一整套服务，其中的PAI-EAS（ElasticAlgorithmService）是用于模型推理和部署的高性能服务。它支持多种硬件资源，能够在高吞吐量和低延迟环境下运行复杂模型，并提供灵活的弹性扩展和全面的运维监控系统。核心原理解析PAI-EAS通过结
AWS Elastic Beanstalk HaoHao_010 aws java 云计算服务器云服务器
AWSElasticBeanstalk是一项由AmazonWebServices(AWS)提供的完全托管的服务，旨在简化和加速应用程序的部署、管理和扩展。通过ElasticBeanstalk，开发者可以轻松地将应用程序发布到AWS云平台，而无需关注底层的基础设施管理，如服务器、负载均衡、扩展等。ElasticBeanstalk为开发人员提供了一个简化的方式来运行Web应用程序和服务，并自动处理许多
阿里云服务器国际站：如何安装？？聚好云阿里云服务器阿里云服务器国际站阿里云服务器代理商阿里云服务器云计算
阿里云服务器国际站：如何安装？？在阿里云上安装和配置服务器通常涉及以下几个步骤。这里主要以创建一个ECS（ElasticComputeService，弹性计算服务）实例为例：###1.注册与登录-**注册账户**：如果还没有阿里云账号，请前往[阿里云官网](https://www.aliyun.com)注册一个账户。-**登录**：使用注册的账户登录阿里云控制台。###2.创建ECS实例-**访问
Grafana 小馋喵知识杂货铺性能 grafana
Grafana是一款广泛使用的开源数据可视化与监控平台，通过与Prometheus、InfluxDB、Elasticsearch等多种数据源集成，提供强大的监控、数据展示和告警功能。其告警体系在及时通知系统异常、保障业务稳定性方面起到关键作用。Grafana告警体系概述Grafana的告警体系分为以下几个部分：告警规则：用于定义何时触发告警，包括监控指标、评估条件和评估时间间隔。告警规则可以基于面
ElasticSearch查询第四篇：匹配查询（Match）悦光阴字符串 java python elasticsearch 索引
《ElasticSearch查询》目录导航：ElasticSearch查询第一篇：搜索APIElasticSearch查询第二篇：文档更新ElasticSearch查询第三篇：词条查询ElasticSearch查询第四篇：匹配查询(Match)ElasticSearch查询第五篇：布尔查询匹配(Match)查询属于全文(Fulltext)查询，不同于词条查询，ElasticSearch引擎在处理全
【Elasticsearch】RestClient操作文档乙卯年QAQ elasticsearch jenkins 大数据 java
RestClient操作文档新增文档实体类API语法查询文档删除文档修改文档批量导入文档小结新增文档将数据库中的信息导入elasticsearch中以商品数据为例实体类定义一个索引库结构对应的实体。@Data@ApiModel(description="索引库实体")publicclassItemDoc{@ApiModelProperty("商品id")privateStringid;@ApiMo
elasticsearch pipeline 总结 weixin_40455124 elasticsearch 代码分析及扩展 pipeline elasticsearch ingest index
pipeline可以理解为elasticsearch对接收到的数据的入库前再处理过程，这个过程可以非常复杂，包括修改数据归属index。pipeline运行在ingestnode上一个pipeline由多个process组成，一个nodes支持哪些process，可以通过GET/_nodes/ingest查看，每种processor用途可以参看https://www.elastic.co/guid
ElasticSearch解析logback日志并处理异常栈轨迹甘蓝聊Java 【更新中...】项目中的那些事 elasticsearch logback pipeline multiline filebeat多行
文章目录背景分析IngestPipeline解析日志-示例查看IngestPipeline创建Pipeline添加Grok处理器添加时间戳、IP地址和用户代理处理器测试Pipeline多行消息管理filestreaminputloginput解决自定义pipeline解析logback日志Grok处理器Date处理器失败处理器为loginput添加多行处理验证调整Kibana数据视图验证失败处理器
es-Ingest pipelines 童小绿笔记 elasticsearch 大数据 big data
Ingestpipelinesnode为ingest角色，对indexingrequest做预处理，主要用于数据转换为合规、期望值的场景官方地址：https://www.elastic.co/guide/en/elasticsearch/reference/7.13/ingest.html#ingest使用pipeline必要条件node角色必须为：ingestpipeline的组成{"descr
Elasticsearch 摄取节点(Ingest Node)使用Pipeline预处理文档 °Fuhb ELK elasticsearch es 预处理节点 pipeline ingest node
1.IngestnodeIngestnode是elasticsearch的节点类型之一，通过在Ingestnode配置pipeline管道，可以在文档存入索引之前对文档进行预处理。例如：删除字段，重命名字段，修改字段值等等。默认情况下，所有节点都是IngestNode，可以通过修改elasticsearch.yml，把node.ingest改成false来关闭node.ingest:false要实
ElasticSearch 实战： ES 文档 API 用心去追梦 elasticsearch jenkins 大数据
Elasticsearch提供了一系列文档（Document）API，用于对索引中的个体数据单元进行增删改查操作。以下是对主要文档API的实战介绍：1.索引文档(IndexAPI)目的：插入或更新文档。请求方式：PUT或POSTURL：PUT//_doc/或POST//_doc/请求体：包含待索引的文档数据，以JSON格式表示。示例：PUT/my_index/_doc/1{"title":"Exa
Elasticsearch 摄取节点(Ingest Node)常用的数据处理器(Processor) °Fuhb ELK elasticsearch es Processor 预处理 Ingest Node
文章目录SetProcessorAppendProcessorRemoveProcessorRenameProcessorConvertProcessorGrokProcessorDotExpanderProcessorDropProcessorFailProcessorJoinProcessorSplitProcessorKVProcessorJSONProcessorTrimProcessor
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交