weixin_42784244

Elasticsearch学习日记

简介

Elasticsearch(下文简称es) 是一个分布式的 RESTful 风格的搜索和数据分析引擎。

查询： Elasticsearch 允许执行和合并多种类型的搜索 — 结构化、非结构化、地理位置、度量指标 — 搜索方式随心而变。
分析：找到与查询最匹配的十个文档是一回事。但是如果面对的是十亿行日志，又该如何解读呢？Elasticsearch 聚合让您能够从大处着眼，探索数据的趋势和模式。
速度： Elasticsearch 很快。真的，真的很快。
可扩展性：可以在笔记本电脑上运行。也可以在承载了 PB 级数据的成百上千台服务器上运行。
弹性： Elasticsearch 运行在一个分布式的环境中，从设计之初就考虑到了这一点。
灵活性：具备多个案例场景。数字、文本、地理位置、结构化、非结构化。所有的数据类型都欢迎。
HADOOP & SPARK ： Elasticsearch + Hadoop

es的安装

es版本与jdk版本对应

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-d8Tsa5Qz-1570668035081)(img\20180920164546532.png)]

es下载地址:https://www.elastic.co/guide/en/elasticsearch/reference/index.html

es 5.5版本下载,需要jdk1.8以:上https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.5.3.msi

安装后查看es状态:http://localhost:9200/

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5eElDnJD-1570668035082)(img\2019-10-01_175014.gif)]

es管理后台和ik分词器安装

Ealsticsearch只是后端提供各种API，那么怎么直观的使用它呢？Elasticsearch-head将是一款专门针对于Elasticsearch的客户端工具

Elasticsearch-head配置包，下载地址：https://github.com/mobz/elasticsearch-head

ik分词器要与es版本一致,下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v5.5.3

参考博客:https://blog.csdn.net/chen_2890/article/details/83757022

es名称概念解析

**强推这篇文章,**下面的观点,也是基本取材这篇文章:http://developer.51cto.com/art/201904/594615.htm

倒排索引

倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值，而是由属性值来确定记录的位置，因而称为倒排索引(inverted index)。(注:上文博客,用古诗词的记忆,很通俗的描述了倒排索引的概念)

索引(index),类型(type),文档(document)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WTzbggn5-1570668035083)(img\2019-10-02_155927.gif)]

索引:es吧数据放到一个或者多个索引中，如果用关系型数据库模型对比，索引的地位与数据库实例（db）相当;索引存放和读取的基本单元是文档（document）。es内部使用的是apache lucene实现的索引中数据的读写。（es被视为单独的一个索引，在lucene中不止一个，因为分布式中，es会用到分区shards和备份 replicas机制讲一个索引存储多份）。

文档:在es中，文档主要是存储实体。所有的es应用需求最后都需要统一建成一个检索模型：检索相关文档。文档由一个或多个域，每个域field由一个域名或多个值组成（有多个值的称为多值域）。在es中每个文档都可能会有不同的域field集合；也就是说文档是没有固定的模式和同意的结构的。文档之间保持的相似性即可。在客户端角度来看，文档就是一个json对象。

文档类型（type）:每个文档在es中都必须设定它的类型。文档类型使得同一个索引中在存储结构不同文档时，只需根据文档类型就可以找到对应的参数映射信息，方便文档的存取。

参数映射:所有的文档在存储之前都必须分析（analyze）流程，用户可以配置输入文本分解成token的方式：哪些token被滤掉；或者其它的处理流程，比如去除html标签。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hmgpE0Tv-1570668035083)(img\2019-10-02_160806.gif)]

上图表现的很清晰:索引类似于mysql的数据库**,类型**类似于mysql的表结构定义,文档则是mysql中一行行的数据

分词

分词涉及到很多文档搜索的实际情况考虑,不仅仅是简单的拆词,过滤,还包括中英文同义词的处理

参考博客:https://www.jianshu.com/p/914f102bc174

type:text与keyword都是表示字符串,text要分词,keyword不分词

es分布式原理

es整合springboot

踩坑一

最开始使用的是spring-boot-starter-data-elasticsearch,项目启动正常

<dependency>
    <groupId>org.springframework.bootgroupId>
    <artifactId>spring-boot-starter-data-elasticsearchartifactId>
dependency>

但是,对es的操作,都会报如下的异常,在确认es配置无误之后,只有可能是maven依赖的原因

None of the configured nodes are available: [{#transport#-1}{OkLKCpyRQY-7k4rR8Q6h0A}{127.0.0.1}

es根据不同版本,对java连接工具要求都不同,真是一个大坑

在确定启动es,并确定自己的es版本是5.5.3之后,我们选择spring data Elasticsearch,版本选择如下

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HHl59lRK-1570668035083)(img\2019-10-05_000506.gif)]

新的依赖如下


<properties>
        <elasticsearch.version>5.5.3elasticsearch.version>
properties>

<dependency>
    <groupId>org.springframework.datagroupId>
    <artifactId>spring-data-elasticsearchartifactId>
    <version>3.0.0.RELEASEversion>
dependency>

5.5.3,会让如下的elasticsearch的三个连接工具与你使用的es版本一致,重点就是java连接tool要与运行的es版本一致,都是5.5.3

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-D6bMqoN8-1570668035084)(img\2019-10-05_134146.gif)]

根据自己的es版本,选择对应的maven依赖,这真是太重要了

踩坑二

spring:
  application:
    name: tttare-elasticsearch
  data:
    elasticsearch:
      cluster-name: elasticsearch
      cluster-nodes: 127.0.0.1:9300

很多人,nodes的端口配置的是9200,这肯定是连不上的,9200是http连接端口,java开发要连9300,tcp连接端口;

127.0.0.1:9200这个端口也很重要,后文将详细描述用这个端口查看集群及es的数据

spring-data-elasticsearch代码编写

熟悉spring data系列的同学应该了解,spring data 通过继承特定Repository类,通过方法名和参数,就可以完成一些简单的crud

定义实体类Movie

@Document(indexName = "item",type = "docs", shards = 1, replicas = 0)
//indexName:索引库名，个人建议以项目名称命名
//type:类型，个人建议以实体类名称命名
//shards 分片;replicas 副本
public class Movie {

    @Id  //主键
    private String id;

    //ik_max_word  最大程度分词,分词很细
    //ik_small  智能分词,分词不会太细
    @Field(type = FieldType.text, analyzer = "ik_max_word")
    private String name;

    //FieldType.keyword 不分词,没个字都要拆开
    //FieldType.text  分词,实际情况(ik分词器)来拆分
    @Field(type = FieldType.keyword)
    private String type;//惊悚 悬疑 喜剧 动作 科幻 动画 英语剧 舞台剧

    @Field(type = FieldType.keyword)
    private String director;//导演

    @Field(type = FieldType.keyword)
    private String actor;//代表演员

    @Field(type = FieldType.text, analyzer = "ik_max_word")
    private String brief;//电影简述

    //搜索时,不会作为条件的字段,可以加上:index = false,即不会以文件路径作为搜索的参数
    @Field(index = false, type = FieldType.keyword)
    private String filePath;

    @Field(index = false, type = FieldType.Integer)
    private int favCount;
    //查询index=false的字段,会返回如下异常
    //IllegalArgumentException[Cannot search on field [favCount] since it is not indexed
    @Field(index = false, type = FieldType.keyword)
    private String createDate;
}

注:

http://localhost:9200/_analyze?analyzer=ik_max_word&text=胡迪深知自己在这个世界上的使命

http://localhost:9200/_analyze?analyzer=ik_smart&text=胡迪深知自己在这个世界上的使命

访问以上的两个地址,可以体会max分词和small分词

定义Repository

//Movie:为实体类
//String:为Movie实体类中主键的数据类型
@Repositorypublic 
interface MovieRepository extends ElasticsearchRepository<Movie,String> {
    
}

ElasticsearchRepository即spring data Elasticsearch定义的对es库进行基本增删改查的类,该类定义了很多基本方法,可以直接调用,完成简单的增删改查;

当然,你也可以按照一些规则,完成一些复查的查询,参考博客:https://blog.csdn.net/chen_2890/article/details/83895646

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-H5GC3Zwa-1570668035084)(img\2019-10-05_152238.gif)]

新建索引库,插入数据

org.springframework.data.elasticsearch.core.ElasticsearchTemplate,可以让我:

创建索引的API

esTemplate.createIndex(Movie.class);

映射相关的API

删除索引的API

esTemplate.deleteIndex(Movie.class)  可以根据类和索引名删除索引
esTemplate.deleteIndex("item")

创建索引后,是数据的插入

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-i6jEikvc-1570668035084)(img\2019-10-05_153121.gif)]

es数据搜索操作(java代码及接口请求访问)

http://localhost:9200/item,可以查看item索引库的一些基本信息,字段映射相关信息

http://localhost:9200/item/docs/_search/,http://localhost:9200/{索引库名}/{类型}/_search,是我们进行接口请求访问数据的关键方式,效果如下:

请求参数:

{
    "query": {
        "bool": {
            "must": {
                "match": {
                    "name": "轮到你了"
                }
            }
        }
    }
}

接口响应

{
    "took": 17,
    "timed_out": false,
    "_shards": {
        "total": 1,
        "successful": 1,
        "failed": 0
    },
    "hits": {
        "total": 1,
        "max_score": 3.878859,
        "hits": [
            {
                "_index": "item",
                "_type": "docs",
                "_id": "9ff2152a3cbf4d9485ee012da71f711c",
                "_score": 3.878859,
                "_source": {
                    "id": "9ff2152a3cbf4d9485ee012da71f711c",
                    "name": "轮到你了",
                    "type": "犯罪",
                    "director": "小室直子",
                    "actor": "西野七濑",
                    "brief": "新婚夫妇菜奈（原田知世饰）和翔太（田中圭饰）搬进了公寓的新房，幸福甜蜜的两人对新生活充满期待。搬家当天公寓要开居民会，菜奈猜拳输给了翔太，便独自前去参加。",
                    "filePath": "/file/movie/a.mp4",
                    "favCount": 2300,
                    "createDate": "2019-08-04"
                }
            }
        ]
    }
}

讲http://localhost:9200接口访问数据搜索的原因,也是方便大家在java编码前,自己先尝试,因为接口请求参数的规则与java代码请求的规则,是一致

上文的接口请求,下文是java的代码编写

@Test
public void testboolQuery(){
    // 创建对象
    NativeSearchQueryBuilder queryBuilder = new NativeSearchQueryBuilder();
                  		queryBuilder.withQuery(QueryBuilders.boolQuery().must(QueryBuilders.matchQuery("name","轮到")));
    Page<Movie> movies = movieRepository.search(queryBuilder.build());
    List<Movie> content = movies.getContent();
    content.stream().forEach(System.out::println);
}

**QueryBuilders.boolQuery().must(QueryBuilders.matchQuery(“name”,“轮到”))**与上文接口请求参数的编写方式是一致的

matchQuery和termQuery

@Test
public void testMatchQuery(){
    // 创建对象
    NativeSearchQueryBuilder queryBuilder = new NativeSearchQueryBuilder();
    queryBuilder.withQuery(QueryBuilders.matchQuery("name","轮到你"));
    Page<Movie> movies = movieRepository.search(queryBuilder.build());
    List<Movie> content = movies.getContent();
    content.stream().forEach(System.out::println);
}

@Test
public void testTermQuery(){
    //matchQuery:底层就是使用的termQuery
    //termQuery 功能更强大，除了匹配字符串以外，还可以匹配 int/long/double/float/
    NativeSearchQueryBuilder queryBuilder = new NativeSearchQueryBuilder();
    queryBuilder.withQuery(QueryBuilders.termQuery("favCount",800));
    Page<Movie> movies = movieRepository.search(queryBuilder.build());
    List<Movie> content = movies.getContent();
    content.stream().forEach(System.out::println);
}

关于matchQuery和termQuery的区别:

matchQuery:会将查询的字段进行分词,用分好的词去匹配索引库,返回查询结果

termQuery:不处理查询的字段,直接去匹配索引库,返回查询结果

我们已近期比较火的日剧,轮到你了来举例

http://localhost:9200/_analyze?analyzer=ik_max_word&text=轮到你了

{
    "tokens": [
        {
            "token": "轮到",
            "start_offset": 0,
            "end_offset": 2,
            "type": "CN_WORD",
            "position": 0
        },
        {
            "token": "到你",
            "start_offset": 1,
            "end_offset": 3,
            "type": "CN_WORD",
            "position": 1
        },
        {
            "token": "了",
            "start_offset": 3,
            "end_offset": 4,
            "type": "CN_CHAR",
            "position": 2
        }
    ]
}

termQuery的效果

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ed0dlfFq-1570668035085)(img\2019-10-06_074438.gif)]

matchQuery的效果

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Yw1aM5au-1570668035085)(img\2019-10-06_074556.gif)]

都是搜索 “轮到你了”,termQuery没有结果,而matchQuery确有结果;显然,ik分词器分词时,并没有给 “轮到你了”,这个词建立索引,termQuery对查询参数不做处理,“轮到你了"匹配不到任何索引,故无结果;但是matchQuery自带为查询参数分词的效果,将查询条件的"轮到你了"分词,这些分词匹配到了索引库中的"轮到”,"你了"这些字段,故返回了结果;

如上特性也只:matchQuery适合中一些模糊的,需要分词的查询,被text修饰的字段;而termQuery适合做一些较为准确的查询,比如数字查询,名称查询等被keyword修饰的字段

注:上文声明时,我将favCount字段修饰为index=false,故我在搜索favCount时,报了IllegalArgumentException[Cannot search on field [favCount] since it is not indexed,我就不改了,要查询的字段,记得不要设置为false

matchQuery与matchPhraseQuery

说法一:

matchPhraseQuery和matchQuery等的区别，在使用matchQuery等时，在执行查询时，搜索的词会被分词器分词，而使用matchPhraseQuery时，不会被分词器分词，而是直接以一个短语的形式查询，而如果你在创建索引所使用的field的value中没有这么一个短语（顺序无差，且连接在一起），那么将查询不出任何结果。

说法二:

和match查询类似，match_phrase查询首先解析查询字符串来产生一个词条列表。然后会搜索所有的词条，但只保留包含了所有搜索词条的文档，并且词条的位置要邻接

网上有多种方法,不会分词,会分词,但是我自己实尝试,用"轮到你了"搜索.termQuery无结果而matchPhraseQuery确实有结果.故说法二应该是对的

有争议,说明有坑,研究一下这个查询

matchQuery

queryBuilder.withQuery(QueryBuilders.matchQuery("name","轮到大家"));//有结果

结论:matchQuery,查询参数分词,只要分词匹配到索引库,就返回该记录

matchPhraseQuery

queryBuilder.withQuery(QueryBuilders.matchPhraseQuery("name","轮到大家"));//无结果

结论:matchPhraseQuery,查询参数分词,但是,然后会搜索所有的词条，但只保留包含了所有搜索词条的文档，并且词条的位置要邻接;虽然通过"轮到"匹配到了词条,但是这条记录并没有包含"轮到大家"这个搜索条件,故也被排除;

matchPhraseQuery查询结果比matchQuery更加精确,一般而言,会过滤掉一些matchQuery搜索出的结果,使得搜索结果更精确

boolQuery

Bool查询现在包括四种子句,must,filter,should,must_not。

query的时候，会先比较查询条件，然后计算分值，最后返回文档结果；

filter则是先判断是否满足查询条件，如果不满足，会缓存查询过程（记录该文档不满足结果）；满足的话，就直接缓存结果。

综上所述，filter快在两个方面：

1 对结果进行缓存
2 避免计算分值

Bool查询对应Lucene中的BooleanQuery，它由一个或者多个子句组成，每个子句都有特定的类型。

must

返回的文档必须满足must子句的条件，并且参与计算分值

filter

返回的文档必须满足filter子句的条件。但是不会像Must一样，参与计算分值(如下图,虽然有结果,但是max_score为0)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0aEf8DLu-1570668035085)(img\2019-10-08_115359.gif)]

should

返回的文档可能满足should子句的条件。在一个Bool查询中，如果没有must或者filter，有一个或者多个should子句，那么只要满足一个就可以返回。minimum_should_match参数定义了至少满足几个子句。

must_nout

返回的文档必须不满足must_not定义的条件。

 @Test
public void testboolQuery2(){
    // 构建查询条件
    NativeSearchQueryBuilder queryBuilder = new NativeSearchQueryBuilder();
    QueryBuilder queryBuilder1=QueryBuilders.matchPhraseQuery("name", "轮到你了");
    QueryBuilder queryBuilder2=QueryBuilders.matchPhraseQuery("type", "轮到你了");
    QueryBuilder queryBuilder3=QueryBuilders.matchPhraseQuery("director", "轮到你了");
    QueryBuilder queryBuilder4=QueryBuilders.matchPhraseQuery("actor", "轮到你了");
    QueryBuilder queryBuilder5=QueryBuilders.matchPhraseQuery("brief", "轮到你了");
    //比较时间
    //QueryBuilder queryBuilder3=QueryBuilders.rangeQuery("publishDate").gt("2018-01-01");
    queryBuilder.withQuery(QueryBuilders.boolQuery().should(queryBuilder1)
                         .should(queryBuilder2).should(queryBuilder3).should(queryBuilder4).should(queryBuilder5).minimumShouldMatch(2));
    //minimumShouldMatch为 1 时,有查询结果
    //minimumShouldMatch为 2 时,无查询结果
    //分页查询
    Page<Movie> movies = movieRepository.search(queryBuilder.build());
    List<Movie> content = movies.getContent();
    content.stream().forEach(System.out::println);
}

fuzzyQuery

wildcardQuery

通配符查询,较为简单,还是以"轮到你了"这个字段做例子

{
    "query": {
        "match": {
            "name": "轮"
        }
    }
}
// match,term 查询都没有结果,因为索引库并没有分"轮"作为索引
{
    "query": {
        "wildcard": {
            "name": "轮*"
        }
    }
}
// wildcard查询,能查到结果;“*”表示0到多个字符，而使用“？”表示一个字符就行了

regexQuery

结果排序

es分值计算

//TODO 算法还是比较复杂的后续学习

Elasticsearch 默认是按照文档与查询的相关度(匹配度)的得分倒序返回结果的. 得分 (_score) 就越大, 表示相关性越高.

查看查询条件的相似度_score,请求路径如下

http://localhost:9200/item/docs/_search?explain&format=json,

//TODO

“query”: {
“match”: {
“name”: “轮”
}
}
}
// match,term 查询都没有结果,因为索引库并没有分"轮"作为索引
{
“query”: {
“wildcard”: {
“name”: “轮*”
}
}
}
// wildcard查询,能查到结果;“*”表示0到多个字符，而使用“？”表示一个字符就行了


#### regexQuery



#### 结果排序



## es分值计算

//TODO 算法还是比较复杂的 后续学习

**Elasticsearch 默认是按照文档与查询的相关度(匹配度)的得分倒序返回结果的. 得分 (_score) 就越大, 表示相关性越高.**

**查看查询条件的相似度_score**,请求路径如下

http://localhost:9200/item/docs/_search?explain&format=json,

//TODO

## 分词优化

你可能感兴趣的:(elasticsearch入门,springboot)

基于Springboot用axiospost请求接收字符串参数为null的解决方案呀243 spring boot 后端 java
问题今天在用前端post请求后端时发现，由于是以Json对象的形式传输的，后端用两个字符串形参无法获取到对应的参数值前端代码如下：axios.post('http://localhost:8083/test/postParams',{a:'1',b:'2'},{'Content-Type':'application/json'}).then(response=>{console.log(respo
【Java】SpringBoot 全局异常捕获不到Filter中的异常的解决办法 PlanOne_A Java java spring boot spring
情景：当我想用一个过滤器（filter）来对所有请求进行jwt校验，当校验不通过时我想抛出异常，然后再通过@ExceptionHandler来全局捕获该异常，发现SpringBoot全局异常捕获不了filter中抛出的异常原因：因为filter是JavaWeb提供的技术，是在所有请求之前，spring是捕获不到filter抛出的异常的；解决：要想SpringBoot全局异常捕获到该filter抛出
c语言从入门到精通第四版电子书_C语言从入门到精通————8.数组 James Swineson c语言从入门到精通第四版电子书
前言当我们有非常多的变量值需要进行存储时，我们就会接触到“数组”这个概念，他可以使用一条C语言语句来申请若干个存储空间来存储若干变量。数组(1)数组是一组有序数据的集合。数组中各数据的排列是有一定的规律的，下标代表数据在数组中的序号。(2)用一个数组名和下标来唯一确定数组中的元素，如a3就代表第3个元素的值。(3)数组中的每一个元素都属于同一数据类型。不可以把不同类型的数据放在同一个数组中。数组的
C语言从入门到精通 - 学习资源颜栩原
C语言从入门到精通-学习资源【下载地址】C语言从入门到精通-学习资源C语言从入门到精通-学习资源欢迎来到《C语言从入门到精通》的学习资源页面项目地址:https://gitcode.com/open-source-toolkit/a3eac欢迎来到《C语言从入门到精通》的学习资源页面。这本书是专为那些渴望深入理解并掌握C语言的初学者以及进阶者所准备的宝贵资料。通过本书，你将能够系统地学习C语言的基
（三）python网络爬虫（理论+实战）——爬虫与反爬虫阳光宅男xxb 30天学会python网络爬虫 python 大数据爬虫
系列文章目录（1）python网络爬虫—快速入门（理论+实战）（一）（2）python网络爬虫—快速入门（理论+实战）（二）序言本人从事爬虫相关工作已8年以上，从一个小白到能够熟练使用爬虫，中间也走了些弯路，希望以自身的学习经历，让大家能够轻而易举的，快速的，掌握爬虫的相关知识并熟练的使用它，避免浪费更多的无用时间，甚至走
Spring Boot 单元测试 leisurelyZ spring boot junit
在软件开发过程中，单元测试是确保代码质量和稳定性的重要环节。对于使用SpringBoot框架构建的应用程序，编写单元测试同样重要。本文将介绍如何在SpringBoot中编写单元测试，帮助你更好地进行软件开发和维护。1.为什么需要单元测试？单元测试的主要目的是验证代码的最小可测试部分是否按预期工作。这不仅有助于发现和修复错误，还能提高代码的可维护性和可读性。对于SpringBoot应用，单元测试可以
springboot+vue项目实战2024
1.创建项目@SpringBootApplicationpublicclassApp{publicstaticvoidmain(String[]args){SpringApplication.run(App.class,args);}}2.引入依赖4.0.0org.springframework.bootspring-boot-starter-parent3.1.3com.ivan.cnshizh
202年寒假充电计划——自学手册网络安全（黑客技术）网安康sir web安全安全网络 php 开发语言
前言什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习导航三大章节，涉及价值观、方法论、执行力、行业分类、职位解读、法
免费AI大模型API汇总（非常详细），零基础入门到精通，看这一篇就够了大模型扬叔人工智能免费AI大模型API汇总大模型
前言一、免费大模型API一览大模型免费版本免费限制控制台（api_key等）讯飞星火大模型spark-litetokens：总量无限；QPS：2；(每秒发送的请求数)有效期：不限访问链接百度千帆大模型平台ERNIE-Speed-8KRPM=300，TPM=300000（RPM是每分钟请求数（RequestsPerMinute），TPM是指每分钟处理的tokens数量）访问链接ERNIE-Speed
SpringBoot整合Easy-Es 今天的接口写完了吗？ elasticsearch spring boot elasticsearch 后端
目录一、什么是Easy-Es二、使用场景2.1检索类服务2.2问答类服务(本质上也是检索类)2.3地图类服务三、springboot整合Easy-Es3.1pom.xml3.2配置文件3.3创建、删除、查询索引3.4创建一个实体类3.5新建Mapper类，类似Mybatis的dao3.6启动类扫描dao四、代码展示五、原生Api调用5.1查看索引mapping关系5.2查看某个文档，具体字段的分词
Elastic Stack（filebeat/logstash/elasticserarch/kibana）性能分析应用一缕晨光~ Elastic Stack elasticsearch kibana elk 大数据
目录概要：1.待分析日志的格式（1条日志）：2.filebeat设置获取日志的路径：3.logstash匹配日志4.调试5.Elasticsearch插件（方便对es的查询与删除）6.对已有日志进行分析7、Kibana展示概要：使用kibana展示日志分析结果的初衷是性能分析，终于分析出了第一份日志。性能压测情况下，某个日志文件的分析出的响应时间分布。上篇文章请参看：logstashconfigf
MySQL数据库入门到大蛇尚硅谷宋红康老师笔记基础篇 part 5 E___V___E 数据库 mysql 笔记
第05章_排序与分页排序#第05章_排序与分页#1.排序#如果没有使用排序操作，默认情况下查询返回的数据是按照添加数据的顺序显示的。SELECT*FROMemployees;#1.1基本使用#使用ORDERBY对查询到的数据进行排序操作。#升序：ASC(ascend)#降序：DESC(descend)#练习：按照salary从高到低的顺序显示员工信息#使用ORDERBY对查询到数据排序操作SELE
【新人向】关于PyCharm中Python Interpreter问题的一些解答 Cold_Rain02 python pycharm ide
0.引言很多新人在刚刚入门Python这一领域时，会选择使用PyCharm作为自己的开发环境，但由于经验浅薄、认知不足，经常会出现很多难以解决的问题，其中以PythonInterpreter（Python解释器）相关问题最为常见，遂作此篇，以作指引。1.你需了解：PyCharm的本质是什么PyCharm是一款由JetBrains公司开发的集成开发环境（IDE），专门用于Python编程。它提供了丰
MySQL入门学习-索引.删除索引守护者170 MySQL学习数据库学习 mysql
一、索引的概念索引是一种特殊的数据结构，用于加速数据库中数据的检索。它可以提高查询的效率，减少磁盘I/O操作，从而加快数据的访问速度。二、索引的类型MySQL支持多种类型的索引，包括：1.主键索引（PRIMARYKEY）：用于唯一标识表中的每行记录。2.唯一索引（UNIQUE）：确保表中某一列的值是唯一的。3.普通索引（INDEX）：用于加速数据的查询。4.全文索引（FULLTEXT）：用于对文本
C语言青蛙跳台阶问题共享家9527 c语言
在算法学习中，青蛙跳台阶问题是一个经典的递归和动态规划入门案例。它通过简单的场景，揭示了复杂的算法思想，非常适合初学者理解递归与动态规划的核心概念。一、问题描述一只青蛙要跳上n级台阶，每次它可以跳1级或者2级台阶。那么，青蛙跳上n级台阶总共有多少种不同的跳法呢？二、解题思路递归思路：-对于第n级台阶，青蛙到达它的方式要么是从第n-1级台阶跳1级上来，要么是从第n-2级台阶跳2级上来。-所以，跳上n
Hibernate快速入门：基于H2内存数据库的ORM实践 t0_54coder 数据库 hibernate oracle 个人开发
在当今的软件开发中，ORM（对象关系映射）框架已经成为简化数据库操作的重要工具之一。Hibernate作为Java领域中非常流行的ORM框架，能够帮助开发者将Java类映射到数据库表中，从而减少大量的数据库操作代码。本文将通过一个简单的示例，介绍如何使用Hibernate结合H2内存数据库，快速实现一个简单的ORM应用。一、项目依赖配置在开始之前，我们需要配置项目的依赖。这里我们使用Maven作为
【python GUI编码入门-04】使用Tkinter实现拖放操作：打造交互式GUI的秘诀木头左 python办公自动化 python
哈喽，大家好，我是木头左！理解拖放操作的基础在开始编码之前，需要了解拖放操作的基本概念。简单来说，拖放是一种用户通过鼠标移动对象（如文件、图标或窗口中的组件）并将其放置在新位置的操作。在Tkinter中，这涉及到几个关键步骤：捕获拖动事件、更新对象位置以及处理放置事件。环境搭建与基础组件确保你的Python环境中安装了Tkinter。大多数Python发行版默认包含Tkinter，但如果没有，你可
【SpringBoot 】dynamic 动态数据源配置连接池（转） binqian spring spring boot 数据库 oracle
前言在复杂的业务场景中，我们经常需要使用多数据源来满足不同的数据访问需求。DynamicDatasource为我们提供了一种灵活切换不同数据源的解决方案。但是多数据源配置连接池以及说明文档都是收费的。本篇博文将详细介绍如何配置和优化DynamicDatasource的连接池，包括Druid和HikariCP，以及如何根据项目需求进行选择。连接池配置连接池是数据库连接管理的核心组件，它可以显著提高数
PC端后台管理系统实现在线预览文件在下不知好歹前端 javascript html
PC端后台管理系统实现在线预览文件后台管理系统是每个新手前端必然接触的项目，当产品要求在线预览文件的预览的时候，我收集了两种在线预览的方法，希望对一些刚入门的小白有所帮助1.使用iframe标签微软有一个解析地址，Word、Xls、PPT这些文件需要使用微软官方的解析地址，如微软解析地址：https://view.officeapps.live.com/op/view.aspx?src=你的文件地
Opus编解码协议入门弱冠少年嵌入式软件嵌入式硬件
主要参考资料：走进音视频的世界——Opus编解码协议:https://blog.csdn.net/u011686167/article/details/126647876目录1.简介2.码率与音质、延时的关系2.1音质与码率比较2.2码率与延时对比3.Opus编解码框架4.DTX非连续传输5.FEC前向纠错1.简介Opus是一种开源免费的音频编解码器，支持音乐和语音，具有低延时、带内FEC、DTX
Wi-Fi AP模式入门（基于ESP-IDF）弱冠少年嵌入式软件网络
主要参考资料：Wi-Fi库:https://docs.espressif.com/projects/esp-idf/zh_CN/v4.4/esp32s3/api-reference/network/esp_wifi.htmlESP-NETIF:https://docs.espressif.com/projects/esp-idf/zh_CN/v4.4/esp32s3/api-reference/n
Pandas读写JSON文件的终极指南与实战技巧read_json、to_json 步入烟尘 Python超入门指南全册 pandas json python 文件处理实战技巧
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
[Python从零到壹] 七十七.图像识别及经典案例篇之目标检测入门普及和ImageAI对象检测详解 Eastmount Python从零到壹 python 目标检测 ImageAI 图像是被基础系列
欢迎大家来到“Python从零到壹”，在这里我将分享约200篇Python系列文章，带大家一起去学习和玩耍，看看Python这个有趣的世界。所有文章都将结合案例、代码和作者的经验讲解，真心想把自己近十年的编程经验分享给大家，希望对您有所帮助，文章中不足之处也请海涵。Python系列整体框架包括基础语法10篇、网络爬虫30篇、可视化分析10篇、机器学习20篇、大数据分析20篇、图像识别30篇、人工智
C++从入门到实战（二）C++命名空间珹洺 C++学习之旅 c++算法开发语言
C++从入门到实战（二）C++命名空间前言一、C++的第一个程序二、命名空间（一）为什么需要命名空间（二）定义命名空间（三）使用命名空间1.通过命名空间限定符：2.使用using声明：2.1展开命名空间2.2使用usingnamespace（四）嵌套命名空间（五）标准命名空间std前言上一节我们介绍了C++的历史，对这门强大编程语言的发展脉络有了清晰认识。这一节我们将围绕着C++的第一个程序，深入
springboot+vue项目实战2024第四集修改文章信息 java后端
1.添加文章信息@PostMappingpublicResultadd(@RequestBody@ValidatedArticlearticle){articleService.add(article);returnResult.success();}voidadd(Articlearticle);@Overridepublicvoidadd(Articlearticle){article.set
入门Stable-Diffusion-WebUI全过程沙漠蓝色披头 Ai大模型 stable diffusion
这里用的软件叫“stable-diffusion-webui”，严格意义上来说是一个基于StableDiffusion的开源项目。这个项目非常强大，把原本很难安装配置的开源项目做成了一个简单易操作的网页，后来又引入了插件系统，可以玩出很多花样。最重要的是这一切都免费且开源。安装stable-diffusion-webui需要事先做一些准备工作。一台带中高端显卡的电脑电脑可以流畅的访问github安
SpringBoot日常：集成Kafka 码至终章 spring boot kafka java 后端
文章目录1、pom.xml文件2、application.yml3、生产者配置类4、消费者配置类5、消息订阅6、生产者发送消息7、测试发送消息本章内容主要介绍如何在springboot项目对kafka进行整合，最终能达到的效果就是能够在项目中通过配置相关的kafka配置，就能进行消息的生产和消费。1、pom.xml文件原本项目用SpringBoot的版本为2.6.X，所以这里用spring-clo
RabbitMQ-SpringBoot案例 -topic模式毕竟尹稳健 RabbitMQ SpringBoot rabbitmq spring boot java
生产者工程1、RabbitTemplate配置类无,其实并不是没有，而是将配置类的方式换成了注解的。但实际上开发建议用配置类，注解也就图一乐。2、消息发送服务packagecom.sky.service.impl;importcom.sky.service.OrderService;importorg.springframework.amqp.rabbit.core.RabbitTemplate;
springboot实现webservice的发布和调用梦星剑魂 springboot mvc java spring
springboot使用cxf发布调用webservice发布webservicepom文件org.apache.cxfcxf-spring-boot-starter-jaxws3.2.5webservice接口packagecom.example.webservicedemo.fabu;importjavax.jws.WebMethod;importjavax.jws.WebParam;impo
SpringBoot WebService IDEA版本客户端调用（postman调用） SmileDark Spring SpringBoot WebService SpringBoot WebService WebService springboot ws postman 调用WebSerice postman webservice
webservice是什么网上的解释很多，其实就是跨语言和操作系统的的远程调用技术。比如亚马逊，可以将自己的服务以webservice的服务形式暴露出来，我们就可以通过web调用这些，无论我们使用的语言是java还是c，这也是SOA应用一种表现形式。注意点讲在前面1.命名空间（nameSpase）.xsd文件targetNamespace==Endpoint的NAMESPACE_URI1.新建sp
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一