欧内的手好汗

ElasticSearch个人学习笔记狂神说

ES安装

介绍：ELK是Elasticsearch、Logstash、Kibana的合体，市面上也成为Elastic Stack，是一个日志分析架构技术栈总称

声明：JDK版本1.8+才可以

安装：ElasticSearch客户端、可视化界面，整合的时候版本要对应

1.下载es

官网：https://www.elastic.co/cn/

华为云镜像：
ElasticSearch: https://mirrors.huaweicloud.com/elasticsearch/?C=N&O=D
logstash: https://mirrors.huaweicloud.com/logstash/?C=N&O=D
kibana: https://mirrors.huaweicloud.com/kibana/?C=N&O=D

暂时先下载了7.6.2版本

修改配置文件

修改jvm的内存为256m 初始是1g

运行elasticsearch.bat

访问localhost:9200

2. 安装可视化界面es head

网址：https://github.com/mobz/elasticsearch-head

# Running with built in server
git clone git://github.com/mobz/elasticsearch-head.git
cd elasticsearch-head`
npm install
npm run start

`open` http://localhost:9100/

This will start a local webserver running on port 9100 serving elasticsearch-head

# Running with docker
for Elasticsearch 5.x: `docker run -p 9100:9100 mobz/elasticsearch-head:5`
for Elasticsearch 2.x: `docker run -p 9100:9100 mobz/elasticsearch-head:2`
for Elasticsearch 1.x: `docker run -p 9100:9100 mobz/elasticsearch-head:1`
for fans of alpine there is `mobz/elasticsearch-head:5-alpine`

`open` http://localhost:9100/

此时打开控制台，发现报跨域错误

配置跨域

打开elasticsearch.yml，输入

http.cors.enabled: true
http.cors.allow-origin: "*"

配置完成后将显示es节点

新建索引

索引当成一个数据库，文档当成库里的数据，这个head当成一个数据展示工具，后面所有的查询操作都在Kibana中进行

3. 安装Kibana

网址：kibana: https://mirrors.huaweicloud.com/kibana/?C=N&O=D

版本要和ES版本一致

启动比较耗时，访问localhost:5601
打开Dev tools页面，可以测试连接
汉化：打开kibana.yml，添加i18n.locale: “zh-CN”

ES核心概念

1. 总体概述

Elasticsearch是面向文档的，ES中的一切都是JSON。关系型数据库和 Elasticsearch对比：

Mysql存数据：建库 – 建表 – 建行(对应具体数据) – 写入字段

ES存数据：建索引 – 建立types(慢慢被弃用) – 创建文档(对应具体数据)

物理设计：

ES在后台把每个索引划分成多个分片，每个分片可在集群中不同的服务器之间迁移，他一个人就是一个集群，不存在单个的ES

逻辑设计：

一个索引类型包含多个文档：文档1、文档2.当索引一篇文档时，可通过这样的顺序找到他：索引 – 类型 – 文档ID，通过这个组合我们就能所引导某个具体的文档。

2. 文档

文档就是一条条数据，类似行：

user:
1  zhangsan  18
2  wangwu    19
3  zhaoliu   20

ES是面向文档的，所以索引搜索数据的最小单位就是文档。文档重要属性：

自我包含，一篇文章同时包含字段和对应的值，即包含key:value
可以使层次型的，一个文档中包含文档，复杂的逻辑实体就是这么来的
灵活的结构，文档不依赖预先定义的模式，我们知道关系型数据库中，要提前定义字段才能使用，在elasticsearch中，对于字段是非常灵活的，有时候,我们可以忽略该字段，或者动态的添加一个新的字段。

3. 类型

类型是文档的逻辑容器，类似表，就像关系型数据库一样，表格是行的容器。类型中对于字段的定义称为映射，比如name映射为字符串类型。我们说文档是无模式的，它们不需要拥有映射中所定义的所有字段，比如新增一个字段，那么elasticsearch是怎么做的呢?

elasticsearch会自动的将新字段加入映射，但是这个字段的不确定它是什么类型，elasticsearch就开始猜，如果这个值是18，那么elasticsearch会认为它是整形。但是elasticsearch也可能猜不对，所以最安全的方式就是提前定义好所需要的映射，这点跟关系型数据库殊途同归了，先定义好字段，然后再使用。

4. 索引

索引是映射类型的容器，类似数据库， elasticsearch中的索引是一个非常大的文档集合。索引存储了映射类型的字段和其他设置。然后它们被存储到了各个分片上了。我们来研究下分片是如何工作的。

5. 物理设计：节点和分片如何工作

创建新索引

一个集群至少有一个节点，而一个节点就是一个elasricsearch进程，节点可以有多个索引默认的，如果你创建索引，那么索引将会有个5个分片(primary shard ,又称主分片)构成的，每一个主分片会有一个副本(replica shard，又称复制分片)

上图是一个有3个节点的集群，可以看到主分片和对应的复制分片都不会在同一个节点内，这样有利于某个节点挂掉了，数据也不至于失。实际上，一个分片是一个Lucene索引（一个ElasticSearch索引包含多个Lucene索引） ，一个包含倒排索引的文件目录，倒排索引的结构使得elasticsearch在不扫描全部文档的情况下，就能告诉你哪些文档包含特定的关键字。不过，等等，倒排索引是什么鬼?

6. 倒排索引

搜索的核心需求是全文检索，全文检索简单来说就是要在大量文档中找到包含某个单词出现的位置，在传统关系型数据库中，数据检索只能通过 like 来实现，例如需要在酒店数据中查询名称包含公寓的酒店，需要通过如下 sql 实现：

select * from hotel_table where hotel_name like '%公寓%';

这种实现方式实际会存在很多问题：

无法使用数据库索引，需要全表扫描，性能差
搜索效果差，只能首尾位模糊匹配，无法实现复杂的搜索需求
无法得到文档与搜索条件的相关性

正排索引：是以文档对象的唯一 ID 作为索引，以文档内容作为记录的结构。

倒排索引：Inverted index，指的是将文档内容中的单词作为索引，将包含该词的文档 ID 作为记录的结构。

例子

有两个文档

文档 id	content
1	苏州街维亚大厦
2	桔子酒店苏州街店

生成倒排索引：

首先进行分词，这里两个文档包含的关键词有：苏州街、维亚大厦…
然后按照单词来作为索引，对应的文档 id 建立一个链表，就能构成上述的倒排索引结构。

Word	文档 id
苏州街	1,2
维亚大厦	1
维亚	1
桔子	2
酒店	2
大赛	1

有了倒排索引，能快速、灵活地实现各类搜索需求。整个搜索过程中我们不需要做任何文本的模糊匹配。

例如，如果需要在上述两个文档中查询 苏州街桔子 ，可以通过分词后 苏州街 查到 1、2，通过桔子查到 2，然后再进行取交取并等操作得到最终结果。

在ES中，索引（库）被分为多个分片，每个分片是一个Lucene的索引。所以一个ES索引是由多个Lucene索引组成的

IK分词器

1. 配置

下载网址：https://github.com/medcl/elasticsearch-analysis-ik/releases
新建文件夹“ik”，放到es的plugin文件夹中，将文件解压到ik里
重启es
可以通过elasticsearch-plugin list命令查看加载的插件

2. 测试

有两种模式：ik_smart(最少切分) 和 ik_max_word(最细粒度划分)

GET _analyze
{
  "analyzer": "ik_smart",
  "text": "中国共产党"
}
//结果
{
  "tokens" : [
    {
      "token" : "中国共产党",
      "start_offset" : 0,
      "end_offset" : 5,
      "type" : "CN_WORD",
      "position" : 0
    }
  ]
}

GET _analyze
{
  "analyzer": "ik_max_word",
  "text": "中国共产党"
}
//结果
{
  "tokens" : [
    {
      "token" : "中国共产党",
      "position" : 0
    },
    {
      "token" : "中国",
      "position" : 1
    },
    {
      "token" : "国共",
      "position" : 2
    },
    {
      "token" : "共产党",
      "position" : 3
    },
    {
      "token" : "共产",
      "position" : 4
    },
    {
      "token" : "党",
      "position" : 5
    }
  ]
}

3. 添加自定义词汇到词典中

elasticsearch/plugins/ik/config/IKAnalyzer.cfg.xml

<properties>
	<comment>IK Analyzer 扩展配置comment>
	
	<entry key="ext_dict">herb_names.dicentry>
	 
	<entry key="ext_stopwords">entry>
properties>

elasticsearch/plugins/ik/config/herb_names.dic

麻黄
桂枝
荆芥
...

REST风格操作

基本Rest命令说明

method	url地址	描述
PUT（创建,修改）	localhost:9200/索引名称/类型名称/文档id	创建文档（指定文档id）
POST（创建）	localhost:9200/索引名称/类型名称	创建文档（随机文档id）
POST（修改）	localhost:9200/索引名称/类型名称/文档id/_update	修改文档
DELETE（删除）	localhost:9200/索引名称/类型名称/文档id	删除文档
GET（查询）	localhost:9200/索引名称/类型名称/文档id	查询文档通过文档ID
POST（查询）	localhost:9200/索引名称/类型名称/文档id/_search	查询所有数据

测试

1. 创建索引

Deprecation: [types removal] Specifying types in document index requests is deprecated, use the typeless endpoints instead (/{index}/doc/{id}, /{index}/doc, or /{index}/_create/{id}).

//已弃用方式：
PUT /test1/type1/1
{
   "name" : "流柚",
   "age" : 18
}

//替换：
PUT /test1/_doc/1
{
    "name": "流油",
    "age": 18
}

结果：

2. 字段数据类型

字符串类型
- text、keyword
  - text：支持分词，全文检索,支持模糊、精确查询,不支持聚合,排序操作;text类型的最大支持的字符长度无限制,适合大字段存储；
  - keyword：不进行分词，直接索引、支持模糊、支持精确匹配，支持聚合、排序操作。keyword类型的最大支持的长度为——32766个UTF-8类型的字符,可以通过设置ignore_above指定自持字符长度，超过给定长度后的数据将不被索引，无法通过term精确匹配检索返回结果。
数值型
- long、Integer、short、byte、double、float、half float、scaled float
日期类型
- date
te布尔类型
- boolean
二进制类型
- binary
等等…

3. 指定字段的类型

设置规则

PUT /test2
{
  "mappings": {
    "properties": {
      "name": {
        "type": "text"
      },
      "age": {
        "type": "long"
      },
      "birthday": {
        "type": "date"
      }
    }
  }
}

通过GET获取建立的规则

GET /test2

添加数据

PUT /test2/_doc/1
{
  "name": "这里就叫卢本伟广场好了",
  "age": 19,
  "birthday": "2022-12-19"
}

如果自己的文档字段没有被指定，那么ElasticSearch就会给我们默认配置字段类型

扩展：通过GET _cat/xx 可以获取ElasticSearch的当前的很多信息！

GET _cat/indices
GET _cat/aliases
GET _cat/allocation
GET _cat/count
GET _cat/fielddata
GET _cat/health
GET _cat/indices
GET _cat/master
GET _cat/nodeattrs
GET _cat/nodes
GET _cat/pending_tasks
GET _cat/plugins
GET _cat/recovery
GET _cat/repositories
GET _cat/segments
GET _cat/shards
GET _cat/snapshots
GET _cat/tasks
GET _cat/templates
GET _cat/thread_pool

4. 修改

旧的方法（使用put覆盖原来的值）
- 版本+1（_version）
- 但是如果漏掉某个字段没有写，那么更新是没有写的字段，会消失

PUT /test2/_doc/1
{
  "name": "这里就叫卢本伟广场",
  "birthday": "2022-12-19"
}

es-head中对应记录的age字段消失

新的方法（使用post的update）
- version不会改变
- 需要注意doc
- 不会丢失字段

POST /test2/_doc/2/_update
{
  "doc": {
    "age": 122,
    "birthday": "1919-10-10"
  }
}

没有指定"name"并不会导致他的“name”丢失

5. 删除

删除索引
DELETE /test1
删除文档
DELETE /test2/_doc/1

6. 查询

简单查询

GET /test2/_doc/_search?q=birthday:2022-12-19

匹配查询
- match：匹配（会使用分词器解析（先分析文档，然后进行查询））
- _source：过滤字段，即要获取的字段
- sort：排序
- form、size 分页

GET /test2/_doc/_search   (现在不用写_doc，直接GET /test2/_serach 就行)
{
  "query": {
    "match": {
      "name": "中国饭"
    }
  },
  "_source": [  //获取name 和 age
    "name",
    "age"
  ],
  "sort": [
    {
      "age": {
        "order": "asc"
      }
    }
  ],
  "from": 0,  //from是第几个开始 不是第几页
  "size": 15  //一页多少个
}

匹配的方法与sql的like不同

多条件查询（bool)
- must 相当于 and
- should 相当于 or
- must_not 相当于 not (... and ...)
- filter 过滤

GET /test2/_search
{
  "query":{
    "bool": {
      "must": [
        {
          "match": { "birthday": "2022-12-19" }
        }
      ],
      "should": [
        {
          "match": { "name": "这里就叫卢本伟广场" }
        },
        {
          "match": { "name": "吃" }
        }
      ], 
      "filter": {
        "range": {
          "age": { "gte": 0, "lte": 120 }
        }
      }
    }
  }
}

匹配数组
- 可以多关键字查（空格隔开）— 匹配字段也是符合的
- match 会使用分词器解析（先分析文档，然后进行查询）
- 搜词

先创建这样的文档

PUT /test1/_doc/1    
{
  "id": "10001",
  "name": "麻黄散",
  "ingredient": [
    "当归", "吴茱萸", "大黄"
  ]
}

再进行查询

GET /test1/_search
{
  "query":{
    "match":{
      "ingredient":"白术 当归 大黄 仓鼠"  //默认将所有结果or起来
    }
  }
}

结果

"hits" : [
      {
        "_id" : "6",
        "_score" : 4.2601705,
        "_source" : { "id" : "10006", "name" : "药方6", "ingredient" : ["当归","白术","大黄"] }
      },
      {
        "_id" : "1",
        "_score" : 3.0661612,
        "_source" : { "id" : "10001", "name" : "麻黄散", "ingredient" : ["当归","吴茱萸","大黄"] }
      },
      {
        "_id" : "5",
        "_score" : 1.7683537,
        "_source" : { "id" : "10005", "name" : "药方5", "ingredient" : ["大黄","龙胆草","木香"] }
      },
      {
        "_id" : "2",
        "_score" : 1.2978076,
        "_source" : { "id" : "10002", "name" : "药方2", "ingredient" : ["百合","当归","浙贝母"] }
      },
      {
        "_id" : "3",
        "_score" : 1.1404719,
        "_source" : { "id" : "10003", "name" : "药方3", "ingredient" : ["白术","百合"] }
      }
    ]

精确查询
- term 直接通过倒排索引指定词条查询
- 适合查询 number、date、keyword ，不适合text

// 精确查询（必须全部都有，而且不可分，即按一个完整的词查询）
// term 直接通过 倒排索引 指定的词条 进行精确查找的
GET /test1/_search
{
  "query":{
    "term":{
      "ingredient": "白"  //这里用白能搜出来，但是白术就搜不出来了，是中文分词的问题
        				  //用match_phrase代替term 或 修改索引中ingredient的analyzer为ik
    }
  }
}

text在查询时会被分词器分析，keyword整体进行查询不分词

手动指定类型为keyword

PUT /test3
{
  "mappings": {
    "properties": {
      "name": { "type": "text" },
      "id": { "type": "long" },
      "ingredient": { "type": "keyword" }
    }
  }
}

插入数据

PUT /test3/_doc/1
{
  "name": "中药1",
  "id": 121,
  "ingredient": [ "白术", "当归", "浙贝母" ]
}

查询数据

//单独查询一个关键词
GET /test3/_search
{
  "query": {
    "term": {
      "ingredient": "白术"  //白术能查出来，白、白术1查不出来
    }
  }
}
//查询多个关键词
//  1.只要包含里面的其中一个都会被查出来，所有记录score都为1
GET /test3/_search
{
  "query": {
    "terms": {
      "ingredient": ["白术", "麻药", "的使劲地发"]  
    }
  }
}
//  2.需要包含所有指定的词
GET /test3/_search
{
  "query": {
    "bool": {
      "must": [
        { "term": { "ingredient": "白术" } },
        { "term": { "ingredient": "麻药" } }
      ]
    }
  }
}
//  3.包含其中一个就可以，包含的越多score越高
GET /test3/_search
{
  "query": {
    "bool": {
      "should": [
        { "term": { "ingredient": "白术" } },
        { "term": { "ingredient": "麻药" } },
        { "term": { "ingredient": "吴恩达" } }
      ]
    }
  }
}

设置为keyword后，不管查询方式是match还是term，如果不完全相等都不会被查出来，查询”白术“时，“白术1”就查不出来，这是由keyword的性质决定的，不取决于查询的方式。而在之前未指定keyword的例子中，查询 “白术1”、“白魔术” 都是可以查出来的。

模糊查询
- wildcard 查询条件分词模糊查询
- regexp 正则查询
- prefix 前缀查询

GET /test3/_search
{
  "query": {
    "wildcard": {
      "ingredient": "白*"   //查出白 白术 白术1 白芷
    }
  }
}
GET /test3/_search
{
  "query": {
    "wildcard": {
      "ingredient": "白??"  //查出白术1
    }
  }
}

不要在搜索字段的前面加通配符，不然会像数据库一样扫描一遍整个表去匹配数据

7. 高亮

可以设置高亮，让查询到的字词凸显出来

GET /test1/_search
{
  "query":{
    "match":{
      "ingredient":"白术 当归"
    }
  },
  "highlight": {
    "pre_tags": "", //指定前缀 默认
    "post_tags": "", 		  //指定后缀 默认
    "fields": {
      "ingredient": {}				  //指定高亮字段
    }
  }
}

结果

{
    "_id" : "6",
    "_score" : 2.3712473,
    "_source" : {
       "id" : "10006",
       "name" : "药方6",
       "ingredient" : [ "当归", "白术", "大黄" ]
    },
    "highlight" : {
       "ingredient" : [
         "当归",
         "白术"
       ]
    }
}

8. 最小匹配度

当输入一串很长的文本，使用match对其进行搜索时，会搜出来一大堆不相关的东西。

比如输入 “福曦堂四川白芍生白芍白芍片芍药中药材可磨白芍粉也可搭配川芎当归使用精选货白芍250克*1罐福曦堂四川白芍生白芍白芍片芍药中药材可磨白芍粉也可搭配川芎当归使用精选货白芍”，搜索结果：

"hits" : {
    "total" : {
      "value" : 263,  // 搜到了好多没用的
      "relation" : "eq"
    },
    "max_score" : 229.36502,
    "hits" : [
        ...
    ]
}

highlight一下看一下那些不相关的他怎么匹配的

所以我们使用minimum_should_match来过滤一些无关内容。
当搜索“Sip on La Croix”时，分词器会将其解析成：

{ 
  "bool": { 
    "should": [ 
      { "term": { "body": "Sip"}}, 
      { "term": { "body": "on"}}, 
      { "term": { "body": "La"}},
      { "term": { "body": "Croix"}},
    ]
  } 
}

当我们指定minimum_should_match后，他会根据你指定的值来进行结果的筛选。具体如下图

使用

GET /goods-temp/_search 
{
  "query": {
    "match": {
      "title": {
        "query": "福曦堂 四川白芍 生白芍 白芍片 芍药 中药材 可磨白芍粉也可搭配川芎 当归使用 精选货 白芍250克*1罐 福曦堂 四川白芍 生白芍 白芍片 芍药 中药材 可磨白芍粉也可搭配川芎 当归使用 精选货 白芍",
        "minimum_should_match": "4<40%"
      }
    }
  }
}
//结果
"hits" : {
    "total" : {
      "value" : 7,
      "relation" : "eq"
    },
    "max_score" : 229.36502,
    "hits" : [
      {
        "_score" : 229.36502,
        "_source" : { "title" : "福曦堂 四川白芍 生白芍 白芍片 芍药 中药材 可磨白芍粉也可搭配川芎 当归使用 精选货 白芍250克*1罐 福曦堂 四川白芍 生白芍 白芍片 芍药 中药材 可磨白芍粉也可搭配川芎 当归使用 精选货 白芍250克*1罐" }
      },
      {
        "_score" : 67.59854,
        "_source" : { "title" : "京东超市 福东海 川芎片250克/袋 中药材当归白芍川芎粉熟地四物汤原料川穹 川芎茶 【五一秒杀特惠,2件9折】宁夏原产红枸杞500克2件到手均件价35.9元！上浮率92%以上,大颗足干,新鲜无硫，活动时间:5月2日20点-3日20点点击" }
      },
      {
        "_score" : 67.06959,
        "_source" : { "title" : "福曦堂土茯苓 四川土茯苓 中药材 土茯苓干货 精选货 土茯苓500克*1袋 福曦堂土茯苓 四川土茯苓 中药材 土茯苓干货 精选货 土茯苓500克*1袋" }
      },
      { 
        "_score" : 62.90972,
        "_source" : { "title" : "北京同仁堂四物汤膏搭四物汤中药材颗粒汤包四君子汤搭当归白芍川芎熟地黄八珍膏补f气血不足月经不调怡福寿 1支装 北京同仁堂四物汤膏搭四物汤中药材颗粒汤包四君子汤搭当归白芍川芎熟地黄八珍膏补f气血不足月经不调怡福寿 1支装" }
      },
      {
        "_score" : 58.995457,
        "_source" : { "title" : "福曦堂沙苑子 沙苑蒺藜 沙菀子潼蒺藜可代磨沙苑子粉 中药材 沙苑子250克*1罐 福曦堂沙苑子 沙苑蒺藜 沙菀子潼蒺藜可代磨沙苑子粉 中药材 沙苑子250克*1罐" }
      },
      { 
        "_score" : 55.16248,
        "_source" : { "title" : "福东海四物汤中药材当归熟地黄川穹白芍四物汤原料 4袋*10包（共400g） 超值特惠全店所有商品2件9折，活动时间4月26日-5月5日。热销产品买二送一···" }
      },
      { 
        "_score" : 49.526695,
        "_source" : { "title" : "世斛堂 生何首乌片 四川何首乌中药材切片何首乌干片精选可泡水煮粥煲汤 何首乌-1000克 精选正品原料，保证质量售后，让购买放心无忧。" }
      }
    ]
  }

不过没有达到我想要的效果，以后再研究。

集成SpringBoot

SpringBoot: 2.2.1.RELEASE

ElasticSearch: 7.6.2

1. 创建空Maven项目，指定es的version


<properties>
    <java.version>8java.version>
    <elasticsearch.version>7.6.2elasticsearch.version>
properties>

2. 依赖

<dependencies>
        <dependency>
            <groupId>org.springframework.bootgroupId>
            <artifactId>spring-boot-starter-webartifactId>
        dependency>
        <dependency>
            <groupId>org.springframework.bootgroupId>
            <artifactId>spring-boot-starter-data-elasticsearchartifactId>
        dependency>
        <dependency>
            <groupId>com.alibabagroupId>
            <artifactId>fastjsonartifactId>
            <version>1.2.79version>
        dependency>
        <dependency>
            <groupId>org.projectlombokgroupId>
            <artifactId>lombokartifactId>
        dependency>
dependencies>

3. 配置ElasticSearchClientConfig配置类，添加Bean

@Configuration
public class ElasticSearchClientConfig {

    @Bean
    public RestHighLevelClient restHighLevelClient() {
        RestHighLevelClient client = new RestHighLevelClient(
                RestClient.builder(
                        new HttpHost("localhost", 9200, "http")
                )
        );
        return client;
    }
}

4. 创建实体类

@Data
@NoArgsConstructor
@AllArgsConstructor
public class Prescription implements Serializable {

    private static final long serialVersionUID = 1L;

    private Long id;

    private String name;

    private List<String> ingredient;

}

5. 测试

注入RestHighLevelClient

 @Autowired
 private RestHighLevelClient client;

1. 测试索引

创建索引

@Test
public void createIndex() throws IOException {
    //配置索引
    CreateIndexRequest request = new CreateIndexRequest("test4");
    CreateIndexResponse response = client.indices().create(request, RequestOptions.DEFAULT);

    System.out.println("是否创建成功:" + response.isAcknowledged());
    System.out.println("返回对象:" + response);
    client.close();
}

获取索引

@Test
public void queryIndex() throws IOException {
    GetIndexRequest request = new GetIndexRequest("test4");
    //是否存在：client.indices().exists(request, RequestOptions.DEFAULT);
    GetIndexResponse response = client.indices().get(request, RequestOptions.DEFAULT);
    System.out.println(response);
    client.close();
}

删除索引

@Test
public void deleteIndex() throws IOException {
    DeleteIndexRequest request = new DeleteIndexRequest("test4");
    AcknowledgedResponse response = client.indices().delete(request, RequestOptions.DEFAULT);
    System.out.println(response);
    client.close();
}

2. 文档操作

添加文档

添加单条记录

@Test
public void addDocument() throws IOException {
    Prescription prescription = new Prescription();
    prescription.setId(10009L);
    prescription.setName("麻黄散他爹");
    List<String> list = new ArrayList<>();
    list.add("当归");
    list.add("人参");
    list.add("阿胶");
    prescription.setIngredient(list);

    IndexRequest request = new IndexRequest("test3");  //Index
    request.id("9");
    request.timeout(TimeValue.timeValueMillis(2000));
    request.source(JSON.toJSONString(prescription), XContentType.JSON);
    IndexResponse response = client.index(request, RequestOptions.DEFAULT);
    System.out.println(response.status());
    client.close();
}

添加多条记录

@Test
public void addDocumentBatch() throws IOException {
    BulkRequest request = new BulkRequest("test3");  //Global Index
    
    List<Prescription> list = new ArrayList<>();
    list.add(new Prescription(10L, "10", null));
    list.add(new Prescription(11L, "11", null));
    list.add(new Prescription(12L, "12", null));
    list.add(new Prescription(13L, "13", null));
    list.forEach(item -> {
        request.add(new IndexRequest()
                .id(item.getId().toString())
                .source(JSON.toJSONString(item), XContentType.JSON));
    });
    
    BulkResponse response = client.bulk(request, RequestOptions.DEFAULT);
    System.out.println(response.status());
    client.close();
}

查找文档

@Test
public void getDocument() throws IOException {
    GetRequest request = new GetRequest("test3", "9");
    GetResponse response = client.get(request, RequestOptions.DEFAULT);
    System.out.println(response.getSourceAsString());
    client.close();
}

更新文档

@Test
public void updateDocument() throws IOException {
    UpdateRequest request = new UpdateRequest("test3", "9");
    Prescription prescription = new Prescription();
    //只对name进行更新,其他字段不会变
    prescription.setName("卢本伟");
    request.doc(JSON.toJSONString(prescription), XContentType.JSON);
    UpdateResponse response = client.update(request, RequestOptions.DEFAULT);
    System.out.println(response);
    System.out.println(response.status());
    client.close();
}

删除文档

@Test
public void deleteDocument() throws IOException {
    DeleteRequest request = new DeleteRequest("test3", "9");
    DeleteResponse response = client.delete(request, RequestOptions.DEFAULT);
    System.out.println(response);
    client.close();
}

查询文档

@Test
public void searchDocument() throws IOException {
    SearchRequest request = new SearchRequest("test3");

    //查询条件
    SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
    //Term
    TermQueryBuilder termQueryBuilder = new TermQueryBuilder("ingredient", "当归");
    //Match
    MatchQueryBuilder matchQueryBuilder = new MatchQueryBuilder("ingredient", "当归");
    //HighLight
    HighlightBuilder highlightBuilder = new HighlightBuilder();
    highlightBuilder.field("ingredient");
    searchSourceBuilder.highlighter(highlightBuilder);
    //Page
    searchSourceBuilder.from(0);
    searchSourceBuilder.size(10);

    searchSourceBuilder.query(termQueryBuilder);
    request.source(searchSourceBuilder);
    SearchResponse response = client.search(request, RequestOptions.DEFAULT);

    System.out.println(response.getHits().getTotalHits());
    response.getHits().forEach(System.out::println);
    client.close();
}

仿京东搜索

1. 解析京东网页获取数据放入ES

引入依赖

<dependency>
    <groupId>org.jsoupgroupId>
    <artifactId>jsoupartifactId>
    <version>1.10.2version>
dependency>

创建HtmlContent类

@Data
@NoArgsConstructor
@AllArgsConstructor
public class HtmlContent implements Serializable {

    private String title;

    private String price;

    private String img;
}

解析京东网页

public class HtmlParseUtil {

    public static List<HtmlContent> parseJD(String keyword, int pageNum) {
        List<HtmlContent> list = new ArrayList<>();
        for (int i = 1; i <= pageNum; i++) {
            String url = "https://search.jd.com/Search?keyword=#1&enc=utf-8&wq=#1&page=#2"
                    .replaceAll("#1", keyword)
                    .replaceAll("#2", String.valueOf(i));
            Document doc = null;
            try {
                doc = Jsoup.parse(new URL(url), 3000);
            } catch (IOException e) {
                e.printStackTrace();
            }
            Element goodsList = doc.getElementById("J_goodsList");
            Elements lis = goodsList.getElementsByTag("li");
            for (Element li : lis) {
                String img = li.getElementsByTag("img").eq(0).attr("data-lazy-img");
                String price = li.getElementsByClass("p-price").eq(0).text();
                String title = li.getElementsByClass("p-name").eq(0).text();
                list.add(new HtmlContent(title, price, img));
            }
        }
        return list;
    }
}

配置ElasticSearchClientConfig

@Configuration
public class ElasticSearchClientConfig {

    @Bean
    public RestHighLevelClient restHighLevelClient() {
        RestHighLevelClient client = new RestHighLevelClient(RestClient.builder(
                new HttpHost("localhost", 9200, "http")));
        return client;
    }
}

创建ContentService

@Service
public class ContentService {

    @Autowired
    RestHighLevelClient client;

    /**
     * 分析页面，将商品添加到ES中
     * @param keyword 搜索关键词
     * @param pageNum 搜索京东上几页的内容
     * @return
     */
    public Boolean addContent(String keyword, int pageNum) {
        List<HtmlContent> list = HtmlParseUtil.parseJD(keyword, pageNum);
        BulkRequest bulkRequest = new BulkRequest("goods");
        list.forEach(content -> {
            bulkRequest.add(new IndexRequest()
                    .source(JSON.toJSONString(content), XContentType.JSON));
        });
        try {
            BulkResponse response = client.bulk(bulkRequest, RequestOptions.DEFAULT);
            return !response.hasFailures();
        } catch (IOException e) {
            e.printStackTrace();
            return false;
        }
    }
}

创建ContentController

@RestController
public class ContentController {

    @Autowired
    ContentService contentService;

    @GetMapping("/add/{keyword}/{pageNum}")
    public R addContent(@PathVariable String keyword, @PathVariable Integer pageNum) {
        System.out.println("keyword: " + keyword + ", pageNum:" + pageNum);
        Boolean flag = contentService.addContent(keyword, pageNum);
        return flag ? R.ok() : R.error();
    }
}

2. 搜索功能实现

Service

/**
 * 检索功能
 * @param keyword 搜索的关键词
 * @param pageNo 第几页 最小为0
 * @param pageSize 一页几个
 * @param searchForContent 用于搜索框提示输入还是用于在页面上展示商品
 * @return
 */
public Map<String, Object> search(String keyword, Integer pageNo, Integer pageSize, Boolean searchForContent) {
    SearchRequest request = new SearchRequest("goods");
    SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
    if (!searchForContent) { //搜索框提示输入
        //只需要获取title
        searchSourceBuilder.fetchSource("title", null);
        BoolQueryBuilder boolQueryBuilder = new BoolQueryBuilder();
        String[] keywords = keyword.split(" ");
        for (String word : keywords) {
            boolQueryBuilder.must(new MatchPhraseQueryBuilder("title", word));
        }
        searchSourceBuilder.query(boolQueryBuilder);
    } else {
        MatchQueryBuilder matchQueryBuilder = new MatchQueryBuilder("title", keyword);
        matchQueryBuilder.minimumShouldMatch("2<50%");
        searchSourceBuilder.query(matchQueryBuilder);
    }
    searchSourceBuilder.from(pageNo * pageSize);
    searchSourceBuilder.size(pageSize);
    searchSourceBuilder.highlighter(new HighlightBuilder()
            .field("title")
            .preTags("")
            .postTags("
"));

    request.source(searchSourceBuilder);
    try {
        SearchResponse response = client.search(request, RequestOptions.DEFAULT);
        Map<String, Object> result = new HashMap<>();
        List<Map<String, Object>> list = new ArrayList<>();
        response.getHits().forEach(item -> {
            Map<String, Object> map = item.getSourceAsMap();
            // 返回文本设置高亮
            Map<String, HighlightField> highlight = item.getHighlightFields();
            HighlightField name = highlight.get("title");
            if (name != null){
                Text[] fragments = name.fragments();
                StringBuilder new_name = new StringBuilder();
                for (Text text : fragments) {
                    new_name.append(text);
                }
                map.put("title", new_name.toString());
            }
            list.add(map);
        });
        result.put("total", response.getHits().getTotalHits().value);
        result.put("list", list);
        return result;
    } catch (IOException e) {
        e.printStackTrace();
        return null;
    }
}

Controller

@GetMapping("search/{keyword}/{pageNo}/{pageSize}")
public R search(@PathVariable String keyword, @PathVariable Integer pageNo, 
                @PathVariable Integer pageSize) {
    return R.ok().data(contentService.search(keyword, pageNo, pageSize, true));
}

@GetMapping("searchList/{keyword}/{pageSize}")
public R searchList(@PathVariable String keyword, @PathVariable Integer pageSize) {
    return R.ok().data(contentService.search(keyword, 0, pageSize, false));
}

3. 前端页面

引入js文件

写Html

<html lang="en" xmlns:th="http://www.thymeleaf.org">
<head>
    <script src="/js/vue.js">script>
    <script src="/js/axios.js">script>
    <script src="/js/jquery.js">script>
    <style>
        body {
            margin: 0;
            padding: 0;
        }
        .nav {
            width: 700px;
            margin: 20px auto;
            position: relative;
        }
        .nav input {
            outline: none;
            margin: 0;
            box-sizing: border-box;
            width: 70%;
            height: 50px;
            font-size: 22px;
            display: inline-block;
            vertical-align: bottom;
            border: 4px solid rgb(255, 0, 0)
        }
        .nav button {
            margin-left: -5px;
            width: 15%;
            height: 50px;
            box-sizing: border-box;
            display: inline-block;
            vertical-align: bottom;
            font-size: 18px;
            background: rgb(255, 0, 0);
            color: white;
        }
        .nav ul {
            position: absolute;
            top: 50px;
            left: 0;
            width: 595px;
            background: white;
            box-sizing: border-box;
            border: 1px solid black;
            padding: 0;
            margin: 0;
        }
        .nav li {
            list-style: none;
            border-bottom: 1px solid grey;
            text-overflow: ellipsis;
            word-break: break-all;
            white-space: nowrap;
            overflow: hidden;
            margin: 0 5px;
            height: 40px;
            line-height: 40px;
            font-size: 18px;
            transition: .2s;
            cursor: pointer;
        }
        .nav li:hover {
            background: rgb(230, 230, 230);
        }
        .nav li .highlight {
            color: red;
            display: inline;
        }
        .nav li p {
            margin: 0;
        }
        .main {
            width: 90%;
            margin: 20px auto;
            display: flex;
            justify-content: left;
            flex-wrap: wrap;
        }
        .box {
            border: 1px solid white;
            width: 230px;
            height: 300px;
            margin: 5px;
            box-sizing: border-box;
            transition: .3s;
        }
        .box:hover {
            box-shadow: 0px 0px 8px gray;
        }
        .box img {
            width: 220px;
            margin-left: 5px;
        }
        .price {
            color: rgb(255, 31, 38);
            font-size: 20px;
            font-weight: 550;
            margin: 0 10px;
        }
        .title {
            margin: 0 5px;
            display: -webkit-box;
            -webkit-box-orient: vertical;
            -webkit-line-clamp: 2;
            overflow: hidden;
        }
        .title p {
            display: inline;
        }
        .title .highlight {
            color: red;
        }
        .footer {
            width: 50%;
            margin: 20px auto;
            display: flex;
            justify-content: center;
        }
    style>
head>
<body>
<div id="app">
    <div class="nav">
        <input type="text" id="search" v-model="keyword"
               @focusin="showSearchList"
               @focusout="() => {if(!this.focus)this.searchListVisible=false}"
               @keyup="handleKeyUp"
        >
        <button @click="search(1)">搜索button>
        <ul v-show="searchListVisible&&this.keyword" @mouseenter="()=>{this.focus=true}" @mouseleave="()=>{this.focus=false}">
            <li v-for="item in searchList" v-html="item.title" @click="setKeyword(item.title)">li>
        ul>
    div>
    <h1 style="text-align:center;margin-top:150px" v-if="!list[0]">暂无数据h1>
    <div class="main">
        <div class="box" v-for="goods in list">
            <img v-bind:src="goods.img">
            <p class="price" v-text="goods.price">￥122p>
            <p class="title" v-bind:title="goods.title.replaceAll(/<.*?>/ig,'')" v-html="goods.title">标题p>
        div>
    div>
    <div class="footer" v-if="list[0]">
        <button @click="lastPage">上一页button>
        <button v-for="i in pageNum" @click="search(i)" :disabled="i==pageNo">{{i}}button>
        <button @click="nextPage">下一页button>
    div>
div>
<script>
    new Vue({
        el: '#app',
        data: {
            keyword: '',
            pageNo: 0,
            pageSize: 30,
            total: 0,
            pageNum: 0,
            list: [],
            searchList: [],
            searchListVisible: false,
            focus: false,
            compositionStart: false
        },
        created() {
        },
        mounted() {
            $('#search').on('compositionstart', e => {
                this.compositionStart = true
            }).on('compositionend', e => {
                this.compositionStart = false
                this.updateSearchList()
            })
        },
        methods: {
            search(pageNo = 1) {
                if (!this.keyword) {
                    return
                }
                this.pageNo = pageNo
                axios.get(`search/${this.keyword}/${pageNo-1}/${this.pageSize}`).then(resp => {
                    this.list = resp.data.data.list
                    this.total = resp.data.data.total
                    this.pageNum = Math.max(Math.floor(this.total / this.pageSize), 1)
                    this.searchListVisible = false
                }).catch(err => {
                    console.log(err)
                })
            },
            showSearchList() {
                if (this.keyword) {
                    this.searchListVisible = true
                }
            },
            updateSearchList() {
                if (this.keyword) { //有内容 去搜索
                    let pageSize = 10
                    axios.get(`searchList/${this.keyword}/${pageSize}`).then(resp => {
                        this.searchList = resp.data.data.list
                        this.searchListVisible = true
                    }).catch(err => {
                        console.log(err)
                    })
                } else {
                    this.searchList = []
                    this.searchListVisible = false
                }
            },
            handleKeyUp(e) {
                if (e.keyCode == 13) { // 回车
                    this.search(1)
                } else if (e.keyCode == 8) { // 删除
                    this.updateSearchList()
                } else {
                    if (!this.compositionStart) {
                        this.updateSearchList()
                    }
                }
            },
            setKeyword(keyword) {
                this.keyword = keyword.replaceAll(/<.*?>/ig, '')
                this.search()
            },
            lastPage() {
                if (this.pageNo > 1) {
                    this.search(this.pageNo - 1)
                }
            },
            nextPage() {
                if (this.pageNo < this.pageNum) {
                    this.search(this.pageNo + 1)
                }
            }
        }
    })
script>
body>
html>

4. 最终效果

学到了感谢狂神

你可能感兴趣的:(elasticsearch,学习,搜索引擎)

论文学习11：Boundary-Guided Camouflaged Object Detection zl29 学习目标检测人工智能
代码来源GitHub-thograce/BGNet:Boundary-GuidedCamouflagedObjectDetection模块作用BGNet利用额外的目标相关边缘语义信息来引导COD任务的特征学习，从而强制模型生成能够突出目标结构的特征。这一机制有助于提高目标边界的精准定位，从而提升伪装目标的检测性能。模块结构BGNet的架构基于Res2Net-50，编码器提取多级特征，解码器通过EA
从0到1：小白也能轻松上手的高清电影搜索引擎网站制作指南计算机学长网站制作搜索引擎前端服务器
引言在互联网飞速发展的当下，在线观影已成为人们日常娱乐不可或缺的一部分。据相关数据显示，2024年网络视频用户规模达到了惊人的规模，如此庞大的用户群体，对电影资源的需求自然也是水涨船高。然而，面对海量的电影资源，如何快速、准确地找到自己心仪的高清电影，却成了许多影迷的一大难题。各大视频平台资源分散，想要观看不同的电影，往往需要在多个平台之间来回切换，而且还可能面临付费门槛、广告干扰等问题。这时，一
使用 MistralAI 平台进行开源模型托管与调用 VYSAHF python
MistralAI是一个提供开放源码模型托管的平台，致力于帮助开发者更轻松地使用和管理开源模型。通过该平台，你可以方便地调用强大的深度学习模型，并将其集成到你的应用中。本文将带你了解如何利用MistralAI提供的服务来进行模型的托管和调用。技术背景介绍MistralAI的服务包括了如聊天模型和嵌入模型等，这些模型适用于聊天机器人、文本嵌入等各种场景。使用这些模型需要注册并获取一个有效的API密钥
【尚硅谷】鸿蒙应用开发 - 带源码课件 6v6-博客 harmonyos 华为
【尚硅谷】鸿蒙应用开发-带源码课件课程描述本教程精心设计了一款精致而小巧的实战应用，贯穿整个学习过程，真正做到理论与实践相结合。课程内容从基础到高级，层层递进，全面覆盖鸿蒙应用开发的所有必备技能。通过图解抽象知识、丰富的案例和清晰的讲解，帮助学习者快速掌握鸿蒙应用开发的核心技术。课程亮点实战驱动：以实际应用案例为主线，贯穿整个学习过程，让学习更贴近实际开发需求。内容全面：从基础概念到高级技能，系统
部分标签数据集生成与过滤特定标签方法阳光明媚大男孩机器学习人工智能
完整代码总结这段代码的目的是通过构建一个部分标签学习（PartialLabelLearning,PLL）框架来生成一个包含部分标签的数据集，并且支持根据给定的标签列表对数据集进行筛选和过滤。代码包含了多个类和函数，主要分为以下几部分：数据预处理与加载：使用PyTorch和torchvision来加载CIFAR-10数据集，并对其进行标准化处理。部分标签数据集的生成：为每个样本生成多个候选标签，并模
使用spring data MongoDB对MongoDB进行简单CURD操作示例其实我就是个萌新 spring mongodb java
本文章为作者个人学习笔记，仅作参考。1.application.properties配置spring.data.mongodb.database=[数据库名]spring.data.mongodb.host=localhost[主机名,本机：localhost]spring.data.mongodb.port=[数据库端口，默认:27017]2.根据数据库文档定义实体类：@RequiredArgs
暗光增强技术研究进展与产品落地综合分析（2023-2025） AndrewHZ 深度学习新浪潮图像处理算法动态范围计算机视觉深度学习 transformer 暗光增强
一、引言暗光增强技术作为计算机视觉与移动影像领域的核心研究方向之一，近年来在算法创新、硬件适配及产品落地方面取得了显著进展。本文从技术研究与产业应用两个维度，系统梳理近三年（2023-2025）该领域的关键突破，并对比分析主流手机厂商的影像技术优劣势。二、暗光增强技术研究进展1.算法创新：从传统模型到深度学习（1）Retinex理论的深度结合清华与ETH联合提出的Retinexformer（202
C++基础匿名对象，友元和常成员(const) 没有百宝袋的哆啦A梦 c++java jvm
目录学习内容：1.匿名对象2.友元2.1友元的引入2.2友元函数2.3友元类2.4友元的总结3.常成员（const）3.1常成员的引入3.2常成员函数3.3常对象3.4mutable关键字3.5常函数3.6关于C/C++中const的使用(面试题)学习内容：1.匿名对象1>所谓匿名对象，就是没有名字的对象，生命周期只在当前语句内，所以可以理解成时一个将亡值2>定义格式：直接调用类的构造函数3>使用
金融风控算法透明度与可解释性优化智能计算研究中心其他
内容概要金融风控算法的透明化研究面临模型复杂性提升与监管合规要求的双重挑战。随着深度学习框架在特征提取环节的广泛应用，算法可解释性与预测精度之间的平衡成为核心议题。本文从联邦学习架构下的数据协作机制出发，结合特征工程优化与超参数调整技术，系统性分析逻辑回归、随机森林等传统算法在召回率、F1值等关键指标上的表现差异。研究同时探讨数据预处理流程对风控决策鲁棒性的影响，并提出基于注意力机制的特征权重可视
联邦学习算法安全优化与可解释性研究智能计算研究中心其他
内容概要本研究围绕联邦学习算法的安全性优化与模型可解释性增强展开系统性探索。首先，针对联邦学习中数据隐私泄露与模型性能损耗的固有矛盾，提出一种融合差分隐私与动态权重聚合的协同优化框架，通过分层加密机制降低敏感信息暴露风险。其次，引入可解释性算法（如LIME与SHAP）构建透明化决策路径，结合注意力机制实现特征贡献度的可视化映射，有效提升模型在医疗影像异常检测与金融欺诈识别场景中的可信度。此外，研究
下一代模型技术演进与场景应用突破智能计算研究中心其他
内容概要当前模型技术正经历多维度的范式跃迁，可解释性模型与自动化机器学习（AutoML）成为突破传统黑箱困境的核心路径。在底层架构层面，边缘计算与量子计算的融合重构了算力分配模式，联邦学习技术则为跨域数据协作提供了安全可信的解决方案。主流框架如TensorFlow和PyTorch持续迭代优化能力，通过动态参数压缩与自适应超参数调优策略，显著提升模型部署效率。应用层创新呈现垂直化特征，医疗诊断模型通
H800核心性能优化技术智能计算研究中心其他
内容概要作为新一代AI加速卡的核心创新载体，H800通过异构计算架构与动态能效管理技术的协同设计，实现了从硬件底层到应用层的系统性优化。其技术突破聚焦于张量核心重构带来的计算密度提升、混合精度运算对资源利用率的增强，以及智能散热方案在复杂负载场景下的稳定性保障。这些创新不仅显著提升了30%以上的能效比，更通过精细化任务调度机制，解决了深度学习训练中高并发数据处理与模型参数同步的效率瓶颈。值得关注的
TikTokenizer 项目常见问题解决方案齐飞锴Timothea
TikTokenizer项目常见问题解决方案tiktokenizerOnlineplaygroundforOpenAPItokenizers项目地址:https://gitcode.com/gh_mirrors/ti/tiktokenizer项目基础介绍TikTokenizer是一个开源项目，主要用于文本处理，特别是将文本转化为可用于深度学习的格式。该项目是基于TensorFlow和Keras开发
TypeScript语言的计算机视觉苏墨瀚包罗万象 golang 开发语言后端
使用TypeScript进行计算机视觉：一个现代化的探索引言随着人工智能和机器学习的快速发展，计算机视觉（ComputerVision）成为了一个极具活力的研究领域。计算机视觉旨在使计算机能够“看”和“理解”数字图像或视频中的内容。近年来，TypeScript作为一种现代化的编程语言，因其类型安全和更好的开发体验，逐渐在前端和后端开发中得到了广泛应用。本文将探讨如何使用TypeScript进行计算
日常学习日记——从练习代码中学习梦想成为大牛呀学习 c语言笔记
日常学习日记——从练习代码中学习一、题目展示二、代码展示三、问题剖析四、冒泡排序4.1阐述4.2优缺点4.3逻辑阐述初学者记录不易，还请多多哦点赞支持呀！！也请各位大佬慷慨对我的问题提出指正如果对我的阐述有些疑问或者觉得博主写的不对，评论下来。主播觉得有道理一定会一一改正！！一、题目展示二、代码展示#include#defineMAX1000intmain(){intn,m=0;scanf("%d
MyBatis 学习经验分享吱屋猪_ mybatis 学习经验分享
MyBatis是一个广泛使用的Java持久层框架，它为开发者提供了灵活、易用的数据库操作方式。与Hibernate等全自动化ORM（对象关系映射）框架不同，MyBatis采用了更精细的控制，允许开发者在SQL语句和Java对象之间进行映射。通过它，开发者可以直接编写SQL查询，灵活处理数据库操作，并且仍然享受到框架提供的简化工作流程。以下是我在学习MyBatis过程中的一些经验分享。1.理解MyB
DeepSeek混合专家架构赋能智能创作智能计算研究中心其他
内容概要在人工智能技术加速迭代的当下，DeepSeek混合专家架构（MixtureofExperts）通过670亿参数的动态路由机制，实现了多模态处理的范式突破。该架构将视觉语言理解、多语言语义解析与深度学习算法深度融合，构建出覆盖文本生成、代码编写、学术研究等场景的立体化能力矩阵。其核心优势体现在三个维度：精准化内容生产——通过智能选题、文献综述自动生成等功能，将学术论文写作效率提升40%以上；
怎样用Java实现快速排序与找到数组中第k小的值？上官美丽 java 算法排序算法
大家好，今天我们来聊聊在Java中如何实现快速排序算法，以及如何利用这个排序算法来找到一个数组中的第k小的值。这两个主题在算法和数据结构的学习中都非常重要，理解这些内容对编写高效程序有很大的帮助！快速排序（QuickSort）是一种非常流行的排序算法，因为它在平均情况下表现得非常迅速。它的基本思路是通过一个“基准”值将数组分为两部分，然后递归对这两部分进行排序。听起来简单吧！接下来，我们深入了解一
SvelteKit 最新中文文档教程（7）—— 构建和部署
前言Svelte，一个语法简洁、入门容易，面向未来的前端框架。从Svelte诞生之初，就备受开发者的喜爱，根据统计，从2019年到2024年，连续6年一直是开发者最感兴趣的前端框架No.1：Svelte以其独特的编译时优化机制著称，具有轻量级、高性能、易上手等特性，非常适合构建轻量级Web项目。为了帮助大家学习Svelte，我同时搭建了Svelte最新的中文文档站点。如果需要进阶学习，也可以入手我
探索 Tavily Search API：为 AI 提供快速准确的搜索结果 nseejrukjhad 人工智能 python 开发语言
引言在当今的技术时代，AI代理（如大型语言模型）日益需要实时、准确和事实性强的搜索结果。TavilySearchAPI就是为此而生的。这篇文章将介绍如何将TavilySearchAPI集成为一个检索器，使开发者可以在应用中快速获取所需信息。此外，我们将讨论这一集成过程中的挑战及其解决方案。主要内容1.TavilySearchAPI简介TavilySearchAPI是一个专门为AI代理设计的搜索引擎
人工智能之数学基础：数学对人工智能技术发展的作用每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习机器学习神经网络自然语言处理数学
本文重点数学是人工智能技术发展的基础，它提供了人工智能技术所需的数学理论和算法，包括概率论、统计学、线性代数、微积分、图论等等。本文将从以下几个方面探讨数学对人工智能技术发展的作用。概率论和统计学概率论和统计学是人工智能技术中最为重要的数学分支之一。概率论和统计学的应用范围非常广泛，包括机器学习、数据挖掘、自然语言处理、计算机视觉等领域。在人工智能技术中，概率论和统计学主要用于处理不确定性的问题，
人工智能之数学基础：线性子空间每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习线性代数线性子空间线性空间
本文重点在前面的课程中，我们学习了线性空间，本文我们我们在此基础上学习线性子空间。在应用中，线性子空间的概念被广泛应用于信号处理、机器学习、图像处理等领域。子空间的性质子空间是线性空间的一部分，它需要满足下面的性质：设V是数域F上的线性空间，W是V的一个非空子集。如果W对于V中的加法运算和数乘运算也构成F上的一个线性空间，则称W为V的线性子空间（或称向量子空间）。具体来说，设V是一个线性空间，W是
使用 Tavily 搜索 API 获取实时精确搜索结果 fgayif python 数据库开发语言
技术背景介绍Tavily搜索API是一个专为AI代理（如大型语言模型）而设计的搜索引擎。它能够快速提供实时、准确且事实性强的搜索结果。这使得Tavily成为可以嵌入到AI应用中的理想工具，提升信息获取的效率和准确性。核心原理解析Tavily搜索API提供了异步的原生调用方式，可以返回包括标题、URL、内容和答案在内的数据。API可以根据需求设置不同的搜索深度和结果数量。通过与其他语言模型（如Ope
详解离线安装Python库爱编程的喵喵 Python基础课程 python 离线安装 requirements
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了详解离线安装Python库，希望能对
YOLO11改进-模块-引入频率谱动态聚合模块FSDA 去除噪声一勺汤 YOLOv11模型改进系列目标检测魔改模块 YOLO YOLOv11 YOLOv11改进改进
在图像去雾领域，深度学习在白天图像去雾方面成果显著，但夜间雾图研究较少。夜间雾图面临诸多挑战，其中包括雾、辉光和噪声因多个低强度有源彩色光源而具有复杂特性，以及模拟与真实数据的域差异导致的亮度问题。为解决这些，我们使用FSDA模块，处理频率不一致特性。FSDA先对频谱信息聚合，再计算通道权重并应用，最后映射回空间域，以此优化频谱信息，使模型更好处理复杂干扰。本文将其与YOLOv11相结合，增强YO
java--(StringBuilder) qq_44766305 java 开发语言
上一节我们讲解了String，这一节我们来讲解StringBuilder。同样让我们带着疑问来学习:1.什么是StringBuilder?2.为什么要有StringBuilder?一、什么是StringBuilder?StringBuilder可以看成是一个容器，创建之后里面的内容是可变的。二、为什么要有StringBuilder？回答这个问题之前，让我们先看一个例子：publicclassdem
Kotlin学习4.3：构造函数 CNwanku Kotlin入门学习 Kotlin 移动开发
Kotlin学习4.3：构造函数主构函数this关键字次构函数主构函数在Kotlin中，构造函数用constructor关键字进行修饰，一个类可以有一个主构造函数和多个次构造函数。主构函数位于类头跟在类名之后，如果主构造函数没有任何注解或可见性修饰符（如public），constructor关键字可省略。主构函数定义的语法格式如下：class类名constructor([形参1，形参2，形参3])
基于多头注意机制的多尺度特征融合的GCN的序列数据（功率预测、故障诊断）模型及代码详解清风AI 深度学习算法详解及代码复现人工智能神经网络深度学习 python conda pip pandas
GCN基础在深度学习领域中，图卷积网络(GCN)是一种强大的图数据处理工具。它将卷积操作扩展到图结构上，能够有效捕捉图中节点之间的关系信息。GCN的核心思想是通过聚合邻居节点的特征来更新目标节点的表示，这种局部聚合机制使得GCN能够学习到图的拓扑结构和节点属性。GCN的主要构成要素包括节点特征矩阵、邻接矩阵和卷积核。通过多次迭代，GCN可以逐步学习到图中节点的高阶表示，为后续的分类、预测等任务提供
Kotlin学习-构造函数 liujun3512159 kotlin kotlin
Kotlin的构造函数分为主构造函数（primaryconstructor）和次级构造函数（secondaryconstructor）；主构造函数1、在Kotlin中一个类可以有一个主构造函数和一个或多个次构造函数；如果不写构造函数会有一个默认空的构造函数//关键字类名类头(参数、主构造函数){类体}classMyTest{}vartest=MyTest()//使用默认的构造函数创建对象//空的类
【第9章】“基础工作流”怎么用？（图生图/局部重绘/VAE/更多基础工作流）ComfyUI基础入门教程聚梦小课堂 ComfyUI基础入门课 comfyui 基础教程工作流教程 AI绘画教程 AI作画人工智能 stable diffusion
引言学到这里，大家是不是会比较纠结，好像还在持续学习新的东西，未来还有多少基础的东西要学习，才能正常使用ComfyUI呢？这其实需要转变一个心态。AI绘画还处于一个快速迭代的过程，隔三岔五的就会有很多新技术、新模型出现，ComfyUI目前同样处于一个快速更新的阶段，从更新记录上也可以看到，几乎每一两天都会更新新版本。同样，生态的各种自定义节点也在持续更新。所以，不可能有个教程把所有未来会用到的知识
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的

ElasticSearch个人学习笔记 狂神说