super_大队长

ElasticSearch最全详细使用教程：入门、索引管理、映射详解

一、快速入门

1. 查看集群的健康状况 http://localhost:9200/_cat

http://localhost:9200/_cat/health?v

说明：v是用来要求在结果中返回表头状态值说明 Green - everything is good (cluster is fully functional)，即最佳状态 Yellow - all data is available but some replicas are not yet allocated (cluster is fully functional)，即数据和集群可用，但是集群的备份有的是坏的 Red - some data is not available for whatever reason (cluster is partially functional)，即数据和集群都不可用查看集群的节点 http://localhost:9200/_cat/?v

2. 查看所有索引 http://localhost:9200/_cat/indices?v

3. 创建一个索引 创建一个名为 customer 的索引。pretty要求返回一个漂亮的json 结果 PUT /customer?pretty

再查看一下所有索引 http://localhost:9200/_cat/indices?v

GET /_cat/indices?v

4. 索引一个文档到customer索引中

curl -X PUT "localhost:9200/customer/_doc/1?pretty" -H 'Content-Type: application/json' -d'
{
  "name": "John Doe"
}
'

复制

5. 从customer索引中获取指定id的文档

curl -X GET "localhost:9200/customer/_doc/1?pretty"

复制

6. 查询所有文档

GET /customer/_search?q=*&sort=name:asc&pretty

复制

JSON格式方式

GET /customer/_search
{
  "query": { "match_all": {} },
  "sort": [
    {"name": "asc" }
  ]
}

复制

二、索引管理

1. 创建索引 创建一个名为twitter的索引，设置索引的分片数为3，备份数为2。注意：在ES中创建一个索引类似于在数据库中建立一个数据库(ES6.0之后类似于创建一个表)

PUT twitte
{
    "settings" : {
        "index" : {
            "number_of_shards" : 3,
            "number_of_replicas" : 2
        }
    }
}
说明：
默认的分片数是5到1024
默认的备份数是1
索引的名称必须是小写的，不可重名

创建结果：

复制

创建的命令还可以简写为

PUT twitte
{
    "settings" : {
        "number_of_shards" : 3,
        "number_of_replicas" : 2
    }
}

复制

2. 创建mapping映射 注意：在ES中创建一个mapping映射类似于在数据库中定义表结构，即表里面有哪些字段、字段是什么类型、字段的默认值等；也类似于solr里面的模式schema的定义

PUT twitte
{
    "settings" : {
        "index" : {
            "number_of_shards" : 3,
            "number_of_replicas" : 2
        }
    },
   "mappings" : {
        "type1" : {
            "properties" : {
                "field1" : { "type" : "text" }
            }
        }
    }
}

复制

3. 创建索引时加入别名定义

PUT twitte
{
    "aliases" : {
        "alias_1" : {},
        "alias_2" : {
            "filter" : {
                "term" : {"user" : "kimchy" }
            },
            "routing" : "kimchy"
        }
    }
}

4. 创建索引时返回的结果说明

5. Get Index 查看索引的定义信息 GET /twitter，可以一次获取多个索引（以逗号间隔）获取所有索引 _all 或用通配符*

GET /twitter/_settings

GET /twitter/_mapping

6. 删除索引

DELETE /twitter 说明：可以一次删除多个索引（以逗号间隔）删除所有索引 _all 或通配符 *

7. 判断索引是否存在

HEAD twitter

HTTP status code 表示结果 404 不存在， 200 存在 8. 修改索引的settings信息

索引的设置信息分为静态信息和动态信息两部分。静态信息不可更改，如索引的分片数。动态信息可以修改。 REST 访问端点： /_settings 更新所有索引的。 {index}/_settings 更新一个或多个索引的settings。详细的设置项请参考：https://www.elastic.co/guide/en/elasticsearch/reference/current/index-modules.html#index-modules-settings 9. 修改备份数

PUT /twitter/_settings
{
    "index" : {
        "number_of_replicas" : 2
    }
}

复制

10. 设置回默认值，用null

PUT /twitter/_settings
{
    "index" : {
        "refresh_interval" : null
    }
}

复制

11. 设置索引的读写

index.blocks.read_only：设为true,则索引以及索引的元数据只可读
index.blocks.read_only_allow_delete：设为true，只读时允许删除。
index.blocks.read：设为true，则不可读。
index.blocks.write：设为true，则不可写。
index.blocks.metadata：设为true，则索引元数据不可读写。

复制

12. 索引模板

在创建索引时，为每个索引写定义信息可能是一件繁琐的事情，ES提供了索引模板功能，让你可以定义一个索引模板，模板中定义好settings、mapping、以及一个模式定义来匹配创建的索引。注意：模板只在索引创建时被参考，修改模板不会影响已创建的索引 12.1 新增/修改名为tempae_1的模板，匹配名称为te* 或 bar*的索引创建：

PUT _template/template_1
{
  "index_patterns": ["te*", "bar*"],
  "settings": {
    "number_of_shards": 1
  },
  "mappings": {
    "type1": {
      "_source": {
        "enabled": false
      },
      "properties": {
        "host_name": {
          "type": "keyword"
        },
        "created_at": {
          "type": "date",
          "format": "EEE MMM dd HH:mm:ss Z YYYY"
        }
      }
    }
  }
}

复制

12.2 查看索引模板

GET /_template/template_1
GET /_template/temp* 
GET /_template/template_1,template_2
GET /_template

复制

12.3 删除模板

DELETE /_template/template_1

复制

13. Open/Close Index 打开/关闭索引

POST /my_index/_close
POST /my_index/_open

复制

说明：关闭的索引不能进行读写操作，几乎不占集群开销。关闭的索引可以打开，打开走的是正常的恢复流程。 14. Shrink Index 收缩索引

索引的分片数是不可更改的，如要减少分片数可以通过收缩方式收缩为一个新的索引。新索引的分片数必须是原分片数的因子值，如原分片数是8，则新索引的分片数可以为4、2、1 。 什么时候需要收缩索引呢? 最初创建索引的时候分片数设置得太大，后面发现用不了那么多分片，这个时候就需要收缩了 收缩的流程： 先把所有主分片都转移到一台主机上；在这台主机上创建一个新索引，分片数较小，其他设置和原索引一致；把原索引的所有分片，复制（或硬链接）到新索引的目录下；对新索引进行打开操作恢复分片数据； (可选)重新把新索引的分片均衡到其他节点上。 收缩前的准备工作： 将原索引设置为只读；将原索引各分片的一个副本重分配到同一个节点上，并且要是健康绿色状态。

PUT /my_source_index/_settings
{
  "settings": {
    
    "index.routing.allocation.require._name": "shrink_node_name",
    
     "index.blocks.write": true
  }
}

复制

进行收缩：

POST my_source_index/_shrink/my_target_index
{
  "settings": {
    "index.number_of_replicas": 1,
    "index.number_of_shards": 1,
    "index.codec": "best_compression"
  }}

复制

监控收缩过程：

GET _cat/recovery?v
GET _cluster/health

复制

15. Split Index 拆分索引

当索引的分片容量过大时，可以通过拆分操作将索引拆分为一个倍数分片数的新索引。能拆分为几倍由创建索引时指定的index.number_of_routing_shards 路由分片数决定。这个路由分片数决定了根据一致性hash路由文档到分片的散列空间。如index.number_of_routing_shards = 30 ，指定的分片数是5，则可按如下倍数方式进行拆分：

5 → 10 → 30 (split by 2, then by 3)
5 → 15 → 30 (split by 3, then by 2)
5 → 30 (split by 6)

复制

为什么需要拆分索引？当最初设置的索引的分片数不够用时就需要拆分索引了，和压缩索引相反注意：只有在创建时指定了index.number_of_routing_shards 的索引才可以进行拆分，ES7开始将不再有这个限制。和solr的区别是，solr是对一个分片进行拆分，es中是整个索引进行拆分。拆分步骤：准备一个索引来做拆分：

PUT my_source_index
{
    "settings": {
        "index.number_of_shards" : 1,
        
        "index.number_of_routing_shards" : 2
    }
}

复制

先设置索引只读：

PUT /my_source_index/_settings
{
  "settings": {
    "index.blocks.write": true
  }
}

复制

做拆分：

POST my_source_index/_split/my_target_index
{
  "settings": {
    
    "index.number_of_shards": 2
  }
}

复制

监控拆分过程：

GET _cat/recovery?v
GET _cluster/health

复制

16. Rollover Index 别名滚动指向新创建的索引

对于有时效性的索引数据，如日志，过一定时间后，老的索引数据就没有用了。我们可以像数据库中根据时间创建表来存放不同时段的数据一样，在ES中也可用建多个索引的方式来分开存放不同时段的数据。比数据库中更方便的是ES中可以通过别名滚动指向最新的索引的方式，让你通过别名来操作时总是操作的最新的索引。 ES的rollover index API 让我们可以根据满足指定的条件（时间、文档数量、索引大小）创建新的索引，并把别名滚动指向新的索引。 注意：这时的别名只能是一个索引的别名。 Rollover Index 示例：创建一个名字为logs-0000001 、别名为logs_write 的索引：

PUT /logs-000001
{
  "aliases": {
    "logs_write": {}
  }
}

复制

添加1000个文档到索引logs-000001，然后设置别名滚动的条件

POST /logs_write/_rollove
{
  "conditions": {
    "max_age":   "7d",
    "max_docs":  1000,
    "max_size":  "5gb"
  }
}

复制

说明：

如果别名logs_write指向的索引是7天前（含）创建的或索引的文档数>=1000或索引的大小>= 5gb，则会创建一个新索引 logs-000002，并把别名logs_writer指向新创建的logs-000002索引

Rollover Index 新建索引的命名规则：

如果索引的名称是-数字结尾，如logs-000001，则新建索引的名称也会是这个模式，数值增1。

如果索引的名称不是-数值结尾，则在请求rollover api时需指定新索引的名称

POST /my_alias/_rollover/my_new_index_name
{
  "conditions": {
    "max_age":   "7d",
    "max_docs":  1000,
    "max_size": "5gb"
  }
}

复制

在名称中使用Date math（时间表达式）

如果你希望生成的索引名称中带有日期，如logstash-2016.02.03-1 ，则可以在创建索引时采用时间表达式来命名：

# PUT / with URI encoding:
PUT /%3Clogs-%7Bnow%2Fd%7D-1%3E
{
  "aliases": {
    "logs_write": {}
  }
}
PUT logs_write/_doc/1
{
  "message": "a dummy log"
} 
POST logs_write/_refresh
# Wait for a day to pass
POST /logs_write/_rollove
{
  "conditions": {
    "max_docs":   "1"
  }
}

复制

Rollover时可对新的索引作定义：

PUT /logs-000001
{
  "aliases": {
    "logs_write": {}
  }
}
POST /logs_write/_rollover
{
  "conditions" : {
    "max_age": "7d",
    "max_docs": 1000,
    "max_size": "5gb"
  },
  "settings": {
    "index.number_of_shards": 2
  }
}

复制

Dry run 实际操作前先测试是否达到条件：

POST /logs_write/_rollover?dry_run
{
  "conditions" : {
    "max_age": "7d",
    "max_docs": 1000,
    "max_size": "5gb"
  }
}

复制

说明：

测试不会创建索引，只是检测条件是否满足

注意：rollover是你请求它才会进行操作，并不是自动在后台进行的。你可以周期性地去请求它。 17. 索引监控

17.1 查看索引状态信息官网链接： https://www.elastic.co/guide/en/elasticsearch/reference/current/indices-stats.html 查看所有的索引状态： GET /_stats 查看指定索引的状态信息： GET /index1,index2/_stats 17.2 查看索引段信息官网链接：

https://www.elastic.co/guide/en/elasticsearch/reference/current/indices-segments.html

GET /test/_segments 
GET /index1,index2/_segments
GET /_segments

复制

17.3 查看索引恢复信息官网链接： https://www.elastic.co/guide/en/elasticsearch/reference/current/indices-recovery.html

GET index1,index2/_recovery?human

GET /_recovery?human 17.4 查看索引分片的存储信息官网链接：

https://www.elastic.co/guide/en/elasticsearch/reference/current/indices-shards-stores.html

# return information of only index test
GET /test/_shard_stores
# return information of only test1 and test2 indices
GET /test1,test2/_shard_stores
# return information of all indices
GET /_shard_stores
  GET /_shard_stores?status=green

复制

18. 索引状态管理

18.1 Clear Cache 清理缓存

POST /twitter/_cache/clear

默认会清理所有缓存，可指定清理query, fielddata or request 缓存

POST /kimchy,elasticsearch/_cache/clear
POST /_cache/clear

复制

18.2 Refresh，重新打开读取索引

POST /kimchy,elasticsearch/_refresh
POST /_refresh

复制

18.3 Flush，将缓存在内存中的索引数据刷新到持久存储中

POST twitter/_flush

复制

18.4 Force merge 强制段合并

POST /kimchy/_forcemerge?only_expunge_deletes=false&max_num_segments=100&flush=true

复制

可选参数说明： max_num_segments 合并为几个段，默认1 only_expunge_deletes 是否只合并含有删除文档的段，默认false flush 合并后是否刷新，默认true

POST /kimchy,elasticsearch/_forcemerge
POST /_forcemerge

复制

三、映射详解

1. Mapping 映射是什么

映射定义索引中有什么字段、字段的类型等结构信息。相当于数据库中表结构定义，或 solr中的schema。因为lucene索引文档时需要知道该如何来索引存储文档的字段。 ES中支持手动定义映射，动态映射两种方式。 1.1. 为索引创建mapping

PUT test
{

"mappings" : {

        "type1" : {
        
            "properties" : {
            
                "field1" : { "type" : "text" }
            }
        }
    }
}

复制

说明：映射定义后续可以修改 2. 映射类别 Mapping type 废除说明

ES最先的设计是用索引类比关系型数据库的数据库，用mapping type 来类比表，一个索引中可以包含多个映射类别。这个类比存在一个严重的问题，就是当多个mapping type中存在同名字段时（特别是同名字段还是不同类型的），在一个索引中不好处理，因为搜索引擎中只有索引-文档的结构，不同映射类别的数据都是一个一个的文档（只是包含的字段不一样而已） 从6.0.0开始限定仅包含一个映射类别定义（ "index.mapping.single_type": true ），兼容5.x中的多映射类别。从7.0开始将移除映射类别。 为了与未来的规划匹配，请现在将这个唯一的映射类别名定义为“_doc”,因为索引的请求地址将规范为：PUT {index}/_doc/{id} and POST {index}/_doc Mapping 映射示例：

PUT twitter
{
  "mappings": {
    "_doc": {
      "properties": {
        "type": { "type": "keyword" },
        "name": { "type": "text" },
        "user_name": { "type": "keyword" },
        "email": { "type": "keyword" },
        "content": { "type": "text" },
        "tweeted_at": { "type": "date" }
      }
    }
  }
}

复制

多映射类别数据转储到独立的索引中： ES 提供了reindex API 来做这个事

3. 字段类型 datatypes

字段类型定义了该如何索引存储字段值。ES中提供了丰富的字段类型定义，请查看官网链接详细了解每种类型的特点： https://www.elastic.co/guide/en/elasticsearch/reference/current/mapping-types.html 3.1 Core Datatypes 核心类型

string
    text and keyword
Numeric datatypes
    long, integer, short, byte, double, float, half_float, scaled_float
Date datatype
    date
Boolean datatype
    boolean
Binary datatype
    binary
Range datatypes     范围
    integer_range, float_range, long_range, double_range, date_range

复制

3.2 Complex datatypes 复合类型

Array datatype
    数组就是多值，不需要专门的类型
Object datatype
    object ：表示值为一个JSON 对象
Nested datatype
    nested：for arrays of JSON objects（表示值为JSON对象数组 ）

复制

3.3 Geo datatypes 地理数据类型

Geo-point datatype
    geo_point：for lat/lon points  （经纬坐标点）
Geo-Shape datatype
    geo_shape：for complex shapes like polygons （形状表示）

复制

3.4 Specialised datatypes 特别的类型

IP datatype
    ip：for IPv4 and IPv6 addresses
Completion datatype
    completion：to provide auto-complete suggestions
Token count datatype
    token_count：to count the number of tokens in a string
mapper-murmur3
    murmur3：to compute hashes of values at index-time and store them in the index
Percolator type
    Accepts queries from the query-dsl
join datatype
    Defines parent/child relation for documents within the same index

复制

4. 字段定义属性介绍 字段的type (Datatype)定义了如何索引存储字段值，还有一些属性可以让我们根据需要来覆盖默认的值或进行特别定义。请参考官网介绍详细了解：https://www.elastic.co/guide/en/elasticsearch/reference/current/mapping-params.html

   analyzer   指定分词器
    normalizer   指定标准化器
    boost        指定权重值
    coerce      强制类型转换
    copy_to    值复制给另一字段
    doc_values  是否存储docValues
    dynamic
    enabled    字段是否可用
    fielddata
    eager_global_ordinals
    format    指定时间值的格式
    ignore_above
    ignore_malformed
    index_options
    index
    fields
    norms
    null_value
    position_increment_gap
    properties
    search_analyzer
    similarity
    store
    term_vector

复制

字段定义属性—示例

PUT my_index
{
  "mappings": {
    "_doc": {
      "properties": {
        "date": {
          "type":   "date",
           
          "format": "yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis"
        }
      }
    }
  }
}

复制

5. Multi Field 多重字段 当我们需要对一个字段进行多种不同方式的索引时，可以使用fields多重字段定义。如一个字符串字段即需要进行text分词索引，也需要进行keyword 关键字索引来支持排序、聚合；或需要用不同的分词器进行分词索引。示例：定义多重字段：说明：raw是一个多重版本名（自定义）

PUT my_index
{
  "mappings": {
    "_doc": {
      "properties": {
        "city": {
          "type": "text",
          "fields": {
            "raw": {
              "type":  "keyword"
            }
          }
        }
      }
    }
  }
}

复制

往多重字段里面添加文档

PUT my_index/_doc/1
{
  "city": "New York"
}
 
PUT my_index/_doc/2
{
  "city": "York"
}

复制

获取多重字段的值：

GET my_index/_search
{
  "query": {
    "match": {
      "city": "york"
    }
  },
  "sort": {
    "city.raw": "asc"
  },
  "aggs": {
    "Cities": {
      "terms": {
        "field": "city.raw"
      }
    }
  }
}

复制

6. 元字段

官网链接： https://www.elastic.co/guide/en/elasticsearch/reference/current/mapping-fields.html 元字段是ES中定义的文档字段，有以下几类：

7. 动态映射 动态映射：ES中提供的重要特性，让我们可以快速使用ES，而不需要先创建索引、定义映射。如我们直接向ES提交文档进行索引：

PUT data/_doc/1
{ "count": 5 }

复制

ES将自动为我们创建data索引、_doc 映射、类型为 long 的字段 count 索引文档时，当有新字段时， ES将根据我们字段的json的数据类型为我们自动加人字段定义到mapping中。 7.1 字段动态映射规则

7.2 Date detection 时间侦测

所谓时间侦测是指我们往ES里面插入数据的时候会去自动检测我们的数据是不是日期格式的，是的话就会给我们自动转为设置的格式 date_detection 默认是开启的，默认的格式dynamic_date_formats为：

[ "strict_date_optional_time","yyyy/MM/dd HH:mm:ss Z||yyyy/MM/dd Z"]
PUT my_index/_doc/1
{
  "create_date": "2015/09/02"
}
 
GET my_index/_mapping

复制

自定义时间格式：

PUT my_index
{
  "mappings": {
    "_doc": {
      "dynamic_date_formats": ["MM/dd/yyyy"]
    }
  }
}

复制

禁用时间侦测：

PUT my_index
{
  "mappings": {
    "_doc": {
      "date_detection": false
    }
  }
}

复制

7.3 Numeric detection 数值侦测开启数值侦测（默认是禁用的）

PUT my_index
{
  "mappings": {
    "_doc": {
      "numeric_detection": true
    }
  }
}
PUT my_index/_doc/1
{
  "my_float":   "1.0",
  "my_integer": "1"
}

复制

出处：https://blog.csdn.net/ZYC88888/article/details/91463253

你可能感兴趣的:(spring,cloud,spring,eureka)

Springboot——整合SpringSecurity 发量堪忧的小伙子 spring boot spring java
目录一、核心概念二、Springboot整合SpringSecurity核心流程三、Springboot整合SpringSecurity3.1引入依赖3.2创建SecurityConfig配置文件3.3重写UserDetailsService参考文献一、核心概念SpringSecurity的核心包括认证和授权两个部分。认证认证过程主要是实现AuthenticationManager，Authent
UniCloud 完整入门指南九情丶 uni-app 前端
UniCloud完整入门指南目录什么是UniCloud为什么选择UniCloud快速开始基础概念核心功能最佳实践常见问题高级功能详解开发工具部署和运维最新特性和更新什么是UniCloudUniCloud是DCloud推出的基于serverless模式和js编程的云开发平台。它让不会后端的前端工程师可以快速完成整栈开发，让开发者专注于业务实现，而无需关心服务器运维等繁琐事务。主要特点基于server
【Elasticsearch 】聚合分析：聚合概述程风破～ Elasticsearch elasticsearch 大数据搜索引擎
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
使用缓存保存验证码进行登录校验记得开心一点嘛 JavaWeb后端开发技术栈高并发处理缓存后端 redis springboot
在SpringBoot项目中使用Redis进行登录校验，一般的做法是将用户的登录状态（例如，JWT令牌或者用户信息）存储在Redis中，并在后续请求中进行校验。我们需要建立两个拦截器：RefreshTokenInterceptor+LoginInterceptor，它们分别拦截全部路径和拦截需要登录的路径：首先我们需要将这个token从前端进行获取，随后在Redis缓存中查询是否有该用户的toke
UniApp + UniCloud 实现微信小程序静默登录九情丶 uni-app 微信小程序 notepad++
UniApp+UniCloud实现微信小程序静默登录目录1.项目准备2.UniCloud配置3.前端实现4.云函数实现5.完整示例1.项目准备1.1环境要求HBuilderX3.0+微信开发者工具UniCloud已开通微信小程序已注册1.2项目配置在manifest.json中配置微信小程序AppID：{"mp-weixin":{"appid":"你的小程序AppID","setting":{"u
【SpringBoot实现xss防御】龙少9543 后端 spring boot xss 后端
SpringBoot实现xss防御在SpringBoot中实现XSS防御，可以通过多种方式来确保输入的安全性和防止恶意脚本的注入。下面提供了一些具体的实现代码示例，包括输入清理、输出编码以及设置安全响应头。1.输入清理创建一个简单的工具类来进行HTML转义：importorg.jsoup.Jsoup;importorg.jsoup.nodes.Document.OutputSettings;imp
hive电影数据分析系统 Springboot协同过滤-余弦函数推荐系统爬虫2万+数据大屏数据展示 + [手把手视频教程和开发文档] QQ-1305637939 毕业设计大数据毕设计算机毕业设计 hive spring boot 爬虫
hive电影数据分析Springboot协同过滤-余弦函数推荐系统爬虫2万+数据大屏数据展示+[手把手视频教程和开发文档]【功能介绍】1.java爬取【豆瓣电影】网站中电影数据,保存为data.csv文件,数据量2万+2.data.csv上传到hadoop集群环境3.MR数据清洗data.csv4.Hive汇总处理,将Hive处理的结果数据保存到本地Mysql数据库中5.Springboot+Vu
hadoop电影数据分析系统 Springboot协同过滤-余弦函数推荐系统爬虫2万+数据大屏数据展示 + [手把手视频教程和开发文档] QQ-1305637939 计算机毕业设计毕业设计大数据毕设 hadoop spring boot 爬虫
全套视频教程全套开发文档hadoop电影数据分析系统Springboot协同过滤-余弦函数推荐系统爬虫2万+数据大屏数据展示【Hadoop项目】1.java爬取【豆瓣电影】网站中电影数据,保存为data.csv文件,数据量2万+2.data.csv上传到hadoop集群环境3.data.csv数据清洗4.MR数据汇总处理,将Reduce的结果数据保存到本地Mysql数据库中5.Springboot
spark电影数据分析系统 Springboot协同过滤-余弦函数推荐系统爬虫2万+数据大屏数据展示 + [手把手视频教程和开发文档] QQ-1305637939 毕业设计大数据毕设计算机毕业设计 spark spring boot 爬虫大数据电影推荐电影分析
spark电影数据分析系统Springboot协同过滤-余弦函数推荐系统爬虫2万+数据大屏数据展示+[手把手视频教程和开发文档【功能介绍】1.java爬取【豆瓣电影】网站中电影数据,保存为data.csv文件,数据量2万+2.data.csv上传到hadoop集群环境3.MR数据清洗data.csv4.Spark汇总处理,将Spark处理的结果数据保存到本地Mysql数据库中5.Springboo
hadoop图书数据分析系统 Springboot协同过滤-余弦函数推荐系统爬虫1万+数据大屏数据展示 + [手把手视频教程和开发文档] QQ-1305637939 毕业设计大数据毕设图书数据分析 hadoop spring boot 爬虫
hadoop图书数据分析系统Springboot协同过滤-余弦函数推荐系统爬虫1万+数据大屏数据展示+[手把手视频教程和开发文档]【亮点功能】1.Springboot+Vue+Element-UI+Mysql前后端分离2.Echarts图表统计数据,直观展示数据情况3.发表评论后，用户可以回复评论,回复的评论可以被再次回复,一级评论可以添加图片附件4.爬虫图书数据1万+5.推荐图书列表展示,推荐图
SpringCloud Alibaba：RocketMQ - 分布式消息中间件的最佳实践 mckim_ 笔记学习 spring cloud rocketmq
引言随着分布式系统和微服务架构的发展，消息队列作为异步通信的关键组件，其重要性日益凸显。RocketMQ作为一款高性能、高可靠的消息中间件，在处理海量消息方面表现卓越。本文将结合实际应用场景，全面介绍RocketMQ的基础知识、配置要点、高级特性以及性能监控的最佳实践。一、RocketMQ基础知识1.概述RocketMQ是由阿里巴巴开源的一款分布式消息中间件，以其高效、可靠、易用的特点著称。它支持
使用宝塔面板以jar包方式部署SpringBoot个人博客（以IP+端口号访问） emmastone 部署 spring boot ssh centos 服务器
使用宝塔面板以jar包方式部署SpringBoot个人博客购买阿里云服务器ECS在服务器端创建数据库修改SpringBoot项目的配置文件上传jar包和配置文件到服务器同一个目录下放行相关端口号首先需要在阿里云的控制台放行相关端口号然后在宝塔面板的安全放行相关端口号购买阿里云服务器ECS购买ECS服务器时，选择附带宝塔面板的，会默认安装好LAMP（Apache+Mysql+php），只需在安装to
如何实现亿级用户在线状态统计？繁川 Java面试精选数据库 android
亿级用户在线场景分析与解决方案目录亿级用户在线场景分析解决方案2.1基于总数的统计方案2.2基于具体用户详情的统计方案具体实现3.1基于总数的统计方案3.2基于用户标识的统计实现3.3SpringBoot中的实现总结1.亿级用户在线场景分析以QQ在线状态统计为例，其典型特征包括：数据量大、内存占用高、实时性要求高。传统的解决方案（如在数据库中为每个用户添加一个在线状态字段，上线设为1，下线设为0）
2025毕设springboot MVC框架下的精品课程管理平台论文+源码 zhihao501 课程设计 spring boot mvc
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景在教育信息化的大背景下，精品课程管理平台的构建成为提升教学质量和效率的重要手段。当前，许多高校和教育机构仍然采用传统的课程管理方式，不仅效率低下，还难以满足学生日益增长的个性化学习需求。SpringBootMVC框架作为一种轻量级、高效的JavaWeb开发框架，以其简洁的设计理
【大模型】Spring AI对接ChatGpt使用详解小码农叔叔微服务治理与实战 springboot 入门到精通 spring spring ai Aspring Ai spring ai对接gpt spring ai整合gpt spring ai使用详解 spring ai使用
目录一、前言二、springai介绍2.1什么是SpringAI2.2SpringAI特点2.3SpringAI为开发带来的便利2.4SpringAI应用领域2.4.1聊天模型2.4.2文本到图像模型2.4.3音频转文本2.4.4嵌入大模型使用2.4.5矢量数据库支持2.4.6用于数据工程ETL框架三、SpringAI对接ChatGPT3.1前置准备3.2添加依赖3.3接入流程3.3.1配置文件3
【微服务】Spring AI 使用详解逆风飞翔的小叔精通springboot微服务 Spring AI Spring AI使用详解 Spring AI使用
目录一、前言二、SpringAI概述2.1什么是SpringAI2.2SpringAI特点2.3SpringAI带来的便利2.4SpringAI应用领域2.4.1聊天模型2.4.2文本到图像模型2.4.3音频转文本2.4.4嵌入大模型使用2.4.5矢量数据库支持2.4.6数据工程ETL框架三、SpringAI对接ChatGPT3.1前置准备3.2添加必要的依赖3.3接入操作流程3.3.1配置文件3
RabbitMQ高级特性 - 消费者消息确认机制陈亦康面试总结 rabbitmq ruby 分布式
文章目录RabbitMQ消息确认机制背景消费者消息确认机制概述手动确认（RabbitMQ原生SDK）手动确认（Spring-AMQP封装RabbitMQSDK）AcknowledgeMode.NONEAcknowledgeMode.AUTO（默认）AcknowledgeMode.MANUALMANUAL可能会引发的问题RabbitMQ消息确认机制背景上图中可以看出，从生产者发送消息到消费者接收到消
Spring AI提示词模板PromptTemplate的使用大龄码农有梦想 AI人工智能 spring 人工智能 PromptTemplate Prompt提示词提示词模板 Spring AI
本文重点介绍Prompt提示词和PromptTemplate提示词模板，在SpringAI框架里，Prompt类的设计旨在简化与LLM之间的交互过程，同时提供了足够的灵活性来满足不同类型的对话需求。通过合理利用Prompt及其内部的消息结构，开发者可以有效地引导LLM生成高质量的回答，提升用户体验。1、SpringBoot集成SpringAI框架如何基于Springboot集成SpringAI框架
JAVA：Spring Boot 实现责任链模式处理订单流程的技术指南拾荒的小海螺 JAVA java spring boot 责任链模式
1、简述在复杂的业务系统中，订单流程往往需要一系列的操作，比如验证订单、检查库存、处理支付、更新订单状态等。责任链模式（ChainofResponsibility）可以帮助我们将这些处理步骤分开，并且以链式方式处理每一个操作，从而让代码更加清晰、可扩展和模块化。本文将介绍如何在SpringBoot3.3中使用责任链模式实现订单流程管理。2、场景设计责任链模式是一种行为设计模式，它通过将请求沿着处理
域名解析平台有哪些
在互联网的广袤世界中，域名解析平台起着至关重要的作用，它们就像是互联网的“导航仪”，将人们易于记忆的域名转换为计算机能够理解的IP地址，从而确保我们能够顺利访问各类网站和在线服务。域名解析的过程就是将域名翻译为对应的IP地址，使得浏览器能够准确地找到服务器并获取网页内容。以下是一些国内外知名的域名解析平台：国外域名解析平台1.Cloudflare：Cloudflare是一个全球知名的DNS解析服务
Spring AI VectorStoreChatMemoryAdvisor 王小工 AI spring 人工智能 oracle
SpringAI中的VectorStoreChatMemoryAdvisor是一个重要的组件，它实现了长期记忆功能，能够将用户提出的问题及模型的回答存储到向量数据库中。以下是对SpringAIVectorStoreChatMemoryAdvisor的详细解析：一、功能概述VectorStoreChatMemoryAdvisor的主要功能是将聊天对话中的历史记录存储到向量数据库中，以便在后续对话中提
Springboot-配置文件中敏感信息的加密：三种加密保护方法比较 m0_74825223 面试学习路线阿里巴巴 spring boot 后端 java
一.背景当我们将项目部署到服务器上时，一般会在jar包的同级目录下加上application.yml配置文件，这样可以在不重新换包的情况下修改配置。一般会将数据库连接、Redis连接等放到配置文件中。例如配置数据库连接：spring:servlet:multipart:max-file-size:10MB#文件大小限制max-request-size:100MB#请求大小限制datasource:
使用 Caffeine 和 Redis 实现高效的二级缓存架构微技术 redis 架构数据库缓存
在现代应用开发中，缓存是提升系统性能的关键手段。为了兼顾本地缓存的高性能和分布式缓存的扩展能力，常见的实现方式是结合使用Caffeine和Redis实现二级缓存架构。本文将详细介绍如何通过SpringBoot实现一个Caffeine+Redis二级缓存，并通过合理的架构设计和代码实现，确保缓存的一致性、性能和容错性。一、需求与挑战1.多级缓存的需求：•一级缓存（Caffeine）：快速响应，存储本
springboot图书馆管理系统前后端分离版本酷爱码 spring boot 后端 java
springboot图书馆管理系统前后端分离版本，系统供的功能全部都可以使用这是一个成品，系统的架构包括代码的层次都比较清晰而且功能比较丰富大家可以拿到手里改改界面改改文字的描述细节稍微修改一下就可以完成自己的毕业设计了，也可二次开发系统特性技术先进：使用了最新的SpringBoot框架，简化了项目配置，提高了开发效率。模块化设计：系统分为多个独立但相互关联的模块，如用户管理、书籍管理、借阅记录等
docker和Nvidia-docker安装教程 _helen_520 安装和配置各种环境 docker linux 运维
channels:https://mirrors.ustc.edu.cn/anaconda/pkgs/main/https://mirrors.ustc.edu.cn/anaconda/cloud/conda-forge/https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/defaultsshow_channel_urls:truedoc
Spring之定时任务基本使用篇后端springboot
Spring之定时任务基本使用篇spring-boot项目中，想添加一个定时任务，可以怎么办？不管什么项目，都是可以直接用JDK原生的定时任务来实现借助@Scheduled注解来使用本篇博文则主要集中在在SpringBoot项目中，怎么使用定时任务I.基本使用demo在SpringBoot项目中，使用定时任务需要先开启对应的配置，一个简单的demo如下代码解读复制代码@EnableScheduli
LoadBalancer负载均衡服务调用胡尔摩斯. java 后端 spring cloud LoadBalancer
LoadBalancerLoadBalancer（负载均衡器）是SpringCloud中的一个关键组件，用于在微服务架构中实现服务请求的负载均衡。它的主要作用是将客户端的请求分发到多个服务实例上，以提高系统的可用性、性能和容错能力。通过LoadBalancer，可以实现服务的水平扩展，使得系统能够处理更多的并发请求。LoadBalancer的类型在SpringCloud中，LoadBalancer
如何基于SpringBoot和PostGIS的各国及所属机场信息检索实现机场的可视化实现用心去追梦 spring boot 后端 java
基于SpringBoot和PostGIS实现各国及所属机场信息检索，并进行机场的可视化展示，可以按照以下步骤来进行：1.环境准备安装PostGIS确保你的数据库服务器已安装PostgreSQL。安装PostGIS扩展来支持地理空间数据类型和函数。CREATEEXTENSIONpostgis;设置SpringBoot项目使用SpringInitializr创建一个新的SpringBoot项目，选择W
庖丁解java(一篇文章学java) 庖丁解java java 开发语言
(大家不用收藏这篇文章,因为这篇文章会经常更新,也就是删除后重发)一篇文章学java,这是我滴一个执念...当然,真一篇文章就写完java基础,java架构,java业务实现,java业务扩展,根本不可能.所以,这篇文章,就是一个索引,索什么呢?请看下文...关于决定开始写博文的介绍(一切故事的起点源于这一次反省)中小技术公司的软扩展(微服务扩展是否有必要?)-CSDN博客SpringCloud(
ros 机器人地图转化为gis地图 Sunday_ding 问题集地图 arcgis java 图论
ROS(RobotOperatingSystem)和CloudLibrary的结合可以通过生成的文件构建地理信息系统（GIS），尤其是当涉及到机器人、传感器数据以及地图构建时。下面将详细说明ROS和CloudLibrary如何生成的数据文件能够被用来构建GIS系统，以及如何通过这些数据进一步进行地理空间分析。1.ROSCloudLibrary生成的文件ROS提供了多种与地图构建和机器人定位相关的工
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交