红蒲公英

GoLang学习之路，对Elasticsearch的使用，一文足以（包括泛型使用思想）（一）

这几天没有更新，其主要的的原因是，在学习对Elasticsearch的使用。Elasticsearch是一个非常强大的数据库索引工具。是一个基于Lucene库的搜索引擎。它提供了一个分布式、支持多租户的全文搜索引擎，具有HTTP Web接口和无模式JSON文档。Elasticsearch是用Java开发的，并在Apache许可证下作为开源软件发布。官方客户端在Java、.NET（C#）、PHP、Python、Apache Groovy、Ruby和许多其他语言中都是可用的。根据DB-Engines的排名显示，Elasticsearch是最受欢迎的企业搜索引擎，其次是Apache Solr，也是基于Lucene。

所以你可以不用，但是你不能不知道，不可谓重要。

文章目录

Elasticsearch概念
安装
使用ElasticSearch
- `使用前提`
- - 存储结构
  - Elasticsearch语法
  - - 常见的几种查询方法
    - - `精确匹配单个字段`
      - `多值匹配`
      - `范围查询`
      - `bool组合查询`
      - `排序`
      - `聚合查询`
      - `count函数`
        
        `cardinality`
        
        `avg`求平均值
        
        `Sum`求和计算
        
        `max`求最大值
        
        `min`求最小值

Elasticsearch概念

ElasticSearch是一个分布式、RESTful风格的搜索和数据分析引擎，在国内简称为ES；使用Java开发的，底层基于Lucene是一种全文检索的搜索库，直接使用使用Lucene还是比较麻烦的，Elasticsearch在Lucene的基础上开发了一个强大的搜索引擎。

主要功能有：

分布式的搜索引擎和数据分析引擎
全文检索、结构化检索、数据分析
对海量数据进行近实时的处理

Elastic 是Lucene的封装，提供了REST API的操作接口，开箱即用

Lucene：是单机应用，只能在单台服务器上使用，最多只能处理单台服务器可以处理的数据量。
Elasric：ES自动可以将海量数据分散到多台服务器上去存储和检索海量数据的处理：
- 分布式以后，就可以采用大量的服务器去存储和检索数据，自然而然就可以实现海量数据的处理了，近实时；在秒级别对数据进行搜索和分析。

国外
- 维基百科，类似百度百科，全文检索，高亮，搜索推荐
  - Stack Overflow（国外的程序异常讨论论坛）
- GitHub（开源代码管理）
- 电商网站，检索商品
- 日志数据分析，logstash采集日志，ES进行复杂的数据分析（ELK技术，elasticsearch+logstash+kibana）
- BI系统，商业智能，Business Intelligence
国内
- 站内搜索（电商，招聘，门户）
- IT系统搜索（OA，CRM，ERP）
- 数据分析（ES热门的一个使用场景）

优点：

Elasticsearch，将全文检索、数据饭呢西、分布式技术合并到了一起。lucene（全文检索），商用的数据分析软件（也是有的），分布式数据库（mycat）
数据库的功能面对很多领域是不够用的（事务，还有各种联机事务型的操作）；特殊的功能，比如全文检索，同义词处理，相关度排名，复杂数据分析，海量数据的近实时处理；Elasticsearch作为传统数据库的一个补充，提供了数据库所不不能提供的很多功能
可以作为一个大型分布式集群（数百台服务器）技术，处理PB级数据，服务大公司；也可以运行在单机上，服务小公司
对用户而言，是开箱即用的，非常简单，作为中小型的应用，直接3分钟部署一下ES，就可以作为生产环境的系统来使用了，数据量不大，操作不是太复杂

安装

现在的安装并不像之前的版本那样，包括对Elasticsearch使用。主要存在的问题是密钥。说到密钥，这个就不得不说一个东西。

Elasticsearch其实有三个方面构成：

调用的服务器，这个服务器指代的是，你通过API去使用Elasticsearch引擎的服务器。
Elasticsearch服务器。这个服务器就是搭载Elasticsearch的云服务器
Elasticsearch可视化工具。这个可视化工具功能最齐全的就是Kibana，这个是Elacsticsearch官方指定的可视化工具。除了这个我推荐一个更加轻量的可视化工具es-client,当然对于Kibana的来说，是比不上的，但是轻量啊。安装没有那么复杂。执行需要在浏览器的插件管理中下载就可以用了，非常方便

这里建议安装用docker去安装。这里献上官方文档（官网的不一定能成，主要是看你的虚拟机是什么）

注意：如果是按照别人博客上的安装的话，跟着就行。诺是按照官网的上的，你就注意：

密钥的生成。这个密钥的生成非常重要，Kibana在登录的时候是需要的。这个密钥是安全密钥，在配置的时候是可以取消的。（一定要注意不然在后面是非常弄的）
在用安全组中将相应的端口开放。可视化工具链接的接口与服务器调用端口是一致的。

这里不放我如何去安装的因为我怕更不上时代，到时候误人子弟，官网是一直在变的。

使用ElasticSearch

`使用前提`

必须要有一个ElasticSearch服务器
必须要有一个可视化工具
安装API包，"github.com/elastic/go-elasticsearch/v8"

import "github.com/elastic/go-elasticsearch/v8"

但是这个包下面其实还有一些包，这些包非常的重要。当时我在使用的时候，根本不知道，走了不少的弯路的，找了官网的文档，又找了一些博客，都没有详细的说明情况和要点。要不就少些，要不就只把部分给列出来。但是现在我将这些无私的奉献给各位。

因为这个v8的包非常的多，所以很难将所有的放进去。这里我做一些解释：

客户端：
- 调用NewDefaultClient()和NewClient(cfg Config)方法会返回一个普通客户端
  - NewDefaultClient() 不需要去配置链接时的配置参数，默认参数链接，并返回一个普通客户端
  - NewClient(cfg Config)需要按照总共需要的配置需求去配置参数，并返回一个普通客户端
- 调用NewTypedClient(cfg Config)会返回一个属性客户端（相比普通客户端强大，但是有局限，后面再说）
工具包：
- 这个工具包主要是普通客户端进行调用的，使用的范围是对于批量处理数据的情况
参数类型包：
- 我们在对ElasticSearch进行处理的时候会有很多中情况：
  - 首先是对于语法的选择，ElasticSearch有独属于他自己的一套语法。
  - 查询时会有很多选择，比如对于字段是模糊查询，还是精确查询，还是对地图进行查询。这些参数都有，也有对于AI进行处理的参数。（建议下一个翻译软件，去看看。那个参数太多了。。。也就是说功能非常齐全）

存储结构

ES存储结构	Mysql存储结构
Index（索引）	表
document（文档）	行，一行数据
Field（字段）	表字段
mapping(映射)	表结构定义

index
- ES中索引(index)就像mysql中的表一样，代表着文档数据的集合，文档就相当于ES中存储的一条数据
type
- type也就是文档类型，不过在Elasticsearch7.0以后的版本,已经废弃文档类型了。
- 在Elasticsearch老的版本中文档类型，代表一类文档的集合，index(索引)类似mysql的数据库、文档类型类似Mysql的表。
- 新的版本文档类型没什么作用了，那么index（索引）就类似mysql的表的概念，ES没有数据库的概念了。
document
- ES是面向文档的数据库，文档是ES存储的最基本的存储单元，文档类似mysql表中的一行数据。
- 其实在ES中，文档指的就是一条JSON数据
- ES中文档使用JSON格式存储，因此存储上要比mysql灵活的很多，ES支持任意格式的json数据
  - 要注意：虽然说，一个索引就理解成一个表，但是这个表是可以存任意数据的，也就是说，不遵从约定的一开始的索引也是可以的。（所以索引名一定不能错否则，会有脏数据）

一个document的数据

{
  "_index" : "order",
  "_type" : "_doc",
  "_id" : "1",
  "_version" : 2,
  "_seq_no" : 1,
  "_primary_term" : 1,
  "found" : true,
  "_source" : {
    		"productName": "12370",
            "masterPic": "12345650",
            "categoryId": 1,
            "desc": "12345640",
            "price": "12345630",
            "tags": null,
            "startProvinceCode": "12345690",
            "startCityCode": "12345680",
            "destinationProvinceCode": "12345640",
            "destinationCityCode": "12345670",
            "startDate": null
  }
}

文档中的任何json字段都可以作为查询条件。并且文档的json格式没有严格限制，可以随意增加，减少字段，甚至每个文档的格式都不一样也可以。
值得注意的是：

_index：代表当前json文档所属的文档名字(重要)
_type：代表当前json文档所属的类型。不过在es7.0以后废弃了type用法，但是元数据还是可以看到的(API可以)（重要）
_id：文档唯一ID，如果我们没有为文档指定id，系统自动生成。（重要，一定要自己去控制）
_source：代表我们插入进入json数据
_version：文档的版本号，每修改一次文档数据，字段就会加1，这个字段新版es也给取消了
_seq_no：文档的编号，替代老的 version字段
_primary_term：文档所在主分区，这个可以跟seq_no字段搭配实现乐观锁（重要）

Field

文档由多个json字段，这个字段跟mysql中的表的字段是类似的。ES中的字段也是有类型的：

数值类型(long、integer、short、byte、double、float)
Date 日期类型
boolean布尔类型
Text 支持全文搜索
Keyword 不支持全文搜索，例如：phone这种数据，用一个整体进行匹配就ok了，也不要进行分词处理
Geo 这里主要用于地理信息检索、多边形区域的表达。

mapping:

Elasticsearch的mapping类似于mysql中的表结构体定义，每个索引都有一个映射的规则，我们可以通过定义索引的映射规则，提前定义好文档的json结构和字段类型，如果没有定义索引的映射规则，ElasticSearch会在写入数据的时候，根据我们写入的数据字段推测出对应的字段类型，相当于自动定义索引的映射规则。

这里献上一篇我在学习时看见的一篇非常详细的文章：

mappingTpl = `{
 "mappings":{
  "properties":{
   "categoryId":     { 
   		"type": "long" 
   		},
   "productName":   {
   		 "type": "keyword" 
   		 },
   "masterPic":   {
   		 "type": "text"
   		  },
   "desc":   {
   		 "type": "keyword" 
   		 },
   "price":    { 
   		"type": "long"
   		 },
   "startProvinceCode":  {
   		 "type": "text" 
   		 },
   "startCityCode":         {
   		 "type": "text" 
   		 },
   "update_time":  { 
   		"type": "long"
   		 },
   "create_time":  { 
   		"type": "long"
   		 }
	   }
 	 }
 }`

这样我们就定义好了，一个索引的结构

Elasticsearch语法

在使用ES时，查询是我们经常使用的

GET /{索引名}/_search
{
 "from" : 0,  // 搜索结果的开始位置
   "size" : 10, // 分页大小，也就是一次返回多少数据
   "_source" :[ ...需要返回的字段数组... ],
 "query" : { ...query子句... },
 "aggs" : { ..aggs子句..  },
 "sort" : { ..sort子句..  }
}

ES查询分页：通过from和size参数设置，相当于MYSQL的limit和offset结构
query：主要编写类似SQL的Where语句，支持布尔查询（and/or）、IN、全文搜索、模糊匹配、范围查询（大于小于）
aggs：主要用来编写统计分析语句，类似SQL的group by语句
sort：用来设置排序条件，类似SQL的order by语句
source：用于设置查询结果返回什么字段，相当于select语句后面指定字段

查询语句：GET /{索引名}/_search

查询 GET /test/_search

返回结果：


{
    "took": 1,
    "timed_out": false,
    "_shards": {
        "total": 1,
        "successful": 1,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": {
            "value": 1006,
            "relation": "eq"
        },
        "max_score": 1,
        "hits": [
            {
                "_index": "test",
                "_id": "bZ8TfIwBuOjgAaUNdD1u",
                "_score": 1,
                "_source": {
                    "productName": "123",
                    "masterPic": "123456",
                    "categoryId": 1,
                    "desc": "123456",
                    "price": "123456",
                    "tags": null,
                    "startProvinceCode": "123456",
                    "startCityCode": "123456",
                    "destinationProvinceCode": "123456",
                    "destinationCityCode": "123456",
                    "startDate": null
                }
            }
}

常见的几种查询方法

匹配单个字段
通过match实现全文索引，全文搜索是ES的关键特性之一，我们平时使用搜索一些文本、字符串是否包含指定的关键词，但是如果两篇文章，都包含我们的关键词。

GET /{索引名}/_search
{
  "query": {
    "match": {
      "{FIELD}": "{TEXT}"
    }
  }
}

{FIELD} 就是我们需要匹配的字段名
{TEXT} 就是我们需要匹配的内容

`精确匹配单个字段`

当我们需要根据手机号、用户名来搜索一个用户信息时，这就需要使用精确匹配了。可以使用term实现精确匹配语法

GET /{索引名}/_search
{
  "query": {
    "term": {
      "{FIELD}": "{VALUE}"
    }
  }
}

{FIELD} - 就是我们需要匹配的字段名
{VALUE}- 就是我们需要匹配的内容，除了TEXT类型字段以外的任意类型

`多值匹配`

多值匹配，也就是想mysql中的in语句一样，一个字段包含给定数组中的任意一个值匹配。上文使用term实现单值精确匹配，同理terms就可以实现多值匹配

GET /{索引名}/_search
{
  "query": {
    "terms": {
      "{FIELD}": [
        "{VALUE1}",
        "{VALUE2}"
      ]
    }
  }
}

{FIELD}- 就是我们需要匹配的字段名
{VALUE1}, {VALUE2} … {VALUE N} - 就是我们需要匹配的内容，除了TEXT类型字段以外的任意类型。

`范围查询`

使用range就可以实现范围查询，相当于SQL语句的>，>=，<，<=表达式

GET /{索引名}/_search
{
  "query": {
    "range": {
      "{FIELD}": {
        "gte": 100, 
        "lte": 200
      }
    }
  }
}

{FIELD} - 字段名
gte范围参数 - 等价于>=
lte范围参数 - 等价于 <=
范围参数可以只写一个，例如：仅保留 “gte”: 100，则代表 FIELD字段 >= 100

范围参数有如下：

gt - 大于（ > ）
gte - 大于且等于（ >= ）
lt - 小于（ < ）
lte - 小于且等于（ <= ）

`bool组合查询`

前面的查询都是设置单个字段的查询条件，实际项目中这么应用是很少的，基本都是多个字段的查询条件。

GET /{索引名}/_search
{
  "query": {
    "bool": { // bool查询
      "must": [], // must条件，类似SQL中的and, 代表必须匹配条件
      "must_not": [], // must_not条件，跟must相反，必须不匹配条件
      "should": [] // should条件，类似SQL中or, 代表匹配其中一个条件
    }
  }
}

must条件：类似SQL的and，代表必须匹配的条件。
must_not条件：跟must作用刚好相反，相当于sql语句中的 !=
should条件：类似SQL中的 or，只要匹配其中一个条件即可

`排序`

假设我们现在要查询订单列表，那么返回符合条件的列表肯定不会是无序的，一般都是按照时间进行排序的，所以我们就要使用到了排序语句。
ES的默认排序是根据相关性分数排序，如果我们想根据查询结果中的指定字段排序。

sort子句支持多个字段排序，类似SQL的order by。

GET /{索引名}/_search
{
  "query": {
    ...查询条件....
  },
  "sort": [
    {
      "{Field1}": { // 排序字段1
        "order": "desc" // 排序方向，asc或者desc, 升序和降序
      }
    },
    {
      "{Field2}": { // 排序字段2
        "order": "desc" // 排序方向，asc或者desc, 升序和降序
      }
    }
    ....多个排序字段.....
  ]
}

`聚合查询`

ES中的聚合查询，类似SQL的SUM/AVG/COUNT/GROUP BY分组查询，主要用于统计分析场景。

一般统计分析主要分为两个步骤：

分组：
- 对查询的数据首先进行一轮分组，可以设置分组条件
  - 例如：新生入学，把所有的学生按专业分班，这个分班的过程就是对学生进行了分组。
组内聚合：
- 组内聚合，就是对组内的数据进行统计
  - 例如：计算总数、求平均值等等，接上面的例子，学生都按专业分班了，那么就可以统计每个班的学生总数，这个统计每个班学生总数的计算，就是组内聚合计算。

一些概念：

1. 桶：

桶的就是一组数据的集合，对数据分组后，得到一组组的数据，就是一个个的桶。
- ES中桶聚合，指的就是先对数据进行分组。

指标：指标指的是对文档进行统计计算方式，又叫指标聚合。
- 桶内聚合，说的就是先对数据进行分组（分桶），然后对每一个桶内的数据进行指标聚合。
  - 其实就是，前面将数据经过一轮桶聚合，把数据分成一个个的桶之后，我们根据上面计算指标对桶内的数据进行统计。
  - 常用的指标有：SUM、COUNT、MAX等统计函数。

{
  "aggregations" : {
    "" : {
        "" : {
            >
        }
        [,"aggregations" : { [>]+ } ]? // 嵌套聚合查询，支持多层嵌套
    }
    [,"" : { ... } ]* // 多个聚合查询，每个聚合查询取不同的名字
  }
}

aggregations
- 代表聚合查询语句，可以简写为aggs
- 代表一个聚合计算的名字，可以随意命名，因为ES支持一次进行多次统计分析查询，后面需要通过这个名字在查询结果中找到我们想要的计算结果。
- 聚合类型，代表我们想要怎么统计数据，主要有两大类聚合类型，桶聚合和指标聚合，这两类聚合又包括多种聚合类型
- 例如：指标聚合：sum、avg，桶聚合：terms、Date histogram等等。
- 聚合类型的参数，选择不同的聚合类型，有不同的参数。
aggregation_name_2
- 代表其他聚合计算的名字，意思就是可以一次进行多种类型的统计。

例子：

GET /order/_search
{
    "size" : 0, // 设置size=0的意思就是，仅返回聚合查询结果，不返回普通query查询结果。
    "aggs" : { // 简写
        "count_store" : { // 聚合查询名字
            "terms" : { // 聚合类型为，terms，terms是桶聚合的一种，类似SQL的group by的作用，根据字段分组，相同字段值的文档分为一组。
              "field" : "store_name" // terms聚合类型的参数，这里需要设置分组的字段为store_name，根据store_name分组
            }
        }
    }
}

`count函数`

Value Count：值聚合，主要用于统计文档总数，类似SQL的count函数。

GET /sales/_search?size=0
{
  "aggs": {
    "types_count": { // 聚合查询的名字，随便取个名字
      "value_count": { // 聚合类型为：value_count
        "field": "type" // 计算type这个字段值的总数
      }
    }
  }
}

`cardinality`

基数聚合，也是用于统计文档的总数，跟Value Count的区别是，基数聚合会去重，不会统计重复的值，类似SQL的count(DISTINCT 字段)用法。

POST /sales/_search?size=0
{
    "aggs" : {
        "type_count" : { // 聚合查询的名字，随便取一个
            "cardinality" : { // 聚合查询类型为：cardinality
                "field" : "type" // 根据type这个字段统计文档总数
            }
        }
    }
}

`avg`求平均值

POST /exams/_search?size=0
{
  "aggs": {
    "avg_grade": { // 聚合查询名字，随便取一个名字
      "avg": { // 聚合查询类型为: avg
        "field": "grade" // 统计grade字段值的平均值
      }
    }
  }
}

`Sum`求和计算

POST /sales/_search?size=0
{
  "aggs": {
    "hat_prices": { // 聚合查询名字，随便取一个名字
      "sum": { // 聚合类型为：sum
        "field": "price" // 计算price字段值的总和
      }
    }
  }
}

`max`求最大值

POST /sales/_search?size=0
{
  "aggs": {
    "max_price": { // 聚合查询名字,随便取一个名字
      "max": { // 聚合类型为：max
        "field": "price" // 求price字段的最大值
      }
    }
  }
}

`min`求最小值

POST /sales/_search?size=0
{
  "aggs": {
    "min_price": { // 聚合查询名字，随便取一个
      "min": { // 聚合类型为: min
        "field": "price" // 求price字段值的最小值
      }
    }
  }
}

到了这里查询语法就全部结束了，但是语法只是语法，如何去用包的API去调用就是一个非常重要的问题。这里我说明一下。无论是什么Elasticsearch语句，最后都会转换成相应的接口API去实现的。所以调用也会变得简单。

具体API调用方式请看这个文章：GoLang学习之路，对Elasticsearch的使用，一文足以（包括泛型使用思想）（二）

本来是想继续写下去，但是超过一万字真的好卡啊。。。。。csdn什么扩充一下啊。

你可能感兴趣的:(GoLong,golang,学习,elasticsearch,架构,后端)

Oracle vs MySQL 窗口函数大对决：7个关键差异你了解几个？墨瑾轩数据库学习 oracle mysql 数据库
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣嘿，小伙伴们！今天咱们要来一场精彩的对决——Oracle与MySQL的窗口函数较量。你知道吗？这两个数据库巨头在处理复杂查询时都引入了窗口函数这一强大的工具。那么问题来了，它们之间到底有哪些不同之处呢？别急，让我们一步步揭开谜底，保证你看完这篇文章就能轻松掌握
【排序算法】希尔排序（C语言）手眼通天王水水 #查找排序算法排序算法 c语言算法
【排序算法】——希尔排序目录一、希尔排序原理1.插入排序的问题2.希尔排序的思路二、希尔排序的相关问题1.为什么插入排序那么多但效率却很高2.如何选择希尔增量三、代码实现1.代码实现思路2.实现代码希尔排序是对直接插入排序的优化，在学习之前，没有学过插入排序的童鞋们建议先学习插入排序：点击跳转到插入排序一、希尔排序原理1.插入排序的问题逆序有序的数组排序时，时间复杂度为O(n2)O(n^2)O(n
Hadoop--HA架构详解娘子，出来看上帝 Hadoop Hadoop 大数据 HA
一、HA架构工作背景HDFS集群中的nameNode存在单点故障因素。对于只有一个nameNode工作的集群来说，一旦nameNode出现意外情况，会导致整个集群无法工作，直到nameNode重新启动。为了解决上述问题，Hadoop给出了高容错，高可用的HA方案：一个HDFS集群至少存在两个nameNode，一个nameNode处在active（主）状态，其他nameNode处在standby（备
双线性函数的紧凑超平面散列（Compact Hyperplane Hashing with Bilinear Functions）阅读笔记 Legend105CC 机器学习主动学习机器学习
Abstract超平面散列（Hyperplanehashing）的目的是快速搜索到离超平面最近的点，并在使用支持向量机（SVM）扩大主动学习方面显示出实际效果。存在问题：不幸的是，现有的随机方法需要长哈希码才能达到合理的搜索精度，因此会降低搜索速度和内存开销。解决方法：为此，论文（CompactHyperplaneHashingwithBilinearFunctions）提出了一种新的超平面哈希技
Hadoop HA 架构 weixin_30569033 shell 大数据
为什么要用集群?企业里面,多台机器伪分布式每一个角色都是一个进程HDFS:NNSNNDNYARN:RMNM大数据所有组件,都是主从架构master-slaveHDFS读写请求都是先到NN节点,但是,HBase读写请求不是经过master,建表和删除表是需要经过masterNN节点挂了,就不能提供对外服务(-put,-get)需要配置两个NN节点(实时的,任何时刻只有一台active对外,另外一台是
聊聊AI中的“蒸馏”技术自由鬼行业发展 IT应用探讨产品分析对比人工智能深度学习机器学习
一、什么是“蒸馏”技术“蒸馏”技术实际上是指知识蒸馏（KnowledgeDistillation），这是一种用于压缩和优化大模型的机器学习方法。其核心思想类似于传统蒸馏：大模型（教师模型）包含丰富的知识，而小模型（学生模型）通过学习大模型的输出，从而在保持高性能的同时降低计算成本。1.知识蒸馏的过程教师模型（TeacherModel）训练先训练一个大规模基础模型，这个模型能力很强，但计算开销大。生
Oracle PL/SQL 编程入门：第十六章记录类型 Records caifox菜狐狸 Oracle PL/SQL 编程入门 oracle sql 数据库 PL/SQL Record Records 记录
欢迎来到OraclePL/SQL编程入门的第十六章！在这一章中，我们将深入探讨记录类型（Records）。通过学习基于表和游标的记录、用户自定义记录、记录的兼容性、嵌套记录以及集合记录的定义和使用方法，你将能够编写更加灵活和高效的数据库操作代码。此外，我们还会介绍一些注意事项，并通过实际例子展示它们的用法。准备好迎接新的挑战了吗？让我们开始吧！第一节：记录类型Record记录类型（Record）是
Java 六边形架构 – BABAL Java_ttcd java 架构 servlet
一、概述在本教程中，我们将使用HexagonalArchitecture的原理，使用CLI使用者实现一个简单的JavaCMS应用程序。主要思想是尽可能保持业务逻辑分离，并使用SOLID原则中的“D”依赖反转原则来防止层之间的耦合。2.什么是六边形架构它是一种围绕业务逻辑设计软件应用程序架构并将其与其他层解耦的方法。解耦是通过使用端口和适配器来处理的，这就是为什么HexagonalArchitect
workman服务端开发模式-应用开发-总架构逻辑说明龙哥·三年风水 PHP 长链接分布式分布式 php gateway
一、后台管理端(操作页面端)管理员用浏览器打开页面管理端后，页面管理端会自动检测，如果本地cookie不存在的情况下，跳转到登录页面，如果本地cookie存在的情况下，跳转到首页。登录的情况下，就不说，后面在业务架构里面会说明的。在登录页面输入邮箱账号、密码、验证码，点击提交。提交之前会在前端进行类型及相应的格式验证，如果验证结果都是OK的情况下，将参数提交到api接口中，等待返回结果。如果api
什么是知识蒸馏技术？ deepdata_cn 垂域模型机器学习人工智能知识蒸馏
知识蒸馏（KnowledgeDistillation）是一种模型压缩和加速技术，旨在将大型模型（通常称为教师模型）所学到的知识迁移到小型模型（通常称为学生模型）中，从而让小型模型在减少计算资源消耗和推理时间的同时，尽可能达到接近大型模型的性能。具有很好的成本效益，在实际应用中有助于降低计算资源需求和部署成本。一、基本原理1.模仿学习：知识蒸馏的核心思想是让学生模型模仿教师模型的行为。教师模型通常是
WSL开发环境配置（linux + python + nodejs + docker） Lilixxs 环境搭建基础设施 linux 运维服务器
配置要求及目标总体目标：完整的Linux开发环境可开发基于node.js的前端程序可开发基于python的后端程序（仅日常程序，不包含机器学习程序）可运行docker容器，用于快速搭建测试环境Linux环境要求支持centos发行版类似的操作方式和指令（如使用rpm、dnf进行软件包管理）登录用户具有root权限（执行高权限命令，输入sudo即可执行）可从国内源更新软件基本优化：内核指令优化、禁用
AIGC产品数字人 –【字形绘梦】之绘声拉达曼迪斯II AI创业 WebRTC AIGC学习人工智能音视频 AIGC SD 数字人微信小程序字形绘梦
最近开始发一些AIGC相关的学习博客，期间用到的RamendeusStudio公司的一款免费图文生成微信小程序【字形绘梦】还是不错。关键是免费。最近貌似它们新增了一个语音还是视频的能力叫【绘声】，简单的试用之后觉得还行，给大家分享下先上效果：PT3-11绘文模块使用方法：打开主界面，点选角色或者自定义图片，选择默认文案或者字形输入，点击生成。完成后微信会自动通知你制作完成，点击过去查看即可。它的绘
Nginx--日志（介绍、配置、日志轮转） m0_74825466 nginx 运维
前言：本博客仅作记录学习使用，部分图片出自网络，如有侵犯您的权益，请联系删除一、Nginx日志介绍nginx有一个非常灵活的日志记录模式，每个级别的配置可以有各自独立的访问日志,所需日志模块ngx_http_log_module的支持，日志格式通过log_format命令来定义，日志对于统计和排错是非常有利的，下面总结了nginx日志相关的配置包括access_log、log_format、ope
在亚马逊云科技上通过LangChain ReAct Agent开发金融多模态数据AI分析中台佛州小李哥 AWS技术科技 langchain 人工智能云计算亚马逊云科技 aws 数据分析
项目简介：小李哥将继续每天介绍一个基于亚马逊云科技AWS云计算平台的全球前沿AI技术解决方案，帮助大家快速了解国际上最热门的云计算平台亚马逊云科技AWSAI最佳实践，并应用到自己的日常工作里。本次介绍的是如何在亚马逊云科技机器学习托管服务AmazonSageMaker上搭建一个多模态LangChainAgent，通过ReAct逻辑让Agent通过AmazonBedrockAI模型托管服务上的大模型
FreeRTOS深入教程（任务创建的深入和任务调度机制分析）花落已飘 FreeRTOS全系列教程嵌入式 FreeRTOS ARM 入门 STM32
文章目录前言一、深入理解任务的创建二、任务的调度机制1.FreeRTOS中任务调度的策略2.FreeRTOS任务调度策略实现的核心3.FreeRTOS内部链表源码解析4.如何通过就绪链表管理任务的执行顺序三、一个任务能够运行多久1.高优先级任务可抢占低优先级任务一直运行2.相同优先级的任务遵循时间片轮转四、FreeRTOS中任务如何释放CPU总结前言本篇文章将带大家深入学习任务的创建和分析任务调度
并发编程 - 线程同步快乐非自愿 java jvm 开发语言
经过前面对线程的尝试使用，我们对线程的了解又进一步加深了。今天我们继续来深入学习线程的新知识——线程同步。01、什么是线程同步线程同步是指在多线程环境下，确保多个线程在同时使用共享资源时不会发生冲突或数据不一致问题的技术，保证线程间的正确协作。它的目的是使得多个线程在执行过程中能够按照某种顺序、安全地使用共享资源。02、为何需要线程同步1、避免竞争条件不知道大家还记得在《并发编程-初识线程》中出现
MVC 模型：架构与原理 froginwe11 开发语言
MVC模型：架构与原理MVC（Model-View-Controller）模型是一种广泛应用于软件工程的架构模式，主要用于分离应用程序的逻辑层，以提高其可维护性和可扩展性。MVC模型将应用程序分为三个核心组件：模型（Model）、视图（View）和控制器（Controller）。本文将深入探讨MVC模型的概念、工作原理及其在软件开发中的应用。1.模型（Model）模型是MVC架构中的核心组件，负责
DeepSeek大模型技术深度解析：揭开Transformer架构的神秘面纱不一样的信息安全网络杂烩 AI DeepSeek
摘要DeepSeek大模型由北京深度求索人工智能基础技术研究有限公司开发，基于Transformer架构，具备卓越的自然语言理解和生成能力。该模型能够高效处理智能对话、文本生成和语义理解等复杂任务，标志着人工智能在自然语言处理领域的重大进展。关键词DeepSeek模型,Transformer架构,自然语言,智能对话,文本生成,语义理解一、DeepSeek大模型的架构解析1.1DeepSeek大模型
LLM主要类别架构大模型微调实战人工智能 langchain 自然语言处理神经网络深度学习
LLM主要类别架构介绍LLM主要类别LLM本身基于transformer架构。自2017年，attentionisallyouneed诞生起，transformer模型为不同领域的模型提供了灵感和启发。基于原始的Transformer框架，衍生出了一系列模型，一些模型仅仅使用encoder或decoder，有些模型同时使encoder+decoder。LLM分类一般分为三种：自编码模型（encod
手把手教你搭建 Android MVI架构 MVI + kotlin + Flow m0_74825466 android 架构 kotlin
一、什么是MVIAndroidMVI是一种用于构建Android应用程序的架构模式，其核心思想在于实现单向数据流和唯一可信数据源。在MVI架构中，应用程序的状态管理得到简化，并且用户界面与业务逻辑之间的交互更加清晰和规范。二、MVI组成MVI由Model、View和Intent三个核心组件组成：Model：代表数据模型，负责存储应用程序的状态。它是唯一可信的数据源，意味着应用程序的所有状态都集中在
分布式系统架构7：本地缓存快乐非自愿架构缓存
1.引入缓存的影响我们在开发时，用到缓存的情况，无非就是为了减少客户端对相同资源的重复请求，降低服务器的负载压力。引入缓存后，既有好处也有坏处引入缓存负面影响：开发角度，增加了系统复杂度，需考虑缓存失效、更新、一致性问题运维角度，缓存会掩盖一些缺陷问题安全角度，缓存可能泄密某些保密数据引入缓存的理由：为了缓解CPU压力，将实时计算运行结果存储起来，节省CPU压力为了缓解I/O压力，将原本对网络、磁
Spring MVC 框架：构建高效 Java Web 应用的利器来恩1003 Java 从入门到精通 java spring mvc
Java学习资料Java学习资料Java学习资料一、引言在JavaWeb开发领域，SpringMVC框架是一颗耀眼的明星。它作为Spring框架家族的重要成员，为开发者提供了一套强大而灵活的解决方案，用于构建Web应用程序。SpringMVC遵循模型-视图-控制器（MVC）设计模式，将业务逻辑、数据展示和用户交互进行了有效的分离，使得代码结构清晰、易于维护和扩展。二、MVC设计模式概述2.1基本概
学技术学英文：elasticsearch部署架构-容错设计学会了没 elasticsearch 架构全文检索容错
Unlessyou'rerunningElasticsearchonasinglenode,preparetodesignforfailure.Designingforfailuremeansrunningyourclusterinmultiplelocationsandbereadytoloseawholedatacenterwithoutserviceinterruption.It'snott
《DeepSeek-R1 问世，智能搜索领域迎来新变革》黑金IT 智能搜索
DeepSeek-R1是由DeepSeek公司开发的一款创新型人工智能模型，自2024年5月7日发布以来，迅速在AI领域引起广泛关注。该模型凭借其卓越的语言理解能力、高效的数据处理能力、自适应学习能力、高安全性与可靠性以及广泛的应用场景与拓展性，在众多人工智能模型中脱颖而出。DeepSeek-R1的核心特点强大的语言理解能力：DeepSeek-R1采用先进的深度学习算法，能够精准解析复杂的语义结构
AI绘画关键词（咒语）分析与热点研究集eee AI作画 midjourney chatgpt 人工智能 prompt text2img stable diffusion
语义文本图像生成技术关键词分析与热点研究一、研究背景与研究意义随着深度学习的发展，语义文本到图像的生成技术已经取得长足进步，AI绘画也因此快速崛起。只需输入关键词，AI系统就能自动生成符合语义描述的图像，这一技术的出现,使绘画的创作方式发生革命性变化。目前主流的AI绘画模型有Midjourney、Stablediffusion和文心一格等，其使用方式多为输入一段含有图片描述的“prompt（指令）
Ping Pong Buffer 双缓冲 C++代码学习 gregrgr #C/C++c++开发语言
1、PingPongBuffer原理分析基本原理如上图所示，当设备有数据来时，先放入缓冲区1然后将缓冲区1的数据放入缓冲区2，这时缓冲区1可接收下次数据。工作区可从缓冲区2拿数据2、C++代码实现相关结构体创建typedefstruct{void*buffer[2];volatileuint8_twriteIndex;volatileuint8_treadIndex;volatileuint8_t
【自我提升】一、Hyperledger Fabric 概念梳理记录菌 hyperledger fabric hyperledger
写在前面：最近因为业务需要，开始学习HyperledgerFabric了，做java全栈工程师可真难搞。现在算是啥类型的都在涉及了，现在这个技术啥都不懂，就先开个学习专栏，记录记录。顺带也给各位道友参考参考。目录1.什么是hyperledger2.什么是HyperledgerFabric2.1主要特点2.2应用场景3.关键名词4.通道概念4.1通道的关键特性如下：4.2通道的工作机制：5.步骤简单
服务器虚拟化实战：架构、技术与最佳实践一ge科研小菜鸡运维服务器
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言服务器虚拟化是现代IT基础设施的重要组成部分，通过虚拟化技术可以提高服务器资源利用率、降低硬件成本，并增强系统的可扩展性与容灾能力。本教程将深入讲解服务器虚拟化的核心技术、主流平台、部署方案及实际案例，帮助读者掌握虚拟化架构的最佳实践。2.服务器虚拟化架构服务器虚拟化主要由虚拟化层、管理层和存储/网络层三部分组成：层级主要功能常见技术硬件
Camera Framework 架构了解下 2401_89828732 架构
.├——camera2│├——CaptureRequest.aidl│├——ICameraDeviceCallbacks.aidl│├——ICameraDeviceUser.aidl│├——impl││├——CameraMetadataNative.aidl││└——CaptureResultExtras.aidl│├——params││├——OutputConfiguration.aidl││├
「分块」数列分块入门1 – 9 by hzwer 解题记录 GA_PK
出处学习蓝书的时候感觉书上关于分块的题目太少了.而且都是难度较大的一些分块题目,想巩固一下分块方面的知识,就找到了hzwer大佬的分块入门知识介绍.用这篇博客记录一下.从树状数组到线段树再到分块.都是对区间信息的快速处理来达到想要的效果.树状数组效率最优,可是拓展性实在不高.线段树效率稍微差一点但是拓展性较好,可是在信息不满足区间可加性的情况下代码难度会高很多.而分块效率上最差但是可以接受,且拓展
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

GoLang学习之路，对Elasticsearch的使用，一文足以（包括泛型使用思想）（一）

文章目录

Elasticsearch概念

安装

使用ElasticSearch

使用前提

存储结构

Elasticsearch语法

常见的几种查询方法

精确匹配单个字段

多值匹配

范围查询

bool组合查询

排序

聚合查询

count函数

cardinality

avg求平均值

Sum求和计算

max求最大值

min求最小值