katy的小乖

es学习

getting startted

基本概念

Near Realtime(NRT)

Cluster

Node

index

document

shards & replicas

安装

暴露集群

cluster health

集群健康状态

创建索引

delete index

modify data

update documents

批量处理： _bulk

load simple dataset

1.参数放在request uri后面

2.参数在requrst body里面

query dsl

1.leaf query clauses

2.compound query clauses

查询指定索引里的所有文档

excuting search

匹配查询

bool 查询，must, should, must_not

executing filters

excuting aggregations

set up es

配置

创建keystore

logging 配置

审核安全设置

跨集群副本设置

es集群元素

搜索相关性排序算法

TF-IDF

TF(词频)

逆向文件频率

算法原理

TF-IDF算法例子

额外的学习资料

官方参考手册：https://www.elastic.co/guide/en/elasticsearch/reference/7.1/index.html

getting startted

基本概念

Near Realtime(NRT)

近实时。

es是一个近实时的搜索平台。从检索文档到可搜索文档的时间大概有1秒的延时。

Cluster

集群。

集群是一个或多个节点(服务器)的集合，共同保存整个数据，并提供跨节点的联合索引和搜索功能。

集群由唯一的名称标识，默认为：elasticsearch。当这些节点设置成通过名称来加入集群的时候，集群名称就显得很重要。

确保在不同的环境下不要重复使用集群名称，否则就会把节点加入到错误的集群里面。比如，可以用logging-dev, logging-stage, logging-prod一次代表开发，测试，生成的集群环境。

一个集群只有一个节点是可以的，也是很不错的。当然，也可以由多个独立的集群，每个集群由唯一的集群名称。

Node

节点。

节点是集群里面一个单独的服务器，存储数据，参与集群的索引和查询能力。跟集群类似，节点以名称标识，默认是改节点在启动时候随机分配的uuid。如果不想使用默认节点名称也可以自定义。节点名称对于管理目的很重要，当要识别网络中哪些服务于集群中哪些节点名称符合的时候。

节点可以配置来按照集群名称加入特定的集群。默认情况下，每个节点都加入elasticsearch这个集群。这就意味着如果你在网络中启动了多个节点并假设他们可以彼此相互发现，这些节点就会自动形成并且加入到elasticsearch这个集群。

在当集群中，可以拥有任意数量的节点。另外，如果当前网络上没有其他es节点正在运行，默认启动的单个节点将形成一个名为elasticsearch的新但节点集群。

index

索引

一个index是具有某些相似特征的文档的集合。比如，一个customer data的index, product data的index，或者其他order index。

索引由名称标识，必须全部小写。索引名称用来在对文档进行索引，搜索，更新，删除的时候进行引用。

单个集群中，可以定义任意数量的索引。

document

文档。

是可以被检索的基本信息单元。如，有一个文档是单个customer ，一个文档是单个product，还有一个文档是单个order。

文档以json格式表示。在索引中，可以按需存储任意数量的文档。

shards & replicas

碎片和副本。

shard

一个index可能存储大量的数据超过当节点的硬件限制。

es将index细分为shard。

在创建index，只需要定义需要的shard数量即可。每个shard都是一个功能齐全且独立的"index"，可以托管在集群的任意节点。

允许水平分割/缩放容量

允许跨shard(可能在多个节点)分布和并行化操作，提供性能/吞吐量。

shard的分布方式以及如何将文档聚合是es管理，对用户透明。

副本

在shard/节点出现故障时提供高可用。请务必注意，副本分片永远不会在与从中复制的原始/主分片相同的节点上分配。

允许扩展搜索量/吞吐量，因为可以在所有副本上并行执行搜索。

总而言之，每个Index可以被拆分为多个shard。每个index也可以被复制0次或多次。。一旦被复制，每个index将有一个主shards(从中复制的原始的shard)和副shards(主shards的副本)。

在创建index的时候定义shards和replicas的数量。在创建后可以随时动态更改replicas数量。

可以使用_shrink和_split api来更新现有的shards数量。(需要预先计划正确的shards数量)

默认情况下，es为每个index都分配了一个主shards和一个replicas。意味着如果集群中至少2个节点，则index将由一个主shards和一个副本shards.

安装

https://blog.csdn.net/wslixiaoliang/article/details/80688090

暴露集群

rest api

1.检查cluster，node，index的health, status, statistics

2.管理cluster，node, index 数据和元数据

3.通过index进行执行crud和搜索

4.执行高级搜索，分页，排序，过滤，脚本编写，聚合等

cluster health

api

_cat

GET /_cat/health?v

返回结果

epoch      timestamp cluster       status node.total node.data shards pri relo init unassign pending_tasks max_task_wait_time active_shards_percent
1475247709 17:01:49  elasticsearch green           1         1      0   0    0    0        0             0                  -                100.0%

由以上返回结果可见：

cluster name : elasticsearch(默认的集群名称)

node number:1

node data number: 1

shards: 0 (在shards里面没有数据)

status:green

集群健康状态

green

everything is good(集群功能齐全)

yellow

所有数据都是可用的但是一些副本可能还没分配(集群功能齐全)

red

出于某种原因，某些数据不可用(集群部分功能齐全)。此时集群将继续为来自可用shards的搜索请求提供服务，但最好急躁修复，因为存在未分配的shards。

列出所有索引

GET /_cat/indices?v

创建索引

创建一个customer的索引

// 创建名未customer得索引，pretty表明如果有响应，打印标准得json
PUT /customer?pretty

index/replace documents

给customer index里面添加数据

PUT /customer/_doc/1?pretty
{
  "name": "John Doe"
}

响应结果

{
  "_index" : "customer",
  "_type" : "_doc",
  "_id" : "1",
  "_version" : 1,
  "result" : "created",
  "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 0,
  "_primary_term" : 1
}

其实es并不需要在文档加入index之前显示创建index。当customer index不存在的时候，会自动创建index。

查询刚刚创建的文档

GET /customer/_doc/1?pretty

返回结果

{
  "_index" : "customer",
  "_type" : "_doc",
  "_id" : "1",
  "_version" : 1,
  "_seq_no" : 25,
  "_primary_term" : 1,
  "found" : true,
  "_source" : { "name": "John Doe" }
}

由返回结果可知：

found: true，表明找到了一个_id为1 的文档数据

_source:返回该文档的json格式数据

delete index

DELETE /customer?pretty

modify data

之前已经执行过

PUT /customer/_doc/1?pretty
{
  "name": "John Doe"
}

当再次执行上述命令，使用相同的id=1，但是name改变：

PUT /customer/_doc/1?pretty
{
  "name": "Jane Doe"
}

由于是相同的id，那么最新的文档就会替换掉上次的结果。

当使用不同的id的时候，就会生成一个新的文档，并且原有的文档不会受任何影响。

PUT /customer/_doc/2?pretty
{
  "name": "Jane Doe"
}

执行以上命令会生成一个request _id为2 的文档，以前_id为1 的文档不会受到任何影响。

当在检索的时候，id部分是可选的，如果没有指定，会生成一个随机id，并且用作该文档的index id。

当没有明确指定id 的时候使用POST

POST /customer/_doc?pretty
{
  "name": "Jane Doe"
}

update documents

除了index/replace documents，也可以update documents。

当执行update的时候，会删除旧的文档，并给新的文档重新index。

将之前创建的索引customer。id=1的更新name:

POST /customer/_update/1?pretty
{
  "doc": { "name": "Jane Doe" }
}

在更新name的时候添加属性age:

POST /customer/_update/1?pretty
{
  "doc": { "name": "Jane Doe", "age": 20 }
}

update也可以执行脚本

POST /customer/_update/1?pretty
{
  "script" : "ctx._source.age += 5"
}

根据查询条件来更新

https://www.elastic.co/guide/en/elasticsearch/reference/7.1/docs-update-by-query.html

POST twitter/_update_by_query?conflicts=proceed

update documents

删除之前创建的id=2的文档

DELETE /customer/_doc/2?pretty

也可以根据查询条件来删除

https://www.elastic.co/guide/en/elasticsearch/reference/7.1/docs-delete-by-query.html

POST twitter/_delete_by_query
{
  "query": { 
    "match": {
      "message": "some message"
    }
  }
}

批量处理： _bulk

POST /customer/_bulk?pretty
{"update":{"_id":"1"}}
{"doc": { "name": "John Doe becomes Jane Doe" } }
{"delete":{"_id":"2"}}

上述命令更新_id=1的document，并且删除_id=2的document。

load simple dataset

准备数据account.json

{
    "account_number": 0,
    "balance": 16623,
    "firstname": "Bradshaw",
    "lastname": "Mckenzie",
    "age": 29,
    "gender": "F",
    "address": "244 Columbus Place",
    "employer": "Euron",
    "email": "[email protected]",
    "city": "Hobucken",
    "state": "CO"
}

load

curl -H "Content-Type: application/json" -XPOST "localhost:9200/bank/_bulk?pretty&refresh" --data-binary "@accounts.json"

search

_search

search有两种方式

1.参数放在request uri后面

GET /bank/_search?q=*&sort=account_number:asc&pretty

q=*: 在索引中匹配所有的文档

sore=account)number:asc: 结果按照account_number升序

部分结果如下：

{
  "took" : 63,
  "timed_out" : false,
  "_shards" : {
    "total" : 5,
    "successful" : 5,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
        "value": 1000,
        "relation": "eq"
    },
    "max_score" : null,
    "hits" : [ {
      "_index" : "bank",
      "_type" : "_doc",
      "_id" : "0",
      "sort": [0],
      "_score" : null,
      "_source" : {"account_number":0,"balance":16623,"firstname":"Bradshaw","lastname":"Mckenzie","age":29,"gender":"F","address":"244 Columbus Place","employer":"Euron","email":"[email protected]","city":"Hobucken","state":"CO"}
    }, {
      "_index" : "bank",
      "_type" : "_doc",
      "_id" : "1",
      "sort": [1],
      "_score" : null,
      "_source" : {"account_number":1,"balance":39225,"firstname":"Amber","lastname":"Duke","age":32,"gender":"M","address":"880 Holmes Lane","employer":"Pyrami","email":"[email protected]","city":"Brogan","state":"IL"}
    }, ...
    ]
  }
}

took: es执行这个查询耗费的时间，单位毫秒

time_out:是否查询超时

_shards:告诉我们有多少个shards被查询，包括查询成功/失败的shards个数。

hits:查询结果

hits.total:包含了总的文档数量信息。由请求参数：track_total_hits控制，当track_total_hits=true，强制进行准确计数。

hits.total.value:总的命中的值

hits.total.relation:是否是hits.total.value的确切数量。eq:等于，gte:大于等于

hits.hits:实际查询的结果数组

hits.sort:结果的排序key，如果缺失，那就是以socre排序。

hits._score:是一个数值。是文档于指定的搜索查询匹配程度的相对独立。分数越高，文档越相关。当仅仅在filter 文档的时候才会产生_score。

2.参数在requrst body里面

GET /bank/_search
{
  "query": { "match_all": {} },
  "sort": [
    { "account_number": "asc" }
  ]
}

上述命令执行结果跟放在url后面的结果是一致的。

query dsl

dsl(domain specific language)

1.leaf query clauses

在指定的领域找指定的值。如match, term, range。这些查询可用单独存在使用。

2.compound query clauses

封装了leaf query clauses或者compound query clause

查询指定索引里的所有文档

GET /bank/_search
{
  "query": { "match_all": {} }
}

如果size没有明确指定，则默认为10

GET /bank/_search
{
  "query": { "match_all": {} },
  "size": 1
}

查询第10-19条。如果from没有指定，则默认为0。size没有指定，则默认为10.

GET /bank/_search
{
  "query": { "match_all": {} },
  "from": 10,
  "size": 10
}

将结果按照order降序

GET /bank/_search
{
  "query": { "match_all": {} },
  "sort": { "balance": { "order": "desc" } }
}

excuting search

默认情况下，查询结果是完整的返回，如果不想要整个完整的document结果，可用指定某些字段来返回。

指定返回document里面的_source里面的account_number, balance字段

GET /bank/_search
{
  "query": { "match_all": {} },
  "_source": ["account_number", "balance"]
}

匹配查询

查询account_number=20的

GET /bank/_search
{
  "query": { "match": { "account_number": 20 } }
}

查询address包含mill的结果

GET /bank/_search
{
  "query": { "match": { "address": "mill" } }
}

查询address包含mill或者lane的文档

GET /bank/_search
{
  "query": { "match": { "address": "mill lane" } }
}

查询address包含“mill lane”这个短语的文档

GET /bank/_search
{
  "query": { "match_phrase": { "address": "mill lane" } }
}

bool 查询，must, should, must_not

查询address包含mill和lane的文档

GET /bank/_search
{
  "query": {
    "bool": {
      "must": [
        { "match": { "address": "mill" } },
        { "match": { "address": "lane" } }
      ]
    }
  }
}

查询address包含nil或者lane的

GET /bank/_search
{
  "query": {
    "bool": {
      "should": [
        { "match": { "address": "mill" } },
        { "match": { "address": "lane" } }
      ]
    }
  }
}

查询address既不包含nill也不包含lane的文档

GET /bank/_search
{
  "query": {
    "bool": {
      "must_not": [
        { "match": { "address": "mill" } },
        { "match": { "address": "lane" } }
      ]
    }
  }
}

查询age=40，并且state!=id的

GET /bank/_search
{
  "query": {
    "bool": {
      "must": [
        { "match": { "age": "40" } }
      ],
      "must_not": [
        { "match": { "state": "ID" } }
      ]
    }
  }
}

executing filters

查询账户余额在20000-30000的结果

GET /bank/_search
{
  "query": {
    "bool": {
      "must": { "match_all": {} },
      "filter": {
        "range": {
          "balance": {
            "gte": 20000,
            "lte": 30000
          }
        }
      }
    }
  }
}

excuting aggregations

聚合。

提供了将数据分组和提取统计信息的功能。最简单的方式是sql的group by。

将所有账户按照state分组，返回前10条数据。

GET /bank/_search
{
  "size": 0,
  "aggs": {
    "group_by_state": {
      "terms": {
        "field": "state.keyword"
      }
    }
  }
}

上述的size=0，代表不显示查询命中结果，因为只想看到聚合结果。

返回结果

{
  "took": 29,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "skipped" : 0,
    "failed": 0
  },
  "hits" : {
     "total" : {
        "value": 1000,
        "relation": "eq"
     },
    "max_score" : null,
    "hits" : [ ]
  },
  "aggregations" : {
    "group_by_state" : {
      "doc_count_error_upper_bound": 20,
      "sum_other_doc_count": 770,
      "buckets" : [ {
        "key" : "ID",
        "doc_count" : 27
      }, {
        "key" : "TX",
        "doc_count" : 27
      }, {
        "key" : "AL",
        "doc_count" : 25
      }, {
        "key" : "MD",
        "doc_count" : 25
      }, {
        "key" : "TN",
        "doc_count" : 23
      }, {
        "key" : "MA",
        "doc_count" : 21
      }, {
        "key" : "NC",
        "doc_count" : 21
      }, {
        "key" : "ND",
        "doc_count" : 21
      }, {
        "key" : "ME",
        "doc_count" : 20
      }, {
        "key" : "MO",
        "doc_count" : 20
      } ]
    }
  }
}

根据state计算每个账户的平均余额

(默认就是前10个， from=0, size=10)

GET /bank/_search
{
  "size": 0,
  "aggs": {
    "group_by_state": {
      "terms": {
        "field": "state.keyword"
      },
      "aggs": {
        "average_balance": {
          "avg": {
            "field": "balance"
          }
        }
      }
    }
  }
}

按照state，将计算的平局余额降序

GET /bank/_search
{
  "size": 0,
  "aggs": {
    "group_by_state": {
      "terms": {
        "field": "state.keyword",
        "order": {
          "average_balance": "desc"
        }
      },
      "aggs": {
        "average_balance": {
          "avg": {
            "field": "balance"
          }
        }
      }
    }
  }
}

先按照age分组(20-29,30-39,40-49),再按照性别分组，最后计算每个age，性别组里账户的平均余额

GET /bank/_search
{
  "size": 0,
  "aggs": {
    "group_by_age": {
      "range": {
        "field": "age",
        "ranges": [
          {
            "from": 20,
            "to": 30
          },
          {
            "from": 30,
            "to": 40
          },
          {
            "from": 40,
            "to": 50
          }
        ]
      },
      "aggs": {
        "group_by_gender": {
          "terms": {
            "field": "gender.keyword"
          },
          "aggs": {
            "average_balance": {
              "avg": {
                "field": "balance"
              }
            }
          }
        }
      }
    }
  }
}

set up es

安装

配置

设置jvm.options

其实jvm.options没必要修改，如果需要可修改heap size .

jvm.options详解

空行，或者#开头(代表注释)的都会被忽略。

以-开头的，代表与jvm版本无关的选项

以数字:- 开头的，当且仅当数字与jvm版本匹配的时候才适用

如: 8:-Xmx2g

以数字-:- 当前仅当jvm版本大于等于该数字才生效

如: 8-:-Xmx2g

数字-数字:-，当前仅当jvm版本再两个数字之间的才会生效

安全设置：elasticsearch-keystore

https://www.elastic.co/guide/en/elasticsearch/reference/7.1/secure-settings.html

创建keystore

bin/elasticsearch-keystore create

列出在keystore里面的所有设置

bin/elasticsearch-keystore list

新增字符串设置

bin/elasticsearch-keystore add the.setting.name.to.set

新增文件设置

bin/elasticsearch-keystore add-file the.setting.name.to.set /path/example-file.json

移除设置

bin/elasticsearch-keystore remove the.setting.name.to.remove

重新加载安全设置

在每个集群上会解密和重新读取整个keystore，但仅仅reloadable安全设置才会生效。其他的设置的更改将会在下次重启才生效

POST _nodes/reload_secure_settings

logging 配置

https://www.elastic.co/guide/en/elasticsearch/reference/7.1/logging.html

es使用log4j2来记录日志。配置文件为log4j2.properties

es暴露3个属性，可用在配置文件中使用，以确定日志未见得位置。

${sys:es.logs.base_path}将解析为日志目录

${sys:es.logs.cluster_name}将解析为群集名称（在默认配置中用作日志文件名的前缀）

${sys:es.logs.node_name}并将解析为节点名称（如果明确设置了节点名称）

如果日志目录path.logs为:/var/log/elasticsearch，集群名称为：production

那么${sys:es.logs.base_path}将被解析为： /var/log/elasticsearch

${sys:es.logs.base_path}${sys:file.separator}${sys:es.logs.cluster_name}.log 将被解析为：/var/log/elasticsearch/production.log.

审核安全设置

https://www.elastic.co/guide/en/elasticsearch/reference/7.1/auditing-settings.html

跨集群副本设置

https://www.elastic.co/guide/en/elasticsearch/reference/7.1/ccr-settings.html

es集群元素

搜索相关性排序算法

https://lanffy.github.io/2019/05/08/Elasticsearch-Search-Score-Algorithm

TF-IDF

Term Frequency-Inverse Document Frequency。一种用来信息检索与文本挖掘的常用加权算法。是一种统计方法，用来评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加，但同时会随着它在语料库中出现的频率成反比下降。

TF(词频)

词频的所在对象是一个具体的文档，是指一个文档中出现某个单词(Term)的频率(Frequency)。用的是词频，而不是次数，访问文档内容过长而导致某些单词出现次数过多。

逆向文件频率

在文档集合中，包含某个单词的文档数量。表示一个单词在一个文档集合中的普遍重要程度。

某一特定文件内的高词语频率，以及该词语在整个文件集合中的低文件频率，可以产生出高权重的tf-idf。因此，tf-idf倾向于过滤掉常见的词语，保留重要的词语。

算法原理

TF-IDF实际是两个算法TF与IDF的乘积。

TF表示的是一个单词在一段文本中的重要程度，随着单词的增加而增加
IDF表示的是一个单词在一个文档集合中的重要程度，越稀有权重越高，所以它随着单词的增加而降低

TF-IDF算法例子

额外的学习资料

https://lanffy.github.io/2019/04/16/How-Elasticsearch-Create-Index

https://segmentfault.com/a/1190000019173237?utm_source=tag-newest

你可能感兴趣的:(es)

构建未来交互体验：AG-UI 如何赋能智能体与前端通信？ ChaITSimpleLove AG-UI AI Agent 智能体与用户交互协议智能体与用户交互标准化 CopilotKit 开放的轻量的基于事件的协议
目录什么是AG-UI?⚙️AG-UI主要解决什么问题？AG-UI介绍️核心组件1.协议层（ProtocolLayer）2.标准HTTP客户端（StandardHTTPClient）3.消息类型（MessageType）4.运行Agent（RunningAgent）5.状态管理（StateManagement）️6.工具和交接（ToolsandHandoff）事件（Events）MCPvsA2Avs
sql更新某个字段的值为两个字段拼接
//name=name+id;字段后拼接：结果为nameidupdatet_tablesetname=concat(name,id);//name=id+name;字段前拼接：结果为idnameupdatet_tablesetname=concat(id,name);
多核CPU如何实现数据共享与通信你一身傲骨怎能输操作系统多核通信机制
文章摘要多核CPU中core1和core2通过共享内存和缓存一致性协议实现数据共享，通过读写同一内存区域交换数据，并使用MESI等协议保证缓存一致性。操作系统提供的同步原语（如锁）和核间中断（IPI）辅助协调核心间的通信与同步。这些机制共同确保了多核之间的高效数据共享和通信。多核CPU中，core1和core2之间间接实现数据共享和通信的主要机制有：1.共享内存（SharedMemory）多个核心
游戏可观测性：如何打造稳定高效的后台服务你一身傲骨怎能输游戏开发技术专栏可观测性
游戏服务可观测性能力建设摘要游戏服务的可观测性建设是保障稳定运营和高效排障的关键。现代游戏采用分布式架构，需要通过指标(Metrics)、日志(Logs)、追踪(Traces)三大支柱实现系统监控。核心能力包括：指标监控：系统资源、服务性能、业务数据日志分析：访问日志、业务日志、异常日志链路追踪：跨服务调用追踪和业务流程跟踪告警与可视化：实时告警、仪表盘、根因分析技术方案建议：指标采集：Prome
附上java下载excel完整实现代码
importcom.alibaba.excel.EasyExcel;importcom.alibaba.excel.ExcelWriter;importcom.alibaba.excel.write.metadata.WriteSheet;importcom.alibaba.excel.write.metadata.fill.FillConfig;importcom.qhsm.airportexp
使用oracle序列
创建序列：CREATESEQUENCEXXXXX_SEQUENCE使用序列：selectXXXXX_SEQUENCE.nextvalfromdual
React——基础贵沫末 react.js 前端前端框架
文章目录React基础一、基础概念二、组件化三、状态四、属性五、项目初始化六、jsx七、创建React组件的两种方式函数式组件（推荐）类组件（不推荐）八、常用的hooks1、useState：用来修改状态值2、useReducer：用来修改状态值，比useState更适合处理复杂逻辑3、useContext：传递数据4、useMemo:缓存计算结果5、useCallback：缓存函数6、useEf
【机器学习笔记 Ⅲ】4 特征选择巴伦是只猫机器学习机器学习笔记人工智能
特征选择（FeatureSelection）系统指南特征选择是机器学习中优化模型性能的关键步骤，通过筛选最相关、信息量最大的特征，提高模型精度、降低过拟合风险并加速训练。以下是完整的特征选择方法论：1.特征选择的核心目标提升模型性能：去除噪声和冗余特征，增强泛化能力。降低计算成本：减少训练和预测时间。增强可解释性：简化模型，便于业务理解。2.特征选择方法分类(1)过滤法（FilterMethods
LangChain核心组件全解析北辰alk AI langchain
文章目录一、核心架构组件1.模型I/O(ModelI/O)2.检索(Retrieval)3.记忆(Memory)4.链(Chains)5.代理(Agents)二、关键支持组件1.回调系统(Callbacks)2.文档加载器(DocumentLoaders)3.文本分割器(TextSplitters)4.向量存储(VectorStores)三、高级架构组件1.工具集成(Tools)2.工作流(Wor
uniapp、微信小程序使用sm2加密解密，国密sm2
login.js为登录页面js，request.js为公共请求封装js。详细使用方法及文件请前往资源绑定地址下载倒入即可，其中公私要密钥自己生成
Ubuntu磁盘空间清理 BACKLS ubuntu linux 运维
这个错误消息表示你的Ubuntu系统上没有足够的磁盘空间来启动MySQL。你可以按照以下步骤来解决这个问题：检查磁盘使用情况：使用df-h命令检查你的磁盘使用情况，找出哪些分区已经满了。df-h清理不必要的文件：清理一些不必要的文件和目录来释放空间。常见的目录包括/var/log/，/tmp/，以及用户目录下的大文件。sudoapt-getcleansudoapt-getautoremovesud
尝试安装使用无头cms strapi （未完成） skywalk8163 多媒体 web
strapi官网：https://strapi.io/GitHub地址：https://github.com/strapi/strapi中文手册：欢迎来到StrapiCMS文档！|Strapi中文网FreeBSD下使用strapi（未完成）安装npxcreate-strapi-app@latestmy-project--quickstart为了加快速度，可以加上淘宝的npm加速镜像npmconfi
Claude Code 深夜也要加班？这个神器让 AI 自动续命! terryso AI编程 AI编程
你有没有遇到过这种情况？晚上熬夜用ClaudeCode写代码，正写到关键时刻，突然弹出："Claudeusagelimitreached.恢复时间：凌晨3点"这时候你可能已经困得睁不开眼，但又舍不得放弃手头的工作进度…解决方案来了！今天给大家推荐一个开源神器：ClaudeAutoResume，让你的ClaudeCode可以"自动续命"！它是怎么工作的？智能检测：自动监控Claude使用限制倒计时等
PyTorch 详细安装教程及核心API使用指南慕婉0307 pytorch pytorch 人工智能 python
一、PyTorch简介PyTorch是由FacebookAIResearch(FAIR)于2016年开发的开源深度学习框架，现已成为学术界和工业界最受欢迎的深度学习工具之一。其核心优势在于采用了动态计算图（DynamicComputationGraph，又称"define-by-run"机制），这使得开发者能够像编写普通Python代码一样构建神经网络，并在运行时动态调整计算图结构，大大提高了研究
python爬虫正则表达式使用说明 yuwinter Python python 爬虫正则表达式
Python爬虫和正则表达式是自动化网络数据提取中常用的两种技术。本文将详细介绍如何使用Python编写爬虫，结合正则表达式提取网页中的数据。一、基础知识点1.安装必要库爬虫通常需要使用库来处理HTTP请求和解析网页，常用库有：requests：用于发送HTTP请求，获取网页内容。re：Python自带的正则表达式库，用于模式匹配和提取数据。BeautifulSoup（可选）：如果你需要更高级的网
根据无人机倾斜摄影osgb做的3dmax模型3dtiles制作，导出.b3dm加载到谷歌地图cesiumlab
根据无人机倾斜摄影osgb做的3dmax模型3dtiles制作，导出.b3dm加载到谷歌地图cesiumlab根据无人机倾斜摄影osgb做的3dmax模型3dtiles制作，导出.b3dm加载到谷歌地图cesiumlab
web与Java代码保护：混淆、压缩及反编译工具详解
本文还有配套的精品资源，点击获取简介：为保障代码的安全性和保密性，IT行业中开发者采用代码混淆和压缩技术。本文将深入探讨web代码混淆压缩工具和Java代码反编译工具，解释它们的工作原理及应用。混淆工具如UglifyJS和Terser用于混淆JavaScript代码，使其难以理解；压缩工具如YUICompressor和GoogleClosureCompiler减小JavaScript和CSS文件的
深入理解 JavaScript/TypeScript 中的展开运算符（...） ttod_qzstudio TypeScript JavaScript javascript typescript 开发语言
在JavaScript和TypeScript中，...运算符（称为展开运算符，英文SpreadOperator）是一个非常强大且常用的语法。它可以让代码更简洁、更灵活，适用于数组、对象、函数参数等多种场景。本文将详细介绍它的用法，并通过示例帮助你彻底掌握它。1.什么是展开运算符（...）？展开运算符...允许将一个可迭代对象（如数组、字符串、Set、Map等）“展开”成独立的元素。它的核心作用是解
Python：正则表达式慕婉0307 python基础知识点正则表达式
正则表达式是处理文本数据的强大工具，Python通过re模块提供了完整的正则表达式功能。本文将详细介绍Python正则表达式的使用方法，包括基础语法、高级技巧和re模块API的详细解析。一、正则表达式基础1.1什么是正则表达式正则表达式(RegularExpression)是一种用于匹配字符串中字符组合的模式，可以用于搜索、替换和验证文本数据。1.2Python中的re模块Python通过内置的r
一键将 SQL 转为 Java 实体类，全面支持 MySQL / PostgreSQL / Oracle！ A__tao sql java mysql
一键将SQL表结构转为Java实体类，全面支持MySQL/PostgreSQL/Oracle！还在手动根据SQL表结构去写Java实体类？字段一个个敲、类型一个个改、注释一个个补，既浪费时间又容易出错！现在，一款强大而简洁的开发神器来了：SQL转Java实体类在线工具（支持MySQL、PostgreSQL、Oracle）适用人群Java后端开发工程师数据库表结构设计者ORM模型搭建者（如Hiber
你懂安全优化SSL嘛? 巴依老爷coder 安全安全 ssl 网络协议
一文带你了解SSL全部内容CIA?SSL概述加密算法对比数字签名与证书RSA加密算法代码实操1.更完善的错误处理2.证书验证3.资源管理改进常见的面试问题CIA?在信息安全领域，CIA（保密性、完整性、可用性）是核心原则，各有其实现方法与面临的威胁：保密性：实现方法：运用加密技术，对称加密（如AES）适合大量数据快速加密，非对称加密（如RSA）用于密钥交换与数字签名；借助访问控制手段，像基于角色的
对于报错..\meson.build:1:0: ERROR: Unknown compiler(s): [[‘icl‘], [‘cl‘], [‘cc‘], [‘gcc‘], [‘clang‘]等随风万里无云笔记笔记
解决方案1.安装完整的C/C++编译环境适用于Windows的官方编译器（MSVC）：下载并安装VisualStudio2022安装时勾选“使用C++的桌面开发”工作负载，并确保勾选以下组件：•MSVCv143-VS2022C++生成工具•Windows10/11SDK•C++核心功能完成安装后重启计算机2.验证编译器是否可用打开命令提示符（CMD）或PowerShell。运行以下命令检查cl.e
C#企业级API版本控制实战：构建可扩展的微服务架构墨夶 C#学习资料架构 c#微服务
第一章：企业级API版本控制的生死时速1.1版本控制的三重门//版本控制决策树publicenumVersionControlStrategy{[Description("URI路径版本控制")]UriPath=1,[Description("自定义HTTP头版本控制")]CustomHeader=2,[Description("Accept媒体类型版本控制")]MediaType=3}publi
JIEJIE.NET：.NET代码混淆终极实战指南墨夶 C#学习资料 .net windows
第一章：JIEJIE.NET核心架构解析1.1IL代码分析引擎//IL指令分析器核心逻辑publicclassILAnalyzer{publicvoidAnalyzeMethod(MethodBodymethodBody){//提取控制流图varcontrolFlowGraph=BuildControlFlowGraph(methodBody);//识别敏感结构varsensitiveStruct
ASP.NET Core vs ASP.NET：架构革命与性能飞跃的终极指南——从0到1的8大秘诀！墨夶 C#学习资料 asp.net 架构后端
**ASP.NETCore的架构革命与性能优化实战**第一阶段：架构对比——从“城堡”到“积木”1.1传统ASP.NET的“城堡”式架构//旧版ASP.NETWebForms典型结构publicclassGlobal:HttpApplication{voidApplication_Start(){RouteTable.Routes.Add(newRoute("...",newPageRouteHa
6，Receiving Messages：@KafkaListener Annotation
@KafkaListener注释用于将bean方法指定为侦听器容器的侦听器。bean被包装在一个配置了各种功能的MessagingMessageListenerAdapter中，例如在必要时转换数据以匹配方法参数的转换器。您可以使用#{…}或属性占位符（${…}）使用SpEL配置注释上的大多数属性。有关更多信息，请参阅Javadoc。RecordListeners@KafkaListener注释为
PostgreSQL系列- 6 - PgBouncer连接池 IfNotExists postgresql 数据库
目录PgBouncer连接池...11、为什么要使用连接池...12、软件安装...13、连接池的配置文件...14、PgBouncer启动和管理...71、为什么要使用连接池1.1能够缓存和PostgreSQL的连接，当有连接请求进来的时候，直接分配空闲进程，而不需要PostgreSQLfork出新进程来建立连接，以节省创建新进程，创建连接的资源消耗。1.2能够有效提高连接的利用率，避免过多的无
php pgsql 连接池,PostgreSQL数据库连接池PgBouncer的搭建 weixin_39612499 php pgsql 连接池
最近有些项目我们是采用PostgreSQL进行后端数据库，由于要对客户端的连接使用类型和连接数进行控制，因此我们采用PgBouncer来进行最近有些项目我们是采用PostgreSQL进行后端数据库，由于要对客户端的连接使用类型和连接数进行控制，因此我们采用PgBouncer来进行实施。PgBouncer相关的基本文档pgsqldb中文站已经有不少文档，这里我就不再作过多的说明，我将集中对其中的几个
Postgresql快速同步大量数据方案浅析行星008 数据库 postgresql 数据库
目录推荐方案：并行导出导入+网络加速方案优势：详细步骤1.数据选择与准备2.并行数据导出（111服务器）3.高效网络传输4.并行数据导入（112服务器）5.性能优化参数增量同步方案（可选）方法1：逻辑复制（适合持续同步）方法2：增量更新脚本（适合定时同步）性能优化技巧验证与监控预期性能指标故障处理针对PostgreSQL14.3环境中从111服务器同步部分数据（约1000GB）到112服务器的需求
Postgresql中不同数据类型的长度限制行星008 数据库 postgresql sql 运维
目录一、字符类型（CharacterTypes）二、二进制类型（BinaryTypes）三、数值类型（NumericTypes）四、其他类型五、全局限制：单行数据总大小示例对比表注意事项验证命令在PostgreSQL中，不同数据类型的最大长度限制各异。以下是关键类型的详细说明：一、字符类型（CharacterTypes）VARCHAR(n)/CHAR(n)最大长度：n最大可设置为10485760（
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方