~奔跑的简默~

浅谈Elasticsearch 文档操作

Elasticsearch 文档操作

Elasticsearch 是一个基于 Lucene 的分布式搜索引擎，它提供了全文搜索、结构化搜索、分析等功能。在 Elasticsearch 中，文档操作是一个重要的功能，包括文档的索引、更新、删除以及批量操作。本文将详细介绍 Elasticsearch 中的文档操作。

1. 文档索引

1.1 索引文档基本概念

在 Elasticsearch 中，数据以文档（Document）的形式存储。文档是一个 JSON 对象，包含了一组字段（Field）和对应的值。文档可以被索引到一个索引（Index）中，类似于关系型数据库中的表（Table）。每个文档都有一个唯一的 ID，用于标识和检索文档。

1.2 索引文档

在 Elasticsearch 中，我们可以使用 PUT 或 POST 请求来索引文档。例如，我们有一个名为 users 的索引，我们可以向其中添加一个用户文档：

PUT /users/_doc/1
{
  "name": "Alice",
  "age": 30,
  "email": "[email protected]"
}

在这个例子中，我们使用了 PUT 请求来索引一个用户文档。这里我们指定了文档的 ID 为 1。如果文档 ID 已经存在，那么新的文档将覆盖旧的文档。

我们还可以使用 POST 请求来自动生成文档 ID：

POST /users/_doc
{
  "name": "Bob",
  "age": 25,
  "email": "[email protected]"
}

在这个例子中，我们使用了 POST 请求来索引一个用户文档。这里我们没有指定文档的 ID，Elasticsearch 会自动生成一个唯一的文档 ID。

1.3 索引设置和映射

在索引文档之前，我们通常需要创建索引并定义其设置（Settings）和映射（Mappings）。索引设置包括分片数量、副本数量等参数，用于控制索引的性能和可用性。映射定义了文档中字段的类型、分析器等属性，用于控制字段的索引和搜索行为。

例如，我们可以创建一个名为 users 的索引，并定义其设置和映射：

PUT /users
{
  "settings": {
    "number_of_shards": 1,
    "number_of_replicas": 1
  },
  "mappings": {
    "properties": {
      "name": {
        "type": "text"
      },
      "age": {
        "type": "integer"
      },
      "email": {
        "type": "keyword"
      }
    }
  }
}

在这个例子中，我们创建了一个名为 users 的索引，并定义了其设置和映射。这里我们设置了分片数量为 1，副本数量为 1。同时，我们定义了三个字段：name（文本类型）、age（整数类型）和 email（关键词类型）。

1.4 文档版本控制

在 Elasticsearch 中，每个文档都有一个版本号（Version），用于控制文档的并发更新。当我们索引、更新或删除文档时，文档的版本号会自动递增。我们可以使用版本号来实现乐观锁，确保文档在并发更新时不会发生冲突。

例如，我们可以使用 PUT 请求来索引一个用户文档，并指定其版本号：

PUT /users/_doc/1?version=2&version_type=external
{
  "name": "Alice",
  "age": 31,
  "email": "[email protected]"
}

在这个例子中，我们使用了 version 参数来指定文档的版本号，以及 version_type 参数来指定版本类型。这里我们将版本号设置为 2，版本类型设置为 external。当我们尝试索引文档时，Elasticsearch 会检查文档的当前版本号。如果当前版本号小于指定的版本号，那么操作会成功；否则，操作会失败并返回版本冲突错误。

需要注意的是，版本控制可以帮助我们避免并发更新导致的数据不一致问题，但可能会增加系统的复杂性。在实际应用中，我们需要根据需求和场景来选择是否使用版本控制。

1.5 自动创建索引

在 Elasticsearch 中，如果我们尝试索引一个文档到一个不存在的索引，Elasticsearch 会自动创建该索引。自动创建的索引会使用默认的设置和映射，可能不符合我们的需求。因此，我们通常需要在索引文档之前创建索引并定义其设置和映射。

如果需要，我们可以禁用自动创建索引功能。例如，我们可以将 action.auto_create_index 设置为 false：

PUT /_cluster/settings
{
  "persistent": {
    "action.auto_create_index": "false"
  }
}

在这个例子中，我们使用了 _cluster/settings API 来修改集群设置。这里我们将 action.auto_create_index 设置为 false，表示禁用自动创建索引功能。需要注意的是，禁用自动创建索引功能后，我们必须手动创建索引并定义其设置和映射。

2. 文档更新

2.1 更新文档基本概念

在 Elasticsearch 中，文档更新实际上是一个删除和索引操作的组合。当我们更新一个文档时，Elasticsearch 会将旧的文档标记为已删除，并将新的文档索引到相同的位置。这意味着文档更新操作会消耗一定的资源，因为它涉及到文档的删除和索引。

2.2 更新文档

在 Elasticsearch 中，我们可以使用 POST 请求来更新文档。例如，我们可以更新一个名为 users 的索引中的用户文档：

POST /users/_update/1
{
  "doc": {
    "age": 31
  }
}

在这个例子中，我们使用了 POST 请求来更新用户文档。这里我们指定了文档的 ID 为 1，并提供了一个包含更新字段的 doc 对象。需要注意的是，更新操作是部分更新，只会修改指定的字段，不会影响其他字段。

2.3 使用脚本更新文档

在 Elasticsearch 中，我们可以使用脚本（Script）来更新文档。脚本提供了更灵活的更新方式，可以根据文档的当前状态来计算新的值。例如，我们可以使用脚本来更新用户文档的年龄：

POST /users/_update/1
{
  "script": {
    "source": "ctx._source.age += params.age_increment",
    "params": {
      "age_increment": 1
    }
  }
}

在这个例子中，我们使用了脚本来更新用户文档。这里我们指定了一个简单的脚本 ctx._source.age += params.age_increment，用于将用户的年龄增加一个指定的值。脚本可以提供更灵活的更新方式，但可能会影响性能。

2.4 更新文档并返回结果

在 Elasticsearch 中，我们可以使用 POST 请求的 return_source 参数来更新文档并返回更新后的文档。例如，我们可以更新用户文档的年龄，并返回更新后的文档：

POST /users/_update/1?_source=true
{
  "doc": {
    "age": 32
  }
}

在这个例子中，我们使用了 POST 请求来更新用户文档，并通过 _source 参数设置为 true 来返回更新后的文档。这样，我们可以在更新文档的同时获取更新后的文档内容。

2.5 更新文档并处理冲突

在 Elasticsearch 中，文档更新操作可能会遇到版本冲突。当多个客户端同时更新同一个文档时，可能会导致数据不一致。为了解决这个问题，我们可以使用 retry_on_conflict 参数来指定更新操作的重试次数。

例如，我们可以更新用户文档的年龄，并在遇到冲突时重试更新操作：

POST /users/_update/1?retry_on_conflict=3
{
  "doc": {
    "age": 33
  }
}

在这个例子中，我们使用了 POST 请求来更新用户文档，并通过 retry_on_conflict 参数设置为 3 来指定重试次数。这样，当遇到版本冲突时，Elasticsearch 会自动重试更新操作，直到成功或达到重试次数限制。

3. 文档删除

3.1 删除文档基本概念

在 Elasticsearch 中，文档删除实际上是一个标记操作。当我们删除一个文档时，Elasticsearch 会将文档标记为已删除，但不会立即从磁盘中移除。在后续的合并（Merge）过程中，Elasticsearch 会自动清理已删除的文档，释放磁盘空间。这意味着文档删除操作通常具有较低的性能开销，但可能会导致磁盘空间暂时浪费。

3.2 删除文档

在 Elasticsearch 中，我们可以使用 DELETE 请求来删除文档。例如，我们可以删除一个名为 users 的索引中的用户文档：

DELETE /users/_doc/1

在这个例子中，我们使用了 DELETE 请求来删除用户文档。这里我们指定了文档的 ID 为 1。删除操作是不可逆的，一旦文档被删除，将无法恢复。

3.3 删除查询匹配的文档

在 Elasticsearch 中，我们可以使用 _delete_by_query API 来删除查询匹配的文档。例如，我们可以删除年龄大于 30 的用户文档：

POST /users/_delete_by_query
{
  "query": {
    "range": {
      "age": {
        "gt": 30
      }
    }
  }
}

在这个例子中，我们使用了 _delete_by_query API 来删除查询匹配的文档。这里我们指定了一个范围查询，用于匹配年龄大于 30 的用户文档。需要注意的是，删除查询匹配的文档可能会消耗较多的资源，因为它需要遍历所有匹配的文档。

3.4 删除索引中的所有文档

在 Elasticsearch 中，我们可以使用 _delete_by_query API 来删除索引中的所有文档。例如，我们可以删除 users 索引中的所有用户文档：

POST /users/_delete_by_query
{
  "query": {
    "match_all": {}
  }
}

在这个例子中，我们使用了 _delete_by_query API 来删除索引中的所有文档。这里我们指定了一个 match_all 查询，用于匹配所有用户文档。需要注意的是，删除索引中的所有文档可能会消耗较多的资源，因为它需要遍历所有文档。

3.5 删除整个索引

在 Elasticsearch 中，我们可以使用 DELETE 请求来删除整个索引。例如，我们可以删除名为 users 的索引：

DELETE /users

在这个例子中，我们使用了 DELETE 请求来删除整个索引。这里我们指定了索引的名称为 users。删除操作会移除索引中的所有文档以及索引的设置和映射。需要注意的是，删除整个索引是不可逆的，一旦索引被删除，将无法恢复。

4. 批量操作

4.1 批量操作基本概念

在 Elasticsearch 中，批量操作是指在一个请求中执行多个操作，例如索引、更新和删除文档。批量操作可以减少网络开销，提高性能，特别是在需要处理大量文档时。批量操作使用 _bulk API 来实现，支持多种操作类型，包括 index（索引文档）、update（更新文档）和 delete（删除文档）。

4.2 执行批量操作

在 Elasticsearch 中，我们可以使用 _bulk API 来执行批量操作。批量操作的请求体使用换行符（\n）分隔，每个操作都需要以换行符结尾。每个操作由两行组成：第一行是操作的元数据，包括操作类型、索引名和文档 ID；第二行是操作的具体内容，例如文档数据或更新字段。批量操作可以提高性能，因为它可以在一个请求中执行多个操作。例如，我们可以在一个请求中索引、更新和删除多个用户文档：

POST /_bulk
{ "index": { "_index": "users", "_id": "2" } }
{ "name": "Charlie", "age": 22, "email": "[email protected]" }
{ "index": { "_index": "users", "_id": "3" } }
{ "name": "David", "age": 28, "email": "[email protected]" }
{ "update": { "_index": "users", "_id": "1" } }
{ "doc": { "age": 32 } }
{ "delete": { "_index": "users", "_id": "2" } }

在这个例子中，我们使用了 _bulk API 来执行批量操作。这里我们在一个请求中执行了多个操作，包括索引、更新和删除。每个操作都由两行组成：第一行是操作的元数据，包括操作类型、索引名和文档 ID；第二行是操作的具体内容，例如文档数据或更新字段。

需要注意的是，批量操作的请求体使用换行符（\n）分隔，每个操作都需要以换行符结尾。此外，批量操作的顺序会影响执行结果，因为操作是按照顺序执行的。

4.3 批量操作的错误处理

在执行批量操作时，可能会遇到错误，例如文档 ID 不存在或版本冲突。Elasticsearch 会在响应中返回错误信息，但不会中止整个批量操作。我们需要检查响应中的错误信息，以确定哪些操作失败并采取相应的措施。

例如，我们可以执行一个包含错误的批量操作：

POST /_bulk
{ "index": { "_index": "users", "_id": "4" } }
{ "name": "Eva", "age": "invalid_age", "email": "[email protected]" }
{ "delete": { "_index": "users", "_id": "non_existent_id" } }

在这个例子中，我们执行了一个包含错误的批量操作。第一个操作尝试索引一个包含无效年龄的用户文档；第二个操作尝试删除一个不存在的文档。Elasticsearch 会在响应中返回错误信息，我们可以根据错误信息来判断操作是否成功。

4.4 批量操作的性能优化

在使用批量操作时，我们需要关注性能和资源消耗。以下是一些优化批量操作性能的建议：

合理设置批量大小：批量操作的大小会影响性能和资源消耗。过大的批量可能会导致内存不足或请求超时；过小的批量可能会导致网络开销过大。我们需要根据实际情况来选择合适的批量大小。
并行执行批量操作：为了提高性能，我们可以并行执行多个批量操作。这可以充分利用 Elasticsearch 集群的处理能力，提高吞吐量。需要注意的是，并行执行批量操作可能会增加集群的负载，我们需要根据集群的资源和性能来选择合适的并行度。
使用批量操作的顺序执行：在某些情况下，我们可能需要按照顺序执行批量操作，以确保数据的一致性。这可以通过将批量操作分成多个顺序执行的批次来实现。需要注意的是，顺序执行批量操作可能会降低性能，我们需要在性能和一致性之间进行权衡。
优化索引设置和映射：在执行批量操作时，我们需要关注索引的设置和映射，以确保数据的存储和检索效率。例如，我们可以合理设置分片数量、副本数量和刷新间隔，以提高批量操作的性能。同时，我们可以优化字段的类型、分析器和存储选项，以减少资源消耗。

总结

Elasticsearch 提供了丰富的文档操作功能，包括文档的索引、更新、删除以及批量操作。在实际应用中，我们可以根据需求灵活地使用这些功能来管理文档。需要注意的是，在使用文档操作时，应该关注性能和资源消耗，尽量避免使用过于复杂的操作。同时，文档操作通常需要与查询、聚合、分页、排序和高亮功能结合使用，以便提供更好的搜索体验。

【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
2019-08-08 65454
东莞家庭聚会出行旅游去哪里玩住？想起来有很久没有和家里人聚会啦，这次组织家人来到威廉古堡别墅轰趴，一大家子27个人，在别墅订了一天办，玩的非常的开心，小孩子玩游戏机，也很放心不会丢，我们就在唱歌、打麻将、打桌球一系列的活动，还准备小次等小孩生日在别墅举办，还可以给孩子做一个生日的策划
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
果然只有离职的时候，才有人敢说真话！ return2ok
今天公司出了神贴。今天中午吃饭，同事问我看了论坛上的神贴了吗？什么帖子？我问。同事显得很惊讶，你居然没看，现在那个帖子可能会成为年度最佳帖子。这么厉害？我等不及了，饭没吃完就快速的奔向办公室，打开公司论坛，我要一睹这个帖子的神奇。写这帖子的童鞋胆儿真肥。这哪里是一个帖子，这是很多个帖子，组成了一个系列。某人从公司文化、管理、人事、项目管理等多个方面分析了公司的概况，并抨击了公司的各种弊端，并提出了
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
红手套节马小媛为中国城市环卫者公益发声：今天我手红疏狂君
#红手套节#公益活动，线头公益以及同多方资源的共同努力我们邀请到了线头公益大使马小媛马小媛，1993年5月3日出生于江苏省南京市，中国内地新生代女演员。2015年马小媛参演网剧《余罪》，饰演警校校花安嘉璐的闺蜜。2016年马小媛主演系列电影《丽人保镖》中女一号林欢馨，正式出道。此后，马小媛陆续接演了电视剧《警花与警犬2》，在网剧《你美丽李美丽》中担任女主角李美丽。拂晓，当你还在睡梦中时，这座城跟你
Some jenkins settings SnC_
Jenkins连接到特定gitlabproject的特定branch我采用的方法是在pipeline的script中使用git命令来指定branch。如下：stage('Clonerepository'){steps{gitbranch:'develop',credentialsId:'gitlab-credential-id',url:'http://gitlab.com/repo.git'}}
张芝华49天共修 - 草稿李娟AINI
祈禱、靜心、源代碼編程、觀想發願四根支柱，運用靈性能量的助力，讓夢想和渴望在最大向度中輕鬆實現。共修群指定书籍:1.能断金刚麦克格西2.新世界：灵性的觉醒埃克哈特·托尔3.爱是一切的答案芭芭拉迪安吉莉思4.完美的爱,不完美的关系约翰•威尔伍德5.爱的业力法则麦克格西6.漫画《金刚经》蔡志忠7.蔡志忠典藏国学漫画系列(套装共6册)作业:全部在共修群里完成，并请保存好自己的作业。l一周三次共修觉察作业
ARMv8 Debug __pop_ ARMv8 ARM64 架构 linux 运维
内容来自DEN0024A_v8_architecture_PG.pdf本质ARMv8Debug是什么历史在ARMv4开始被引入,并已发展成一系列广泛的调试(debug1)和跟踪(trace)功能ARMv6和ARMv7-a新增了自托管调试(debug2)和性能评测(trace-enhance)ARMv8处理器提供硬件功能侵入式:调试工具能够对核心活动提供显著级别的控制非侵入式:以非侵入性方式收集有关
Python入门之Lesson2:Python基础语法小熊同学哦 Python入门课程 python 开发语言算法数据结构青少年编程
目录前言一.介绍1.变量和数据类型2.常见运算符3.输入输出4.条件语句5.循环结构二.练习三.总结前言欢迎来到《Python入门》系列博客的第二课。在上一课中，我们了解了Python的安装及运行环境的配置。在这一课中，我们将深入学习Python的基础语法，这是编写Python代码的根基。通过本节内容的学习，你将掌握变量、数据类型、运算符、输入输出、条件语句等Python编程的基础知识。一.介绍1
【ARM Cortex-M 系列 2.3 -- Cortex-M7 Debug event 详细介绍】主公讲 ARM #ARM 系列 arm开发 debug event
请阅读【嵌入式开发学习必备专栏】文章目录Cortex-M7DebugeventDebugeventsCortex-M7Debugevent在ARMCortex-M7架构中，调试事件（DebugEvent）是由于调试原因而触发的事件。一个调试事件会导致以下几种情况之一发生：进入调试状态：如果启用了停滞调试（HaltingDebug），一个调试事件会使处理器在调试状态下停滞。通过将DHCSR.C_DE
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
【Python搞定车载自动化测试】——Python实现车载以太网DoIP刷写（含Python源码）疯狂的机器人 Python搞定车载自动化 python DoIP UDS ISO 14229 1SO 13400 Bootloader tcp/ip
系列文章目录【Python搞定车载自动化测试】系列文章目录汇总文章目录系列文章目录前言一、环境搭建1.软件环境2.硬件环境二、目录结构三、源码展示1.DoIP诊断基础函数方法2.DoIP诊断业务函数方法3.27服务安全解锁4.DoIP自动化刷写四、测试日志1.测试日志五、完整源码链接前言随着智能电动汽车行业的发展，汽车=智能终端+四个轮子，各家车企都推出了各自的OTA升级方案，本章节主要介绍如何使
为什么学生不喜欢上学虾虾说
图片发自App《为什么学生不喜欢上学》作者是丹尼尔·威林厄姆。本书从认知心理学角度，结合大量实证案例，阐释了大脑工作的基本原理，回答了关于学习过程的一系列问题。为什么学生不喜欢上学？——大脑工作的基本原理思考是缓慢的、费力的、不可靠的。思考有三个要素，环境、工作记忆和长期记忆。环境是信息来源；长期记忆是知识、经验的巨型仓库，随时可以调取；工作记忆是中央处理器，是加工信息素材的中央厨房，也是思考过程
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
6.0 践行打卡 D47 星月格格
去努力改变1.运动步行13000+8分钟腿部拉伸2.阅读《墨菲定律》第三章第三节:霍桑效应～适度发泄，才能轻装上阵“霍桑效应”这一概念，源自于1924年一个1933年间以哈佛大学心理专家乔治·埃尔顿·梅奥教授为首进行的一系列工厂工人的谈话实验研究。“霍桑效应”告诉我们，在工作，生活中总会产生数不清的情绪反应，其中很大一部分是负面的负面情绪的积累会影响人的精神和心情，不仅仅会影响个人健康，还会破坏人
python爬取微信小程序数据,python爬取小程序数据 2301_81900439 前端
大家好，小编来为大家解答以下问题，python爬取微信小程序数据，python爬取小程序数据，现在让我们一起来看看吧！Python爬虫系列之微信小程序实战基于Scrapy爬虫框架实现对微信小程序数据的爬取首先，你得需要安装抓包工具，这里推荐使用Charles，至于怎么使用后期有时间我会出一个事例最重要的步骤之一就是分析接口，理清楚每一个接口功能，然后连接起来形成接口串思路,再通过Spider的回调
今天是个好日子 singing阿梅
图片发自App今日小年公历日子是20180208上午赶写一个材料，关于“四风”问题自查自纠报告，待一稿已成送交主任过目，他瞄一眼即大声反对！不顾我这厢受伤的小心脏，立马重写！吓！下午两个视频会议自从单位条件改善，会议多开了不少……贷款到期开始着急上火今日写作任务还欠奉写什么呢原本想继续写《我的2017》系列很多时候所谓意义都是总结和提炼出来的码一堆文字于他人无甚意义于己也待商榷、重估。另一方面，冥
极度休闲的一天淡泊孤峰
国庆国庆，普天同庆。在家躺着看大家游山玩水，长辈走亲戚，我的微信一天没几条消息，标准结局，习惯了。哈利波特系列电影真不错，童年总幻想着像主角哈利一样，像《龙族》少年楚子航浪迹江湖，风云天下。而现在却败给华为ICT大赛题还有永无止境的代码视频，唉，真可笑！
python画图|同时输出二维和三维图西猫雷婶 python 开发语言
前面已经学习了如何输出二维图和三维图，部分文章详见下述链接：python画图|极坐标下的3Dsurface-CSDN博客python画图|垂线标记系列_如何用pyplot画垂直x轴的线-CSDN博客有时候也需要同时输出二位和三维图，因此有必要学习一下。【1】官网教程首先我们打开官网教程，链接如下。https://matplotlib.org/stable/gallery/mplot3d/mixed
靠写文章能赚钱么如何通过写作赚钱写文章怎么赚钱优惠券高省
如何通过写作赚钱？最近这段时间，在网上搜兼职的时候，我发现很多人不在谈做自媒体赚钱，为什么呢？我想是普通人想做，根本不能赚钱！了解过写作的人，应该很多人都能看到网上各种各样的推文，什么“月入三千的我是怎么靠写作月入三万的？”，还有“一个公众号，月入几万，靠的是啥？”等等一系列写作相关的文章。给大家推荐一个适合任何人可做的线上副业项目，属于0投资创业项目，使用智能手机就可以做，兼职专职都可以，这个软
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
安全演练有保障，专项督查促改进——记公道中学校园安全（化学实验）系列活动公中盛传云
近期，公道中学为了全面贯彻落实“预防为主，安全第一，综合治理”的安全工作方针，学校按照安全工作方针的要求，通过多种途径开展了以“预防演练为主，人防物防技防相结合”的主题的安全教育系列活动。11月8日，在学校校务会议上，学校党总支书记李兆兵强调，学校必须采取有力措施，不断增强教师综治安全防范意识，落实学校安全工作责任制，切实保障教师和学生的安全坚决杜绝意外事故的发生，确保校园平安稳定、教育教学工作顺
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http