acbworld123456

ElasticSearch6更新与重大变化

截至 2018-06-10 Elasticsearch6.2.4

Elasticsearch更新

通常滚动更新，具体升级方案需要参考官网。
小版本更新，可以一次对集群中的单节点滚动更新（不支持在非升级期间在集群中使用多个版本，新版本分片的更新不会复制到运行中的老版本节点上）
主要版本更新需要重启整个集群
跨主要版本升级不被支持
需要检查是否用到了deprecated的特性
需要检查各种插件（尤其是非官方的）的版本兼容性
需要备份数据（跨主要版本创建的索引的快照数据无法恢复，并且会阻止Elasticsearch启动），如果没有备份数据，将无法回滚到之前的版本，在升级到下一个主要版本之前，对上一个主要版本创建的索引，需要进行重建索引（或者删除），让其在下个主要版本可用。
在升级生产环境集群之前要先在开发环境下进行测试。
滚动更新的过程
- 关闭分片分配，关闭一个节点，重新分配分片需要大量的IO，当节点很快重新启动时，这些IO是不必要的，可以关闭节点前通过禁用分配时钟避免这个过程。
```
 PUT _cluster/settings
 {
     "persistent":{
         "cluster.routing.allocation.enable": "none"
     }
 }
```
- 停止非必要的索引，并且将数据刷入磁盘在升级过程中，仍然会持续索引，当临时关闭非必要索引，并且进行synced-flush将缓存刷入后，分片的恢复速度会快很多。POST _flush/synced 当执行synced flush时，应该检查响应结果，确认写入是否成功，响应体会列出由于索引期间由于失败而挂起的同步操作，而返回状态码仍然为200。如果失败了，重新提交请求。
- 关闭单节点
- 更新关闭的节点根据原本的安装方式更新（RPM|Debian|.tar.gz），以.tar.gz包解压安装的要注意各种配置的设置（尤其是原本没有设置过数据路径时，要特别注意，ES_PATH_CONF，path.data，path.logs）。解压安装时目录中会包含config,data,logs和plugins目录，推荐将这些目录移动到Elasticsearch目录外，使他们不会在你升级Elasticsearch时被（失误）删除。使用ES_PATH_CONF环境变量和path.data，path.logs设定指定新的位置。用包管理工具安装，会将这些目录放到系统的合适位置。在生产环境，推荐使用包管理工具。
- 更新所有插件使用elasticsearch-plugin 脚步更新所有安装的Elasticsearch插件版本。在更新一个节点时，所有的插件必须被更新。
- 启动更新了的节点启动节点并确认已经加入集群，通过GET _cat/nodes请求确认。
- 重新启用分片分配
```
PUT _cluster/settings
{
  "persistent":{
    "cluster.routing.allocation.enalbe":null
  }
}
```
- 等待节点恢复在开始更新下一个节点之前，等待集群完成分片分配。可以通过GET _cat/health请求检查进度。等待status列从yellow变为green。一旦node为green，所有的主分片和复制分片都已经被分配。滚动更新时，分配到新版本节点上的主分片不会分配复制分片到老版本节点。如果不能分配复制分片到其他节点（集群中仅有一个更新的节点），复制分片会一直保持未分配，status会保持yellow。这种情况下，只要没有初始化或重定位分片，就可以继续（检查init和relo列）。一旦有其他节点被更新，复制分片可以被分配（需要有复制数的其他分片更新），状态会变为green。未sync-flushed的分片可能需要更长时间来恢复。可以通过GET _cat/recovery请求监控独立分片的恢复状态。如果停止索引，一完成恢复就继续索引是安全的。
- 重复当节点完成恢复，集群稳定后，对每个需要更新的节点重复这些步骤（更新整个集群）。在滚动更新期间，集群能够持续正常服务。然而，新的功能或向后的兼容模式操作在集群中所有节点完成更新之前仍不可用。一旦升级完成，所有节点在新的版本下运行，新的功能可被使用。一旦发生这种情况，就不能再回到一个向后兼容的模式。运行在之间主要版本的节点将无法加入完全更新的集群。在少见的情况下，升级过程期间出现网络故障，会将剩余的老节点从集群中隔离出来，这时必须离线升级这些老节点来使他们加入集群。
全集群重启升级
- 全集群重启升级需要关闭关闭集群所有节点，进行更新，然后重启集群。在从之前的主版本升级时需要进行全集群重启更新（上一个主要版本，跨主要版本时不允许直接更新）。
- 关闭分片分配
- 关闭索引并执行 synced flush
- 关闭所有节点
- 更新所有节点
- 更新所有插件
- 启动每一个被更新过的节点，如果有指定一些主要节点，在启用数据节点之前要最先启动他们，等待他们组成一个集群并选举出主节点。可以通过查看日志检查进度。一旦一个最小数量的主节点候选节点之间相互发现，他们将会组成一个集群并选举出一个主节点。在这时，就可以使用GET _cat/health GET _cat/nodes请求检测加入集群的节点。
- 等待所有节点加入集群，集群状态被报告为yellow 所有的主分片被分配（可用），在所有主分片可用之前，不要打开分片（自动）分配。
- 重新打开分片分配，集群将复制分片分配给数据节点，这时，继续进行索引和搜索是安全的，但是如果能够等到所有主要和复制分片成功分配（所有节点状态为green），集群能更快恢复。可以通过_cat/health和_cat/recoveryapi进行检测。
跨主要版本更新
- 本集群升级（跨多个版本时需要进行多次）
  - 在进行更新前对更早版本创建的索引重建索引或者删除。Elasticsearch能够读取前一个主版本创建的索引，更老的索引必须重建索引或删除。
  - 进行全集群重启升级（多数时候）。
- 创建新版本集群，从远程集群直接导入索引
- 对于基于时间的索引，过老版本的索引通常随着时间流逝变得无用，并且在保留周期过去后被删除。除非有一个少见的长保留周期的（用途），否则可以等到所有老版本索引被删除后进行更新。
（本集群）重建索引使用reindex API重建老的索引
- 使用老索引相同的mappings和settings创建新索引
- 为了快速重建索引，可以设置refresh_interval为-1，number_of_replicas为0
- 使用 reindex API 将所有文档从老的索引重新索引到新的索引
- 重新设置refresh_interval和number_of_replicas的值与老的索引中使用的相同
- 等待索引状态变为green
- 进行更新别名请求删除老的索引为新的索引添加老索引名的别名添加所有老索引有的别名到新索引
- X-Pack 5.6 提供迁移辅助与更新工具，能够方便的重建索引并升级到6.x
从远端集群重建索引
- 创建一个新版本的与老集群独立的集群，通过设置reindex.remote.whitelist: oldhost:httpport来开启对老索引的访问
- 对于每一个需要迁移的索引
  - 创建一个合适的mappings和settings的新索引，设置refresh_interval: -1，number_of_replicas: 0来快速重建索引
  - 从远端老索引获取文档重新索引到新索引，使用POST _reindex重建索引，如果设置wait_for_completion: false让重建索引工作后台执行，reindex请求会返回一个 task_id ，可以通过使用 task API ：GET _tasks/TASK_ID检测重建索引工作进度
  - 当重建索引工作完成后，设置refresh_interval和number_of_replicas为希望的值（默认为30s(索引文档可读取时间)和1（复制分片数量））
  - 当所有复制完成，新索引的状态变为green以后，可以删除老索引。

重大变化

聚合
- 移除 terms聚合中include/exclude的 pattern元素，替代为直接作为include/exclude的值
- date_range的from和to参数，现在依照format将总被解析为epoch_millis数值，其他如epoch_seconds的数值输入format，将不再可用。现在通过目标字段的format解析这些参数。如果mappings中的format不兼容数字输入值，一种兼容格式（如epoch_millis,epoch_second）必须在date_range聚合时指定，否则会抛出错误。
- 移除terms聚合中的 global_ordinals_hash 和 global_ordinals_low_cardinality，替代为global_ordinals（将在内部选择是否remap一个全局顺序到密集顺序或直接使用片段顺序）
分析
- 同义词token过滤器 Synonym Token Filter 将对任何分词器标记同义词，并且token filters 在链中在它之前， tokenizer 和 ignore_case 将被移除，在新的索引中使用时将被忽略。
- 限制高亮时分析text的长度，高亮text分析在搜索请求时在内存中实时处理，过大的texts，分析可能占用大量的时间和内存。为了防止这种情况，被分析的最大字符数将在下个主要版本限制为1000000。现在在超过这个数值的分析text时，会输出deprecation警告信息。这个限制可以通过对索引设定 index.highlightt.max_analyzed_offset 根据索引指定。
cat API
- 现在在未限制cat线程池队列大小时，queue_size列会输出-1，保证总是输出一个数值。
客户端
- 从5.6.0版本起，一个新的客户端 the Java High Level REST Client 被发布。这个高级客户端，将使用与 TransportClient 使用的相同的核心Java类，能够用来执行 search, index, delete, update 和 bulk 操作。这个Java高级客户端被设计用来在不久的将来代替 TransportClient
集群
- 集群名称不再允许在path.data中使用（子目录）（现在path.data下应该直接为nodes目录)
Document API
- 移除文档修改操作指定 version_type 为 force 覆盖文档版本检查的操作
- 不再支持在 upsert 请求中添加一个 version
- 在 Index API 及 bulk 的 index 和 create 操作中，移除了created字段（元素），使用operation字段代替。
- 在 Delete API 及 bulk 的 delete 操作中，移除了found字段，应该使用operation字段代替。
Geo
- 移除了 ShapeBuilders 辅助类，现在必须使用 builder的构造函数代替（如 new MultiPointBuilder()）
- 移除了 ShapeBuilder.parse 静态方法使用 ShapeParser.parse 代替
索引（Indices）
- 索引模板使用 index_patterns 代替 template ，可以在一个数组中定义多个glob风格的通配模式，对于单个通配模式，也支持直接使用一个字符串，两种方式都是有效的
- 移除影子复制分片（因为影子分片似乎并没有很大的用处）包括设定 index.shared_filesystem, index.shadow_replicas, node.add_lock_id_to_custom_path
- 当没有匹配的索引时，是否允许Open/Close index API 使用通配表达式的设定 allow_no_indices的默认值从false改为true，与 Delete index API 一致。因此，当Open/Close index API 使用一个没匹配任何打开/关闭的索引的通配表达式时，不会返回一个错误。
- 删除一个文档从一个不存在的索引中删除一个文档被改变为不会创建这个索引。然而，如果这个索引使用了外部版本控制，索引将被创建，而文档将被标记为删除。
- indices aliases api 仅针对索引解析索引表达式 update-aliases， put-alias 和 delete-alias API 不再接受别名作为参数，他将仅接受索引（或使用通配符扩充索引匹配）
- delete index api 仅针对索引解析索引表达式 delete index API 不再接受别名作为参数，仅接受索引名（或通配符匹配索引）
- 移除索引表达式的+ （遗漏+符号与使用具有相同效果，因此移除索引表达式中+的支持）
- 事物日志的存留事物日志现在默认保持12小时，默认最大大小为512mb，并且不再在flush时删除，这是为了在请用一个复制加速时，基于操作的恢复的机会
- NGramTokenFilter与NGramTokenizer的最大值与最小值之间差异的限制为了防止创建太多索引术语，最大最小值差被限制为1，默认限制可以通过设置index.max_ngram_diff改变，如果超过限制会产生警告日志
- ShingleTokenFilter最大最小值差异限制为了防止创建过多tokens，默认限制ShingleTokenFilter最大最小值差值为3，默认限制可以通过堆索引设置 index.max_shingle_diff 属性改变，如果超过这个限制会输出警告日志
Ingest
- Timestamp元数据字段类型从java.lang.String 改变为 java.util.Date
- 字符串格式字段ingest.timestamp字段的格式改变在之前需要使用ingest.new_date_format来让ingest.timestamp元数据字段被格式化为ES可以不需要进一步转换强制使用date类型，限制不再需要这样了，而这个设置被移除，可以简单的通过在管线中设置一个字段到{{ingest.timestamp}}来获得date类型的字段而不会有任何mapping错误
Java API
- setSource方法需要XContentType 之前setSource和其他方法接受字节/字符串对象源表示而不需要指定XContentType，自动侦测内容类型不再使用，当提供字节或一个字符串作为source时，这些方法现在需要指定XContentType作为额外的参数XContentType
- DeleteByQueryRequest 需要一个明确设置的query 之前的Elasticsearch版本中，使用一个没有明确指定query的delete by query请求会被接受，将会使用 match_all 作为默认query，会导致所有的文档被删除，限制必须明确设定query
- 移除了InternalStats 和 Stats 的getCountAsString方法如果有需要，改为使用String.valueOf(getCount())风格
- 使用ActionRequestBuilder#execute 返回ActionFuture 而不是 ListenableActionFuter 当通过requeste builder 发送一个请求时，他曾经可能针对ListenableActionFuture调用addListener。替代为返回ActionFuture，与Client方法返回一致，因此关联listeners与future不可行。在
  execute方法接受一个listener参数来替代
- Terms.Order 和 Histogram.Order 类使用 BucketOrder代替 terms, histogram 和 date_histogram 聚合代码被重构为使用公共排序桶代码。必须使用BucketOrder代替Terms.Order和Histogram.Order，直接使用内部排序实例，必须使用BucketOrder类的静态方法代替。
- 将getTookInMillis()从BulkResponse,SearchResponse和TermVectorsResponse中移除使用getTook方法风格代替（getTook().getMillis()）
- 使用DocumentField代替GetField和SearchHitField GetField和SearchHitField有相同的成员，同一使用DocumentField
- 一些聚合类移动到其他包 range聚合（geo_distance,date和ip）移动到org.elasticsearch.search.aggregations.bucket.range包，org.elasticsearch.search.aggregations.bucket.terms.support包中的类移动到org.elasticsearch.search.aggregations.bucket.terms，filter聚合类移动到org.elasticsearch.search.aggregations.bucket.filter
- PercentileRanksAggregationBuilder的构造器改变现在需要在builder的构造器中明确的non-null，non-empty浮点数数组，而不是通过builder的setter，相应的移除了setter方法values()
mapping
- 强制bool字段在之前，Elasticsearch会解析字符串 true, false, on, off, yes, no, 0, 1 为布尔值，现在仅解析字符串 true 和 false 为布尔值，其他的则会跑出异常。为了向后兼容，6.x版本提前强制使用规则，而之前主要版本建立的索引仍能工作。这意味着你不需要立刻修改影响到的已存在的mappings，然而，通过一个已存在的违背严格boolean强制规则的索引模板建立索引是不可行的
- _all元字段默认改为不启用在新的mappings中，包含了所有字段文本复制的_all元字段默认不启用，在之前使用_all字段进行搜索的query_string和simple_query_string现在将检查是否启用_all字段，并在_all字段禁用时执行跨越所有字段的query。_all字段在Elasticsearch6.0之后创建的索引中将不再可以配置
- include_in_all mapping参数不再可用由于新创建的mappings中禁用_all字段，include_in_all设置在这些索引中将不再可用
- 未识别的 match_mapping_type 选项不会silently ignored 先前的Elasticsearch会silently忽略包含不识别的match_mapping_type类型的动态模板，现在将会跑出一个未识别类型的异常
- 日期字段的locale验证先前date字段的locale选项允许几乎所有的字符串，未识别的值将会简单的被忽略，6.0之后在索引创建时未识别的值将被拒绝
packaging
- 不再运行package配置custom用户与组之前可以通过指定$ES_USER 和 $ES_CROUP 变量指定运行Elasticsearch的用户与群组，现在使用DEB和RPM包仅允许使用 elasticsearch 用户群组。如果要使用custom的用户或群组，要使用tarball方式安装Elasticsearch
- path.conf不再是一个可配置的设置之前使用设定path.conf 作为设定，你能通过在启动Elasticsearch时通过指定path.conf，Elasticsearch应该使用另一个配置文件，这相当复杂。应该使用 ES_PATH_CONF 环境变量配置用户设定目录来替代
- 移除了默认path设定在之前的版本中，允许使用default.path.data和default.path.logs来设置没有被设定文件中的其他设定覆盖时的默认数据路径和默认日志路径。这些设定被移除了，现在数据路径和日志路径仅能通过设定配置，相应的，通过packagin scripts设定default.path.data和default.path.logs的环境变量DATA_DIR和LOG_DIR将不再生效。另外，这意味着如果你使用分发包（如通过RPM或DEB分发包安装安装），在之前没有明确指定path.data或path.logs，在迁移配置文件时，必须增加path.data和path.logs的设定。使用之前的默认值，需要添加两行设定path.data: /var/lib/elasticsearch和path.logs: /var/log/elasticsearch到elasticsearch.yml文件中。如果已经指定了，需要保留他们。如果不这么做，Elasticsearch将无法启动
- 不再维护32位 Elasticsearch之前尝试确保Elasticsearch可以在32位JVM上启动（虽然引导检测会阻止在生产环境中使用一个32位JVM），将不再尝试维护他
- 在Windows service上不再过滤 -server标记与之前32位不再支持的改变相关，默认的jvm.option文件不再包含-server标记。先前，由于与服务不兼容，在Windows service将过滤 -server 标记。由于jvm.options文件不再包含 -server ，这个标记的过滤将在 Windows service 安装时移除，这意味着如果你的jvm.options文件包含这个标记，你需要移除他
- 不再支持ES_JVM_OPTIONS 允许jvm.options文件自定义位置的环境变量 ES_JVM_OPTIONS 被移除，促使使用环境变量 ES_PATH_CONF。这个环境变量已经在packaging中用来支持配置文件的定位，所以这个改变只是让jvm.options文件与其他配置文件放在一起
- 不再支持ES_INCLUDE 环境变量 ES_INCLUDE 之前能够用来建立用来启动Elasticsearch的环境（和各种支持脚本）。当有几个环境变量用来配置JVM选项时，这个遗留特性是有用的，这个功能被 Setting JVM options 代替了，因此，移除了 ES_INCLUDE
Percolator
- 弃用了percolator，删除了mpercolate apis 应该通过search 或者 msearch apis 来代替 percolate query
- 弃用了percolator.map_unmapped_fields_as_string设定应该使用percolator.map_unmapped_fields_as_text设定来代替
Plugins https://www.elastic.co/guide/en/elasticsearch/reference/current/breaking_60_plugins_changes.html
- Mapper attachments 插件 mapper attachments plugin 在Elasticsearch5中启用，并在6中移除，可以使用 ingest attachment plugin 代替
- 忽略隐藏文件夹先前的Elasticsearch版本在扫描插件时会跳过隐藏文件和文件夹，现在被移除了
- ICU Analysis plugin icu4j库更新到了59.1，为了让前面主要版本创建的索引返回正确（并正确排序）的结果，需要重建索引，并利用新的字符
- 插件不应该从Settings构建Environment实例以前，允许从Settings构建一个Environment实例来发现特定插件的配置文件，在所有Settings对象没有包含正确设定的配置路径的必要信息时将不适用。相反，需要知道配置路径的插件应该有一个接受Settings和Path实例的构造函数，通过使用Environment上适当的构造函数构造一个Environment
- 亚马逊、微软、谷歌云计算相关插件
  - S3 Repository plugin(亚马逊AWS 对象存储S3) https://www.elastic.co/guide/en/elasticsearch/plugins/6.2/repository-s3.html
  - Azure Repository plugin(微软Azure) https://www.elastic.co/guide/en/elasticsearch/plugins/6.2/repository-azure.html
  - GCS Repository plugin(google云存储) https://www.elastic.co/guide/en/elasticsearch/plugins/6.2/repository-gcs.html
  - EC2 Discovery plugin(亚马逊云服务器EC2) https://www.elastic.co/guide/en/elasticsearch/plugins/6.2/discovery-ec2.html
Reindex
- size参数 size参数不能再指定为-1。如果需要所有的文档，那么不应该设置size参数
REST
- Unquoted JSON 在以前的版本，JSON文档允许包含一些未用引号的字段名，并不是一个严格的JSON，并且会导致一些ELasticsearch客户端断开，所以这个特性被移除了
- 在JSON，CBOR，Yaml和Smile中重复的键在之前的Elasticsearch版本中，文档允许包含重复的键，Elasticsearch6.0强制所有的键唯一，应用于所有的内容类型：JSON、CBOR、Yaml和Smile
- Content-Type Auto-detection 在Elasticsearch以前的版本中，不强制要求请求中适当的内容类型（Content-Type），在Elasticsearch6.0强制所有带有请求体的请求必须包含一个支持的内容类型，这种类型将用来解析数据。当在source查询字符串参数时，同样要指定source_content_type参数指定源媒体类型
- Boolean API parameters 所有的REST APIs 的参数（包括请求参数和JSON body）对boolean只提供false和true作为值，所有其他的值将导致一个错误
- Analyze API 使用请求参数和请求体中纯文本（text/plain）的请求方式被移除了，使用JSON文本参数
- Analyze API中自定义归一化（标准化 normalizer）支持 Analyze API 能够分析normalizer和自定义normalizer，在以前的版本，Analyze API 需要一个tokenizer或者analyzer参数，在Elasticsearch6.0，如果设定了char_filter/filter并且没有设定tokenizer/analyzer，Analyze API 能够分析文本为自定义标准化关键字字段
- 索引请求的timestamp和ttl 在index/update请求中，timestamp和ttl参数将不再接受
- 在Refresh请求中有一个或更多分片失败时将返回Http500响应取代200状态码 Refresh请求广播到多个分片，期间至少有一个分片失败时将会用响应500来代替响应200
- Delete by Query API 需要一个明确的query 在之前，一个没有明确的query的通过query删除请求会被接受，会导致使用match_all删除所有文档，在Elasticsearch6.0起，delete by query 请求需要一个明确的query
- DELETE document 调用现在隐式创建type 运行 DELETE index/type/id 当type不存在时，现在会通过default mapping隐式创建type
- Indices information APIs 以前能通过执行 GET /_aliases,_mappings 或 GET /myindex/_settings,_alias 使用逗号分割多种请求类型获取一个或多个索引的多种类型信息，逗号分割获取多种信息片段的用法已经被移除了。使用 GET /_all 获取所有索引 aliases,settings,mappings 信息。使用 GET /myindex/_mapping|_alias|_settings 获取一个索引对应信息
- 使用不适当的HTTP方法请求一个存在的端点现在返回405响应使用不适当的HTTP请求方法（如一个POST请求到/myindex/_settings）将返回一个HTTP405响应来代替404。一个Allow头将被添加到405响应中，包含允许的方法（动作）
- 禁止_cache和_cache_key的使用现在请求中的_cache和_cache_key选项被完全移除了，使用他们将抛出一个错误
- IndexClosedException返回400状态码当设定ignore_unavilable为false时，对一个关闭的索引调用所有在关闭的索引上不支持的api，将返回一个IndexClosedException，响应状态码将从403改变为400
Scripting
- 移除Groovy,JavaScript和Python语言移除Groovy，JavaScript和Python脚本语言，使用painless代替
- Native scripts removed 移除了本地脚本，通过implement a ScriptEngine代替
- Date字段现在返回dates doc.some_dete_field.value现在返回ReadableDateTime来取代epoch以来毫秒数的long值。doc.some_date_field[some_number]也是一样。如果有需要，使用doc.some_date_field.value.millis来获取epoch以来的毫秒数
- 移除内部访问索引的_index变量 _index变量现在被移除了，如果你需要用他来进行高级排序，考虑写一个Similarity插件
- Script Settings 移除了所有现有的脚本安全设定，使用script.allowed_types和allowed_contexts代替
- 当使用stored script作为请求的一部分时，不能再指定lang 不能再指定lang变量为使用了stored script的请求的一部分，否则会出现一个错误。注意一个使用了stored script的请求与puts一个stored script的请求是不同的。脚本的语言已经作为集群状态的一部分储存，执行stored script使用id已经可以获取所有必要的信息
- 在putting|getting|deleting一个stored script时不能再使用lang 在使用_scripts/路径执行PUT|GET|DELETE动作的stored script时，不能再指定lang参数为url的一部分。所有的stored scripts必须有一个唯一的id作为命名空间，现在仅有id而不再有lang和id
- 移除了Stored search template apis 移除了PUT|GET|DELETE 的_search/templateapis，使用带store search templates的stored script api来代替
Search and Query DSL
- changes to queries
  - 移除了span_near query的collect_payloads 参数，payloads将在需要时加载
  - 现在严格解析boolean字段的值，即仅字符串"true"和"false"能被解析为他们对应的bool值，其他字符串将抛出一个异常
  - 移除了in query（与terms query类似）
  - 移除了geo_bbox query（与geo_bounding_box query类似）
  - 移除了mlt query（与more_like_this query类似）
  - 移除了more_like_this query的like_text|ids|docs参数（都与like类似），min_word_len（与min_word_length类似）,max_word_len（与max_word_length类似）
  - 移除了fuzzy_match和match_fuzzy query（与match query类似）
  - terms query现在总是返回1，并且不再是indices.query.bool.max_clause_count的主体
  - 移除了indices query
  - 从query DSL中移除了堆空查询对象({ })的支持，当使用一个空查询对象时将会抛出一个异常
  - bool query的minimum_number_should_match被移除，应该使用minimum_should_match代替
  - 现在query_string query在使用max_determinized_states将允许正确解析最大状态数量
  - query_string query不再接受enable_position_increment，使用enable_position_increments代替
  - 对与geo_distance查询、排序和聚合，在distance_type参数中移除了sloppy_arc选项
  - 移除了geo_distance_range query
  - 在geo_distance query中移除了optimize_bbox参数
  - 从geo_bounding_box|geo_polygon|geo_distance query中移除了ignore_malformed|coerce参数
  - 从bool|common_terms queries中移除了disable_coord参数，如果提供了，将被无视并输出弃用警告
  - 移除了template query
  - 废弃了percolate query的document_type，不能再指定document_type参数
  - query_string query的split_on_whitespace参数，如果提供了，会输出废弃警告。query_string query现在仅使用操作符分割
  - 移除了query_string query中的use_dis_max参数，必须使用tie_breaker参数代替
  - 移除了query_string query的auth_generate_phrase_queries参数，使用明确引用的query
  - 移除了query_string和simple_query_string的all_fields参数，使用设置default_field为`代替，如果提供了，default_field会自动设置为
  - terms过滤器中的index参数现在是强制的（用来在专门的索引中查找terms），在之前，index默认为执行query的index，现在index必须在请求中明确设定
  - 在match query中的type和slop参数被移除了，使用match_phrase或match_phrase_prefix来代替设置type。从match移除了slop但是在match_phrase和match_phrase_prefix支持了
  - 移除了match_phrase query的phrase_slop参数（与slop参数相似）
  - 移除了constant_score query中的query参数（与filter参数相似）
  - 从multi_match query中移除了phrase_slop参数（与slope参数相似）
  - 从prefix query中移除了prefix参数（与value参数相似）
  - 从range query中移除了le（与lte相似）和ge（与gte相似）
  - 移除了ids query中与type相似的types和_type参数
  - 移除了与constant_score相似的constant_score_auto和constant_score_filter
- Search shards API search shards API不再接受type url参数
- Profile API time字段显示人类可读的时间输出被显示使用纳秒数的time_in_nanos字段代替，可以通过在请求url中加上?human=true打开time字段，将会显示取整的人类可读的时间值
- Scoring changes
  - Query normalization 移除了query normalization。这意味着TF-IDF相似不再尝试产生通过across queries生成比较分，boosts现在现在作为简单的乘法因子集成到分数中。其他相似性不会被影响，因为他们没有进行分值归一化并且已经将boosts作为乘法因子集成到分数中了,通过LUCENE-7347查看更多信息 https://issues.apache.org/jira/browse/LUCENE-7347
  - Coordination factors 从评分公式中移除了coordination factors。这意味着boolean queries不再基于匹配的条件数量评分，相反，他们总是返回子句的总分。因此，现在不鼓励使用TF-IDF相似度作为产生相似性分值质量的重要组件。推荐使用BM25来代替。通过LUCENE-7347查看更多信息 https://issues.apache.org/jira/browse/LUCENE-7347
- _uid字段数据废弃了_uid字段数据，可以改为使用_id代替，而他（_id）仍没有被启用的原因是因为在random_score function中被使用（没有设定一个seed字段时，默认会用_id，但会消耗大量内存，不设定seed字段的用法弃用）。如果你真的需要获取文档id来排序、聚合或搜索，推荐冗余id作为文档的一个字段
- 高亮 unified高亮时新的默认高亮选择。这个补偿策略对每个字段高亮依赖于字段类型（index_options）内部精选。强制指定fvh或plain类型的高亮仍是可用的。postings高亮从Lucene和Elasticsearch中移除了。当index_options选项设置为offsets时，unified高亮输出同样的highlighting
- fielddata_fields 移除了fielddata_fields，应该用docvalue_fields代替
- docvalue_fields docvalue_fields现在默认最多请求100字段，可以通过使用index.max_docvalue_fields_search索引设定覆盖
- script_fields script_fields现在默认请求最大限制32个script fields，可以通过使用索引设定index.max_script_fields设定
- Inner hits 内部hits命中的source保持相对于整个source的相对路径，在最早的版本，source字段会关联到内部hit
- Scroll 在开始一个scroll时，不再接受一个from参数，这个参数在这种情况已经被无视了，现在增加一个错误抛出
- top hits、inner hits的from/size限制通过top hits，inner hits允许取回的最大值（from+size）被限制为100，这个限制可以通过index.max_inner_result_window索引设置控制
- 废弃Scroll queries中的request_cache的使用设置request_cache:true到一个查询中会创建一个scroll（'scroll=1m'）现在废弃了，这个请求将不会使用内部缓存在未来版本将会用400代替仅提示忽略。Scroll queries的缓存没有意义
- 限制Terms Query请求中可以使用的terms数量执行一个有大量terms的Terms Query可能降低集群的性能，每个附加的term需要额外的处理和内存。为了保护这种情况，一个Terms Query中能用的最大数量限制为65536。可以通过在指定索引中改变索引设定index.max_terms_count来改变默认最大值
Settings changes
- 移除了elasticsearch.json和elasticsearch.yaml配置文件支持之前会寻找Elasticsearch配置目录下.yml|.yaml|.json拓展名的文件，现在仅支持elasticsearch.yml
- 配置文件中重复keys 以前允许配置文件中包含重复的keys，在Elasticsearch6.0，不再允许，必须指定一个single key，如
```
node:
 name: my-node
 attr:
rack: my-rack
```
- 强制boolean设定 Elasticsearch6.0仅解析true和false为boolean，其他的会抛出异常，为了向后兼容，在Elasticsearch6.0之前建立的索引仍能工作。注意这不会应用到存储在elasticsearch.yml中的节点级别设定
- Snapshot settings 内部设定cluster.routing.allocation.snapshot.relocation_enabled允许分片运行重新分配到其他节点被移除的snapshots。启用此设定，在分片分配到其他节点，然后在快照运行时重新分配到此节点可能会引发问题
- Store throttling settings Store throttling 被移除了，因此集群设定indices.store.throttle.type和indices.store.throttle.max_bytes_per_sec及索引设定index.store.throttle.type和index.store.throttle.max_bytes_per_sec将不再解析
- Store settings 默认的index.store.type被移除了，如果你在使用他，单纯的将他从你的索引设定中移除，Elasticsearch会使用对于你操作系统最好的store实现
- Network settings 阻塞的TCP客户端，阻塞的TCP服务端以及阻塞的HTTP服务端被移除，因此，network.tcp.blocking_client，network.tcp.blocking，transport.tcp.blocking_client，transport.tcp.blocking_server和http.tcp.blocking_server设定将不再解析，之前未使用的设定transport.netty.max_cumulation_buffer_capacity，transport.netty.max_composite_buffer_components和http.netty.max_cumulation_buffer_capacity被移除了
- Similarity settings base相似现在作为调整被忽略，query normalization现在被移除，如果提供了，会忽略设定并给出一个废弃警告
- Script Settings 所有现有的脚本安全性设定被移除了，使用script.allowed_types和script.allowed_contexts来代替
- Discovery Settings discovery.type不再支持gce|aws|ec2值，这些平台的集成应该通过设置discovery.zen.hosts_provider为他们的值
- Stats and info changes
  - 移除了store stats中的throttle_time 由于存储阈值被移除了，store stats将不再报告throttle_time
  - FS stats将不再报告磁盘是否旋转从2.x开始，Elasticsearch默认会判断是否在SSDs上运行，如上，Elasticsearch不再需要从文件系统收集是否每个数据路径的基本磁盘是否旋转。他在ES2.x开始不再需要，用来维护节点状态API中文件系统分区。这个信息现在移除了
6.1
- 引导检测应用到本地连接地址之前，当Elasticsearch bind到localhost时，会bind到回路设备的所有地址，包括 link-local addresses 如macOS上的 fe80::1%lo0。从6.1.2开始，Elasticsearch将仅bind到回路设备的回路地址。所以现在，当Elasticsearch没有bind到localhost时，引导检测会应用于link-local addresses
6.2
- 所有权限的引导检测 Elasticsearch安装了一个安全管理器，来减少漏洞的范围，对JDK、第三方依赖、Elasticsearch本身提供像不被信任的插件一样的沙盒环境。自定义的安全策略和单个权限可以添加到策略java.security.AllPermission。但是，这实际上相当于禁用了安全管理器。因此，在生产模式下现在通过all permission bootstrap check 禁止授权
- 私有临时目录在Linux，之前的版本进程使用默认临时目录/tmp，然而/tmp时公开的，所以Elasticsearch选择改变packaging使用一个私有临时目录。如果是从之前的版本升级的，并且保持了之前存在的jvm.options，应该添加一行-Djava.io.tmpdir=${ES_TMPDIR}指定临时目录，在所有的操作系统上这样操作都是安全的
- GC日志从Elasticsearch6.2.0开始，JVM GC日志是开箱即用的。这种轻量级的设备可以了解GC问题。这些设定在jvm.options中，（默认64M轮替，最多32个，约2G）保存到默认日志目录。如果从之前的版本更新，并且保留原有的jvm.options，应该添加GC日志设定来获取有价值的调试信息。如果是使用packaging distributions，使用默认的日志位置为/var/log/elasticsearch，从tarball安装默认使用logs/gc.log，否则，在日志文件中设定绝对路径
- Rollover alias 在Elasticsearch6.2.0或之后，如果在匹配索引模板时找到同样的别名，rollover请求将被中止。这个变化是为了在rollover期间保护指向多索引的别名。如果你的索引模板已经包含了同样的别名，你应该通过更新索引模板移除他

转载于:https://www.cnblogs.com/wanghaoxiang/p/9163588.html

你可能感兴趣的:(ElasticSearch6更新与重大变化)

税务门户网站系统：数据分析与税务政策传播 liuxin33445566 安全 java 开发语言数据库前端
2.1SSM框架介绍本课题程序开发使用到的框架技术，英文名称缩写是SSM，在JavaWeb开发中使用的流行框架有SSH、SSM、SpringMVC等，作为一个课题程序采用SSH框架也可以，SSM框架也可以，SpringMVC也可以。SSH框架是属于重量级别的框架，配置繁琐，不够灵活，修改程序需要修改好多个文件，并且运行起来也占用内存较高，CPU使用率相对也高，SpringMVC是Spring开发的
大数据手写面试题Scala语言实现大全（持续更新）大模型大数据攻城狮大数据数据结构算法面试题面试宝典
在大数据领域，Scala语言因其强大的函数式编程特性和对并发处理的良好支持而成为了开发者们的热门选择。有些面试官，为了考验面试者的基本功，需要让手写一些面试题，以数据结构和算法类的居多。本文将为您提供一些常见的Scala手写面试题及参考答案，帮助您在面试或工作中更好地运用Scala。目录1.冒泡排序2.二分查找3.快速排序4.归并排序5.手写Spark-WordCount6.手写Spark程序求平
手机崩溃日志的查找与分析鹅肝手握高V五色 ios 网络
摘要本文介绍了一款名为克魔助手的iOS应用日志查看工具，该工具可以方便地查看iPhone设备上应用和系统运行时的实时日志和崩溃日志。同时还提供了崩溃日志的分析查看模块，可以对苹果崩溃日志进行符号化、格式化和分析，极大地简化了开发者的调试工作。引言在iOS应用开发过程中，调试日志和崩溃日志是开发者必不可少的工具。然而，使用XcodeConsole等工具查看日志可能不够方便，而且处理崩溃日志也相当繁琐
Python百度搜索引擎API使用手册宫和举Esmeralda
Python百度搜索引擎API使用手册python-baidusearch自己手写的百度搜索接口的封装，pip安装，支持命令行执行。BaiduSearchunofficialAPIforPythonwithnoexternaldependencies项目地址:https://gitcode.com/gh_mirrors/py/python-baidusearch概览本文档将详细介绍如何安装与使用p
WPF 实现动态属性绑定与动态绑定详解 code_shenbing WPF wpf
在WPF开发中，动态属性绑定与动态绑定是十分强大的功能，它们为构建灵活、可交互的应用程序提供了有力支持。本文将深入探讨这两种技术，帮助开发者更好地理解和运用它们，提升WPF应用开发的效率与质量。一、动态属性绑定基础概念（一）什么是动态属性绑定动态属性绑定是指在运行时，根据程序的逻辑动态地改变绑定的属性路径或绑定源。与静态属性绑定不同，它不是在XAML编译阶段就确定好绑定关系，而是在程序运行过程中动
机器人学习的范式转变：从专用走向通用基础模型 XianxinMao 机器人
标题：机器人学习的范式转变：从专用走向通用基础模型文章信息摘要：机器人学习正经历从特定任务向通用基础模型的范式转变，这一演进路径与大语言模型相似。通过多机器人协作和跨任务泛化能力的成功，基础模型方向展现出实现通用人工智能的潜力。然而，这一转变面临两大关键挑战：机器人硬件的高昂成本限制了大规模部署和数据采集，以及获取足够规模和多样性的训练数据存在实际困难。突破这些瓶颈需要在制造工艺创新、数据共享生态
Web3 与数据隐私：如何让用户掌控个人信息 Roun3 web3 web3 去中心化区块链隐私保护
随着数字化时代的快速发展，互联网已经渗透到我们生活的方方面面，个人数据的收集与使用也变得越来越普遍。与此同时，数据隐私问题逐渐成为全球关注的焦点。传统的互联网平台通常将用户的数据存储在中心化的服务器上，这意味着平台拥有对用户数据的完全控制权。然而，Web3的出现为我们提供了一个新的可能性，让用户能够重新掌控自己的个人信息，恢复数据隐私的主权。1.什么是Web3？Web3，也被称为去中心化的互联网，
豆瓣API-我在IDE上标记想看的电影(低配版API文档) dreadp 前端 python beautifulsoup selenium html web 数据分析
引言我只是想在IDE上标记想看的电影,所以写了这个脚本…以下是脚本调用的API接口使用指南.脚本运行方式以及使用方法在使用MovieWishlister.py脚本之前,保证运行过一次TagAssassin.py中的get_all_tags(douban_user_url)函数来更新写入的文件中的标签,保证此时是最新的,以便可看JSON文件的标签来核对自己曾自定义的标签名.因为标签过多可能无法一次性
LimeSuite库函数说明 Christal_pyy c++
LMS_SetSampleRate(lms_device_t*device,float_typerate,size_toversample)device:设备句柄（lms_device_t*），在之前通过调用LMS_Open()获得。rate:采样率，以Hz为单位，设置为设备与主机之间数据交换的采样率。oversample:RF硬件的过采样比率。有效的过采样值有：1,2,4,8,16,320表示使
【网络安全】零基础小白如何入门CTF 程序员橘子 web安全安全网络渗透测试网络安全
新手小白应该怎么入门CTF？要如何学习CTF？分几阶段学习？想打CTF，但是没有思路怎么办？这是我花了两天，整理的CTF学习的思路与方法，方便大家学习时可以参考。如果觉得有帮助的小伙伴，记得点赞收藏关注！一、CTF简介01」简介中文一般译作夺旗赛（对大部分新手也可以叫签到赛），在网络安全领域中指的是网络安全技术人员之间进行技术竞技的一种比赛形式。CTF起源于1996年DEFCON全球黑客大会，以代
RocketMQ介绍与应用场景我心向阳iu #RocketMQ Java面试知识点精讲 java-rocketmq rocketmq java
文章目录1.RocketMQ介绍1.1RocketMQ介绍1.2MQ的主要应用场景1.3MQ的应用场景举例1、限流削峰1、任务异步处理。3、应用程序解耦合4、日志收集：1.4消息队列技术选型对比1.3.1主流消息队列优缺点比较1.RocketMQ介绍1.1RocketMQ介绍RocketMQ是阿里开源的一款非常优秀中间件产品，脱胎于阿里的另一款队列技术MetaQ，后捐赠给Apache基金会作为一款
flutter 解决 Running Gradle task ”assembleDebug“ 赖某 Flutter flutter android studio
前提时间：2020-08-0100:00:00AndroidStudio配置好模拟器运行的时候在RunningGradletask”assembleDebug“始终不会变化flutterdoctor的环境基本没有问题照着官网，去配置flutter，环境变量等，然后执行命令flutterdoctor#它会检查插件SDK等环境，尽量保证无打叉这时候在AndroidStudio的考虑下，因为照着flut
视频的上传，转码与展示的过程小子武 java 视频上传视频转码
本文是记录自己学习过程的，不适合直接拿来用的业务需求及场景后台基于springboot的微服务框架，页面是vue用户可以选择一个视频上传的管理页面，新增时，用户可以选择上传封面图片或者不选择上传封面图片（此时要根据视频的格式决定是从视频中截图或者展示默认图片）页面效果先不展示了，涉及的信息比较多这里贴的是视频转码功能部分，我从网上找的代码又根据自己的需要又改的，很佩服写这段代码的人真的很厉害（侵删
AI写代码工具Claude：惊悚小说创作的意外热潮与全球用户偏好差异前端
近年来，人工智能在各个领域的应用日新月异，其中AI代码生成器的兴起更是为开发者带来了前所未有的效率提升。Anthropic最近发布的一份Claude使用报告，基于百万级用户数据，揭示了这款强大的AI模型的广泛应用，以及不同语言用户对其偏好差异的惊人发现。报告的核心发现之一，便是中文用户对使用Claude创作惊悚小说的强烈偏好，这一现象引发了广泛关注。这篇文章将深入探讨这一现象背后的原因，并对比分析
首个“非遗版春节”怎么过？扫描全能王发起新春扫描活动人工智能算法
“爆竹声中一岁除，春风送暖入屠苏”。春节凝结了华夏民族数千年来的家国情感和历史底蕴，近期，“春节——中国人庆祝传统新年的社会实践”也被联合国教科文组织列入人类非物质文化遗产代表作名录。面对首个世界“非遗版”春节，合合信息旗下扫描全能王发起了“扫描全能王春节还能这样用”新春扫描活动，用户可“花式”扫描与新春相关的“记忆符号”，助力“非遗”元素传承。春节是中华民间艺术的集中体现，围绕着辞旧迎新、团圆和
【C语言的数组指针，指针数组及数组与指针的区别】 afool�‍♂️ c语言开发语言
C语言的数组指针，指针数组及数组与指针的区别目录C语言的数组指针，指针数组及数组与指针的区别一、数组和指针的区别二、数组指针三、指针数组四、题总结一、数组和指针的区别老师常念叨数组名是首元素的地址，charp[3]=“abc”;数组名p是数组p的首元素a的地址，若想取到后面的值便增加偏移量就好可以得到，指针好像也是保存的地址，然后通过该增加偏移量获取后面的值。看似好像两个真像是一对“兄弟”。但是仔
鸿蒙UI主线程任务调度原理介绍及最佳实践 harmonyos
课程简介本课程是【HarmonyOSTechTalk】的第18课。本次交流重点围绕鸿蒙UI展开。其中，主线程在整个应用的任务处理中占据关键地位，其任务调度机制更是核心要点。开发者可通过子线程向主线程抛任务的方式，有效避免主线程阻塞，提升整体性能。而状态驱动UI更新则是一种推荐的高效模式，它依据应用状态的变化精准触发UI刷新，避免不必要的更新操作。深入理解并运用鸿蒙UI主线程任务调度机制，开发者能够
ArkUI原生页面滑动性能分析优化实践 harmonyos
课程简介本课程是【HarmonyOSTechTalk】的第20课。本次交流核心为ArkUI原生页面的滑动性能相关内容。从HarmonyOS渲染原理切入，这是理解页面呈现与滑动效果的根基。深入剖析应用滑动性能问题的分析思路，为开发者提供排查问题的有效方法。详细阐述针对典型性能问题的优化手段，涵盖代码优化、资源管理等多方面。开发者通过此次交流，能够精准把握ArkUI原生页面滑动性能的关键要点，提升性能
小红书获取笔记详情API接口的开发、应用与收益。前端后端运维数据挖掘api
一、开发基础（一）技术选型在开发小红书获取笔记详情API接口时，后端语言可选用Python搭配Django框架。Django具有强大的路由系统、数据库管理功能以及内置的安全机制，能极大提高开发效率。数据库方面，MySQL以其稳定性和广泛的应用场景成为不错选择，可高效存储笔记的各类信息，包括文字内容、图片链接、点赞数、评论数等。（二）接口设计请求方式：采用HTTPGET请求，通过在URL中携带笔记的
DevEcoStudio性能工具集介绍 harmonyos
课程简介本课程是【HarmonyOSTechTalk】的第15课。本次交流聚焦于IDE性能工具集这一关键开发辅助资源。该工具集涵盖多方面重要功能，性能检测可精准定位应用运行中可能存在的效率瓶颈与问题所在；性能分析则深入挖掘问题根源，剖析各类性能数据背后的关联与原因；而性能指导依据专业知识与经验提供最佳解决方案。开发者借助这一强大的IDE性能工具集，能在鸿蒙应用开发过程中显著提升性能优化分析效率，有
问题调试定位法宝箱及动态启停/采样抓栈方案 harmonyos
课程简介本课程是【HarmonyOSTechTalk】的第16课。本次围绕HarmonyOS应用开发展开。着重介绍其关键的调试工具及高效定位问题的方法。其中，调试工具涵盖堆栈异常解析，可依据常见异常格式深入剖析问题根源。通用日志与离线日志过滤能力有助于精准筛选有用信息，配合应用沙箱访问与智能检测功能，全方位辅助开发。DFX维测领域的抓栈和trace能力同样重要，明确其启用方式、规格以及解读方法，能
唯品会按关键字搜索 VIP 商品 API 接口的开发应用与收益前端后端运维数据挖掘api
在电商行业蓬勃发展的当下，精准高效的商品搜索功能对于提升用户购物体验和商家销售业绩至关重要。唯品会作为知名的电商平台，其按关键字搜索VIP商品的API接口在这一过程中发挥着关键作用。接下来将深入探讨该API接口的开发应用以及所能带来的收益。一、API接口开发基础（一）接口设计目标设计唯品会按关键字搜索VIP商品API接口的主要目标是为了实现高效、精准的商品检索。当用户输入特定关键字时，接口能够快速
1688商品类目API接口的开发应用与收益前端后端运维数据挖掘api
在电子商务领域，数据的获取与分析是企业决策的关键。阿里巴巴旗下的1688平台，作为全球领先的B2B在线交易市场，提供了丰富的API接口，助力企业高效获取商品信息，优化供应链管理，提升市场竞争力。本文将深入探讨1688商品类目API接口的开发应用，结合实际案例，展示其为企业带来的显著收益，并附上Python代码示例，以便开发者快速上手。一、1688商品类目API接口概述1688商品类目API接口允许
这有一份神秘新年礼物！编程语言
亲爱的MoonBit社区成员们：烟花[烟花]随着新年的钟声即将敲响，我们满怀感激地回顾过去一年的成长与进步。感谢您一路的支持与陪伴！爱心[爱心]为了更好地服务大家，我们正式启动了2024年MoonBit社区年度调查。我们诚挚地邀请您参与问卷调查，完成问卷只需1~3分钟，您的每一条反馈都将是我们不断优化和提升MoonBit平台服务质量的宝贵财富。特别福利：前50名填写问卷并留下建议的参与者将获得Mo
这有一份神秘新年礼物！编程语言
亲爱的MoonBit社区成员们：烟花[烟花]随着新年的钟声即将敲响，我们满怀感激地回顾过去一年的成长与进步。感谢您一路的支持与陪伴！爱心[爱心]为了更好地服务大家，我们正式启动了2024年MoonBit社区年度调查。我们诚挚地邀请您参与问卷调查，完成问卷只需1~3分钟，您的每一条反馈都将是我们不断优化和提升MoonBit平台服务质量的宝贵财富。特别福利：前50名填写问卷并留下建议的参与者将获得Mo
帮助应用实现免密身份认证的移动端能力 harmonyos
课程简介本课程是【HarmonyOS主题课：HarmonyOSSDK开放能力】的第17课。本课程致力于帮助应用实现免密身份认证的移动端能力。深入探讨FIDO、IIFAA、SOTER等核心技术标准，详细解析FIDO免密身份认证的原理与流程，让开发者理解其强大的安全与便捷性。全面剖析IIFAA免密身份认证的特色优势与应用场景，以及SOTER所提供的独特保障机制。通过理论讲解、案例分析与实践操作指导，开
帮助应用实现更好的推广下载能力 harmonyos
课程简介本课程是【HarmonyOS主题课：HarmonyOSSDK开放能力】的第14课。本课程旨在助力应用实现卓越的推广下载能力。全面深入讲解应用市场相关要点，包括应用市场推荐机制与更新功能的深度解析，让开发者了解如何提升应用曝光与更新效率。详细阐述展示应用详情页以促进下载安装目标应用的有效策略，以及查询广告验签版本的关键步骤。同时教授获取模块安装信息与添加按需加载模块的实用技术，使开发者能够优
帮助应用实现实时语音与文本的相互转换 harmonyos
课程简介本课程是【HarmonyOS主题课：HarmonyOSSDK开放能力】的第10课。本课程专为助力应用实现实时语音与文本相互转换而设。课程将深入讲解CoreSpeechKit这一基础语音服务，详细阐述其语音识别（SpeechRecognizer）能力，使开发者能精准掌握语音转文本的技术要点与应用方式。同时全面剖析文本转语音（TextToSpeech）功能，包括其原理、参数设置及优化策略。通过
构建灵活高效的消息推送能力 harmonyos
课程简介本课程是【HarmonyOS主题课：HarmonyOSSDK开放能力】的第3课。本课程聚焦于构建灵活高效的消息推送能力。首先引导开发者认识并开通推送服务，为后续推送工作奠定基础。深入讲解推送通知消息，让开发者掌握其有效应用。详细解析推送卡片刷新消息与推送通知扩展消息，助力拓展推送功能的多样性与深度。同时，对推送实况窗消息进行剖析，使开发者能充分利用这一形式增强信息传递效果。通过本课程学习，
AI写代码工具Claude：惊悚小说创作的意外热潮与全球用户偏好差异前端
近年来，人工智能在各个领域的应用日新月异，其中AI代码生成器的兴起更是为开发者带来了前所未有的效率提升。Anthropic最近发布的一份Claude使用报告，基于百万级用户数据，揭示了这款强大的AI模型的广泛应用，以及不同语言用户对其偏好差异的惊人发现。报告的核心发现之一，便是中文用户对使用Claude创作惊悚小说的强烈偏好，这一现象引发了广泛关注。这篇文章将深入探讨这一现象背后的原因，并对比分析
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后