自定义
put artists
{
"settings":{
"analysis":{
"analyzer":{
"my_analyzer":{ //自定义分词器my_analyzer
"tokenizer":"whitespace",
"filter":"my_filter"
}
},
"filter":{
"my_filter":{ //自定义过滤器my_filter
"type":"pinyin",
"keep_first_letter":true,
"keep_full_pinyin":false,
"keep_none_chinese":true,
"keep_original":false,
"limit_first_letter_length":16,
"lowercase":true,
"trim_whitespace":true,
"keep_none_chinese_in_first_letter":true
}
}
}
}
}
更多介绍:
后台分片合并进程相关配置参数。
相似性相关配置,这个后续可能会以专题介绍,暂不深究。
慢查询日志相关配置。
Search Show Log
首先ES提供在查询阶段(query)和数据获取阶段(fetch)设置阔值,超过该阔值则记录日志。 支持如下参数:
1index.search.slowlog.threshold.query.warn: 10s
2index.search.slowlog.threshold.query.info: 5s
3index.search.slowlog.threshold.query.debug: 2s
4index.search.slowlog.threshold.query.trace: 500ms
上述参数定义查询阶段的阔值,分别表示,如果执行时间超过10s,打出警告日志,超过5s输出info级别日志。
1index.search.slowlog.threshold.fetch.warn: 1s
2index.search.slowlog.threshold.fetch.info: 800ms
3index.search.slowlog.threshold.fetch.debug: 500ms
4index.search.slowlog.threshold.fetch.trace: 200ms
上述参数定义查询获取数据(fetch)的阔值,分别表示,如果执行时间超过1s,打出警告日志,超过800ms输出info级别日志。
index.search.slowlog.level: info 定义日志输出级别为info,也就是hdebug,trace级别的日志不输出。
注意:上述日志级别为分片级日志。
上述参数定义了日志输出级别,那接下来还需要在log4j文件中定义日志输出器,日志输出文件路径等,其相关配置如下:
1appender.index_search_slowlog_rolling.type = RollingFile
2appender.index_search_slowlog_rolling.name = index_search_slowlog_rolling
3appender.index_search_slowlog_rolling.fileName = ${sys:es.logs}_index_search_slowlog.log
4appender.index_search_slowlog_rolling.layout.type = PatternLayout
5appender.index_search_slowlog_rolling.layout.pattern = [%d{ISO8601}][%-5p][%-25c] [%node_name]%marker %.10000m%n
6appender.index_search_slowlog_rolling.filePattern = ${sys:es.logs}_index_search_slowlog-%d{yyyy-MM-dd}.log
7appender.index_search_slowlog_rolling.policies.type = Policies // 文件切割方案,属于log4j的语法
8appender.index_search_slowlog_rolling.policies.time.type = TimeBasedTriggeringPolicy // 基于时间切割,log4j还支持按大小切割,其类为SizeBasedTriggeringPolicy。
9appender.index_search_slowlog_rolling.policies.time.interval = 1 // 1小时切割成一个文件
10appender.index_search_slowlog_rolling.policies.time.modulate = true // 是否修正时间范围, 如果设置为true,则从0时开始计数
11
12logger.index_search_slowlog_rolling.name = index.search.slowlog
13logger.index_search_slowlog_rolling.level = trace
14logger.index_search_slowlog_rolling.appenderRef.index_search_slowlog_rolling.ref = index_search_slowlog_rolling
15logger.index_search_slowlog_rolling.additivity = false
Index Show Log
索引慢日志。
1index.indexing.slowlog.threshold.index.warn: 10s
2index.indexing.slowlog.threshold.index.info: 5s
3index.indexing.slowlog.threshold.index.debug: 2s
4index.indexing.slowlog.threshold.index.trace: 500ms
5index.indexing.slowlog.level: info
6index.indexing.slowlog.source: 1000
index.indexing.slowlog.source参数用来控制记录文档_souce字段字符的个数,默认为1000,表示只记录_souce字段的前1000个字符,可以设置true,表示输出_souce字段全部内容,设置为false,表示不记录_souce字段的内容。
默认情况下,会对_souce字段的输出进行格式化,通常使用一行输出,如果想阻止格式化,可以通过index.indexing.slowlog.reformat设置为false来避免。
同样通过上述属性定义好阔值,接下来将在logg4j配置文件中定义日志的输出。
1appender.index_indexing_slowlog_rolling.type = RollingFile
2appender.index_indexing_slowlog_rolling.name = index_indexing_slowlog_rolling
3appender.index_indexing_slowlog_rolling.fileName = ${sys:es.logs}_index_indexing_slowlog.log
4appender.index_indexing_slowlog_rolling.layout.type = PatternLayout
5appender.index_indexing_slowlog_rolling.layout.pattern = [%d{ISO8601}][%-5p][%-25c] [%node_name]%marker %.-10000m%n
6appender.index_indexing_slowlog_rolling.filePattern = ${sys:es.logs}_index_indexing_slowlog-%d{yyyy-MM-dd}.log
7appender.index_indexing_slowlog_rolling.policies.type = Policies
8appender.index_indexing_slowlog_rolling.policies.time.type = TimeBasedTriggeringPolicy
9appender.index_indexing_slowlog_rolling.policies.time.interval = 1
10appender.index_indexing_slowlog_rolling.policies.time.modulate = true
11
12logger.index_indexing_slowlog.name = index.indexing.slowlog.index
13logger.index_indexing_slowlog.level = trace
14logger.index_indexing_slowlog.appenderRef.index_indexing_slowlog_rolling.ref = index_indexing_slowlog_rolling
15logger.index_indexing_slowlog.additivity = false
存储模块,其主要参数为:index.store.type,表示存储类型,该参数为静态参数,在索引创建时指定,无法更改。 其可选值:
由于Lucene提交的开销太大,不能每个单独变更就提交(刷写到磁盘),所以每个分片复制都有一个事务日志,称为translog。所有索引(index)和删除(delete)操作都是在被内部Lucene索引处理之后(但在它们被确认之前[返回客户端])写入translog的。在发生崩溃的情况下,当分片恢复时,可以从translog中恢复最近已确认但尚未包含在上一次Lucene提交中的事务。
Translog日志有点类似于关系型数据库mysql的redo日志。
Translog相关配置参数(索引级别):
关于ES的配置属性就先介绍到这里,后续还会对Analysis、Index Shard Allocation、Similarities这三个模块进行更加详细的说明。