每天读点书学堂

TiDB 集群报警规则

本文介绍了 TiDB 集群中各组件的报警规则，包括 TiDB、TiKV、PD、TiFlash、TiDB Binlog、TiCDC、Node_exporter 和 Blackbox_exporter 的各报警项的规则描述及处理方法。

按照严重程度由高到低，报警项可分为紧急级别 > 严重级别 > 警告级别三类。该分级适用于以下各组件的报警项。

严重程度	说明
紧急级别	最高严重程度，服务不可用，通常由于服务停止或节点故障导致，此时需要马上进行人工干预
严重级别	服务可用性下降，需要用户密切关注异常指标
警告级别	对某一问题或错误的提醒

TiDB 报警规则

本节介绍了 TiDB 组件的报警项。

紧急级别报警项

TiDB_schema_error

报警规则：

increase(tidb_session_schema_lease_error_total{type="outdated"}[15m]) > 0
规则描述：

TiDB 在一个 Lease 时间内没有重载到最新的 Schema 信息。如果 TiDB 无法继续对外提供服务，则报警。
处理方法：

该问题通常由于 TiKV Region 不可用或超时导致，需要看 TiKV 的监控指标定位问题。

TiDB_tikvclient_region_err_total

报警规则：

increase(tidb_tikvclient_region_err_total[10m]) > 6000
规则描述：

TiDB 访问 TiKV 时发生了 Region 错误。如果在 10 分钟之内该错误多于 6000 次，则报警。
处理方法：

查看 TiKV 的监控状态。

TiDB_domain_load_schema_total

报警规则：

increase(tidb_domain_load_schema_total{type="failed"}[10m]) > 10
规则描述：

TiDB 重载最新的 Schema 信息失败的总次数。如果在 10 分钟之内重载失败次数超过 10 次，则报警。
处理方法：

参考 TiDB_schema_error 的处理方法。

TiDB_monitor_keep_alive

报警规则：

increase(tidb_monitor_keep_alive_total[10m]) < 100
规则描述：

表示 TiDB 的进程是否仍然存在。如果在 10 分钟之内 tidb_monitor_keep_alive_total 增加次数少于 100，则 TiDB 的进程可能已经退出，此时会报警。
处理方法：
- 检查 TiDB 进程是否 OOM。
- 检查机器是否发生了重启。

严重级别报警项

TiDB_server_panic_total

报警规则：

increase(tidb_server_panic_total[10m]) > 0
规则描述：

发生崩溃的 TiDB 线程的数量。当出现崩溃的时候会报警。该线程通常会被恢复，否则 TiDB 会频繁重启。
处理方法：

收集 panic 日志，定位原因。

警告级别报警项

TiDB_memory_abnormal

报警规则：

go_memstats_heap_inuse_bytes{job="tidb"} > 1e+10
规则描述：

对 TiDB 内存使用量的监控。如果内存使用大于 10 G，则报警。
处理方法：

通过 HTTP API 来排查 goroutine 泄露的问题。

TiDB_query_duration

报警规则：

histogram_quantile(0.99, sum(rate(tidb_server_handle_query_duration_seconds_bucket[1m])) BY (le, instance)) > 1
规则描述：

TiDB 处理请求的延时。如果延迟大于 1 秒的概率超过 99%，则报警。
处理方法：

查看 TiDB 的日志，搜索 SLOW_QUERY 和 TIME_COP_PROCESS 关键字，查找慢 SQL。

TiDB_server_event_error

报警规则：

increase(tidb_server_event_total{type=~"server_start|server_hang"}[15m]) > 0
规则描述：

TiDB 服务中发生的事件数量。当出现以下事件的时候会报警：
1. start：TiDB 服务启动。
2. hang：当发生了 Critical 级别的事件时（目前只有 Binlog 写不进去一种情况），TiDB 进入 hang 模式，并等待人工 Kill。
处理方法：
- 重启 TiDB 以恢复服务。
- 检查 TiDB Binlog 服务是否正常。

TiDB_tikvclient_backoff_seconds_count

报警规则：

increase(tidb_tikvclient_backoff_seconds_count[10m]) > 10
规则描述：

TiDB 访问 TiKV 发生错误时发起重试的次数。如果在 10 分钟之内重试次数多于 10 次，则报警。
处理方法：

查看 TiKV 的监控状态。

TiDB_monitor_time_jump_back_error

报警规则：

increase(tidb_monitor_time_jump_back_total[10m]) > 0
规则描述：

如果 TiDB 所在机器的时间发生了回退，则报警。
处理方法：

排查 NTP 配置。

TiDB_ddl_waiting_jobs

报警规则：

sum(tidb_ddl_waiting_jobs) > 5
规则描述：

如果 TiDB 中等待执行的 DDL 任务的数量大于 5，则报警。
处理方法：

通过 admin show ddl 语句检查是否有耗时的 add index 操作正在执行。

PD 报警规则

本节介绍了 PD 组件的报警项。

紧急级别报警项

PD_cluster_down_store_nums

报警规则：

(sum(pd_cluster_status{type="store_down_count"}) by (instance) > 0) and (sum(etcd_server_is_leader) by (instance) > 0)
规则描述：

PD 长时间（默认配置是 30 分钟）没有收到 TiKV/TiFlash 心跳。
处理方法：
- 检查 TiKV/TiFlash 进程是否正常、网络是否隔离以及负载是否过高，并尽可能地恢复服务。
- 如果确定 TiKV/TiFlash 无法恢复，可做下线处理。

严重级别报警项

PD_etcd_write_disk_latency

报警规则：

histogram_quantile(0.99, sum(rate(etcd_disk_wal_fsync_duration_seconds_bucket[1m])) by (instance, job, le)) > 1
规则描述：

fsync 操作延迟大于 1s，代表 etcd 写盘慢，这很容易引起 PD leader 超时或者 TSO 无法及时存盘等问题，从而导致整个集群停止服务。
处理方法：
- 排查写入慢的原因。可能是由于其他服务导致系统负载过高。可以检查 PD 本身是否占用了大量 CPU 或 IO 资源。
- 可尝试重启 PD 或手动 transfer leader 至其他的 PD 来恢复服务。
- 如果由于环境原因无法恢复，可将有问题的 PD 下线替换。

PD_miss_peer_region_count

报警规则：

(sum(pd_regions_status{type="miss_peer_region_count"}) by (instance) > 100) and (sum(etcd_server_is_leader) by (instance) > 0)
规则描述：

Region 的副本数小于 max-replicas 配置的值。
处理方法：
- 查看是否有 TiKV 宕机或在做下线操作，尝试定位问题产生的原因。
- 观察 region health 面板，查看 miss_peer_region_count 是否在不断减少。

警告级别报警项

PD_cluster_lost_connect_store_nums

报警规则：

(sum(pd_cluster_status{type="store_disconnected_count"}) by (instance) > 0) and (sum(etcd_server_is_leader) by (instance) > 0)
规则描述：

PD 在 20 秒之内未收到 TiKV/TiFlash 上报心跳。正常情况下是每 10 秒收到 1 次心跳。
处理方法：
- 排查是否在重启 TiKV/TiFlash。
- 检查 TiKV/TiFlash 进程是否正常、网络是否隔离以及负载是否过高，并尽可能地恢复服务。
- 如果确定 TiKV/TiFlash 无法恢复，可做下线处理。
- 如果确定 TiKV/TiFlash 可以恢复，但在短时间内还无法恢复，可以考虑延长 max-down-time 配置，防止超时后 TiKV/TiFlash 被判定为无法恢复并开始搬移数据。

PD_cluster_low_space

报警规则：

(sum(pd_cluster_status{type="store_low_space_count"}) by (instance) > 0) and (sum(etcd_server_is_leader) by (instance) > 0)
规则描述：

表示 TiKV/TiFlash 节点空间不足。
处理方法：
- 检查集群中的空间是否普遍不足。如果是，则需要扩容。
- 检查 Region balance 调度是否有问题。如果有问题，会导致数据分布不均衡。
- 检查是否有文件占用了大量磁盘空间，比如日志、快照、core dump 等文件。
- 降低该节点的 Region weight 来减少数据量。
- 无法释放空间时，可以考虑主动下线该节点，防止由于磁盘空间不足而宕机。

PD_etcd_network_peer_latency

报警规则：

histogram_quantile(0.99, sum(rate(etcd_network_peer_round_trip_time_seconds_bucket[1m])) by (To, instance, job, le)) > 1
规则描述：

PD 节点之间网络延迟高，严重情况下会导致 leader 超时和 TSO 存盘超时，从而影响集群服务。
处理方法：
- 检查网络状况和系统负载情况。
- 如果由于环境原因无法恢复，可将有问题的 PD 下线替换。

PD_tidb_handle_requests_duration

报警规则：

histogram_quantile(0.99, sum(rate(pd_client_request_handle_requests_duration_seconds_bucket{type="tso"}[1m])) by (instance, job, le)) > 0.1
规则描述：

PD 处理 TSO 请求耗时过长，一般是由于负载过高。
处理方法：
- 检查服务器负载状况。
- 使用 pprof 抓取 PD 的 CPU profile 进行分析。
- 手动切换 PD leader。
- 如果是环境问题，则将有问题的 PD 下线替换。

PD_down_peer_region_nums

报警规则：

(sum(pd_regions_status{type="down-peer-region-count"}) by (instance) > 0) and (sum(etcd_server_is_leader) by (instance) > 0)
规则描述：

Raft leader 上报有不响应 peer 的 Region 数量。
处理方法：
- 检查是否有 TiKV 宕机，或刚发生重启，或者繁忙。
- 观察 region health 面板，检查 down_peer_region_count 是否在不断减少。
- 检查是否有 TiKV 之间网络不通。

PD_pending_peer_region_count

报警规则：

(sum(pd_regions_status{type="pending-peer-region-count"}) by (instance) > 100) and (sum(etcd_server_is_leader) by (instance) > 0)
规则描述：

Raft log 落后的 Region 过多。由于调度产生少量的 pending peer 是正常的，但是如果持续很高，就可能有问题。
处理方法：
- 观察 region health 面板，检查 pending_peer_region_count 是否在不断减少。
- 检查 TiKV 之间的网络状况，特别是带宽是否足够。

PD_leader_change

报警规则：

count(changes(pd_tso_events{type="save"}[10m]) > 0) >= 2
规则描述：

近期发生了 PD leader 切换。
处理方法：
- 排除人为因素，比如重启 PD、手动 transfer leader 或调整 leader 优先级等。
- 检查网络状况和系统负载情况。
- 如果由于环境原因无法恢复，可将有问题的 PD 下线替换。

TiKV_space_used_more_than_80%

报警规则：

sum(pd_cluster_status{type="storage_size"}) / sum(pd_cluster_status{type="storage_capacity"}) * 100 > 80
规则描述：

集群空间占用超过 80%。
处理方法：
- 确认是否需要扩容。
- 排查是否有文件占用了大量磁盘空间，比如日志、快照或 core dump等文件。

PD_system_time_slow

报警规则：

changes(pd_tso_events{type="system_time_slow"}[10m]) >= 1
规则描述：

系统时间可能发生回退。
处理方法：

检查系统时间设置是否正确。

PD_no_store_for_making_replica

报警规则：

increase(pd_checker_event_count{type="replica_checker", name="no_target_store"}[1m]) > 0
规则描述：

没有合适的 store 用来补副本。
处理方法：
- 检查 store 是否空间不足。
- 根据 label 配置（如果有这个配置的话）来检查是否有可以补副本的 store。

PD_cluster_slow_tikv_nums

报警规则：

sum(pd_cluster_status{type="store_slow_count"}) by (instance) > 0) and (sum(etcd_server_is_leader) by (instance) > 0
规则描述：

某一个 TiKV 被检测为慢节点。慢节点的检测由 TiKV raftstore.inspect-interval 参数控制，参见 TiKV 配置文件描述。
处理方法：
- 检查 store 性能是否异常
- 调大 TiKV raftstore.inspect-interval 参数，提高延迟检测的超时上限

TiKV 报警规则

本节介绍了 TiKV 组件的报警项。

紧急级别报警项

TiKV_memory_used_too_fast

报警规则：

process_resident_memory_bytes{job=~"tikv",instance=~".*"} - (process_resident_memory_bytes{job=~"tikv",instance=~".*"} offset 5m) > 5*1024*1024*1024
规则描述：

目前没有和内存相关的 TiKV 的监控，你可以通过 Node_exporter 监控集群内机器的内存使用情况。如上规则表示，如果在 5 分钟之内内存使用超过 5GB（TiKV 内存占用的太快），则报警。
处理方法：

调整 rocksdb.defaultcf 和 rocksdb.writecf 的 block-cache-size 的大小。

TiKV_GC_can_not_work

报警规则：

sum(increase(tikv_gcworker_gc_tasks_vec{task="gc"}[1d])) < 1 and (sum(increase(tikv_gc_compaction_filter_perform[1d])) < 1 and sum(increase(tikv_engine_event_total{db="kv", cf="write", type="compaction"}[1d])) >= 1)
规则描述：

在 24 小时内一个 TiKV 实例上没有成功执行 GC，说明 GC 不能正常工作了。短期内 GC 不运行不会造成太大的影响，但如果 GC 一直不运行，版本会越来越多，从而导致查询变慢。
处理方法：
1. 执行 SELECT VARIABLE_VALUE FROM mysql.tidb WHERE VARIABLE_NAME="tikv_gc_leader_desc" 来找到 gc leader 对应的 tidb-server；
2. 查看该 tidb-server 的日志，grep gc_worker tidb.log；
3. 如果发现这段时间一直在 resolve locks（最后一条日志是 start resolve locks）或者 delete ranges（最后一条日志是 start delete {number} ranges），说明 GC 进程是正常的。否则需要报备开发人员 [email protected] 进行处理。

严重级别报警项

TiKV_server_report_failure_msg_total

报警规则：

sum(rate(tikv_server_report_failure_msg_total{type="unreachable"}[10m])) BY (store_id) > 10
规则描述：

表明无法连接远端的 TiKV。
处理方法：
1. 检查网络是否通畅。
2. 检查远端 TiKV 是否挂掉。
3. 如果远端 TiKV 没有挂掉，检查压力是否太大，参考 TiKV_channel_full_total 处理方法。

TiKV_channel_full_total

报警规则：

sum(rate(tikv_channel_full_total[10m])) BY (type, instance) > 0
规则描述：

该错误通常是因为 Raftstore 线程卡死，TiKV 的压力已经非常大了。
处理方法：
1. 观察 Raft Propose 监控，看这个报警的 TiKV 节点是否明显有比其他 TiKV 高很多。如果是，表明这个 TiKV 上有热点，需要检查热点调度是否能正常工作。
2. 观察 Raft IO 监控，看延迟是否升高。如果延迟很高，表明磁盘可能有瓶颈。一个能缓解但不怎么安全的办法是将 sync-log 改成 false。
3. 观察 Raft Process 监控，看 tick duration 是否很高。如果是，需要在 [raftstore] 配置下加上 raft-base-tick-interval = “2s”。

TiKV_write_stall

报警规则：

delta(tikv_engine_write_stall[10m]) > 0
规则描述：

RocksDB 写入压力太大，出现了 stall。
处理方法：
1. 观察磁盘监控，排除磁盘问题。
2. 看 TiKV 是否有写入热点。
3. 在 [rocksdb] 和 [raftdb] 配置下调大 max-sub-compactions 的值。

TiKV_raft_log_lag

报警规则：

histogram_quantile(0.99, sum(rate(tikv_raftstore_log_lag_bucket[1m])) by (le, instance)) > 5000
规则描述：

这个值偏大，表明 Follower 已经远远落后于 Leader，Raft 没法正常同步了。可能的原因是 Follower 所在的 TiKV 卡住或者挂掉了。

TiKV_async_request_snapshot_duration_seconds

报警规则：

histogram_quantile(0.99, sum(rate(tikv_storage_engine_async_request_duration_seconds_bucket{type="snapshot"}[1m])) by (le, instance, type)) > 1
规则描述：

这个值偏大，表明 Raftstore 负载压力很大，可能已经卡住。
处理方法：

参考 TiKV_channel_full_total 的处理方法。

TiKV_async_request_write_duration_seconds

报警规则：

histogram_quantile(0.99, sum(rate(tikv_storage_engine_async_request_duration_seconds_bucket{type="write"}[1m])) by (le, instance, type)) > 1
规则描述：

这个值偏大，表明 Raft write 耗时很长。
处理方法：
1. 检查 Raftstore 上的压力，参考 TiKV_channel_full_total 的处理方法。
2. 检查 apply worker 线程的压力。

TiKV_coprocessor_request_wait_seconds

报警规则：

histogram_quantile(0.9999, sum(rate(tikv_coprocessor_request_wait_seconds_bucket[1m])) by (le, instance, req)) > 10
规则描述：

这个值偏大，表明 Coprocessor worker 压力很大。可能有比较慢的任务卡住了 Coprocessor 线程。
处理方法：
1. 从 TiDB 日志中查看慢查询日志，看查询是否用到了索引或全表扫，或者看是否需要做 analyze。
2. 排查是否有热点。
3. 查看 Coprocessor 监控，看 coporcessor table/index scan 里 total 和 process 是否匹配。如果相差太大，表明做了太多的无效查询。看是否有 over seek bound，如果有，表明版本太多，GC 工作不及时，需要增大并行 GC 的线程数。

TiKV_raftstore_thread_cpu_seconds_total

报警规则：

sum(rate(tikv_thread_cpu_seconds_total{name=~"raftstore_.*"}[1m])) by (instance, name) > 1.6
规则描述：

Raftstore 线程压力太大。
处理方法：

参考 TiKV_channel_full_total 的处理方法。

TiKV_raft_append_log_duration_secs

报警规则：

histogram_quantile(0.99, sum(rate(tikv_raftstore_append_log_duration_seconds_bucket[1m])) by (le, instance)) > 1
规则描述：

表示 append Raft log 的耗时，如果高，通常是因为 IO 太忙了。

TiKV_raft_apply_log_duration_secs

报警规则：

histogram_quantile(0.99, sum(rate(tikv_raftstore_apply_log_duration_seconds_bucket[1m])) by (le, instance)) > 1
规则描述：

表示 apply Raft log 耗时，如果高，通常是因为 IO 太忙了。

TiKV_scheduler_latch_wait_duration_seconds

报警规则：

histogram_quantile(0.99, sum(rate(tikv_scheduler_latch_wait_duration_seconds_bucket[1m])) by (le, instance, type)) > 1
规则描述：

Scheduler 中写操作获取内存锁时的等待时间。如果这个值高，表明写操作冲突较多，也可能是某些引起冲突的操作耗时较长，阻塞了其它等待相同锁的操作。
处理方法：
1. 查看 Scheduler-All 监控中的 scheduler command duration，看哪一个命令耗时最大。
2. 查看 Scheduler-All 监控中的 scheduler scan details，看 total 和 process 是否匹配。如果相差太大，表明有很多无效的扫描，另外观察是否有 over seek bound，如果太多，表明 GC 不及时。
3. 查看 Storage 监控中的 storage async snapshot/write duration，看是否 Raft 操作不及时。

TiKV_thread_apply_worker_cpu_seconds

报警规则：

max(rate(tikv_thread_cpu_seconds_total{name=~"apply_.*"}[1m])) by (instance) > 0.9
规则描述：

Apply Raft log 线程压力太大，已经接近或超过 apply 线程的处理上限。通常是因为短期内写入的数据量太多造成的。

警告级别报警项

TiKV_leader_drops

报警规则：

delta(tikv_pd_heartbeat_tick_total{type="leader"}[30s]) < -10
规则描述：

该问题通常是因为 Raftstore 线程卡住了。
处理方法：
1. 参考 TiKV_channel_full_total 的处理方法。
2. 如果 TiKV 压力很小，考虑 PD 的调度是否太频繁。可以查看 PD 页面的 Operator Create 面板，排查 PD 产生调度的类型和数量。

TiKV_raft_process_ready_duration_secs

报警规则：

histogram_quantile(0.999, sum(rate(tikv_raftstore_raft_process_duration_secs_bucket{type='ready'}[1m])) by (le, instance, type)) > 2
规则描述：

表示处理 Raft ready 的耗时。这个值大，通常是因为 append log 任务卡住了。

TiKV_raft_process_tick_duration_secs

报警规则：

histogram_quantile(0.999, sum(rate(tikv_raftstore_raft_process_duration_secs_bucket{type=’tick’}[1m])) by (le, instance, type)) > 2
规则描述：

表示处理 Raft tick 的耗时，这个值大，通常是因为 Region 太多导致的。
处理方法：
1. 考虑使用更高等级的日志，比如 warn 或者 error。
2. 在 [raftstore] 配置下添加 raft-base-tick-interval = “2s”。

TiKV_scheduler_context_total

报警规则：

abs(delta( tikv_scheduler_context_total[5m])) > 1000
规则描述：

Scheduler 正在执行的写命令数量。这个值高，表示任务完成得不及时。
处理方法：

参考 TiKV_scheduler_latch_wait_duration_seconds 的处理方法。

TiKV_scheduler_command_duration_seconds

报警规则：

histogram_quantile(0.99, sum(rate(tikv_scheduler_command_duration_seconds_bucket[1m])) by (le, instance, type) / 1000) > 1
规则描述：

表明 Scheduler 执行命令的耗时。
处理方法：

参考 TiKV_scheduler_latch_wait_duration_seconds 的处理方法。

TiKV_coprocessor_outdated_request_wait_seconds

报警规则：

delta(tikv_coprocessor_outdated_request_wait_seconds_count[10m]) > 0
规则描述：

Coprocessor 已经过期的请求等待的时间。这个值高，表示 Coprocessor 压力已经非常大了。
处理方法：

参考 TiKV_coprocessor_request_wait_seconds 的处理方法。

TiKV_coprocessor_pending_request

报警规则：

delta(tikv_coprocessor_pending_request[10m]) > 5000
规则描述：

Coprocessor 排队的请求。
处理方法：

参考 TiKV_coprocessor_request_wait_seconds 的处理方法。

TiKV_batch_request_snapshot_nums

报警规则：

sum(rate(tikv_thread_cpu_seconds_total{name=~"cop_.*"}[1m])) by (instance) / (count(tikv_thread_cpu_seconds_total{name=~"cop_.*"}) * 0.9) / count(count(tikv_thread_cpu_seconds_total) by (instance)) > 0
规则描述：

某个 TiKV 的 Coprocessor CPU 使用率超过了 90%。

TiKV_pending_task

报警规则：

sum(tikv_worker_pending_task_total) BY (instance,name) > 1000
规则描述：

TiKV 等待的任务数量。
处理方法：

查看是哪一类任务的值偏高，通常 Coprocessor、apply worker 这类任务都可以在其他指标里找到解决办法。

TiKV_low_space

报警规则：

sum(tikv_store_size_bytes{type="available"}) by (instance) / sum(tikv_store_size_bytes{type="capacity"}) by (instance) < 0.2
规则描述：

TiKV 数据量超过节点配置容量或物理磁盘容量的 80%。
处理方法：

确认节点空间均衡情况，做好扩容计划。

TiKV_approximate_region_size

报警规则：

histogram_quantile(0.99, sum(rate(tikv_raftstore_region_size_bucket[1m])) by (le)) > 1073741824
规则描述：

TiKV split checker 扫描到的最大的 Region approximate size 在 1 分钟内持续大于 1 GB。
处理方法：

Region 分裂的速度不及写入的速度。为缓解这种情况，建议更新到支持 batch-split 的版本 (>= 2.1.0-rc1)。如暂时无法更新，可以使用 pd-ctl operator add split-region --policy=approximate 手动分裂 Region。

TiFlash 报警规则

关于 TiFlash 报警规则的详细描述，参见 TiFlash 报警规则。

TiDB Binlog 报警规则

关于 TiDB Binlog 报警规则的详细描述，参见 TiDB Binlog 集群监控报警文档。

TiCDC 报警规则

关于TiCDC 报警规则的详细描述，参见 TiCDC 集群监控报警。

Node_exporter 主机报警规则

本节介绍了 Node_exporter 主机的报警项。

紧急级别报警项

NODE_disk_used_more_than_80%

报警规则：

node_filesystem_avail_bytes{fstype=~"(ext.|xfs)", mountpoint!~"/boot"} / node_filesystem_size_bytes{fstype=~"(ext.|xfs)", mountpoint!~"/boot"} * 100 <= 20
规则描述：

机器磁盘空间使用率超过 80%。
处理方法：

登录机器，执行 df -h 命令，查看磁盘空间使用率，做好扩容计划。

NODE_disk_inode_more_than_80%

报警规则：

node_filesystem_files_free{fstype=~"(ext.|xfs)"} / node_filesystem_files{fstype=~"(ext.|xfs)"} * 100 < 20
规则描述：

机器磁盘挂载目录文件系统 inode 使用率超过 80%。
处理方法：

登录机器，执行 df -i 命令，查看磁盘挂载目录文件系统 inode 使用率，做好扩容计划。

NODE_disk_readonly

报警规则：

node_filesystem_readonly{fstype=~"(ext.|xfs)"} == 1
规则描述：

磁盘挂载目录文件系统只读，无法写入数据，一般是因为磁盘故障或文件系统损坏。
处理方法：
- 登录机器创建文件测试是否正常。
- 检查该服务器硬盘指示灯是否正常，如异常，需更换磁盘并修复该机器文件系统。

严重级别报警项

NODE_memory_used_more_than_80%

报警规则：

(((node_memory_MemTotal-node_memory_MemFree-node_memory_Cached)/(node_memory_MemTotal)*100)) >= 80
规则描述：

机器内存使用率超过 80%。
处理方法：
- 在 Grafana Node Exporter 页面查看该主机的 Memory 面板，检查 Used 是否过高，Available 内存是否过低。
- 登录机器，执行 free -m 命令查看内存使用情况，执行 top 看是否有异常进程的内存使用率过高。

警告级别报警项

NODE_node_overload

报警规则：

(node_load5 / count without (cpu, mode) (node_cpu_seconds_total{mode="system"})) > 1
规则描述：

机器 CPU 负载较高。
处理方法：
- 在 Grafana Node exporter 页面上查看该主机的 CPU Usage 及 Load Average，检查是否过高。
- 登录机器，执行 top 查看 load average 及 CPU 使用率，看是否是异常进程的 CPU 使用率过高。

NODE_cpu_used_more_than_80%

报警规则：

avg(irate(node_cpu_seconds_total{mode="idle"}[5m])) by(instance) * 100 <= 20
规则描述：

机器 CPU 使用率超过 80%。
处理方法：
- 在 Grafana Node exporter 页面上查看该主机的 CPU Usage 及 Load Average，检查是否过高。
- 登录机器，执行 top 查看 load average 及 CPU 使用率，看是否是异常进程的 CPU 使用率过高。

NODE_tcp_estab_num_more_than_50000

报警规则：

node_netstat_Tcp_CurrEstab > 50000
规则描述：

机器 establish 状态的 TCP 链接超过 50,000。
处理方法：

登录机器执行 ss -s 可查看当前系统 estab 状态的 TCP 链接数，执行 netstat 查看是否有异常链接。

NODE_disk_read_latency_more_than_32ms

报警规则：

((rate(node_disk_read_time_seconds_total{device=~".+"}[5m]) / rate(node_disk_reads_completed_total{device=~".+"}[5m])) or (irate(node_disk_read_time_seconds_total{device=~".+"}[5m]) / irate(node_disk_reads_completed_total{device=~".+"}[5m])) ) * 1000 > 32
规则描述：

磁盘读延迟超过 32 毫秒。
处理方法：
- 查看 Grafana Disk Performance Dashboard 观察磁盘使用情况。
- 查看 Disk Latency 面板观察磁盘的读延迟。
- 查看 Disk IO Utilization 面板观察 IO 使用率。

NODE_disk_write_latency_more_than_16ms

报警规则：

((rate(node_disk_write_time_seconds_total{device=~".+"}[5m]) / rate(node_disk_writes_completed_total{device=~".+"}[5m])) or (irate(node_disk_write_time_seconds_total{device=~".+"}[5m]) / irate(node_disk_writes_completed_total{device=~".+"}[5m])))> 16
规则描述：

机器磁盘写延迟超过 16 毫秒。
处理方法：
- 查看 Grafana Disk Performance Dashboard 观察磁盘使用情况。
- 查看 Disk Latency 面板可查看磁盘的写延迟。
- 查看 Disk IO Utilization 面板可查看 IO 使用率。

Blackbox_exporter TCP、ICMP 和 HTTP 报警规则

本节介绍了 Blackbox_exporter TCP、ICMP 和 HTTP 的报警项。

紧急级别报警项

TiDB_server_is_down

报警规则：

probe_success{group="tidb"} == 0
规则描述：

TiDB 服务端口探测失败。
处理方法：
- 检查 TiDB 服务所在机器是否宕机。
- 检查 TiDB 进程是否存在。
- 检查监控机与 TiDB 服务所在机器之间网络是否正常。

TiFlash_server_is_down

报警规则：

probe_success{group="tiflash"} == 0
规则描述：

TiFlash 服务端口探测失败。
处理方法：
- 检查 TiFlash 服务所在机器是否宕机。
- 检查 TiFlash 进程是否存在。
- 检查监控机与 TiFlash 服务所在机器之间网络是否正常。

Pump_server_is_down

报警规则：

probe_success{group="pump"} == 0
规则描述：

Pump 服务端口探测失败。
处理方法：
- 检查 Pump 服务所在机器是否宕机。
- 检查 Pump 进程是否存在。
- 检查监控机与 Pump 服务所在机器之间网络是否正常。

Drainer_server_is_down

报警规则：

probe_success{group="drainer"} == 0
规则描述：

Drainer 服务端口探测失败。
处理方法：
- 检查 Drainer 服务所在机器是否宕机。
- 检查 Drainer 进程是否存在。
- 检查监控机与 Drainer 服务所在机器之间网络是否正常。

TiKV_server_is_down

报警规则：

probe_success{group="tikv"} == 0
规则描述：

TiKV 服务端口探测失败。
处理方法：
- 检查 TiKV 服务所在机器是否宕机。
- 检查 TiKV 进程是否存在。
- 检查监控机与 TiKV 服务所在机器之间网络是否正常。

PD_server_is_down

报警规则：

probe_success{group="pd"} == 0
规则描述：

PD 服务端口探测失败。
处理方法：
- 检查 PD 服务所在机器是否宕机。
- 检查 PD 进程是否存在。
- 检查监控机与 PD 服务所在机器之间网络是否正常。

Node_exporter_server_is_down

报警规则：

probe_success{group="node_exporter"} == 0
规则描述：

Node_exporter 服务端口探测失败。
处理方法：
- 检查 Node_exporter 服务所在机器是否宕机。
- 检查 Node_exporter 进程是否存在。
- 检查监控机与 Node_exporter 服务所在机器之间网络是否正常。

Blackbox_exporter_server_is_down

报警规则：

probe_success{group="blackbox_exporter"} == 0
规则描述：

Blackbox_exporter 服务端口探测失败。
处理方法：
- 检查 Blackbox_exporter 服务所在机器是否宕机。
- 检查 Blackbox_exporter 进程是否存在。
- 检查监控机与 Blackbox_exporter 服务所在机器之间网络是否正常。

Grafana_server_is_down

报警规则：

probe_success{group="grafana"} == 0
规则描述：

Grafana 服务端口探测失败。
处理方法：
- 检查 Grafana 服务所在机器是否宕机。
- 检查 Grafana 进程是否存在。
- 检查监控机与 Grafana 服务所在机器之间网络是否正常。

Pushgateway_server_is_down

报警规则：

probe_success{group="pushgateway"} == 0
规则描述：

Pushgateway 服务端口探测失败。
处理方法：
- 检查 Pushgateway 服务所在机器是否宕机。
- 检查 Pushgateway 进程是否存在。
- 检查监控机与 Pushgateway 服务所在机器之间网络是否正常。

Kafka_exporter_is_down

报警规则：

probe_success{group="kafka_exporter"} == 0
规则描述：

Kafka_exporter 服务端口探测失败。
处理方法：
- 检查 Kafka_exporter 服务所在机器是否宕机。
- 检查 Kafka_exporter 进程是否存在。
- 检查监控机与 Kafka_exporter 服务所在机器之间网络是否正常。

Pushgateway_metrics_interface

报警规则：

probe_success{job="blackbox_exporter_http"} == 0
规则描述：

Pushgateway 服务 http 接口探测失败。
处理方法：
- 检查 Pushgateway 服务所在机器是否宕机。
- 检查 Pushgateway 进程是否存在。
- 检查监控机与 Pushgateway 服务所在机器之间网络是否正常。

警告级别报警项

BLACKER_ping_latency_more_than_1s

报警规则：

max_over_time(probe_duration_seconds{job=~"blackbox_exporter.*_icmp"}[1m]) > 1
规则描述：

Ping 延迟超过 1 秒。
处理方法：
- 在 Grafana Blackbox Exporter 页面上检查两个节点间的 ping 延迟是否太高。
- 在 Grafana Node Exporter 页面的 TCP 面板上检查是否有丢包。

你可能感兴趣的:(tidb,数据库,运维,大数据)

数据库的查询爱吃草莓的土拨鼠️ 数据库
一.单表查询1.简单数据查询a.显示指定字段列：使用“*”显示全部字段列；列出字段名显示指定字段列。b.显示字段列别名：使用AS关键字为字段指定别名，方便理解。c.显示计算的列值：通过算术运算符(+-*/%)对字段进行计算，得到新的列值。d.消除重复行：使用DISTINCT参数消除查询结果中的重复行。e.限制行数：利用LIMIT控制返回的行数，可指定偏移量和行数。f.排序：ORDERBY子句按指定
next-hexagonal-starter：前端六边形架构的简约实践翟珊兰
next-hexagonal-starter：前端六边形架构的简约实践next-hexagonal-starter项目地址:https://gitcode.com/gh_mirrors/ne/next-hexagonal-starter项目介绍在软件开发中，六边形架构（HexagonalArchitecture）是一种设计模式，它通过将应用程序的业务逻辑与外部关注点（如UI、数据库、框架等）解耦，
非结构化数据真“野”？聊聊AI处理它时踩过的那些坑 Echo_Wish Python 进阶人工智能
非结构化数据真“野”？聊聊AI处理它时踩过的那些坑在AI圈子里有一句“老话”：真正的世界，是非结构化的。图像、音频、视频、文本、传感器原始数据……这些在数据库里没个字段、没个主键的家伙，占据了全世界80%以上的数据量。咱们都喜欢说“数据是新时代的石油”，但很少人说：非结构化数据，就是粘稠未提炼的原油——处理它，才是最累的活。这篇文章，我不想跟你讲那些“炫技”的论文和模型，而是从一个一线AI工程师的
基于springboot的社会志愿者管理系统 QQ242219979 spring boot 后端 java
目录部分效果实现截图本系统介绍关于我开发技术详细介绍开发思路核心代码参考示例基于springboot的社会志愿者管理系统论文提纲参考系统测试源码获取详细视频演示或者查看其他版本：文章底部获取博主联系方式！部分效果实现截图本系统介绍基于springboot的社会志愿者管理系统采用的开发工具：IntelliJIDEA，VScode；数据库管理软件：Navicat；服务器运行平台：Tomcat；开发技术
oracle 归档日志与RECOVERY_FILE_DEST 视图是桃萌萌鸭~ oracle 数据库
1.RECOVERY_FILE_DEST视图的作用RECOVERY_FILE_DEST是Oracle数据库用于管理快速恢复区（FastRecoveryArea,FRA）的一个视图。FRA是Oracle提供的一种集中存储恢复相关文件（如归档日志、备份文件、闪回日志等）的区域。RECOVERY_FILE_DEST视图的主要作用显示快速恢复区的路径和状态：快速恢复区的配置路径。快速恢复区的总大小和当前使
QT-登录界面的实现是桃萌萌鸭~ ui qt c++物联网数据库开发
QT-登录界面的实现一、登录界面设计要求创建一个窗体，设计用户登录的界面（含有用户名、密码），并实现用户登录的功能，要求用户提交的登录按钮时能获取界面中的用户名、密码数据并与数据库中的数据进行匹配，若用户名，密码正确则登录成功，否则登录失败。二、具体实现过程1、图片演示2、详细代码实现(1)dialog.cpp：（登录界面.cpp文件）#include"dialog.h"#include"ui_d
Oracle 导入导出 dmp 数据文件实战 dazhong2012 数据库 oracle 数据库
一、DMP文件基础知识1.DMP文件定义DMP（DataPumpDumpFile）是Oracle数据库专用的二进制格式文件，由expdp/impdp或旧版exp/imp工具生成。它包含数据库对象的元数据（表结构、索引等）和实际数据，是数据备份、迁移和恢复的核心载体。2.DMP文件结构文件头：记录Oracle版本、字符集、导出时间等元信息。数据段：存储表数据，按数据块组织，支持并行读写。索引段：加速
Spring Cache+Redis缓存方案详解：从代码到实践大手你不懂 Java Java项目实战 Redis spring 缓存 redis
描述：在现代Java开发中，缓存是提升系统性能的核心手段之一。本文通过实际代码案例，深入解析SpringCache与Redis的集成原理，结合项目中的ModuleDatabaseInfoService接口和RedisConfig配置，探讨如何通过声明式缓存实现高效的数据库访问优化。一、核心代码解析1.服务接口设计（拿查询数据源配置信息举例）publicinterfaceModuleDatabase
Python实例题：基于 Flask 的博客系统狐凄实例 python 开发语言
目录Python实例题题目要求：解题思路：代码实现：1.base.html2.index.html3.post.html4.create_post.html5.login.html6.register.htmlPython实例题题目基于Flask的博客系统要求：使用Flask框架构建一个简单的博客系统。实现用户认证（注册、登录、注销）。支持博客文章的创建、编辑、删除和查看。使用SQLite数据库存
Flask(六) 数据库操作SQLAlchemy @昵称不存在 Flask 数据库 flask
文章目录一、准备工作二、最小化可运行示例✅补充延迟绑定方式（推荐方式）三、数据库基本操作（增删改查）1.插入数据（增）2.查询数据（查）3.更新数据（改）4.删除数据（删）四、其他有用方法五、常用字段类型六、初始化数据库脚本（推荐）sqlalchemy实例基本使用常见方法速查多表查询（JOIN）原始SQL语句（可选）示例：分页+排序推荐：使用Flask-SQLAlchemy提供的简写风格完整的Fl
Oracle 临时表空间相关操作 dazhong2012 数据库 oracle 数据库
一、临时表空间概述临时表空间（TemporaryTablespace）是Oracle数据库中用于存储临时数据的特殊存储区域，其数据在会话结束或事务提交后自动清除，重启数据库后彻底消失。主要用途包括：存储排序操作（如ORDERBY）的中间结果支持哈希连接（HashJoin）等复杂查询索引创建时的临时数据存储核心特点：数据非永久性，关闭数据库后自动删除不能存储永久性对象（如表、视图）独立于永久表空间管
5.3 数据库：DELETE语句冰镇毛衣 sql 数据库 sql mysql
Delete语句是用来删除数据的，而不能删除数据表本身。删除数据表用的是drop语句而delete的作用，只是删除记录而已。1.DELETE语法delete语法跟update语法的比较的相似关键字是delete,ignore：就是在删除数据的时候，如果说有外界约束，阻止我们删除某一条记录，那么这个delete就会忽略删除这条数据，把那些没有违反外界约束的记录给删掉。from子句，要删除哪一张数据表
Ansible部署MySQL实操码农运维知识运维 mysql ansible mysql
一、Ansible概述Ansible是一款开源的自动化运维工具，由MichaelDeHaan于2012年创建，2015年被红帽（RedHat）收购（收购金额超1亿美元）。它基于Python开发，通过SSH协议实现远程节点管理，无需在被控端安装任何客户端代理（Agentless）。这种设计使其成为轻量级、易部署的自动化解决方案，特别适合批量系统配置、应用程序部署和任务编排等场景。核心特点无代理架构：
Java实现简易即时通讯系统程序员皮皮林 Java java
我们想要实现一个类似QQ的即时通讯程序。由于这是一个复杂的项目，我们将分步骤进行，并只实现核心功能。核心功能包括：1.用户注册与登录2.添加好友3.发送消息（点对点）4.接收消息我们将使用Socket编程来实现。为了简化，我们不使用数据库，而是使用文件存储用户信息和好友关系。我们将创建两个主要部分：服务器和客户端。服务器端：-处理用户注册、登录请求-管理用户连接（在线状态）-转发消息客户端：-提供
深入学习 GORM：记录插入与数据检索 Code季风 GORM从入门到精通学习数据库 golang 后端
引言在使用GORM进行数据库操作时，掌握如何高效地插入记录和检索数据是非常重要的。本文将详细介绍通过Create方法插入记录、批量插入、以及各种数据检索方法，并结合实际示例进行讲解。一、通过Create方法插入记录GORM提供了简单易用的Create方法来插入单条记录。以下是一个基本示例：typeUserstruct{IDuintNamestring}varuser=User{Name:"jinz
深入了解数据库领域行式存储的架构设计数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent SQL实战数据库 ai
深入了解数据库领域行式存储的架构设计关键词：行式存储、数据库架构、OLTP、存储引擎、行记录格式摘要：本文将以“行式存储”为核心，从生活场景切入，逐步拆解数据库行式存储的底层架构设计。我们将通过“图书馆藏书”的趣味比喻、具体代码示例和真实数据库（如MySQLInnoDB）的实践案例，深入理解行式存储的核心原理、适用场景及未来趋势，帮助读者建立对数据库存储架构的系统认知。背景介绍目的和范围数据库是现
非关系型数据库在数据库领域的崛起与应用数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent SQL实战数据库 nosql 网络 ai
非关系型数据库在数据库领域的崛起与应用关键词：非关系型数据库、关系型数据库、崛起原因、应用场景、数据库领域摘要：本文主要探讨了非关系型数据库在数据库领域的崛起与应用。首先介绍了非关系型数据库的背景，包括目的、预期读者等内容。接着详细解释了非关系型数据库、关系型数据库等核心概念，并阐述了它们之间的关系。然后深入讲解了非关系型数据库的核心算法原理、数学模型和公式。通过项目实战展示了非关系型数据库的实际
PostgreSQL数据库的自动化备份脚本编写与部署数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent SQL实战数据库 postgresql 自动化 ai
PostgreSQL数据库的自动化备份脚本编写与部署关键词：PostgreSQL、自动化备份、pg_dump、crontab、数据库运维摘要：数据库是企业的“数字心脏”，一旦数据丢失可能导致不可挽回的损失。本文将用“给小学生讲故事”的方式，从备份的重要性出发，逐步讲解如何编写PostgreSQL自动化备份脚本（含全量备份、压缩、日志记录、旧文件清理），并通过crontab实现定时执行。无论你是刚接
精准删除：掌握SQL中的DELETE语句 2401_85762266 sql oracle 数据库
精准删除：掌握SQL中的DELETE语句在数据库管理中，数据的增删改查（CRUD）是基本操作。其中，DELETE语句是用于从数据库表中删除数据的重要工具。本文将详细解释如何使用SQL的DELETE语句来删除数据，并提供实际的代码示例，帮助你精确控制数据的删除过程。DELETE语句的基本概念DELETE语句用于从数据库表中根据指定条件删除行。正确使用DELETE语句可以确保数据的完整性和准确性。基本
pycharm——djiango之数据迁移，终端操作 Pop– python
首先在pycharm中找到terminal(终端)，输入指令：pythonmanage.pymakemigrations之后你会看到如下图：这表示创建成功。接着输入指令：pythonmanage.pymigrate就能看到好多ok，你在数据库中也能看到很多表你可以在终端打开数据库查看表，也可以使用客户端的可视化界面查看，还可以在pycharm中右边的database里边打开查看，如下图：之后你就可
Flask入门基础1 浅清陌 Flask flask python 后端
1Flask简介Flask诞生于2010年，是Arminronacher（阿明·罗纳彻）用Python语言基于Werkzeug工具箱编写的轻量级Web开发框架。Flask本身相当于一个内核，其他几乎所有的功能都要用到扩展（邮件扩展Flask-Mail，用户认证Flask-Login，数据库Flask-SQLAlchemy），都需要用第三方的扩展来实现。比如可以用Flask扩展加入ORM、窗体验证工
django 数据库迁移指令 CrazyDemo #django框架 web框架
#rbac/models.pyclassRole(models.Model):...classUser(models.Model):#name=models.CharField(max_length=12)#password=models.CharField(max_length=12)roles=models.ManyToManyField(Role)#直接写对应的类名，字符串形式反射是找不到的
【Flask开发】嘿马文学web完整flask项目第2篇：2.用户认证,Json Web Token(JWT)【附代码文 flaskpython前端后端
教程总体简介：2.目标1.1产品与开发1.2环境配置1.3运行方式1.4目录说明1.5数据库设计2.用户认证JsonWebToken(JWT)3.书架4.1分类列表5.搜索5.3搜索-精准&高匹配&推荐6.小说6.4推荐-同类热门推荐7.浏览记录8.1配置-阅读偏好8.配置9.1项目部署uWSGI配置启动9.部署10.1异常和日志10.补充10.2flask-restful1.项目目录实现3.数据
探索Kafka监控新维度：Burrow深度解析孙爽知Kody
探索Kafka监控新维度：Burrow深度解析BurrowKafkaConsumerLagChecking项目地址:https://gitcode.com/gh_mirrors/bu/Burrow项目介绍在大数据领域，ApacheKafka作为实时数据流处理的领军者，其稳定性和性能备受赞誉。然而，对于消费者端的监控始终是一个挑战。这时，LinkedIn开源的Burrow应运而生，它是一款专为Kaf
day043-负载均衡算法与高可用keepalived 孙克旭‌ 老男孩教育Linux运维99期负载均衡算法运维 linux
文章目录0.老男孩思想-运维能为公司创造的价值1.负载均衡轮询算法1.1加权轮询1.2ip哈希1.3url哈希2.负载均衡模块指令补充3.高可用4.keepalived4.1部署keepalived服务4.2脑裂故障4.2.1脑裂故障常见原因4.2.2脑裂故障解决方法5.思维导图0.老男孩思想-运维能为公司创造的价值省钱：服务器设备、机房带宽、云主机云服务减少CDN流量优化、架构改造，当流量增加时
路由表原理以及数据包进入路由器，路由器的处理
路由表原理以及数据包进入路由器，路由器的处理路由表是路由器转发数据包的数据库，当路由表收到一个数据包时，它会用数据报的目的IP地址去匹配路由表中的路由条目，然后根据匹配条目的路由参数决定如何转发这个数据包。但是，路由表中的路由条目并不会由路由器根据入站数据包的信息自动填充。路由信息的3种来源：链路层协议发现的路由（也称为直连路由）：只要连接该网络的接口状态正常，那么管理员就不需要进行任何配置，直连
【实战演练】运维工程师初试必胜指南：解析公司笔试真题与技巧分享江湖有缘运维工程师面试专栏运维服务器 Linux 面试求职
【实战演练】运维工程师初试必胜指南：解析公司笔试真题与技巧分享一、填空题1.第1题：修改网卡IP地址2.第2题：基本文件相关命令解释3.第3题：新建用户4.第4题：设置文件权限5.第5题：路由协议RIP6.第6题：ping命令相关7.第7题：创建目录8.第8题：正则表达式9.第9题：列出文件10.第10题：如何查看系统信息11.第11题：重命名文件12.第12题：修改用户密码13.第13题：如何向
kingbase人大金仓导入导出和 minio迁移文件（mc 命令）记录代码萌新知知识点学习数据库 linux windows
ksql导出：1.进入kingbase的bin目录,存在ksql文件2.sys_dump-h127.0.0.1-p54321-Usystem-dkingbase-tisp_admin.enterprise_info>C:\test.sqlsys_dump-hip地址-p端口号-U登录数据库账号名-d模式-t数据库名.数据库表>导出文件路径回车后会让输入口令输入数据库账号密码即可ksql导入1.进入
MYSQL中常见DDL语句为你奋斗！数据库 mysql sql
DDL：对数据库以及数据库内部的对象进行创建、删除、修改等操作的语言,DDL语句更多的是由数据库管理员(DBA)使用，开发人员一般很少使用。一、数据库：1、查看数据库列表：showdatabases;2、创建数据库：createdatabase[ifnotexists]数据库名;3、显示已创建的库创建时的创建语句：showcreatedatabases数据库名4、删除数据库：dropdatabas
说说自己Python 代码优化实践 chilavert318 大数据 linux 运维 python
今年上半年在外省做一个大数据相关的项目，在review项目组成员的代码时，发现一段处理大数据集的模块存在明显性能瓶颈：10万条数据的清洗流程耗时近20分钟，CPU占用率却始终在30%以下。深入分析后发现，看似简洁的Python代码背后，隐藏着诸多可以优化的细节——这并非个例，我们的程序在追求代码可读性时，往往忽略了Python特有的性能陷阱。今天抽点时间，从我实践中的代码就python开发，从内存
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发