E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
集群监控
分布式注册服务中心etcd在云原生引擎中的实践
etcd基于Go语言实现,主要用于共享配置,服务发现,
集群监控
,leader选举,分布式锁等场景。在微服务和Kubernates集群中不仅可以作为服务注册发现,还可以作为key-value存储
京东云开发者
·
2022-12-28 16:10
云计算
技术分享
分布式
etcd
云原生
07.redis哨兵机制功能介绍
一、哨兵(sentinal)的介绍哨兵是redis集群架构中非常重要的一个组件,主要功能如下:
集群监控
,负责监控redismaster和slave进程是否正常工作消息通知,如果某个redis实例有故障,
Mr Mirror
·
2022-12-22 10:31
Redis专栏
redis
分布式注册服务中心etcd在云原生引擎中的实践
etcd基于Go语言实现,主要用于共享配置,服务发现,
集群监控
,leader选举,分布式锁等场景。在微服务和Kubernates集群中不仅可以作为服务注册发现,还可以作为key-value存储
·
2022-12-20 11:09
可观测数据采集端的管控方案的简单对比
详细的对比结果见下表:备注:
集群监控
:表示工具可以查看管理采集端的运行状态、采集速度等数据集群管理:表示工具可以对管理采集端的采集配置、运行参数等进行添加、修改、删除ilogtailElasticLogkitSysdigF
阿里云云栖号
·
2022-12-05 14:12
kubernetes
运维
java
阿里云
云计算
可观测数据采集端的管控方案的简单对比
详细的对比结果见下表:备注:
集群监控
:表示工具可以查看管理采集端的运行状态、采集速度等数据集群管理:表示工具可以对管理采集端的采集配置、运行参数等进行添加、修改、删除ilogtailElasticLogkitSysdigF
阿里云技术
·
2022-12-01 20:27
kubernetes
运维
java
云计算
阿里云
微软OpenPAI平台搭建指南
平台搭建操作指南微软OpenPAI平台搭建操作指南OpenPAI架构与功能简介OpenPAI是由微软亚洲研究院和微软(亚洲)互联网工程院联合研发的,支持多种深度学习、机器学习及大数据任务,可提供大规模GPU集群调度、
集群监控
Michelle.chen
·
2022-11-27 18:28
人工智能
集群管理
K8S
Kubernetes部署(六):k8s项目交付----(3)
集群监控
一、介绍PrometheusPrometheus(普罗米修斯)是一个最初在SoundCloud上构建的监控系统。自2012年成为社区开源项目,拥有非常活跃的开发人员和用户社区。为强调开源及独立维护,Prometheus于2016年加入CNCF,成为继kubernetes之后的第二个托管项目。官网:Prometheus-Monitoringsystem×eriesdatabase源码托管:
Jerry00713
·
2022-11-09 13:25
#
k8s_v1.15.2
kubernetes
docker
【Linux集群教程】11
集群监控
- Zabbix 搭建
4Zabbix监控服务器【主流】本节内容:zabbix组件说明构建zabbix监控添加监控主机/自动发现nginx并发监控Web场景、组合图报警设置大部分的新构建的服务集群都是使用Zabbix来进行监控的,收集数据的。而Cacti和Nagios在新的环境中已经使用的非常少了。4.1Zabbix介绍4.1.1Zabbix是什么?zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企
Dark_Ice_
·
2022-11-05 20:07
#
Linux集群管理教程
linux
zabbix
服务器
阿里云注册集群+Prometheus 解决多云容器集群运维痛点
作者:左知容器集群可观测现状随着Kubernetes(K8s)容器编排工具已经成为事实上行业通用技术底座,容器
集群监控
经历多种方案实践后,Prometheus最终成为容器
集群监控
的事实标准。
阿里云云原生
·
2022-11-01 08:03
阿里云
云原生
Prometheus
Grafana
大数据
集群监控
体系架构
背景企业级的数据集群往往有PB级的数据、成百上千的各类型运算任务在一套集群上运行。所以它的维护是充满挑战的:庞大的数据量、复杂的运算逻辑、相互关联的大数据组件、数以万计的运行任务都是要克服的难点。SRE如果不想被动的话,就必须做好各式监控。预防风险、提前发现风险、然后分析问题、进而针对性的处理问题。凡是成体量的分布式系统,一旦出现性能问题,往往很难在短时间内作出有效处理。所以监控要前置,有趋势预测
好未来技术团队
·
2022-10-31 15:03
大数据
Docker搭建Doris
集群监控
grafana+prometheus
说明:Doris使用Prometheus和Grafana进项监控项的采集和展示。来看一下这俩东西都是什么:具体的架构形式是这样的一、Docker安装Prometheus说明:网上有跟多博客,可以教我们在Docker容器上安装Prometheus的,但是步骤比较复杂,我就不喜欢这么复杂的安装方式,所以我是使用Ubuntu16.04的基础镜像上搭建的,搭建下来会比直接用官方的镜像的搭建方式还要简单很多
彪悍程序员
·
2022-10-24 18:58
大数据实时分析
Linux
docker
【云原生 • Kubernetes】集群资源监控概述、监控平台的搭建
本文导读一、集群资源监控概述1.
集群监控
2.Pod监控二、监控平台搭建所需组件概述三、搭建监控平台1.部署Prometheus2.部署Grafana3.打开Grafana,添加数据源和显示模板一、集群资源监控概述
Developer 小马
·
2022-10-18 17:56
云原生
-
入门到实战
kubernetes
云原生
容器
k8s
Observability:
集群监控
(一) - Elastic Stack 8.x
你可以在我之前文章“Elastic:开发者上手指南”的“监视及管理”找到相关的ElasticStack监控的文章。在那些文章里,所有的理论还是成立的,只不过在最新的ElasticStack8.0出现后,由于HTTPS访问变成了默认的配置,需要有一些额外的配置,而且界面有所改变。在今天的文章中,我来详细地介绍如何在ElasticStack8.0平台下监控ElasticStack。监控概览监控集群时,
Elastic 中国社区官方博客
·
2022-10-17 22:16
Elasticsearch
Elastic
elasticsearch
大数据
运维
Kubernetes 部署 Metrics Server 获取集群指标数据
示例部署文件地址:Kubernetes部署MetricsServer部署文件[1]1.MetricsServer简介介绍MetricsServer前首先介绍下Heapster,该工具是用于Kubernetes
集群监控
和性能分析
米开朗基杨
·
2022-10-10 14:22
kubernetes
docker
大数据
github
区块链
Elasticsearch6.2服务器升配后的bug(避坑指南)
一、问题描述升级后出现的异常如下:出现限流日志:stopthrottlingindexing:numMergesInFlight=8,maxNumMerges=9应用写入集群的rt耗时变高,同时
集群监控
的
·
2022-09-22 18:29
Redis 哨兵集群实现高可用
哨兵是redis集群机构中非常重要的一个组件,主要有以下功能:
集群监控
:负责监控redismaster和slave进程是否正常工作。
敲代码的老贾
·
2022-09-21 15:28
redis
数据库
java
uml
spring
EMR重磅发布智能运维诊断系统(EMR Doctor)——开源大数据平台运维利器
简介:E-MapReduce推出面向开源大数据集群的智能运维诊断系统E-MapReduceDoctor,有效提升大数据集群运维效率,辅助EMR用户完善
集群监控
体系。
·
2022-09-16 16:43
后端
开源项目丨ChengYing 1.1版本重磅发布:新增超多功能,全新优化体验!
ChengYing是一站式全自动化全生命周期大数据平台运维管家,提供大数据产品的一站式部署、运维、监控服务,其可实现产品部署、产品升级、版本回滚、扩缩节点、日志诊断、
集群监控
、实时告警等功能,致力于最大化节省运维成本
·
2022-09-13 19:41
大数据
tomcat
集群监控
与弹性伸缩详解
目录如何给tomcat配置合适的线程池如何监控tomcat线程池的工作情况tomcat线程池扩缩容tomcat是如何避免原生线程池的缺陷的如何给tomcat配置合适的线程池任务分为CPU密集型和IO密集型对于CPU密集型的应用来说,需要大量CPU计算速度很快,线程池如果过多,则保存和切换上下文开销过高反而会影响性能,可以适当将线程数量调小一些对于IO密集型应用来说常见于普通的业务系统,比如会去查询
·
2022-09-12 16:20
搭建k8s监控问题排查-9093: connect: connection refused
搭建k8s
集群监控
-Alertmanager问题处理pod启动错误-CrashLoopBackOffCrashLoopBackOff说明pod正常启动后有异常退出了describe查看Events:TypeReasonAgeFromMessage
Geray-zsg
·
2022-09-10 07:04
k8s
云原生
kubernetes
k8s
云原生
监控程序
alertmanager
阿里云 ACK One 多集群管理全面升级:多集群服务、多
集群监控
、两地三中心应用容灾
简介:本文介绍了ACKOne近期发布的3个主要特性,覆盖了多集群管理的3个主要场景,跨集群服务发现与访问、多集群全局监控、应用容灾。除多集群管理外,ACKOne更是支持连接并管理任何地域、任何基础设施上的Kubernetes集群,提供一致的管理和社区兼容的API,支持对计算、网络、存储、安全、监控、日志、作业、应用、流量等进行统一运维管控。作者:宇汇ACKOne概述ACKOne是阿里云面向混合云、
·
2022-08-26 18:24
后端
阿里云 ACK One 多集群管理全面升级:多集群服务、多
集群监控
、两地三中心应用容灾
作者:宇汇ACKOne概述ACKOne是阿里云面向混合云、多集群、分布式计算等场景推出的分布式云容器平台,能够统一管理阿里云上、边缘、部署在客户数据中心以及其他云上的Kubernetes集群,并简化集群管理界面,让企业轻松应对多集群形态,从而灵活地根据自身业务和数据管控等需求,同时使部署在客户数据中心的集群也能获取云上弹性算力,实现“计算无界”。三大重磅特性,覆盖三大场景,引领多集群管理新高度多集
·
2022-08-25 12:18
阿里云云原生集群容器混合云
观察者(observer)模式(一)
1.引子1.1不完美的实现方案公司业务发展壮大,
集群监控
也逐渐走向自动化:上报集群重要指标,实时监控集群状态,异常时进行自动告警老大说:你去写一个告警程序,集群状态异常时,以短信和电话的形式通知运维人员新来的可能会这样写
晓之木初
·
2022-08-21 09:44
设计模式
java
linux服务器
集群监控
,zabbix linux服务器集群 性能监控系统 安装使用
zabbix是一个基于WEB界面的提供分布式服务器系统监控以及网络监控功能的企业级的开源解决方案。zabbix能监视各种系统参数和网络参数,保证服务器系统的安全运营,并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。1.安装zabbixserver找一台服务器当作主机安装zabbixserver1.1安装Zabbixrpm包仓库rpm-vhihttp://repo.zabbix.co
谷文栋
·
2022-08-14 07:22
linux服务器集群监控
监控系统-Prometheus(普罗米修斯)(四)存储机制(Long-Term Storage)
PrometheusLong-TermStorage远程存储方案对比参考Prometheus使用VictoriaMetrics远程存储基于VictoriaMetrics的prometheus
集群监控
报警方案监控系统
西京刀客
·
2022-08-12 20:28
云原生(Cloud
Native)
云计算
虚拟化
prometheus
云原生
redis 集群的哨兵模式保证 redis 的高可用
1、哨兵的介绍sentinal,中文名是哨兵哨兵是redis集群架构中非常重要的一个组件,主要功能如下(1)
集群监控
,负责监控redismaster和slave进程是否正常工作,Sentinal节点会定期检查
football0
·
2022-07-21 12:52
redis
专题
redis
分布式
java
SpringCloudConfig之分布式配置中心
之高可用的注册中心eureka之详解ribbon之客户端负载均衡ribbon之配置详解Hystrix之服务容错保护Hystrix之使用详解Hystrix之请求合并Hystrix之仪表盘以及Turbine
集群监控
荆轲刺秦
·
2022-07-21 09:48
SpringCloud
springcloud
config
分布式配置中心
java
k8s实战之部署Prometheus+Grafana可视化监控告警平台
只有这样才能更有效率的保证我们的服务器和服务的稳定运行,常见的开源监控软件有好几种,如zabbix、Nagios、open-flcon还有prometheus,每一种有着各自的优劣势,感兴趣的童鞋可以自行百度,但是与k8s
集群监控
运维开发故事
·
2022-07-08 09:43
kubernetes
运维
docker
kubernetes
master节点重置后添加node报错_Prometheus监控Kubernetes 集群节点及应用
Prometheus监控Kubernetes集群节点及应用博客地址:i4t.com标签(空格分隔):Prometheus2019年06月18日对于Kubernetes的
集群监控
一般我们需要考虑一下几方面
weixin_39633781
·
2022-07-06 09:47
【Redis】集群方案之哨兵模式
主要功能
集群监控
:负责监控redismaster和slave进程是否正常工作消息通知:如果某个redis实例有故障,那么哨兵负责发送消息作为劲爆通知给管理员故障转移:如果masternode挂掉了,会自动转移到
Elephant_King
·
2022-06-29 18:26
Redis
redis
数据库
java
最牛逼的
集群监控
系统,它始终位列第一
点击“终码一生”,关注,置顶公众号每日技术干货,第一时间送达!在本文中,我们将看到Prometheus监控技术栈的局限性,以及为什么移动到基于Thanos的技术栈可以提高指标留存率并降低总体基础设施成本。用于此演示的内容可以在下面链接中获取,并提交到他们各自的许可证。https://github.com/particuleio/teks/tree/main/terragrunt/live/than
终码一生
·
2022-06-22 07:51
kubernetes
docker
运维
vivo 容器
集群监控
系统架构与实践
本文介绍了vivo容器团队根据自身生产环境特点,利用云原生监控生态来构建容器
集群监控
架构的设计思路和方法,同时分享了实践过程中遇到的困难挑战和应对策略。
vivo互联网技术
·
2022-06-20 09:00
vivo 容器
集群监控
系统架构与实践
vivo互联网服务器团队-YuanPeng一、概述从容器技术的推广以及Kubernetes成为容器调度管理领域的事实标准开始,云原生的理念和技术架构体系逐渐在生产环境中得到了越来越广泛的应用实践。在云原生的体系下,面对高度的弹性、动态的应用生命周期管理以及微服务化等特点,传统的监控体系已经难以应对和支撑,因此新一代云原生监控体系应运而生。当前,以Prometheus为核心的监控系统已成为云原生监控
·
2022-06-20 08:28
每天5分钟玩转Kubernetes | Heapster
附上汇总贴:每天5分钟玩转Kubernetes|汇总_COCOgsta的博客-CSDN博客Heapster是Kubernetes原生的
集群监控
方案。
COCOgsta
·
2022-06-18 07:11
读书笔记
kubernetes
docker
容器
大数据项目学习(一)
:Flume/Kafka/Sqoop存储:Mysql/Hasoop/Hbase计算:Hive/Tez查询:Presto/Druid/Kylin可视化:Superset任务调度:Azkaban全流程调度
集群监控
爱爱爱爱五月天
·
2022-05-28 02:50
大数据
《专题五 容器化微服务》之《第三章 云原生DevOps》之《第三节 日志》
3.3.1prometheus入门》110+时序与时序数据库:644+Prometheus介绍与架构:1214+Prometheus部署《3.3.2prometheus深入》029+Kubernetes
集群监控
qq_23204557
·
2022-05-25 09:45
elasticsearch
prometheus
日志/监控
容器化
云原生
Service
Mesh
Kubernetes
集群监控
方案
原文地址:https://blog.51cto.com/ylw6006/2084403本文介绍在k8s集群中使用node-exporter、prometheus、grafana对集群进行监控。其实现原理有点类似ELK、EFK组合。node-exporter组件负责收集节点上的metrics监控数据,并将数据推送给prometheus,prometheus负责存储这些数据,grafana将这些数据通
JulySeven_ju
·
2022-05-20 13:18
企业集群架构学习
kubernetes
容器
云原生
kubernetes性能监控平台
2监控平台搭建2.1平台搭建准备2.2部署守护进程2.3部署prometheus2.4部署grafana2.5查看部署详情2.6打开grafana配置数据源及导入显示模板1集群资源监控概述1)监控指标
集群监控
Michael_lcf
·
2022-05-20 13:11
Linux
kubernetes
docker
容器
容器化 | 构建 RadonDB MySQL
集群监控
平台
上一篇文章我们演示了如何《在S3备份恢复RadonDBMySQL集群数据》,本文将演示在KubeSphere[1]中使用Prometheus[2]+Grafana[3]构建MySQL监控平台,开启所需监控指标。背景Prometheus基于文本的暴露格式,已经成为云原生监控领域事实上的标准格式。RadonDBMySQL监控引擎基于PrometheusMySQLdExporter[5]定义。通过mys
·
2022-05-11 14:04
Redis进阶知识点(可学习,可复习,可面试)
在这里先感谢各位大佬文章目录Redis集群模式Redis主从架构全量同步(sync)增量同步(psync)repl_backlog原理主从同步优化全量和增量区别Redis哨兵Redis
集群监控
原
小威要向诸佬学习呀
·
2022-05-02 13:20
redis知识总结
redis
面试
学习
五一假期快乐
java
BigData大数据开发路线详细完整结构知识体系学习大全(2022)
BigData一、基础知识(一)采集:(二)存储:(三)计算:(四)查询:(五)可视化:(六)任务调度:(七)
集群监控
:(八)元数据管理:(九)数据质量监控:二、开发平台(一)Hadoop大数据处理框架
REMLILI
·
2022-04-22 20:46
虚拟化
分布式
大数据
bigdata
hadoop
spark
linux
一文读懂Thanos多
集群监控
关注「开源Linux」,选择“设为星标”回复「学习」,有我为您特别筛选的学习资料~在本文中,我们将看到Prometheus监控技术栈的局限性,以及为什么移动到基于Thanos的技术栈可以提高指标留存率并降低总体基础设施成本。用于此演示的内容可以在下面链接中获取,并提交到他们各自的许可证。https://github.com/particuleio/teks/tree/main/terragrunt
开源Linux
·
2022-04-15 10:50
运维
大数据
编程语言
分布式
java
一文搞懂 Prometheus 多
集群监控
神器 Thanos
公众号关注「奇妙的Linux世界」设为「星标」,每天带你玩转Linux!1介绍在本文中,我们将看到Prometheus监控技术栈的局限性,以及为什么移动到基于Thanos的技术栈可以提高指标留存率并降低总体基础设施成本。用于此演示的内容可以在下面链接中获取,并提交到他们各自的许可证。https://github.com/particuleio/teks/tree/main/terragrunt/l
运维之美
·
2022-04-15 09:55
分布式
java
大数据
kubernetes
数据分析
CDH6 离线安装
一、环境准备1、CM简介ClouderaManager是一个拥有集群自动化安装、中心化管理、
集群监控
、报警功能的一个工具,使得安装集群从几天的时间缩短在几个小时内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率
·
2022-03-24 14:12
cdh5hadoop
介绍一款自己常用的磁盘存储状态监控工具——WGCLOUD
WGCLOUD是一款开源运维监控工具,非常的轻量和高效,具有分布式,
集群监控
等能力主要针对物理主机,虚拟机,云主机,以及服务器上的应用、端口、日志文件等资源进行实时监测其中磁盘存贮状态,是WGCLOUD
·
2022-03-05 08:28
大数据平台安装部署--CDH6.2版本【集群】
简单来说:CDH是一个拥有集群自动化安装、中心化管理、
集群监控
、报警功能的一个工具(软件),使得集群的安装可以从几
大自然的农民工
·
2022-02-28 11:37
big
data
hadoop
hdfs
大数据平台安装部署--CDH6.2版本单机
一、CDH介绍CDH是一个拥有集群自动化安装、中心化管理、
集群监控
、报警功能的一个工具(软件),使得集群的安装可以从几天的时间缩短为几个小时,运维人数也会从数十人降低到几个人,极大的提高了集群管理的效率
大自然的农民工
·
2022-02-28 11:36
big
data
hdfs
hadoop
大数据项目实战数仓4——总纲
、项目需求及架构设计1.项目需求分析2.项目框架2.1技术选型2.2系统数据流程设计2.3框架发行版本选型2.4服务器选型2.5集群资源规划设计三、相关命令可视化报表Superset即席查询Kylin
集群监控
未来影子
·
2022-02-28 10:17
大数据项目
big
data
数据仓库
大数据
CDH6 离线安装
一、环境准备1、CM简介ClouderaManager是一个拥有集群自动化安装、中心化管理、
集群监控
、报警功能的一个工具,使得安装集群从几天的时间缩短在几个小时内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率
·
2022-02-27 17:09
cdh5hadoop
mongoDB生态-可视化工具
可视化的运维管理系统1.MongoDBcloudmanager它是官方推出的运维自动化管理工具系统,是其企业版才支持的功能,社区也可以下载使用1.MongoDB集群(复制集,分片)的自动化部署2.
集群监控
及报警定制
北京大数据苏焕之
·
2022-02-22 06:32
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他