E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
On-Call
3.SRE.操作手册:基础篇
SRE的职责并不只是将“所有工作”都自动化,并保持“
on-call
”状态。一.入门系统成熟度级别划分:1.一个处于开发中的绿地应用,目前还没做过任何生产部署。2.一个生产系统
明明改变世界
·
2022-04-13 13:00
DEVOPS的一些想法
GoogleSRE教了我们很多方法论,比如怎么做设计一个分布式监控系统,软件过载了怎么处理,面对日常琐事怎么执行
on-call
轮值等等,这些都是Google在践行DEVOPS道路上总结出来的非常宝贵的经验
小卢二
·
2021-04-23 23:24
有效运维的
on-call
机制
[编者按]本文作者为陈伯龙,云告警平台OneAlert创始人,著《云计算与OpenStack》,在IT运营管理、云计算方面从业10多年。正文互联网技术的发展,离不开运维支撑工作,没有零bug的程序,没有不出问题的系统,问题故障不可怕,可怕的是没能有序的处理:突发紧急事件太多,疲于应付,团队士气低下,效率不高。重要事情淹没在大量事件中,没有有序跟进处理,会引发严重业务影响。如何有效处理紧急事件驱动的
OneAPM官方技术
·
2020-09-16 19:23
云告警
事故报告撰写(参考《SRE Google 运维解密》)
on-call
工程师需要人工介入的事故(包括回滚,切换用户流量等)问题解决耗时超过一定限制监控问题(预示着问题是由人工发现的,而非报警系统)事故报告对事不对人,是
言十年
·
2020-08-21 19:53
如何提问面试官
职责
On-call
(电话值班)的计划或者规定是什么?值班或者遇到问题加班时候有加班费吗?我的日常工作是什么?团队里面初级和高级工程师的比例是多少?(有计划改变吗)入职培训会是什么样的?自己单独的
不会飞的渡渡鸟
·
2020-08-21 03:54
编辑器
SRE Google 运维解密--管理
一、迅速培养SRE加入
on-call
在SRE团队的职责中,主动性任务和被动性任务兼有,每个SRE团队都坚守的一个重要目标是:利用积极主动的办法,去减少和限制被动性工作的产生。
运维个西瓜
·
2020-08-10 02:45
架构设计
有效运维的
on-call
机制
[编者按]本文作者为陈伯龙,云告警平台OneAlert创始人,著《云计算与OpenStack》,在IT运营管理、云计算方面从业10多年。正文互联网技术的发展,离不开运维支撑工作,没有零bug的程序,没有不出问题的系统,问题故障不可怕,可怕的是没能有序的处理:突发紧急事件太多,疲于应付,团队士气低下,效率不高。重要事情淹没在大量事件中,没有有序跟进处理,会引发严重业务影响。如何有效处理紧急事件驱动的
OneAPM_Official
·
2020-04-03 07:26
服务治理的一些思考
这个话题可以写一本书.但核心问题是知识管理.单一服务报警,
on-call
工程师无法准确评估是否下游服务会受影响,或者是哪些上游服务有问题例
haitaoyao
·
2020-03-19 03:30
闲话IT运维---学习Google SRE不易
SRE的的几个核心方法论:1)确保运维人员长期关注研发工作;2)在保障服务SLO的前提下最大化迭代速度;3)重视监控系统;4)应急事件处理,重视运维手册维护以及
on-call
机制;5)变更管理自动化
yanndy
·
2020-03-13 04:10
OneAlert 携手 BearyChat(倍洽)快速构建 IT 运维
on-call
机制
并且能够帮助中⼩企业快速构建IT运维7x24⼩时的
on-call
机制,随时响应解决故障/问题。
OneAPM_Official
·
2019-12-14 13:06
《发布!设计与部署稳定的分布式系统(第2版)》译者序 v0.3
“铃铃铃……”办公桌上的
on-call
电话竟然响了。坐在空荡荡的办公室里值夜班的我,心里咯噔一下。我看了看表,凌晨2点多。
吾真本
·
2019-12-13 20:09
论做人做事“靠谱”这一难能可贵的品质
最近因为临近预产期,再加上身体有一些不适,老板安排我以
on-call
的状态休预备产假,尽量让我休息,紧急情况再call我。
小薇Veronica
·
2019-11-29 09:32
回答面试结束最后,面试官问的你有什么问题想要问我的吗?
职责
On-call
(电话值班)的计划或者规定是什么?值班或者遇到问题加班时候有加班费吗?我的日常工作是什么?团队里面初级和高级工程师的比例是多少?(有计划改变吗)入职培训会是什么样的?
张哲溪
·
2019-10-22 23:38
我们不生产报警,我们只是报警的搬运工
作者简介芃熙百度云高级研发工程师负责百度云Noah监控产品报警系统的设计和研发,在大规模分布式系统、监控、运维
on-call
方面具有广泛的实践经验。
AIOps智能运维
·
2018-07-20 18:57
OneAlert 携手 BearyChat(倍洽)快速构建 IT 运维
on-call
机制
并且能够帮助中⼩企业快速构建IT运维7x24⼩时的
on-call
机制,随时响应解决故障/问题。
OneAPM蓝海讯通
·
2018-04-10 00:00
运维自动化
高效运维最佳实践:如何做好
On-call
和事故响应?
太多的公司所用的
on-call
轮转和事故响应流程让团队成员感到紧张、焦虑、痛苦。特别是,许多优秀的工程师只是由于这个原因而拒掉工作。并非一定要这样。
cpongo2
·
2017-05-14 11:38
centos下整合PagerDuty、nagios初探(
on-call
尝鲜和体验)
【前言】 今天在某个群里看见有人介绍了PagerDuty,介绍到了slack。整合后可以更加方便和团队合作。于是我觉得来尝尝鲜。【PagerDuty是什么?】 PagerDuty是一款能够在服务器出问题时发送提醒的软件。在发生问题时,提醒的方式包括屏幕显示、电话呼叫、短信通知、电邮通知等,而且在无人应答时还会自动将提醒级别提高。该软件通过一个控制面板对问题进行监控。官方网站:http://
茄子_2008
·
2016-06-06 23:00
清理300多台MySQL数据库的过期binlog日志
早晨睡梦中,被
on-call
了,说磁盘报警,赶紧起来打开email,收到上百封email报警,数据库磁盘不够了,查询了原因 [xxx@xxxx cacti]$ ssh xxxx "df
·
2015-11-13 02:29
binlog
清理300多台MySQL数据库的过期binlog日志
早晨睡梦中,被
on-call
了,说磁盘报警,赶紧起来打开email,收到上百封email报警,数据库磁盘不够了,查询了原因[xxx@xxxxcacti]$sshxxxx"df-h" /dev/mapper
mchdba
·
2013-10-12 11:00
上一页
1
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他