原文地址:http://www.itkoala.com/

原文作者:唐文(kevintang),先后在腾讯、盛大、百度工作,曾负责腾讯四大平台之一网络媒体平台整体运维、运营,对海量互联网产品运维支撑、运营规划、性能优化、成本控制、平台建设、质量效率等有丰富的经验积累,目前就职于百度,T6资深工程师,负责百度产品线访问速度优化改进工作,百度UAQ平台负责人,百度运维技术委员会成员。(Email:[email protected])

 

 关于海量运维、运营规划,我想业界都没有准确的定义,假如说互联网的架构师用能否设计多高的摩天大楼来衡量架构能力,那运维、运营更多的是在关注互联网服务的质量、效率、成本、故障、瓶颈,用户的忍耐、抱怨等问题。

在接下来的日子里,将以质量、效率、成本为核心,从运营规划、管理、流程/规范、系统/平台,监控、告警、安全、优化、考核等几个维度结合案例来与大家分享自己的体会,内容大致如下所示。

关于互联网运维、运营 四月 28th, 2010

关于互联网运维、运营,给人第一印象是有些拗口,此外更多的是歧义,互联网企业有这样的岗位吗?感觉像是产品、内容、游戏运营之类的岗位。说说我对这个岗位的理解,首先看看腾讯有那些岗位及分类。

综上所述,这里对运维、运营的理解有综合、抽象了技术支持类多个工程师的属性,比如应用运维、运营服务管理、系统管理等,可以理解为是一种综合素养和协调能力,具体的工作大致如下:

1、运营规划,提供运营综合规划支持,分析业务发展需要的资源趋势,规划IDC资源,并驱动实现并与运营预算对齐。

2、运营预算,负责维护产品设备预算,带宽预算,专线预算的申请和滚动更新,并对运营预算结果和运营成本负责。

3、运营支持,负责运营服务器的日常管理与相关系统的信息变更管理;负责访问策略、域名管理、IP管理等基础运营需要支持。

4、系统运维,负责产品的运营服务器的系统运维、系统监控与安全保障、系统性能分析和优化等工作;随时待命,处理产品可能遇到的问题,突发事件管理。

5、应用运维,负责业务的部署,新版本的发布,服务端的变更;负责监控业务的运行状况,及时处理业务运行中出现的故障,保障业务服务正常可用。

6、运维需求,负责与各开发项目组的日常沟通交流,接受并处理项目组提出的运维需求。

7、运营数据分析、挖掘,负责产品的业务数据分析与挖掘,性能分析与系统优化,问题跟踪与管理,负责定期给出业务运维状况报告。

8、运营流程、规范、制度,负责产品运维流程的探索,产品运维工作范畴与深度方面的文档建设,进行与运维相关的新技术研究;负责系统运维的知识管理体系、流程与文档建设。

9、运营接口、平台、培训,负责承担部门内的运营/运维技术培训,负责公共类运维支撑平台的建设和在部门内的推行;负责与外部门的交互,包括外部信息对内的知会,内部需求对外的反馈。