OSchina源创会体验随记

这次参加的OSCHINA的源创会内容很多,从分布式巨杉数据库说起,到淘宝的mysql数据库平台维护,到运维的工具开发,再到docker的创新应用,最后到华为的开发板,5个主题,给我感觉是横跨整个IT界。但我最感兴趣,觉得最好的还是腾讯的王老师他分享的内容。


王老师他分享的内容用他自己的话来形容,是运维工具总动员,在开场就对运维的总体进行了总结,他认为在运维的过程中必定会经历四个阶段

第一个阶段是统一化--在这个阶段中使用统一的硬件平台,统一的资源架构等等,统一的流程,统一化带来的好处是成本的降低,质量的提高,效益的增加。

第二个阶段是基础化--这个过程中采用之前建立的统一化基础,将运维的几大基础内容建立完善,使用统一的监控,统一的部署,统一的日志框架。

第三个阶段是自动化运维--通过自动化运维,实现能用程序来搞的就不用人来搞。。。

第四个阶段是大数据挖掘--将自动化积淀下来的数据进行分析获取,得到规律总结,帮助故障定位,快速分析解决问题。


自动化运维工具的一些思考

随着自动化运维工具的开发的不断推进,自动化运维系统越来越完善,功能越来越强大,实现了只要点一点鼠标就能轻易的配置完成系统。到了最后连基本的shell脚本都忘记怎么写了。而且系统开发完成后失去了迭代性,运维工具很难继续发展。即前任栽树后人无法乘凉的问题。

这样的问题腾讯怎么解决呢,运维工具SDK化,通过SDK化将运维工具在企业内部公布,实现产品的可迭代更新。实现前人栽树,后人维护,大家乘凉。


故障问题分析

系统有没有问题,只要看dashbord就可以了。工具用久了以后,脚本不会写了,除了看dashbord以外不知道该怎么去解释分析问题了。


dashbord解释-- dashbord的英文解释为仪表板,在这上面应该集成了所有的服务器信息,可以用来进行故障错误分析。


腾讯CLIP介绍:

这个是腾讯内部的一个运维工具,通过这个工具,解决了服务器IP与服务器描述的对应关系,是一个类域名解析工具,通过这个工具,除了能实现域名解析的功能,从新定义了命名规范不在依靠xxx.com来命名可以xxx-xxx-xxx来实现,还能实现隐藏信息的获取,比如XX服务是干什么用的,自动生成与puppet的配置文件,下发执行。


CLIP的开发过程

分析问题 自动化运维面临的问题

海量IP管理时,使用EXECL or CMDB管理IP?

IP相似导致的系统故障

ip写入监控脚本,多年后ip 下载需要找到下线的ip脚本,并替换新ip


功能设计 自动化工具设计思想与初衷

收敛记忆见名识意

工具+ cmdb>2 称呼x关系系统

基于x关系系统集成上对服务器进行管理与命令圣荷

提供api接口,让个系统能够方便的获取到服务的ip关系

提供开放文档,让更多的人了解他的原理,以及共同开发


解决思路 问题解决过程

ip维度替换为string维度,通过名字系统来管理服务

string命名犹如域名解析系统

DOCKER容器,降低负载的服务器,通过docker放到服务器上


CLIP

是c/s架构他将ip关系保存在服务端,客户端用来替换解析对应的服务

CLIP  SDK

CLIP+puppet

puppet 传输信令




你可能感兴趣的:(OSchina源创会体验随记)