马凯-运维

运维

保障高运维质量,提高运维效率,保持低运营成本

自动化、智能化、可视化

技术:

1.       全生命周期自动化管理

自动化处理,提升运维的人均维护效率,满足业务的敏捷要求,以工作流为中心的自动化作业平台,复杂操作简单化:自动化作业平台提供了把日常运维经验标准化和工具化的框架,有利于运维经验的固化与共享。

此外,利用平台提供的通用框架能力,运维人员还可以按需定制自动化作业。运维人员完成原子脚本开发后进行脚本可视化编排后提交,平台可以自动调度和分发执行,完成各种场景复杂作业的在线管理和自动执行。标准化与一致性运维是基础;标准化与一致性运维是基础;软件一键发布,7×24永远在线;移动运维

2.       智能化的故障预防、发现与自愈

传统模式下,运维人员的工作模式是被动等待问题发生,然后再进行故障处理。根据有关数据统计,运维人员平均每天计划内的工作只占50%左右,剩下的时间都是在到处救火。随着云数据中心规模快速增长,运维人员需要处理的事件量越来越大,人工救火将力不从心。这就需要一个智能的运维平台,利用大数据关联分析与机器学习技术为运维系统赋予人工智能,提供从故障预防到故障定位、再到故障闭环的智能保障能力。

关键措施1:减少人工操作引入故障;关键措施2:系统亚健康智能分析,提前发现故障隐患。关键措施1:构建全链路、主动、智能的全方位、多手段和多指标监控体系,关键措施2:系统运行状态可视化。关键措施1:利用业务流跟踪系统快速故障定界,关键措施2:构建专家诊断系统,智能根因定位、已知故障自动化恢复处理。

3.       智能化容量运营提升资源利用率

云数据中心中,容量管理会向运维管理员提供低负载资源的分布信息,并提供缩减资源规格的建议;资源碎片化一般会导致20~30%“资源不可用”的情况,容量碎片管理向运维管理员提供各种资源规格的物理分布视图,并提供资源调整建议,提升现有资源的利用率。智能化的容量管理能够实现现状可视、问题可察、风险可辨、未来可测和调整可控,使云数据中心内资源的利用率提升到70%以上的水平。

 

运维比较成功的云数据中心,通过自动化和智能化的运维体系,面对百万级的服务器规模,在保障用户级99.95%甚至更高服务质量的前提下,实现了云数据中心运维效率的结构性提升:人均维护效率从传统人均50~100台提升至5000~10000台,效率提升100倍以上;而总体资源利用率从传统小于20%提升至60~70%,效率提升3倍以上

 

子豪

一.按系统功能模块分:

      1.统一运维管理门户、

      2.业务运营管理、

      3.IT 服务管理、

      4.集中监控管理

      5.云管理

 

1.集中监控管理

      1.总体架构:

           CA service assurance 对IT管理

           U2000 网络管理  或者CA监控网络

           华为ISM 存储管理

           华为OSS统一告警信息

      2.三个层次

           数据采集层 数据处理层  数据呈现层  

 

2.IT服务管理

      1.功能和流程:

           服务台,服务请求管理,事件管理,问题管理,变更管理,发布管理,配置管理

      2.分层次管理

           服务流程梳理层,web访问层,对象处理层,数据引擎层

 

3.统一运维管理门户

      功能:实现数据中心管理内容的统一展示和控制(包括服务器,数据库,中间件,存储,网络)

1.   综合报表功能

2.   DASHBOARD功能

创建角色,决策层,管理层,运维层用户等不同的权限

Portlet工具,视图自定义

 

4.云管理

      Manageone实现云计算环境管理

      ·fushionsphere 实现自动化部署,并实现对物理资源 监控管理,将结果送给监控管理平台处理

      ·结合BSS和OSS系统功能,实现运营运维一体化

     

      华为云管理平台总体架构:

1.   云门户:自助服务子系统和后台管理系统

2.   运维管理系统:实现云资源的配置,性能和安全管理

3.   Fs云软件平台,包括虚拟化平台系统UVP,和ARS自动资源调度,IMGS镜像管理

4.   报表系统

 

 

 

5.业务运营管理

      业务运营+业务管理+业务的自服务

     

      业务管理包括:产品的目录制作,服务定价等规划设计,

      业务运营包括:日常运转,订单,合同,计量,计费的管理

技术架构:

      客户自助管理+web访问层+业务管理运营层+对象处理层+数据存储层

   

 

二.基于SDN技术的精细化解决方案

      CLOUD Fabric 解决方案,核心内容为Fabric insight的精细运维解决方案

 

功能:

1.   将业务。逻辑,物理三层网络对应的应用质量,物理王媛,功能特性实现全面统计分析,实现大规模运营管理简单化;

2.   全网周期性路径质量扫描,实时调整网络配置,提高探测效率,实现分钟级故障定位

 

     

     

     

 

你可能感兴趣的:(云)