大规模分布式系统监控技术研究与应用——论文复现01

云计算服务平台:

        基础设施即服务(IaaS):为云平台提供如虚拟机等基础设施服务

        云平台及服务(PaaS):为云平台提供应用开发和部署环境

        软件即服务(SaaS):将成熟应用直接作为服务提供给客户

分布式系统的关键目标

        能让用户方便的与资源链接、透明性、开放性、可扩展性。

 

分布式系统分类:

       用于高性能计算任务的分布式计算系统;

       针对大量网络应用,对其逐步分割成各自独立的组件,降低耦合程度进行处理的分布式信息系统以及分布式事务处理系统等;

       为多种类设备提供适配以及自主合成平台的分布式普适系统等;

       使各种异类的计算机和网络都呈现为单个系统而用一个“软件层”组织起来,逻辑上位于用户和应用程序间,称为“中间件”。

分布式性能监控系统:

       集群性能监控;分布式系统调用追踪。

分布式追踪系统:

        解决问题:异常检测、稳态诊断、性能监控、结构分析、资源使用属性

               异常检测:重大问题,涵盖99%的主要工作流

               稳态诊断:异常仅覆盖50%到75%的调用工作流

               分布式结构分析:发掘系统中缓慢的组件和进程

               资源使用属性:检测基础性能消耗数据 

快速异常诊断以及降低监控数据查询采集查询消耗:

        后验式调用链采集方案

        基于决策树分类方法的调用链故障诊断方法

        基于散列概要森林的时序数据索引方法

你可能感兴趣的:(分布式系统)