EMR重磅发布智能运维诊断系统(EMR Doctor)——开源大数据平台运维利器

简介: E-MapReduce 推出面向开源大数据集群的智能运维诊断系统 E-MapReduce Doctor,有效提升大数据集群运维效率,辅助 EMR 用户完善集群监控体系。大数据运维的挑战—如何保证集群稳定与运行效率企业级大数据集群通常拥有海量的数据存储、日常运算成干上万的计算任务,需要满足各类上层业务的计算需求。对于这类集群的运维往往充满着挑战:海量的数据、庞杂的组件以及组件之间复杂的依赖关系、对于时效要求的的运算任务,都会提升运维难度。作为支撑平台,大数据集群的稳定性和运行效率,会直接影响到公司业务的正常运作和发展。
EMR重磅发布智能运维诊断系统(EMR Doctor)——开源大数据平台运维利器_第1张图片
集群管理员往往对整体集群做好了监控运维体系,对于大数据集群,简单的监控运维体系能够帮助管理员在遇到故障的时候定位问题。但对于整体集群的运行效率,集群的状态,通过单纯的监控指标很难给出一个全面的解答。 对于大数据集群,管理员以及 CIO 等更关注以下的内容:集群内的节点的运行状态和资源使用状况;运行在集群上的服务组件的状态监控和异常处理,包括 YARN、HDFS、Hive 和 Spark 等;计算任务运行情况和执行效率;整体集群的健康程度和如何改进。  面对运维挑战,EMR重磅推出:智能运维诊断系统(EMR Doctor)为了提升大数据集群运维效率,辅助 EMR 用户完善集群监控体系。E-MapReduce 推出面向开源大数据集群的智能运维诊断系统 E-MapReduce Doctor(简称EMR Doctor)。 EMR Doctor 作为开源大数据集群的管家,会自动每日巡检集群。集群管理员只需要定期查看健康检查报告,并且根据报告中的建议对集群做相应的优化调整,即可全局了解集群的健康状况和动态走势,并保持集群的健康度。 如何使用 EMR Doctor进入 EMR 控制台健康检查页面。登录 EMR on ECS 控制台。在顶部菜单栏处,根据实际情况选择地域和资源组。在集群管理页面,单击目标集群的集群ID。单击上方的健康检查页签。 在健康检查页面,您可以看到当前集群的健康检查报告(T+1)。健康状态列显示了该集群的健康度,您可以点击查看报告进入检查报告页面。

 健康检查报告中包含集群计算资源的总体分析

 健康检查报告中包含计算任务从各个维度的排名并给出任务调优建议

 健康检查报告中包含对集群存储的总体分析,以及大小文件和冷热数据的详细分析
EMR重磅发布智能运维诊断系统(EMR Doctor)——开源大数据平台运维利器_第2张图片
 健康检查报告主要分析内容如下,更详细说明请参见查看健康检查状态和报告计算资源分析概述状态概述需要关注的问题计算基础信息集群计算评分集群算力内存时集群算力CPU时计算引擎内存算力时计算任务信息计算任务算力内存时分析计算任务评分排行榜SparkSpark任务算力分析及调优建议TezTez任务算力分析及调优建议MapReduceMapReduce任务算力分析及调优建议HDFS存储资源分析(需开启存储资源信息采集开关)概述状态概述需要关注的问题HDFS基础信息HDFS存储资源使用趋势文件总数随时间变化趋势评分趋势HDFS文件大小分布HDFS文件大小比例一级目录空文件个数Top10一级目录极小文件个数Top10一级目录小文件个数Top10一级目录中等文件个数Top10一级目录大文件个数Top10HDFS冷热数据分布HDFS冷热数据一级目录极冷数据大小Top10一级目录冷数据大小Top10一级目录温数据大小Top10一级目录热数据大小Top10HIVE存储资源分析(需开启存储资源信息采集开关)概述状态概述需要关注的问题Hive基础信息存储趋势文件数量趋势评分趋势Hive库信息库存储排名库文件总数排名库评分Hive表文件大小分布Hive表文件大小分布比例Hive表空文件个数Top10Hive表极小文件个数Top10Hive表小文件个数Top10Hive中等文件个数Top10Hive大文件个数Top10Hive冷热数据分布Hive冷热数据分布Hive表极冷数据大小Top10Hive表冷数据大小Top10Hive表温数据大小Top10Hive表热数据大小Top10Hive表存储格式分布Hive表存储格式分布Hive表TextFile/Parquet/ORC格式文件分析  如何开通EMR Doctor开通及使用咨询问题请见 EMR Doctor常见问题EMR-3.39.0之前版本、EMR-5.5.0之前版本,EMR-4.10之前版本需要手动开通健康检查功能,请参见开通指南EMR-3.39.0及更高版本,EMR-5.5.0及更高版本,EMR-4.10及更高版本默认提供健康检查功能,无需手动开通。  欢迎钉钉扫码加入EMR Doctor用户技术交流群获取集群运维最新功能和最佳行业实践~
EMR重磅发布智能运维诊断系统(EMR Doctor)——开源大数据平台运维利器_第3张图片
 原文链接:https://click.aliyun.com/m/10...本文为阿里云原创内容,未经允许不得转载。  

你可能感兴趣的:(后端)