高负载下的应用性能保障 游戏行业性能解决方案

从单机游戏到网络游戏,从客户端游戏到网页游戏再到如今的手机游戏、H5游戏,游戏业一直是IT产业中发展最活跃、用户价值最高的领域。特别是近几年,得益于移动互联网的普及,以及游戏与文学、动漫、影视等产业的水乳交融,游戏不再是年轻人的专属,各年龄层的电脑和手机用户都能享受到游戏的乐趣,游戏业更是呈现出百花齐放、百家争鸣的良好发展态势。

行业背景
网络游戏市场的蓬勃发展,既是广大游戏公司的机遇,也是挑战。随着市场上涌现出越来越多的各式各样的游戏作品,游戏玩家的口味也变得越来越挑剔,对于游戏公司来说,从产品的开发到上线运营,都必须以用户体验为核心,才有可能在同质化严重的市场竞争中脱颖而出,实现高转化率、低流失率和高ARPU收益。

无论是端游代表作《英雄联盟》、《穿越火线》、《魔兽世界》,还是手游吸金大热门《部落冲突Clash of Clans》、《天天酷跑》、《刀塔传奇》,可靠的应用性能是良好用户体验的坚实基础,而频繁闪退、服务器响应缓慢、卡顿、崩溃的游戏,即便设计再杰出也无法留住用户的心。

用户需求
网络游戏,简称“网游”,英文名称为Online Game,是指以互联网为传输媒介,以游戏运营商服务器为平台,通过用户计算机或手机、平板、智能电视等终端设备,在游戏客户端或网页实现玩家交互的多人在线游戏,其中MMORPG游戏以丰富的玩家互动,吸引了大部分重度游戏玩家的注意力,而手游的异军突起,则让卡牌、跑酷等弱交互网游成为了游戏玩家的新宠。

高负载下的应用性能保障 游戏行业性能解决方案_第1张图片



网络游戏通常都是7*24小时服务的,这就要求作为系统支撑的服务器、数据库、网络负载均衡等设备连续稳定运行,数据库、中间件等应用系统在高负载状态下仍能及时响应,用户终端上安装的游戏客户端或应用必须与系统兼容,才能保证游戏不出现卡顿、崩溃等灾难性事件,然而这并不现实。

造成一款网游访问体验不佳的原因有很多,主要是由以下问题造成的:
一, 用户终端设备环境千差万别,游戏客户端或应用与系统不能完全兼容,或系统配置不高影响游戏运行;

二, 玩家所使用的网络状况不一,特别是移动网络质量容易对游戏体验造成较大影响;

三, 服务器在线人数达到上限,服务端某个环节出现性能瓶颈,响应速度缓慢;

四, 由于外挂或其它游戏作弊工具的非正常数据包传输,导致游戏服务器逻辑出现混乱,从而造成宕机。

此外,网络游戏都是采用敏捷开发,快速迭代的交付方式,游戏上线之前虽然都会进行黑盒、白盒和压力测试,但新版本上线之后用户会遇到各种BUG,并通过游戏运营反馈上来。因此,游戏开发商需要一套完整的面向业务的应用性能管理解决方案,才能第一时间采集到用户、网络、系统端的各种问题,反馈到运维或开发端进行解决,并及时通过运营人员反馈给玩家。

解决方案
云智慧游戏行业解决方案是一套面向网络游戏业务的全栈应用性能管理解决方案,能够在游戏上线之前通过全球分布式网络,基于真实业务场景与用户行为进行真实压力测试,发现全链路性能瓶颈;在游戏上线后对网络游戏IT基础设施和应用服务进行全面监控,通过向游戏应用、客户端嵌入探针和Smart SDK来跟踪真实用户的游戏体验,并把性能数据与用户留存、转化率等业务数据结合,为游戏运营提供可视化数据分析。

云智慧游戏行业解决方案的数据分析功能包括:
1. 用户行为分析:包括行为动作、行为流程、用户分析。

2. 网络分析:包括HTTP错误率、HTTP错误类型、错误数量等。

3. 运营分析:包括运营商、系统版本、APP版本、设备。

4. 崩溃深度分析:包括客户端、APP崩溃日志、崩溃汇总统计、崩溃版本统计、崩溃操作系统统计、崩溃设备统计、崩溃发生次数、bug数统计等。

5. 接入方式分析:按设备的接入方式分析各维度的性能数据,如响应时间、活跃设备数、网络错误率等。

6. 网络劫持监测:监测到客户端、APP请求的主机是否是真正的主机,是否被劫持,根据事先定义好的规则判断劫持的发生和分析劫持发生的地域和运营商。

7. 设备分析:根据移动设备的机型对设备的性能数据进行分析,包括响应时间、吞吐率、活跃设备数、网络错误率等。

8. 应用拓扑分析:通过应用拓扑图分析服务调用的外部服务器主机及该主机的性能状况,包括汇总数据、每台服务器的性能数据。

9. 压测分析:提供云压力测试方案,同时支持网页、客户端、移动应用等不同接入方式,真实快速地对应用后台的性能进行全方位的验收体检。

高负载下的应用性能保障 游戏行业性能解决方案_第2张图片



HTTP响应时间变化曲线



高负载下的应用性能保障 游戏行业性能解决方案_第3张图片



崩溃次数变化曲线



高负载下的应用性能保障 游戏行业性能解决方案_第4张图片



吞吐率趋势



通过对监控数据的分析,进行相应的告警和报表输出。

1. 告警:当系统出现异常时,系统产生告警信息,包括设备告警、性能告警、应用告警、网络通信告警、环境告警等,告警以声音、色彩、短信等方式通知管理员。

2. 报表:对监控项目进行整体分析和趋势预测,并以pdf、word等格式自动发送到指定邮箱。

方案特色
云智慧游戏行业解决方案能够帮助游戏企业通过海量性能数据的实时监控分析,实现如下目的:

1. 通过应用性能管理,帮助开发人员准确定位应用崩溃、加载缓慢等各种故障与性能问题的根源;

2. 通过IT监控告警平台,帮助运维人员实时发现IT系统、数据中心、CDN运行故障,缩短故障解决时间;

3. 通过模拟真实的用户行为,生成真实并发负载去访问系统的应用服务器,进行压力测试,快速找出系统的瓶颈,提升系统性能。

4. 通过多维可视化数据实现用户业务流程与性能的智能关联分析,帮助企业提升用户留存率,降低开发运营成本,提高核心竞争力。

更多相关技术文章请关注云智慧官方微信(cloudwise2014)

高负载下的应用性能保障 游戏行业性能解决方案_第5张图片


你可能感兴趣的:(高负载下的应用性能保障 游戏行业性能解决方案)