大数据分析在移动通信网络优化中的应用研究

大数据分析在移动通信网络优化中的应用研究

摘要:随着新的移动通信技术的应用及移动互联网的发展,我国的移动通信用户已经达到了10亿级规模。由于移动互联网应用的快速发展,例如QQ、微信、微博等,移动通信用户对于移动通信数据业务的需求越来越多,进而要求也越来越高。我国移动通信网络建设经历了建设期、发展期后,己经步入了稳定期。但是,稳定期需要的是创新,稳定期用户基数大,需求多,感知要求高。因此,基于大数据分析技术的应用及基于数据库技术的存储与分析体系需求就应运而生,传统的人力优化方法及粗浅的计算机技术应用已经不能满足当前移动通信网络用户的需求,使得移动通信网络优化工作达到了一种瓶颈。
目前,某地区移动通信网络用户需求主要在于网络信号的覆盖以及网络下载速率的感知等方面。针对移动通信网络优化的工作吸引大量的网络咨询公司、大数据处理公司及相关研究机构的重视。本文主要针对日常移动通信网络优化工作的三个方面:道路测试、后台数据分析、网络投诉处理进行基于大数据分析技术的优化应用研究,提出由点及线、由线到面的多纬度优化方案。这样可以全方位、多角度的对移动通信网络优化工作中存在的瓶颈进行综合分析,并提出相应的解决措施及辅助应用工具,从而节约网络优化人员的时间和精力,提高其工作效率。
关键词:大数据分析;移动通信;网络优化;应用研究

Abstract:Because the color of jade is very good and can be displayed by the owner is 2290 generous, love many people, in the modern society is very popular, but in the period of Qing Dynasty, jade jewelry is very prosperous, in order to find the reasons of the prosperity of Qing Dynasty jade jewelry, so for different periods of Qing Dynasty analysis plays an important role in the development of the historical process of China jade jade in his development is very early, than the bronze culture development earlier, and in the Yangtze River and the the Yellow River river near the jade culture is very prosperous, the formal jade culture, better make a great contribution to the development of the Qing Dynasty jade jewelry, jade jewelry in the Qing Dynasty is widely popular in the folk and the royal family, the popularity is not Often the wide use, and this jade jewelry is also very wide, especially in the Qing Dynasty’s politics, we know that the late Qing Dynasty is very troubled, so the Qing Dynasty rulers in order to reassure the public, so that the Qing Dynasty rulers in order to better stability, so strong the implementation of jade jade culture and prosperity so as to vigorously promote the jade jewelry in the Qing dynasty. This article mainly take the history as the clue, better to analyze how the jade jewelry prosperous in the Qing dynasty.
Key words: jadeite jade; Qing Dynasty; reason; analysis.

目录

1绪论 1
1.1.研究背景 1
1.2研究意义 2
2基于矩阵分析的路测数据预测 2
2.1路测数据问题预测分析 3
2.2干扰矩阵分析概述 4
2.2.1什么是手机测量数据 4
2.2.2为什么使用手机测量数据 4
2.3基于矩阵分析的路测数据预测方案 5
2.4基于矩阵分析的路测数据预测模型 5
2.4.1路测数据采集 5
2.4.2干扰数据采集 6
2.4.3建立矩阵分析模型 6
2.4.4路测数据分析预测 6
3基于聚类分析的后台数据优化 7
3.1后台数据分析的困境 7
3.2后台数据库与网络结构 8
3.3基于聚类分析的后台数据优化方案 9
3.4基于聚类分析的后台数据优化模型 9
3.4.1后台数据采集 9
3.4.2后台数据分类 10
3.4.3建立聚类分析模型 11
3.4.4后台数据自动优化 11
4.基于关联规则的网络投诉数据分析 12
4.1网络投诉工作的困境 12
4.2投诉分析与问题定位 13
4.3基于关联规则的网络投诉分析模型 13
4.3.1网络投诉数据采集 13
4.3.2用户业务数据采集 14
4.3.3建立关联分析模型 14
4.3.4网络投诉问题自动定位 15
4.4基于关联规则的网络投诉分析的应用 15
参考文献 17
辞谢 18

1绪论

1.1.研究背景
随着移动通信技术的发展与国家对通信产业的布局,我国移动通信网络建设规模与用户数量均达到了世界上的顶级水平。移动通信网络的发展必须经历的流程就是规划、建站、测试、维护、优化等。不过,移动通信网络的发展不是一践而就的,而是循环往复的,优化工作虽然处于最后阶段,却与规划工作密不可分,形成移动网络建设的衔接部分。移动网络优化工作是与广大用户交互最广泛的环节,是移动运营商掌握网络运行状态以及获取用户信息与服务需求的门户。
目前国内某地区移动通信网络中用户规模发展迅速,达到了200万。而且每年呈10%左右的速度增长,其网络设备建设规模也保持8%左右的高速增长率。在这种情况下,移动通信运营商与移动用户之间的矛盾也逐渐凸显,尤其是网络快速发展过程中可能忽略的区域及可能忽略的服务质量,导致移动通信网络投诉量急剧增加,移动通信网络投诉处理工作压力空前。由于移动网络规模逐渐增加,移动网络用户的业务也逐渐变化,就导致了移动网络优化工作的内容及工作重心也随之产生相应变化。目前某地区移动通信网络优化人员需要花费大量的时间和精力对网络运行情况进行测试和分析。由于网络数据量的指数级增长及工作内容的增加,移动通信网络优化人员的工作压力逐渐上升,而工作效率却不见增长反而下降,这样就不利于移动通信网络的发展及用户感知的提升,继续保持目前状况则会导致运营商的用户增长缓慢甚至下降。
在认真研究并调查某地区移动通信网络优化工作现状的基础上,本文采用大数据分析技术,利用数据挖掘、文献调查、聚类分析、关联分析等研究方法,为某地区移动通信网络发展中存在的问题进行“把脉”,重点通过大数据处理技术与计算机运算技术及数据库技术建立网络大数据分析与处理模型,通过定性与定量分析,不但可以及时发现网络中的现有问题,而且可以预测分析并预防网络潜在问题点及可能产生的问题。为提升移动通信网络用户感知,提高网络服务质量提供了高效且精准的网络优化工具。为某地区移动通信运营商的业务发展及服务内容提供了参考和依据。

1.2研究意义
本文基于我国目前移动通信网络的迅速发展阶段,从大数据分析的角度对移动网络优化工作进行定量与定性分析,以期通过大数据存储、分析与处理技术,使得移动网络优化工作的工作量得到降低、优化效率得到提升、有限的资源得到最佳利用,从而为移动运营商的业务发展提出预测性建议、为移动网络优化工作提供高效的分析处理方案。
通过大数据存储技术的支撑、大数据分析技术与大数据处理技术的应用,我们期望移动网络优化工作可以由点发展到线、面,由传统的单点故障处理、个别问题定位向网络整体分析、矢量问题定位等方向发展。移动通信运营商可以由传统的被动提供业务、服务向主动提供服务、定制服务方向发展。为移动通信运营商的业务提供更多可选类型,深入挖掘用户潜在需求,提供盈利新的增长点。
随着移动互联网的发展及新的移动通信技术的应用,移动通信网络用户对于移动通信网络质量与业务内容的要求越来越高,尤其是移动同行用户对于移动互联网速率及信号覆盖的要求,是移动通信运营商需要关注和解决的瓶颈所在。但是网络规模与用户规模均高速增长,在网络和用户发展的过程中产生了大量的基础数据并未得到合理的利用和挖掘[[5]。本文则基于移动通信网络的基础数据、道路测试数据及用户感知情况,综合利用大数据分析技术,通过数据挖掘、文献调查、数据库存储与处理、聚类分析、关联分析等方法,为移动通信网络发展过程中产生的问题进行定性和定量化分析,并建立相应的数据模型,为移动通信网络优化提供分析处理工具,进而针对具体的移动网络提出优化建议以及网络未来发展的参考。这首先需要采集大量的数据,其次对这些数据进行处理及分析,最后通过分析结论提出优化建议和措施,最终建立几个具有实践意义且通过有效性验证的评估与应用体系,为移动通信运营商的网络优化工作节省大量的人力资源、时间和精力,有利于提高移动通信运营商的整体服务水平和用户感知。

2基于矩阵分析的路测数据预测

通过对道路测试数据进行矩阵分析,目的在于对移动通信网络的道路覆盖与移动性进行优化,矩阵分析的流程分为三个阶段,即网络建模、系统分析、优化方案实施。整个过程可以通过下图展示:
大数据分析在移动通信网络优化中的应用研究_第1张图片

图2-1矩阵分析流程
2.1路测数据问题预测分析
在移动通信领域,网络优化工作中,必不可少的一项工作就是道路测试。通过道路测试,可以发现网络移动性能的好坏,可以发现移动网络覆盖的盲区,可以发现哪些区域或哪些路段信号服务质量较差,甚至可以直接测试到哪些点出现掉话,无法接通等道路测试时间。从而可以为移动通信网络服务质量进行考核,来评估某一地区移动通信网络运行情况,从而综合点线面数据进行整体对比分析来发现点线面三种层次的问题来指导全国范围内的移动运营商进行业务质量优化与服务水平提升。
但是,传统的道路测试及问题分析都是“亡羊补牢”类的行为。都是在发现问题,分析问题,解决问题的流程上进行的。如此以来,就使得移动通信网络优化工作中的道路测试与分析工作呈现出一种滞后性,也就是说问题已经存在了,发生测试事件了移动通信网络优化人员才能发现网络问题,进而去解决发生问题的点。无论是从优化工作的困难和工作量来看,还是从用户对移动通信运营商直观业务感知角度出发,抑或是从运营商集团对某地区移动通信运营商考核角度评估,这都是一种被动的现状,主动的成分欠缺。而且,对于覆盖面较大的地区,有上万个基站,服务上千万人口的地方,道路测试工作的成本也是居高不下。
随着通信网络的发展和移动用户的巨量增长,针对这种现状和瓶颈,迫切的需要移动通信运营商和移动网络优化人员转变思想,利用现在比较成熟的一些计算机技术和数据库技术等通过后端,也就是通过分析网络基础数据从而对道路覆盖问题点,道路测试故障点进行一定程度的预测分析,从而较为全面的分析预测网络问题,也节省大量的劳动力资源,达到国家对于节能减排的倡议要求。
我们对于某地区的道路数据问题预测分析,主要从两个角度出发。一是通过搜集必须的网络测量数据以及己经收集到的网络业务数据,来对网络整体进行业务及服务建模,通过建立的模型对网络整体进行面的分析和评估及定位;二是通过一定次数的道路测试数据来获取网络动态业务模型及状态,毕竟道路网格的测试数据是最能体现一般情况下的网络道路服务质量的。最后我们需要做的就是结合网络测量模型与道路测试数据,进行综合分析,通过己经发生问题的点,路段,区域来结合网络数据进行反向推理,从而验证发生问题的点,路段,区域是否真正存在问题;进而进行正向预测分析,来列举出网络中存在的隐患路段或区域,为后续优化工作提供良好的、行之有效的建议和预测分析数据。
2.2干扰矩阵分析概述
在阐述干扰矩阵理论之前,必须先说明一下手机测量的定义。前面移动通信理论己经简要说明了移动通信中的主要设备就是基站和手机,平常移动用户手持的终端也就是手机是与移动通信基站直接进行通信的,也就是两者之间直接进行信息交换。这里涉及到两个问题:
2.2.1什么是手机测量数据
手机在通话过程中持续上报测量信息给基站,这些数据保持在OMC的数据库中并且实时更新,手机上报的信息包括RXLEV, C/I,令口区列表,TA值等。
2.2.2为什么使用手机测量数据
因为手机测量数据反映了最真实的信息,反映了用户的动态信息,可以同时提供室内和室外的数据,可以实现话务量和质量的位置关联,也能提供最精确和最可靠的数据源,当然也不需要大量人力资源和特别的投资,最重要的是可以实现724小时实时可用,可以用来分析任何时间段的网络性能,比如忙时、特殊时段、夜间、节假日等等。
了解了手机测量的概念及原因之后,我们就很容易理解干扰矩阵的概念。干扰矩阵,故名思议,是关于网络干扰情况的一个矩阵分析模型,也就是把网络的整体干扰情况进行模式化分析和处理,不但定性,而且定量,从而真实直观有效地反映网络的干扰情况。干扰矩阵的建立来源是网络基础测量数据,这些数据就是有成千上万的移动终端,也就是手机搜集并上报给基站,然后存储于网络OMC中的数据。收集测量之前需要在移动通信网络中打开DAC与CF测量。这两种测量DAC代表Defined Adjacent Cells和Channel Finder。分别表征了网络中定义的邻区关系和实时测量发现的信号较强的小区。通过搜集这两种测量数据,经过大数据分析,尤其是聚类和关联分析,可以为网络干扰情况做出评估模型,从而量化网络干扰情况,为网络问题定位和路测数据预测提供最准确和有效的支撑。
2.3基于矩阵分析的路测数据预测方案
通过对手机测量与网络干扰矩阵的理解,我们基本把进行网络矩阵分析来预测路测数据情况的必须基础给夯实了。接下来的工作就是基于矩阵分析来制定路测数据预测方案。本文所采用的预测方案是在建立矩阵分析模型,并获取了至少三轮道路测试数据的基础上制定的。其中用来建立干扰矩阵的网络测量数据进行了7
24小时的收集,也就是一周的网络基础测量数据,从而来保证网络信息的真实有效。
通过DAC与CF测量生成网络干扰矩阵以后,结合某地区网络中每个小区正在使用的频点来计算出每个小区级别的干扰值和小区内每个载频的干扰值,以泰森多边形的形式来展示,从而迅速找到网络中干扰问题小区,可以定位到干扰小区的干扰载频。
在移动通信领域,网络产生干扰的原因主要就是两个方面,一是频率选择不合理;二是越区覆盖导致。在900M与1800M双频网络中,我们针对两个频段分别进行干扰定位分析,找出强干扰小区列表,给出相应的优化建议。进而通过覆盖优化和频率优化降低目标小区或目标区域甚至是全网的干扰值。
2.4基于矩阵分析的路测数据预测模型
2.4.1路测数据采集
路测数据来源为某地市的主干道道路测试情况,数据采集时间为移动用户使用量较大的时段,即忙时。一般情况下为早八点至晚八点。通过专业的道路测试软件,如华星、日讯、鼎利、TOM, TEMS等对覆盖主要干道的移动通信基站信号进行业务测试并收集测试过程中所采集的采样点,保存为特定格式的数据,便于通过专业软件进行历史记录回放与分析工作。
2.4.2干扰数据采集
网络干扰数据的来源为一段时期内,一般情况下为一周,所收集的网络底层干扰数据。本文所采集的数据是通过对某地市移动通信网络开启DAC ( DefinedAdjacent Cells)与CF ( Channel Finder)两项测量搜集的基础数据。分别代表了网络中定义的邻区配置数据与网络中未定义但信号强度较强的附近小区。通过采集这两种测量的大量样本数据,来建立矩阵分析模型,对网络干扰情况进行综合分析。
2.4.3建立矩阵分析模型
干扰矩阵分析模型的建立,主要是通过测量申请、数据采集、数据存储、算法导入、模型建立等五个步骤。由于在网络中开启测量收集数据会占用较多的网络资源,因此默认情况下非必须测量是未开启状态。因此建立矩阵分析模型的第一步是申请相关测量开启,这一步需要明确测量周期,目的在于尽可能完整的搜集网络基础测量数据,使其有效性最佳。其次是数据采集与数据存储,这两个步骤互相交叉,同时进行,因为数据收集以后是直接存储于OMC数据库中。而在进行前三个步骤之后,我们就获取了比较全面的网络干扰测量数据,在收集完毕数据之后,结合某地区网络的当前频率资源使用与配置情况,导入干扰矩阵算法后,就形成了网络干扰矩阵模型。模型建立之后是以泰森多边形的界面来展示网络干扰情况的。通过直观的展现,我们可以结合地理信息工具对某地区网络的单个小区及其载频的干扰情况进行定位和分析,从而节省大量的人力资源。
2.4.4路测数据分析预测
干扰分析和优化
通过使用FEP测量生成网络干扰矩阵(同时支持。AC/CF测量生成网络干扰矩阵),结合现网中每个小区正在使用的频点计算出每个小区的干扰值和小区每TRX干扰值,以泰森多边形形式展示,迅速找到网络中干扰问题小区。
通过使用最新的干扰矩阵生成方式,即FEP模式,能彻底解决双频网自动优化问题,无需人工调整BA LIST,可以大幅缩短采集数据时间。分别对网络中GSM900频段和 DC51800频段的干扰进行分析,找到强干扰小区列表,给出相应的优化建议。可以通过覆盖优化和频率优化降低网络干扰值。
产生网内千扰的主要原因包括:频率选择不合理导致干扰,越区覆盖导致干扰。
栅格干扰矩阵分析
路测栅格干扰矩阵展示的是每个栅格内的所有小区都满功率、全负荷情况下的干扰情况。这些干扰带来的潜在质量问题(如起呼失败、掉话等)是多次路测都无法全面遇到和重现的。
路测栅格干扰矩阵是将一次或多次路测LOG合并后按照N*N(其中N的默认值为50米)的正方形进行栅格化,通过独有的算法计算生成路测栅格干扰矩阵。
路测栅格干扰矩阵输出的主要数据是每个栅格的C/1、RX_QUALITY,服务小区出现次数、RX LEVEL,干扰小区出现次数、干扰频点和RX LEVELo
路测栅格干扰矩阵的优势在于:
(1)高效、准确找到路测中潜在质差点
(2)全面提升道路优化质量
(3)减少不必要的路测数量,节约人力资源
(4)基于路测栅格干扰矩阵的分析和优化必将成为三方保障的有力支持

3基于聚类分析的后台数据优化

后台数据是相对于道路测试数据而言的。一般来说,在移动通信网络优化领域,按工作内容和工作职责来说,分为前台和后台两种。前台主要是指道路测试,定点测试,现场调整等工作类型;而后台则主要是指网络KPI分析与优化,故障排查与定位,告警监控与处理等工作类型。本文提出的后台数据优化就包括了以上几种后台工作类型。提出了基于聚类分析来对纷杂的后台数据进行处理和优化,从而提升网络KPI,提高用户感知度的一种移动通信网络优化方法。
3.1后台数据分析的困境
在目前移动通信网络优化工作中,纵观全国范围内运营商业务部门设置与网络优化工作人员工作内容安排及工作效率与实施周期等,尤其是随着网络规模与移动用户的突增,网络优化工作尤其是后台数据分析工作已经达到了一种瓶颈。主要原因在于建网之处,网络规模小,用户数量少,一些数据的维护与告警的监控及故障的排查通过人力完全可以解决,随着网络的增加,相应部门人员也呈现增加的趋势。但是,由此带来的并不是工作与优化效率的等比提升,相反确是存在移动的冗余与混乱,不单单是工作分工的明确与否,还涉及网络建设与优化的整个流程,毕竟每个步骤都不是单独存在的,需要前后步骤的衔接以及周围环境的沟通协调。尤其是数据量特别巨大的时候,仅仅依靠人力很难统筹兼顾所有。举例来说,某地时建网初期有100个基站,5万用户,一般情况下故障站点1%左右,也就是一两个基站有问题,可能影响500个用户;但是网络发展后,有了1000个基站, 100万用户,故障率维持1%的情况下就有10个基站有问题,影响约一万个用户群体。因此,建网之初与网络高速发展之后单从数字数量级开看,几乎是几何增长,由故障与问题所带来的影响已经不是单靠几个人或几十人所能解决的。虽然目前移动通信运营商也有一些管理平台投入使用,但是其效率与效用确实有待提升,最简单的一点就是管理平台不统一,数据共享不充分,由此造成了信息冗余与混乱,不但无法提升工作效率,反而有所降低。
目前移动通信网络优化所面临的这些困境,就迫切需要提出一种基于网络数据的新的管理办法与分析处理手段,进行统一规划,集中整理,需要明确规则,需要确定方法,通过层级管理与分析模式,以一种清晰明确的网络结构来进行管理和优化,从而提升效率,提高移动通信产业的生产力。
3.2后台数据库与网络结构
通过前述部分对移动通信网络结构的说明,我们可知,移动通信网络优化人员主要接触与操作维护的为OMC数据库部分。某地市移动通信网络OMC数据库由ORACLE数据库厂家提供。因此,在针对某地市移动通信网络优化过程中,大量基础数据与测量数据的存储与提取均通过ORACLE数据库进行。在移动通信网络结构中,后台数据库属于OSS(Operating Sub System)。对于某地市既定网络模型与数据库结构,主要涉及以下内容:
数据库建表
在数据库中创建表是移动通信网络优化的后台数据库常用操作,在网络建设完成投入运行以后,数据库结构是固定的,这时就需要往空洞的数据库中添加一些必须的数据,以方便监控网络运行状态并及时发现网络问题。在某地市移动通信网络中,我们需要创建的表有网络基础配置表、网络新能表、网络告警表、网络网元表等各种不同专业的表格,分别对应网络基础数据、网络测量与KPI数据、网络告警数据以及网络组成单元的数据等等,这些纷杂的数据就构成了宏大的移动通信网络OMC数据库,是整个网络运行及状态的数据集成,重要度很高。
数据库查询
数据库查询操作在移动通信网络优化中也是频繁操作类型。数据库查询是建立在数据库数据充分、有效、及时的基础上的。通过创建查询表,可以从数据库的各种表中取出所需要的数据,比如某地市移动通信网络在春节前后的业务量情况、告警出现情况以及网元配置情况等。最有效的操作就是从不同表中查询所需要的信息组成一个新的表格,来直观的提炼有效数据并直观展示,这样,就节省了大量的人力资源,基本可以通过计算机的自动计算能力得出所需要的结果。
数据库更新
数据库更新是整个移动通信网络OMC数据库部分的重要功能。由于移动通信网络是在动态建设和发展中,并且移动通信用户的业务模型与用户行为也随时间变化而变化。因此,对于移动通信网络优化的数据有效性与及时性要求就特别高,这就要求网络 OMC数据在特定的时间点,或固定的周期内对网络配置数据进行更新,并对网络性能数据进行周期性采集,只有这样才能为移动通信网络优化人员提供准确有效的数据,保证优化人员在第一时间对网络性能进行监控,对网络故障进行处理,并预测网络发展趋势。
3.3基于聚类分析的后台数据优化方案
在数据库完善,数据采集准确,数据提取及时的基础上。移动通信网络优化人员获取了有效的网络配置及网络性能等数据。但是对于单个优化人员,这些数据仍然是分散的、大量的、无规律的。想要准确定位网络问题,或者预测网络发展趋势及业务需求情况,还需要对众多的网络KPI数据进行聚类分析,赋予不同的权重通过加权计算后的数据才具有说服力与有效性及准确性。
聚类分析,顾名思义,就是针对所罗列的指标进行分类,然后每类作为一个类别,分别赋予每一类一个权重,根据重要性和优先级分别加权平均,然后得出一套指标评估体系。这样所得出的网络KPI评估与预测结果才更加合理、有效,经得起推敲,具有实际的推广意义。
3.4基于聚类分析的后台数据优化模型
通过数据库存储与数据聚类分析,我们可以建立一个基于聚类分析的后台数据优化模型。在某地市移动通信网络优化,我们根据网络KPI考核情况,建立套KPI监控分析模型,用于日常KPI指标的优化。经过长期验证,其有效性程度很高,在很大程度上解决了网络KPI监控费人费时费力的瓶颈。
3.4.1后台数据采集
对于聚类分析模型的建认,基础工作还是准确有效的数据采集。在某地市移动通信网络优化过程中,我们采集了一些仁要、能反映网络真实情况的KPi数据,也采集了网络基础信息配置数据。考虑到某地市移动通信网络现状,我们采集了十种基础配置数据与十六种KPI数据,在这些数据的基础上,进行分类,分别赋予权重。
3.4.2后台数据分类
采集到后台数据后,需要对无规律的大量数据进行分类,然后在此基础上分别加权后获得合理的聚类分析模型。根据提取的数据属性,以及这些数据所代表的意义,我们将其主要分为四大类:业务类、质量类、容量类、感知类。
业务类,主要有话务量、数据流量这些数据。分别代表了移动通信用户所使用的业务类型,是拨打电话或者是浏览网页、下载等。通过数据采集及对比,这两种数据能在某种程度上反映某一地区移动通信用户的主要用户行为,从而为后期网络优化、新建基站及资源配置提供参考。
质量类,主要有干扰比例、上行质量、下行质量、重传率等数据。其中干扰比例表征某地区移动通信网络在某一段时间内的干扰情况;上行质量与下行质量则分别统计了移动通信用户到基站方向的链路质量和基站到移动通信用户的链路质量;重传率则说明了某段时间内移动通信用户使用网络浏览网页或进行下载时链路中数据包的丢失与重传情况。这些指标基本概括了移动通信网络质量体系中的必须数据,在较准确的程度上反映了网络运行质量,同时又与用户感知密切相关。
容量类,主要有无线利用率、TBF拥塞率、TBF复用度、可用信道数等。其中无线利用率表示网络资源的利用情况;TBF拥塞率与TBF复用度表征了移动通信数据业务的信道使用情况;可用信道数则统计了某段时间内网络配置资源中的剩余情况。这些容量类指标主要反映网络某时期或某段时间内网络资源的使用情况,统计容量的利用程度,从而为移动通信网络的扩容工作及网络新建基站提供参考。
感知类,主要有PDCH承载效率、单PDCH下载速率、LLC层速率、每线话务量等。其中PDCH承载效率表征移动通信网络中数据业务PDCH信道承载情况,该指标越高则表示网络承载能力越强,反之越弱,需要进行PDCH信道资源优化;单PDCH下载速率则代表了移动通信网络中单个PDCH信道供移动用户使用时可以提供的下载速率,与用户感知密切相关,尤其是移动互联网发展到今天,移动用户对于速率的要求越来越高;而LLC层速率则统计了移动通信网络中会话层的综合下载速率,其包含了冗余信息与移动用户的有效信息,代表的是网络整体性能;每线话务量则说明了移动通信网络中分配给语音业务的信道资源承载情况,表示每个单独的语音业务信道在单位时间内所承载的业务量大小。
通过以上分类,则可以将大量看似无关的数据进行分类聚合,然后在分类聚合的基础上,通过建立聚类分析模型,从而有效地建立准确度较高的移动通信网络指标评估体系。
3.4.3建立聚类分析模型
通过对采集到的后台数据进行分类,我们得到了四种综合数据组数据。在这四类数据组的基础上,对每类数据根据其重要程度进行加权,并对每类中包含的数据进行平均,即可得到一组相对合理的后台数据指标评估体系。此指标评估体系即聚类分析模型的数据基础,在这组评估指标的基础上,如何制作出合理有效的分析模型,则是后台数据聚类分析的关键所在。
在某地市移动通信网络长期数据统计中,经过反复划分与验证,我们获取了一组较为合理的指标评估体系数据,并依此建立了聚类分析模型。
大数据分析在移动通信网络优化中的应用研究_第2张图片

表3-1聚类分析模型
如上表所示,我们将移动通信网络关键指标进行分类,按其属性聚类统计,共计分为六大类,分别为网络覆盖类、网络保持性、网络接入性、通话质量类、资源类及考察类。
3.4.4后台数据自动优化
在获取基础数据之后,我们建立了聚类分析模型。后台数据自动优化正是聚类分析模型所要实现的结果。所谓数据自动优化,不是完全意义上的自动针对有问题的指标或数据进行处理,而是针对移动通信网络的后台数据进行问题定位,问题分析,最终给出解决建议。其主要目的在于大数据处理分析,为移动通信网络优化人员提供工作辅助功能,降低优化人员工作量,节省劳动力资源。
本文所研究的课题是大数据分析在移动网络优化中的应用,因此上述内容必须以应用为前提,一切的数据分析,数据处理,数据聚类等等目的只有一个,就是为了应用。因此,在通过聚类分析之后,我们列出了对移动通信网络指标及移动通信用户感知密切相关的四大类关键指标。并在这四类关键指标的基础上通过聚类分析制定了聚类分析模型,而聚类分析模型的目的及结果即后台数据自动优化。在实现后台数据自动优化以后,我们所要研究和实现的就是后台数据优化的应用。

4.基于关联规则的网络投诉数据分析

移动通信网络中,网络投诉业务逐渐成为各地移动运营商的重点考核指标。所谓网络投诉,及移动通信用户在使用移动业务时发现的移动通信网络中存在的问题,比如掉话、串线、杂音、无法接通、无法上网、速率慢等等。
4.1网络投诉工作的困境
随着移动通信网络的发展,以及移动通信用户的增加,尤其是近两年移动互联网发展迅速,移动通信网络投诉量呈几何级增长[(35]。在建网之初,网络基站少,规模小,用户量也不多,网络中存在的问题能够得到及时解决。但是网络规模逐渐扩大之后,用户越来越多,比如某地市网络移动用户数目由IO年前的30万人,发展为现在的200万,增长迅速。而网络投诉量也由当初的每天5单左右升级到现在的每天100单以上。由此我们得知投诉量的增长率远高于网络用户的增长速度。
针对每单投诉,移动通信运营商需要安排专门人员进行电话回访、现场测试、网络调整等工作,在大量投诉的情况下,这些业务需要较多的工作人员,这也是目前移动运营商业务发展的瓶颈,就是没有足够的网络优化人员去处理投诉业务。这就要求现有网络优化人员针对投诉业务进行大量的统计分析与问题定位,从而结合网络与用户投诉内容及用户地理位置进行关联分析,从而快速定位投诉原因,并归类同一类型的网络投诉。
4.2投诉分析与问题定位
如何对大量的网络投诉进行分析与定位,是现有网络优化人员函待解决的问题。
每月产生的移动通信网络投诉中,经过网络优化人员的后台数据分析定位、上门客户回访、DTCQT测试等工作后,可以大致将产生网络投诉的原因归为网络原因、非网络原因、其他原因等。但是,非网络原因的投诉量常常占据较大的比例,而弱覆盖问题、网络质量问题导致的投诉,往往只占小部分。如果每次用户投诉,都派出网络优化人员上门回访、测试的话,无疑增大了移动通信网络优化人员工作量,也降低了投诉处理效率,更是不能尽快解决用户问题,提升用户感知,浪费了大量的人力资源和时间。因此,通过网络后台数据分析定位,关联分析用户投诉内容以及用户投诉位置及业务类型,可以快速分析问题,定位问题,从而提高移动通信用户投诉工作效率。
4.3基于关联规则的网络投诉分析模型
通过以上基于关联规则的网络投诉分析与问题定位,我们搭建了建立投诉分析模型的基础,即关联规则以及投诉分类。无论何种方式的建模,都需要基础数据来源,在本部分所叙述的网络投诉分析模型中,也不例外,需要一些关键基础数据来支撑。
本部分主要针对移动通信网络投诉进行关联分析与问题定位,因此其需要的建模基础数据有:
某地区某月份的GSM网络性能数据;
某地区某月份的MRR采集数据;
某地区某月份的GSM道路测试数据;
某地区某月份的GSM网络投诉数据;
某地区某月份的GSM网络工参信息。
4.3.1网络投诉数据采集
网络投诉数据采集即上述某地区某月份的GSM网络投诉数据。网络投诉数据采集平台为某地区移动通信网络运营商的自建投诉处理系统,本系统与10086平台对接,可以实时转接网络类投诉内容进入投诉数据库。
针对本文的研究内容,我们采集的网络投诉数据包括:投诉用户手机号、投诉用户投诉内容所处时间窗口内的用户业务清单、投诉用户所处行政区域、投诉用户SIM卡业务类型、投诉用户投诉内容、投诉用户特殊要求等。投诉数据库与10086平台简单记录了用户投诉内容,而本文研究内容所需的这
些数据的采集主要是通过电话回访、业务清单采集、地理信息、软件的使用来获取。
4.3.2用户业务数据采集
采集出用户投诉相关数据后,就需要统计用户投诉时间窗口内的用户业务数据。
用户业务数据包括投诉所处时间窗口内用户所占用的基站信号定位、一段时问内用户所占用基站的告警情况、投诉用户占用基站的关键指标情况以及投诉用户在投诉周期内的业务使用类型等。
在统计用户业务数据的过程中,由于本文本部分的研究目的在任几通过关联规则定位投诉问题,并解决网络问题,因此,必须同时考虑扩大范围的用户业务数据,即统一计用户占用基站周边相邻基站的业务及告警、指标情况。由于移动通信网络的无线业务具有感性特征,因此只有通过采集充足的用户业务数据,我们才能更有效的定位网络中确实存在问题的点,从而避免网络故障发展至线、面的层级。
4.3.3建立关联分析模型
在获取某地区某月份移动通信网络投诉数据、移动通信用厂‘业务数据以及移动通信网络指标数据后,就具备了建立关联分析模型的数据基础[381。将这些数据与网络覆盖、网络保持性、网络接入性、通话质量、资源进行分配与关联,结合用户投诉数据、投诉用户地理位置信息以及投书用户的业务使用情况,我们就能够建立起基于关联规则的网络投诉分析模型。
基于某地区某月份的综合投诉与网络数据,本文得出某月份网络投诉评估得分较低的网络问题分布情祝:
大数据分析在移动通信网络优化中的应用研究_第3张图片

表4-1网络投诉评估得分汇总
如上表所示,某地区移动通信网络部分评估得分较低的网格内投诉原因主要有:上行覆盖率差、SDCCH拥塞率过高、半速率比例过高、干扰带比例过高等。
4.3.4网络投诉问题自动定位
网络投诉关联分析模型已经建立,本部分的研究情况也接近尾声,但是关键的内容还需要说明:如何通过计算机进行批量的网络投诉问题自动定位。
这就涉及到大数据处理、聚类分析及数据挖掘技术。因此我们所采集的数据本身并不具备互联的特性,是我们通过关联分析,数据建模给蹂合在一起所得出了聚类分析结果。想要通过计算机的强大处理能力从大量投诉数据中自动定位网络投诉问题,则需要利用数据挖掘技术从上述聚类关联数据中获取关键的故障定位数据。
所谓网络投诉问题自动定位,则是在以上基于关联规则的网络投诉分析模型中设定一些常见的故障类型,比如上述的网络覆盖、网络保持性、网络接入性、通话资料、资源等问题分类。然后通过关键字搜索,以及模糊搜索技术,将某地区某月份的网络投诉数据进行分类,筛选,加权,平均,最后通过计算机的处理能力给出一份评估得分表,无论是升序还是降序的排列,我们都能得出一份相对完善的网络投诉评估报告,从而分门别类的处理网络投诉,节约移动通信网络优化人员的精力与时间,并提高网络投诉处理效率。
因此,在本部分研究的结论合理性得到验证情况下,基于关联规则的网络投诉分析应用前景就十分看好,在下文中我们就列举了一种基于关联规则的网络投诉分析应用体系。
4.4基于关联规则的网络投诉分析的应用
前文详尽的叙述了关联规则的概念与网络投诉的结合情况,也验证了通过关联规则来批量处理大量网络投诉的合理性和有效性,结合中国移动通信集团针对各地区移动运营商的考核情况,以及移动通信网络发展情况,本部分则通过以上研究结论来应用于某地区移动通信网络投诉处理工作,此应用可以概述为:用户满意度评估体系。
评估体系介绍
某地区移动通信网络监控维护中心网络优化部针对移动通信用户网络整体满意度进行分析,建立起用户满意度评估体系。结合道路测试数据、CQT测试数据、MR测量数据、网络性能数据、网络基础资源数据等五大类数据对某地区移动通信网络的若干个网格进行综合评估打分。然后根据调查问卷结合满意度得分情况,来评估影响用户满意度的网格及其指标情况。评估打分体系具体为:
大数据分析在移动通信网络优化中的应用研究_第4张图片

图4-2评估打分体系雷达图
如上图所示,针对五大类网络指标情况,本评估体系涉及六个方面的工作:
(1)建立评估体系,按照覆盖、接入性、保持性、通话质量、资源对用户满意度进行综合评估
(2)针对每个评分项,建立对应的KPI指标体系,如覆盖包括MR的上行覆盖率、下行覆盖率、D下的90覆盖率和94覆盖率
(3)设置每个评分项的权重,并设置每个评分项下的KPI权重
(4)对某地区进行网格化的管理,划分为若干个网格
(5)建立网格与小区的对应关系,对于性能和MR数据,以区域内小区指标来计算区域指标
(6)使用网络投诉数据对评分结果进行评估,验证打分体系的合理性和有效性

参考文献

[1]漆晨曦.电信企业大数据分析、应用及管理发展策略[J].电信科学,2013(3):12-16.
[2]康波,刘胜强.基于大数据分析的互联网业务用户体验管理[J].电信科学,2013(3):32-35.
[3]邱均平.信息计量学叫.武汉:武汉大学出版社,2007:191-195.
[4]刘洁.王哲.基于大数据的电信运营商业务精确运营平台的构建[J].电信科学,2013(3):22-26.
[5]罗家德.社会网分析讲义叫.北京:社会科学文献出版社,2005:150-161.
[6]谢华.大数据在移动通信中的应用探讨闭.科技创业家,2014(1):125-i26.
[7]夏磊.探究大数据下的智能数据分析技术[[J].科技创新导报,2014(10):21-22.
[8]侯优优,隋严峰.网络优化中的大数据应用闭.互联网天地,,2014(1):34-37.
[9]刘震,付俊辉,赵楠.基于移动通信数据的用户移动轨迹预测方法明.计算机应用与软件,2013(2):10-16.
[10]胡洲亮.二级城市移动通信数据网络资源配置分析明.电信技术,2008(5):32-36.
[11]闻敬.浅谈移动通信数据业务优化管理的思路[J].中国新技术新产品,2012(4):29-30.

辞谢

通过这次论文的设计和研究,我从刚开始是不知道怎么去做,我刚开始做这个题目的时候头是晕晕的慢慢的通过我问同学问老师慢慢的有了一点的思路,知道自己应该怎么去做。首先我通过在网络搜索的过程中找到了我的论文设计的基本的框架,然后在一点一点的进行摸索,再通过在网络上查阅大量的资料,进行丰富框架里边的内容,有不懂得再进行通过问同学和老师的方式进行找到解决的方案,最终我成功的完成了我的论文的设计,当我真正的完成这个论文我真正感觉到了人生中什么是成功,我只能对我的老师和同学说一句话,真的很感谢你们,我也非常感谢我的导师是他在我的背后默默的支持,再给我打进鼓励我才能把这个论文设计做了出来。从做这个论文设计的过程中我经历了很多的困难。我真正的认识的基础知识是非常的重要的,我们必须应该把自己的理论融合到实践的过程中去,这样才能使实现和理论更好的去结合,才能更好的把自己的基础知识打牢。
通过我这一次能够顺利地完成论文,我非常要感谢的一个人,是我的导师。在这个论文的设计的过程中,是他耐心的为我讲解。在我不懂的时候也是他在为我讲解。他没有任何的反感对我非常细心的给我讲解,我应该怎么去做。与此同时,我还应该感谢我们学院的各位领导,是他们在我的大学四年对我的无微不至的关怀,我才能有今天的成就。非常的感谢他们,也是,他们给了我这一次难得的机会,让我真正的踏入了社会,真正的用自己所学的理论,根据自己大学四年所学的理论知识完成了一篇具有理论意义的学术论文。在其中的过程中,我也学会了很多的事情,面对困难,我不应该退缩,应该勇往直前,因为一旦退出,就注定失败,只有坚持不懈的去努力,才能够成功。

你可能感兴趣的:(java,java)