背景
当前运营商新业务类似腾讯视频卡顿及手游业务指标,无法现有网管平台直接提取指标,只能通过特定平台提取网络小区级运行状态,而每个地市及区域需要通过Excel或者其他工具人工汇总指标;相比于需要通过编程,需学习对应的编程语言需要付出大量的精力;或者Excel的通过多次匹配数据、透视的方法汇总指标,重复操作,废时。通过使用spss modeler 生成流的脚本,方便、快捷、简明一次生成脚本后,后期可以一键提取相应指标及top小区明细。
SPSS modeler 工作界面简单 明朗,只需要通过设置对应节点简单的设置,就可以实现对数据的处理(汇总 计数及基本的运算)。
1.数据源导入
1.1Excel文件导入
数据----导入Excel数据时基本设置 文件路径 导入列
过滤器-----对导入的Excel数据的列数据进行滤(不需的列数据剔除)
注解-------对改节点的信息进行注释(对改节点注释 已方便区分)
导入数据预览---导入数据预览
1.2 可变文件导入(文本文档 .csv格式文件等二进制文件)
2.记录选项(对行数据处理)
2.1选择-----通过条件筛选符合规则的数据 ,丢弃或者选取。(筛选记录)
2.2汇总----类似透视表的行数据 对数据进行基本的汇总(计数 平均 最大 最小值等)
2.3合并----通过关键字关联来自不同数据源的列数据,类似Excel中vlookup 函数。
2.3.1合并节点 输入(不同数据源的基本信息 文件名 字段数及连接节点)
2.3.2合并节点 合并(关键字及匹配方式 内连接 外连接 部分连接)
2.3.3合并节点过滤器(对合并后的数据 字段进行保留和剔除)
3.字段选项(列数据处理)
3.1类型---可以对字段的数据格式进行整理(比如:保留小数点位数)
3.3过滤器---对不需要展现的数据进行过滤。
4.数据导出-流的末端
5.常用函数
涉及网优最常用的函数,字符串的拆分和拼接 替换
字符串替换 :replace((SUBSTRING,NEWSUBSTRING,STRING)字符串 在指定 STRING 中,用 NEWSUBSTRING 替换 SUBSTRING中的所有示)
字符串拆分 textsplit(num,2,'.') 字段 第几个字符串 分割符(弊端 多次拆分)
字符串合并: >< 两个字段连接在一起
类型转换 :字符串转整型 to_integer(ITEM)
取整:div
取模(mod)
6. 基于spss modeler 生成腾讯手游业务卡顿分地市KPI指标汇总及TOP小区生成
6.1.流文件效果图
6.2 流文件原始文件
下载地址:LT流媒体视频业务趋势.str-电信文档类资源-CSDN下载
7.结语
spss modeler 是一款快捷 简明的数据分析工具,简单易上手,可以解决一些日常工作中重复的操作。