简单点说:就是对数据进行分析;
专业说法:用适当的统计分析方法,对收集来的大量数据进行分析,将他们加以汇总和理解并消化,以求最大化的开发数据的功能,发挥数据的作用。
数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概况总结的过程。
其目的是为了把隐藏在一批看似杂乱无章的数据背后的信息集中提炼出来,总结出研究对象的内在规律。能够帮助管理者进行判断和决策,以便采取适当的策略和行动。
数据分析在企业日常经营分析中主要有三大作用:
告诉你过去发生了什么。
第一,该诉你企业现阶段的整体运营情况,通过各个指标的完成情况来衡量企业的运营状态(好了还是坏了,以及好坏的程度);
第二,告诉企业的各项业务的构成,了解企业各项业务的发展及变动情况,对企业运营有更深的了解;
现状分析一般通过日常通报来完成,如日报、周报、月报等形式
告诉你某一现状为什么发生。
现状分析—我们对企业运营情况有了基本了解,但具体的运营情况具体好在哪里、差在哪里,是什么原因引起的不知道。分析指标变动原因,对运营策略作出调整与优化。
原因分析一般通过专题分析来完成,根据企业运营情况选择针对某一现状进行原因分析。
告诉你将来会发生什么。
了解企业运营现状后,有时还需要对企业未来发展趋势做出预测,为制定企业运营目标及策略提供有效的参考与决策依据,以保证企业的可持续健康发展。
预测分析一般通过专题分析来完成,通常在制定企业季度、年度等计划时进行,其开展频率较低。
开展数据分析之前,要问问:
为什么要开展数据分析?通过这次数据分析我要解决什么问题?预计会得到什么结果/结论?结果将会产生什么样的影响?下一步估计会采取什么行动?
考虑的不是“需要多少张图表”,而是思考这张图表是否有效表达了观点?如果没有,需要怎么调整?如果目的不明确,多少张图表也没有作用。
只有明确数据分析的目标,数据分析才不会偏离方向。
接着是如何去分析,即分析的思路——逻辑。
当分析目的明确之后,要梳理分析思路,并搭建分析框架,把分析目标分解成若干个不同的分析要点:
即:如何具体的开展数据分析,需要从哪几个角度进行分析,采取哪些分析指标?
只有明确了分析目标,分析框架才能跟着确定下来,最后还要确保分析框架的体系化,使分析结果具有说服力。
实习时有遇到的最常见的重要问题就是:遇到一个分析问题,不知道从哪方面入手,分析的内容和维度不够合理、完整,
体系化就是为了让你的分析框架具有说服力。
以营销、管理等理论为指导,结合实际业务情况搭建分析框架,以确保数据分析维度的完整性,分析结果的有效性及正确性。
分析框架使数据分析变得有血有肉有脉络,真正做到理论指导实践。
数据收集是按照确定的数据分析框架,收集相关数据的过程。
数据包括:
来源:
数据处理:将收集到的数据进行加工整理,形成适合数据分析的样式。即,有效数据。
数据处理主要包括:
数据分析是指,用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。
数据处理是数据分析的基础,数据处理保证了数据的一致性与有效性,确保数据分析结果的正确性。
在这个部分需要了解基本的数据分析方法、数据挖掘算法,了解不同方法适用的场景和适合的问题。
1)常用的数据分析工具,掌握Excel的数据透视表,就能解决大多数的问题。需要的话,可以再有针对性的学习SPSS、R等工具。
2)数据挖掘是一种高级的数据分析方法,侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式与规律。
大多数情况下,人们更愿意接收图表形式的数据展现方式。
常用的数据图表包括饼图、柱形图、条形图、折线图、气泡图、散点图、雷达图等。进一步加工整理变成我们需要的图形,如金字塔图、矩阵图、漏斗图、帕雷托图等。
一般能用图说明问题的就不用表格,能用表说明问题的就不用文字。
图表制作的五个步骤:
1、确定要表达主题
2、确定哪种图表最适合
3、选择数据制作图表
4、检查是否真实反映数据
5、检查是否表达观点
数据分析报告其实是对整个数据分析过程的一个总结与呈现。通过报告,把数据分析的起因、过程、结果及建议完整地呈现出来,供决策者参考。
数据分析报告是通过对数据全方位的科学分析来评估企业的运营质量,为决策者提供科学、严谨的决策依据,以降低企业运营风险,提高企业核心竞争力。
一份好的数据分析报告:
首先,需要有一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然:
另外,数据分析报告需要有明确的结论:
最后,好的分析报告一定要有建议或者解决方案:
数据分析报告不仅是分析结果的直接呈现,还是对相关情况的一个全面的认识。我们经常看到一些行业分析报告从不同角度、深入浅析地剖析各种关系。
所以,你需要一个讲故事的逻辑:
讲故事:要把一个故事讲完整,这样才能说服别人
事例:
1.分析目的不明确,为分析而分析:
2.缺乏业务知识,分析结果偏离实际
3.一味追求使用高级分析方法,热衷研究模型
能简单有效的解决问题的方法才是好方法。
围绕业务、发现问题、解决问题,才是数据分析的最终目的。
各企业经过长期应用积累了大量丰富的数据,诸多行业随着信息技术的蓬勃发展数据也将会迎来井喷。但大部分企业,对信息的利用率极低。庞大的历史数据是否有价值?有何价值?如何综合利用这些数据的价值?是否能够为企业运营与决策提供参考依据?
无论是政府决策还是企业运营,科学研究还是媒体宣传,都需要数据支持。将数据转化为知识、结论和规律,就是数据分析的作用和价值。
面对庞大的数据,数据分析师不仅仅是单纯地做分析,更重要的是与相关业务部门进行合作,将数据真正应用到业务中,根据实际的业务发展识别哪些数据有用,而不是孤立地在“真空环境”下进行分析。——《数据化运营》
“数据供应链”:
数据分析师的职业要求——五懂:
1)懂业务
2)懂管理
3)懂分析
4)懂工具
掌握数据分析相关的常用工具。
5)懂设计
运用图表有效表达数据分析师的分析观点,使分析结果一目了然。如,
颜值即正义。
数据分析师五大基本能力和素质:
1)态度严谨负责
只有态度严谨负责,才能保证数据的客观、准确。——你得为你分析的每一个环节负责,了解每一个环节数据以及分析的来龙去脉——多问自己为什么,不能只知其一不知其二
2)好奇心强烈
3)逻辑思维清晰
具备缜密的思维和清晰的逻辑推理能力:
4)擅长模仿学习
模仿学习是快速提高学习成果的有效方法。
5)勇于创新
今年利润占比45%,比去年提升17个百分点,(不是提升17%);
数据分析心法:
学习:先了解,后深入;先记录,后记忆;先理论,后实践;先模仿,后创新;
方法:先思路,后方法;先框架,后细化;先方法,后工具;先思考,后动手;
分析:先业务,后数据;先假设,后验证;先总体,后局部;先总结,后建议;
确定分析思路要以营销、管理等理论为指导——这些相关理论称为数据分析的方法论。
如,作专题分析时,要明确分析思路,即要有正确合理的分析方法论,以确保分析结果具有指导意义——指南针。
数据分析方法论:主要用来指导数据分析师进行一次完整的数据分析,它更多的是指数据分析思路,,比如主要从哪几方面开展数据分析?各方面包含什么内容和指标?
1)数据分析方法论,主要从宏观角度指导如何进行数据分析,像是一个数据分析的前期规划,指导着后期数据分析工作的开展;
2)数据分析方法,是指具体的分析方法。其主要从微观角度指导如何进行数据分析。
数据分析时时常遇到的问题:不知从哪方面入手开展分析;分析的内容和指标常常被质疑是否合理、完整。
数据分析方法论主要用来指导数据分析师进行一次完整的数据分析,而只有在营销、管理等方法和理论的指导下,结合实际业务情况,才能确保数据分析维度的完整性,分析结果的有效性及正确性。
数据分析方法论主要有以下几个作用:
如果没有宏观指导,会导致报告主线不明,各部分分析逻辑不清。
PEST分析方法用于对宏观环境的分析,即行业或是企业的各种宏观力量。
1)政治环境 Political
构成政治环境的关键指标有:
2.)经济环境 Economic
主要包括微观和宏观两个部分。
宏观经济环境主要指:
微观经济环境主要指:
构成经济环境的关键指标:
3)技术环境 Technological
构成技术环境的关键指标:
4.)社会环境 Social
构成社会文化环境的关键指标:
文化水平会影响居民的需求层次,……
讲话时老是抓不住重点,费口舌讲半天,还是听不懂他在说什么——缺乏逻辑训练
5W2H分析方法:
逻辑树又称问题数、演绎树、分解树;将问题的所有子问题分层罗列,从最高层开始,并逐步向下扩展。
具体方法:
其作用主要是:
逻辑树使用必须遵守的三个原则:
是随着营销组着理论的提出而出现的。营销组合实际上有几十个要素,这些要素可以概括为4类(具体介绍待续):
如果需要全面了解公司的整体运营情况,搭建公司业务分析框架,就可以采用4P营销理论对数据分析进行指导。
搭建好业务分析框架,确定要分析的问题,然后可以将其细化为数据分析指标。
网站分析的发展已经成熟,分析指标体系已经比较成熟:
问题:当遇到这么多指标,都要采用么?那什么采用,什么不采用?各指标之间的联系?哪个指标先分析,哪个后分析?
所以,我们需要梳理他们之间的逻辑关系——如使用用户行为理论。
什么是用户使用行为:是指用户为获取、使用物品或服务所采取的各种行动;用户对产品首先需要有一个认知、熟悉的过程;然后是试用;再决定是否继续消费使用;最后成为忠诚用户。
案例图:用户使用行为理论在网站分析中的应用
回顾:
方法论用于指导分析框架的搭建,但最后都还要落在具体的数据分析指标之上,即形成科学的指标体系。
方法论也可以嵌套使用,当然还有很多其他方法;
两部分知识:
1.字段与记录
2.数据类型:
3.数据表
数据表的要求:
1.文本数据导入
操作:Excel分列
2.自动导入网站数据
操作:web数据导入—>数据更新:
3.问卷录入要求
数值题:录入实际数值即可
单选题:使用1、2、3、4代表ABCD
多选题:
排序题:1…7代表第几个选项,
开发性文字题:一般是一些文字表述观点或建议;
三心二意:
步骤:
数据清洗目的是为数据加工提供简洁、完整、正确的数据,清洗工作包括:
1)函数法
2)高级筛选法
3)条件格式法
4)数据透视表法
5)删除重复数据
如果缺失值过多,说明数据收集过程中存在着严重问题,处理标准一般是:10%以下;
数据缺失的原因:
1.当缺失值是以空白单元格出现(对应其他数据处理工具中)
1)定位输入:“定位”——“定为条件:Ctrl+G”——“空值”
2)缺失值处理方式:
3)具体操作:定位之后——快捷键:Ctrl+Enter(实现单元格同时输入)
2.当缺失值是以错误标识出现
1)查找替换:
1.利用IF函数检查错误:
IF(条件表达式,为TRUE时的返回值,为FALSE时返回值)
2.利用条件格式标记错误:
为何需要进行数据加工:数据表中现有数据字段不满足我们的数据分析需求,所以需要对现有字段进行抽取、计算或者转换,形成分析所需要的一列新数据字段。
数据抽取:指保留原数据表中某些字段的部分信息,组合成一个新字段。可以是:
1.字段分列:截取某一字段的部分信息
举例:将姓和名信息单独抽取出来
方法:
2.字段合并:将某几个字段合并为一个新的字段
3.字段匹配:将原数据表中没有,但其他数据表中有的字段,匹配过来
VLOOKUP(匹配值,匹配区域,匹配列,选项):
某些字段需要通过原表中的字段计算得来;
DATE()
YEAR()
MONTH()
DAY()
DATEIF()
VLOOKUP(匹配值,匹配区域,匹配列,选项):
1.数据表的行列互换:转置、粘贴选项、运算
2.多选题录入数据方式之间的转换
IF(ISNUMBER(HLOOKUP()),1,0)
常见的调查方式:
Rand()函数:
方法:生成随机数——使用VLOOKUP函数匹配
明确方法论、方法、工具三者各自的作用。
数据分析不单单是会用数据分析工具,还必须懂数据分析原理,没有理论的指导,就无法知晓从哪方面入手,要分析哪些关键点。
首先是数据分析的三大作用:
其次是这三大作用是如何实现的呢,其分别对应三大基本方法:
数据分析作用 | 基本方法 | 数据分析方法 |
---|---|---|
现状分析 | 对比 | 对比分析、平均分析、综合评价… |
原因分析 | 细分 | 分组分析、结构分析、交叉分析、杜邦分析、漏斗图分析、矩阵关联、聚类 |
预测分析 | 预测 | 回归分析、时间序列、决策树、神经网络 |
数据分析中各项数据指标没有好坏之分,就好看选什么作为参照物。
1)对比分析法:解释数据之间的差距,可以直观地看出事物某方面的变化或差距;
2)分类:
3)实践运用:常用的对比分析有以下几个维度
4)注意事项:
分组的目的:为了便于对比,把总体中具有不同性质的对象区分开,保持各组内对象属性的一致性、组与组之间属性的差异性,以便进一步运用其他数据分析方法来解构内在的数量关系。
步骤:
结构分析方法:指被分析总体内的各部分与总体之间进行对比的方法,部分对总体占比;如,市场占有率。
结构相对指标(比例) = (总体某部分数值 / 总体总量)× 100%
平均分析方法:运用计算平均数的方法,来反映总体在一定时间、地点条件下某一数量特征的一般水平;
多个维度的数据透视
评价步骤:
1)确定评价体系
2)收集数据,数据进行标准化处理
3)确定指标权重
4)根据标准化数据及权重,计算综合评价结果
5)根据评价结果,进行排序和分析
标准化方法:
赋权方法:
将若干个用以评价企业经营效率和财务状况的比率,按其内在联系有机的结合在一起,形成一个完整的指标体系,并最终通过权益收益率来综合反映。
不仅仅可以用在财务分析上,也可以用在企业市场、用户分析上。
主要以漏斗图的形式展现分析过程及结果,适合业务流程比较规范、周期较长、各流程环节涉及复杂业务过程的管理分析工具。
可以结合对比分析方法使用。
以IPA分析:重要性-满意度分析为例
1)矩阵
重要性-满意度矩阵(四个象限)
2)发展矩阵
IPA+对比数据:时间变化下某指标的变化
3)改进难易举证
在IPA矩阵基础上,增加改进难度这个维度(使用图形大小表示);用以决定先改进哪一个问题。
研究方向 | 数据分析方法 |
---|---|
产品研究 | 相关分析、对应分析、判别分析、结合分析、多维尺度分析… |
品牌研究 | 相关分析、聚类分析、判别分析、因子分析、对应分析、多维尺度分析… |
价格研究 | 相关分析、PSM价格分析… |
市场细分 | 聚类分析、判别分析、因子分析、对应分析、多维尺度分析、逻辑回归、决策树… |
满意度研究 | 相关分析、回归分析、主成分分析、因子分析、结构方程… |
用户研究 | 相关分析、聚类分析、判别分析、因子分析、对应分析、逻辑回归、决策树、关联规则… |
预测决策 | 回归分析、决策时、神经网络、时间序列、逻辑回归… |
数据透视表技巧:
电梯法则:麦肯锡30秒电梯理论——让老板在三十秒内读懂你的数据
问题:
1.图表的作用:
2.常用图表类型及作用
3.图表制作五步法
突出显示单元格:
1.增加平均线图
2.双坐标图
3.树形折线图:蛇形图
4.瀑布图
5.帕累托图
6.旋风图
7.人口金字塔图
8.漏斗图
9.矩阵图(散点图)
10.发展矩阵图
11.改进难易矩阵
专业化评价标准:严谨、简约、美观。
1.“五脏俱全”
2.注意事项:
3.饼图:
4.复合饼图:
5.柱形图:
6.条形图:
7.折线图:
8.图表会说谎:
1.简约:简明扼要,清晰明了;
宜家的家具,总给人感觉色彩鲜明、简单大方且独居匠心;
2.整洁:整齐、干净、和谐自然;
3.对比:突出重要元素,帮助读者迅速抓住信息;
1.最大化数据墨水比:
2.找出隐形的线:让图表中每一个元素被无形的线条贯穿在一起一样;
3.图表喜欢的数字格式:Arial字体
4.图表的突出对比:
5.颜色搭配:
1)主色与配色
2)色环:
3)相似色:由一种色调,及相应的多种亮色和暗色组成;
4)临近色:色环上相邻的颜色;
5)对比色:色环上相对的颜色;常用的对比色是:
6)冷暖色:蓝与红
7)特殊颜色:
颜色 | 交通 | 企业经营分析 |
---|---|---|
红 | 危险,禁止通行 | 显示指标存在重大问题 |
黄 | 警示,提醒即将有危险 | 显示指标存在潜在问题 |
绿 | 安全,准许通行 | 显示指标发育良好 |
项目 | 说明 |
---|---|
色系 | 同色系(红黄蓝绿等);无色系(黑、白、灰) |
色调 | 暖色调(红、黄);冷色调(绿、蓝) |
对比色 | 两种可以明显区别的色彩;可用于突出主题、内容或表现不同类别等 |
相似色 | 同一颜色明度上的深浅变化;可用于表现类似、过渡的事物 |
邻近色 | 用于表现类似、过渡的事务 |
其他技巧:
数据分析报告:是根据数据分析原理和方法,运用数据来反映、研究和分析某项事物的现状、问题、原因、本质和规律,并得出结论,提出解决办法的一根分析应用文本;
数据分析报告的写作原则:
总之,一份完整的分析报告,应当围绕目标确定范围,遵循一定的前提和原则,系统反映存在的问题及原因,从而进一步找出解决问题的方法。
数据分析结果,无论数据搜集多么科学,分析方法多么高深,数据处理多么先进,如果不能将其有效组织展现出来,并与决策者进行沟通交流,就无法向决策者提供一个满意的解决方案。
数据分析报告主要有三方面作用:
对主体的某一方面或某一问题进行专门研究的分析报告;主要作用是为决策者制定某项政策、解决某个问题提供决策参考依据;
特点:
对研究主题的业务或其他方面发展情况的全面评价。
特点:
以定期数据分析报表为基础,反映计划执行情况,并分析其影响和形成原因。
特点:
采用“总——分——总”的结构,主要包括:开篇、正文和结尾三大部分。
1.开篇部分:
2.正文部分:包括具体分析过程与结果;
3.结尾部分:包括结论、建议及附录;
标题常用类型:
要素:
当书面报告中有大量图表时,可以考虑将各章图表单独做成目录,节省领导阅读时间;
主要包括分析背景,目的与思路:
1)分析背景:
主要是为了让报告阅读者对整个分析研究背景有所了解;
主要阐述此项分析的主要原因、分析意义,以及其他相关信息,如行业发展现状等。
2)分析目的:
主要是为了让报告阅读者了解开展此次分析能够带来何种效果,可以解决什么问题。
3)分析思路:
指导分析师进行完整的数据分析,即确定需要分析的内容或指标。
系统全面的表述数据分析的过程与结果;
包括论点与论证,其特点:
结尾是对整个报告的综合与总结,深化与提高,是得出结论、提出建议、解决矛盾的关键。
结论是以数据分析结果为依据,得出的分析结果,通常以综述性文字来说明:
建议是根据系数据分析结论,对企业或业务面临的问题而提出的改进方法:
附录提供正文中涉及而未予以阐述的有关资料,包括:
1.结构合理,逻辑清晰
2.实事求是,反映真相
3.用词准确,避免含糊
4.篇幅适宜,简介有效
5.结合业务,分析合理