四象限图是一种针对二维数据(x,y)的平面图形。二维数据(x,y)的两个维度垂直交叉在一起,分别构成四象限图的X轴及Y轴。两个维度所有样本的均值(即x的均值和y的均值)可以作为分界线,把整个平面区域划分为四个区域象限,然后按照每个样本(x,y)实际值的大小,将每个样本映射到具体的区间,从而实现样本的简单四分类。针对每个类别的样本还可以可以进行深入研究,提出有针对性的策略和建议。
四象限图在商业经营管理应用实践中应用非常广泛,比如在商业银行对公客户经营效益评价方面,常用EVA(经济增加值,或称为风险调整后收益)和RAROC(风险调整后的资本回报率)两个维度来进行评价,我们就可以将EVA和RAROC分别作为X轴及Y轴,绘制四象限图,将客户有效分类为“低EVA-低RAROC”“高EVA-低RAROC”“低EVA-高RAROC”“高EVA-高RAROC”4类,针对每一类客户分别采取差异化的维护策略。例如“高EVA-低RAROC”本质上反映的是客户的整体效益水平较高,但资本利用效率相对不足,需要进一步提升定价水平或减少资本占用等;“低EVA-高RAROC”本质上反映的是针对该类客户的资本利用效率较高但整体效益水平相对不足的情况,需要进一步加大对客户营销力度,鼓励客户办理更多的业务等。
我们用于绘制四象限图的数据文件是“客户规模及利润贡献增长率数据.xlsx”。案例数据是某公司2022年31个省市分店客户群规模增长率和客户利润贡献增长率的数据,我们需要将31个省市分店按照“客户群规模增长率”和“客户利润贡献增长率”两个变量划分为4个类别。针对“客户群规模增长率”和“客户利润贡献增长率”的不同组合实施差异化的资源倾斜与政策指导策略,以期进一步提升经营管理效能,创造出更多价值回报。
绘制四象限图的Python代码示例如下:
以下为载入所需要的模块和函数以及数据读取代码:
以下为绘图代码(注意需同时选中并运行):
运行结果如下图所示。
可以发现该公司在31个省市的分店被分到了四个象限,比如浙江、四川、福建、安徽等省市的分店被列入第一象限,即分店的客户群规模增长率高、客户利润贡献增长率高;吉林、黑龙江、天津、辽宁等省市的分店被列入第四象限,即分店的客户群规模增长率低、客户利润贡献增长率低;广东、江苏、山东、河南等省市的分店被列入第二象限,即分店的客户群规模增长率低、客户利润贡献增长率高;宁夏、西藏、甘肃、海南等省市的分店被列入第四象限,即分店的客户群规模增长率高、客户利润贡献增长率低。该公司可以因地制宜采取合适的经营管理策略。
一般的数据分析师做到前面这部分基本上就结束了。那么问题来了,到底应该怎么因地制宜采取合适的经营管理策略?其实这也是管理者和决策者很关心的问题,发现问题更要解决问题。所以这就是我之前反复强调的“真正优秀的数据分析师,不仅仅需要懂技术,会编程语言、会软件操作;另一方面,还需要掌握一定的统计分析原理,知道每种数据挖掘算法背后的基础逻辑;再一方面,需要结合具体的业务场景,懂一些基本的商业运营逻辑,通过数据分析能够为高层决策起到智力支持的作用”。如果再加上下面一段,是不是一下子就提上了数据分析报告的质量和水平呢?
(1)把客户群规模增长率高、客户利润贡献增长率高的分店分类为重点扶持类分店。
这些分店处于非常优秀的状态,一方面客户群规模增长率高,说明该分店在积极增长,发展潜力较大;另一方面客户利润贡献增长率高,说明该分店在经营管理方面做得较为精细,能够及时将客户群规模增长带来的优势转化为实实在在的利润贡献,创造价值的能力较强。针对这一类分店,可以采用重点扶持的策略,将更多的人力、物力、财力资源配置到这些分店,将更多的优惠政策倾斜到这些分店。
(2)把客户群规模增长率低、客户利润贡献增长率低的分店分类为择机处理类分店。
这些分店处于非常薄弱的状态,一方面客户群规模增长率低,说明该分店增长受阻,发展潜力较小;另一方面客户利润贡献增长率低,说明该分店在经营管理方面做得较为粗放,无法产生出实实在在的利润贡献,创造价值的能力较差。针对这一类分店,可以采用择机处理的策略,将更多的人力、物力、财力资源转移到其他分店,将更多的优惠政策倾斜到其他分店。
(3)把客户群规模增长率高、客户利润贡献增长率低的分店分类为加强指导类分店。
这些分店处于较为尴尬的状态,一方面客户群规模增长率高,说明该分店在积极增长,发展潜力较大;但另一方面客户利润贡献增长率低,说明该分店在经营管理方面做得较为粗放,没有能够及时将客户群规模增长带来的优势转化为实实在在的利润贡献,创造价值的能力较差。针对这一类分店,可以采用加强指导的策略,指导它实现更加精细化的经营管理,创造出更多的利润贡献。
(4)把客户群规模增长率低、客户利润贡献增长率高的分店分类为推动开拓类分店。
这些分店处于较为保守的状态,一方面客户群规模增长率低,说明该分店没有实现积极增长,没有展现出发展潜力;但另一方面客户利润贡献增长率高,说明该分店在经营管理方面做得较为精细,创造价值的能力较强。针对这一类分店,可以采用推动开拓的策略,推动这些分店积极加强营销,改变过于保守的策略打法,不断实现做大做强。
玩转数据并不难,真正难得是读懂数据所代表的的含义,读透背后的商业逻辑。在各行各业数字化全面转型的今天,一方面,技术人员不仅要懂技术,也要积极学习业务,将对数据的分析结果转化为实实在在的商业对策建议,或者说,只有结合商业价值创造开展的数据分析才有意义和价值;另一方面,业务出身的朋友也要积极需要一些技术,比如前面提到的用Python画个四象限图,大家可以想一想,如果一个业务出身的朋友能够拿着这些基于数据分析的报告向老板去汇报,是不是一下子就显得比那些夸夸其谈的同事们更专业、更靠谱?
上述案例节选自《Python数据科学应用从入门到精通》(张甜 杨维忠 著 2023年11月新书 清华大学出版社)
推荐学一门编程语言Python,加两个统计分析软件Stata、SPSS,这样几乎可以胜任统计分析与数据科学的各种场景,无论是在校搞学术还是职场搞数据都绰绰有余。但切记要结合具体的商业实战案例来学。那么学习统计分析与数据科学应该看什么书?
针对Python数据分析或机器学习推荐两本入门级的图书:《Python机器学习原理与算法实现》(杨维忠张甜 著 2023年2月新书 清华大学出版社)《Python数据科学应用从入门到精通》(张甜 杨维忠 著 2023年11月新书 清华大学出版社)。这两本书的特色是在数据分析、机器学习各种算法的介绍方面通俗易懂,较少涉及数学推导,对数学基础要求相对不高,而且紧密结合商业实战案例进行讲解,在python代码方面讲的很细致,看了以后根据自身需要选取算法、优化代码、科学调参。都有配套免费提供的源代码、数据文件和视频讲解,也有PPT、思维导图、习题等。
(1)《Python机器学习原理与算法实现》杨维忠 张甜编著 清华大学出版社 2023年 适用于Python基础教学、数据分析、数据挖掘与建模、机器学习等教学。内容非常详实,包含了Python和机器学习,相当于一次获得了两本书。在讲解各类机器学习算法时,逐一详解用到的各种Python代码,针对每行代码均有恰当注释(这一点基本上是大多数书目做不到的)。这本书在出版之前曾开发成9次系列课程,在某股份制银行全行范围类开展培训,490人跟随杨维忠老师上课学习(课程限报490人),培训完成后课程在知鸟平台上回放超过3万人次。很多银行员工通过这些学习一下子就学会了Python,并且用于工作中开展数据分析、机器学习、数据可视化等,这本书也被多家商业银行选做数字化人才培训教材,成为银行员工的一本网红书。
(2)《Python数据科学应用从入门到精通》张甜 杨维忠编著 清华大学出版社 2023年 适用于Python基础教学、数据分析、数据挖掘与建模、数据可视化、数据清洗等教学。旨在教会读者实现全流程的数据分析,并且相对《Python机器学习原理与算法实现》一书增加了很多概念性、科普性的内容,进一步降低了学习难度。国务院发展研究中心创新发展研究部第二研究室主任杨超 ,山东大学经济学院金融系党支部书记、副主任、副教授、硕士生导师张博,山东管理学院信息工程学院院长 袁锋 教授、硕士生导师,山东大学经济学院刘一鸣副研究员、硕士生导师,得厚投资合伙人张伟民等一众大牛联袂推荐。书中全是干货,买这一本书相当于一下子得到了5本书(Python基础、数据清洗、特征工程、数据可视化、数据挖掘与建模),而且入门超级简单,不需要编程基础,也不需要过多数学推导,非常适用于零基础学生。全书内容共分13章。其中第1章为数据科学应用概述,第2章讲解Python的入门基础知识,第3章讲解数据清洗。第4~6章介绍特征工程,包括特征选择、特征处理、特征提取。第7章介绍数据可视化。第8~13章介绍6种数据挖掘与建模方法,分别为线性回归、Logistic回归、决策树、随机森林、神经网络、RFM分析。从数据科学应用和Python的入门,再到数据清洗与特征工程,最终完成数据挖掘与建模或数据可视化,从而可以为读者提供“从拿到数据开始,一直到构建形成最终模型或可视化报告成果”的一站式、全流程指导。
(3)《SPSS统计学原理与实证研究应用精解》张甜 杨维忠编著 清华大学出版社,高度贴合学生使用SPSS开展实证研究、写论文所设计。
(4)《Stata统计分析从入门到精通》杨维忠 张甜编著 清华大学出版社 2022年 适用于Stata计量经济学、统计分析教学。国内计量大牛、山东大学陈强教授作序推荐,长期占据当当、京东、淘宝同类图书畅销榜前列。国内众多高校作为核心专业课程教材。
(5)《Stata统计分析商用建模与综合案例精解》杨维忠 张甜编著 清华大学出版社 2021年 适用于Stata计量经济学、统计分析教学。国内众多高校作为核心专业课程教材。在51CTO举办的“2021年度最受读者喜爱的IT图书作者评选”中,《Stata统计分析商用建模与综合案例精解》荣获“数据科学领域最受读者喜爱的图书TOP5”。
(6)《SPSS统计分析入门与应用精解(视频教学版)》杨维忠 张甜编著 清华大学出版社 2022年 适用于SPSS统计分析教学。同为国内计量大牛、山东大学陈强教授作序推荐,长期占据当当、京东、淘宝同类图书畅销榜前列。国内众多高校作为核心专业课程教材。
(7)《SPSS统计分析商用建模与综合案例精解》杨维忠 张甜编著 清华大学出版社 2021年 适用于SPSS统计分析教学。国内众多高校作为核心专业课程教材。在51CTO举办的“2021年度最受读者喜爱的IT图书作者评选”中,《SPSS统计分析商用建模与综合案例精解》荣获“数据科学领域最受读者喜爱的图书TOP5”。
京东、当当、淘宝各大平台均在热销中,搜索书名即可。
创作不易,恳请大家多多点赞支持!也欢迎大家关注我,让我们一起学习Stata、SPSS、Python知识。多谢!