银行业客户流失预警模型(一)| 业务介绍

银行业客户群体

1.银行的个人客户

银行对个人客户的主要业务是:为个人客户合理安排个人财务,具体有

(1)存款,取款
(2)小额贷款
(3)代理投资理财
(4)信息咨询
(5)其他各类中介服务

目的:为客户取得收益,并帮助其防范风险,同时提高银行自身效益

客户分类分类:

  • 一般客户:主要以存折,存单,账户,借记卡业务为主

  • 消费信贷客户:以资产业务为主,主要指房贷,车贷,耐用品消费品贷款

  • 信用卡客户:一般是面向社会各阶层人士提供的小额短期信贷款,支付,转账业务等

  • 贵宾理财客户:指收入高,财富多的中产阶级以上提供资产保值,增值服务

  • 私人银行客户:只面向富豪提供专属,私密,量身定做的金融服务,包括海外基金,信托基金,私募基金,目的是帮助其财富增值,避税等。

2.银行的公司客户

公司客户主要是指:各类企事业单位及政府机关,以企业单位为主。

公司客户能为银行带来大量存款,贷款以及收费业务,并成为银行利润的重要来源

银行业产品类别

1.银行信贷类资产

不需要抵押品
信用贷款,抵押贷款,保证书贷款,贷款证券化

2.银行负债业务

(1) 活期存款 (2) 定期存款 (3) 储蓄存款 (4) 可转让定期存单 (5)其他种类

客户流失预警模型的业务意义

根据调查,国内商业银行的客户流失率达20%甚至更高。而获得新客户的成本,可达到现有客户的5倍,因此及时预警客户是否流失,可以有效降低成本。

客户流失的主要原因有
价格流失,产品流失,服务流失。市场流失,促销流失,技术流失,政治流失。

一个表面上看来是由于价格因素流失的客户,实际上可能存在很多种因素

(1)不显示的利润目标,价格结构不合理

(2)过度复杂的业务流程,组织结构的不合理

(3)决策工具应用失误,信息系统的缺陷

(4)银行不恰当的雇佣原则,培训的缺失,落后的技术

(5)员工职业生涯发展不利和对员工的激励不足

维护客户关系的基本方法

追踪制度;
产品跟进;
扩大销售;
维护访问;
机制维护

对于银行或者互联网金融机构来说,建立一个量化的模型,合理预测客户群的潜在流失风险,是非常重要的。

客户流失预警模型中的数据特征选择

当我们拿到一个数据集合,可能有几百几千个数据特征,需要加以处理,选择合适的特征放到模型中进行训练。

运营和分析师之间可能会存在这样的对话:
分析师:“这个变量我做了卡方检验了,不显著,所以我没有放进模型。”

那什么是卡方检验,为什么就能决定某个人曾是否有用呢?

卡方检验,统计学的方法,现在机器学习看变量的时候也会用到。
卡方检验就是检验两个变量之间有没有关系。

比如:

  • 卡方检验可以检验男性或者女性对银行客户群体流失有没有区别
  • 卡方检验可以检验不同的地理区域对这个银行的客户群体流失有没有区别

如果显著有区别,那我们就可以把这个性别或者地理区域这个因素放到模型中

投硬币

下面从投硬币这个简单的例子来理解卡方检验:
1) 根据投硬币观察到的正面,反面次数,判断这个硬币是均衡的还是不均衡。
现在有一个正常的硬币,我给你投50次,你觉得会出现几个正面,几个反面?
银行业客户流失预警模型(一)| 业务介绍_第1张图片

按照你的经验你会这么思考,最好的情况肯定是25个正面,25个反面,
但是肯定不可能这么正正好好的,嗯,差不多28个正面,22个反面吧;
23个正面,27个反面也可能的,
但是10个正面,40个反面肯定不可能的,除非我运气真的那么碰巧。

你上面的这个思维方式,就是拿已经知道的结果(硬币是均衡的,没有人做过手脚),推测出会出现的不同现象的次数。

而卡方检验是拿观察到的现象(投正面或反面的次数或者频数),来判断这个结果(硬币是不是均衡的)。

如果我不知道这个硬币是不是均衡的,我想用正面,反面的频次来判断,我投了50次,
其中28个正面,22个反面。我怎么用卡方检验来证明这个硬币是均衡的还是不均衡的呢?
银行业客户流失预警模型(一)| 业务介绍_第2张图片

这里要引出卡方检验的公式:
银行业客户流失预警模型(一)| 业务介绍_第3张图片

从公式可以看出来,X2越大,观察值和理论值越远,X2越小,观察值和理论值越接近。
根据置信度,自由度查表可以得到相伴概率P值,

  • 如果X2小于或者等于P值,接收零假设,认为样本来自这个总体(投掷硬币结果是均衡的),否则拒绝零假设,认为样本不来自这个总体(就是投掷硬币结果不是均衡的)

这个公式可以帮我们求出卡方检验的值。同时查表需要的自由度可以计算,置信度可以自己定,一般选择90%或者95%。

这三个数值计算方法如下:
银行业客户流失预警模型(一)| 业务介绍_第4张图片

我们拿到卡方检验的值,自由度,置信度这3个信息,去查表,得到相伴概率P值,因为0.72小于查表得到的3.841,所以我们得出这个硬币是均衡的结论。
银行业客户流失预警模型(一)| 业务介绍_第5张图片

金融行业客户群体的性别和流失率

考察客户的性别和流失率有没有关系
去查表,得到相伴概率P值,因为0.72小于查表得到的3.841,所以我们得出这个硬币是均衡的结论。
[外链图片转存中…(img-PcJCIZFz-1595751268510)]

金融行业客户群体的性别和流失率

考察客户的性别和流失率有没有关系
银行业客户流失预警模型(一)| 业务介绍_第6张图片
上述案例中,我们期望,男女性别和最后的流失率没有相关性,所有流失数均衡,但是计算得出的X2值32.66显著大于P值5.99,所以说拒绝零假设,也就是说男女性别和流失率是有显著相关性的,需要将这个特征放到模型中。

你可能感兴趣的:(银行业客户流失预警模型(一)| 业务介绍)