本文描述的是CreditRisk+模型,该模型是一个信用风险模型,根据银行自身的违约率平均值,结合回收率和风险暴露,得到所有债务人的资产组合的预期违约损失分布。该分布可以给银行做参考,准备相应的年度信用准备金。
目录
1.CreditRisk+模型简介:主要说明CreditRisk+模型是什么,该模型需要的假设以及大概的计算流程。
2.计算过程:主要说明Z计分模型里的特征含义,以及Z值的用途。
3.用到的python库及其方法:主要说明导入的库的用途以及使用方法
4.模型演示:给出数据,看一下Python代码是如何实现的,并分析结果。
5.总结:总结该模型的优缺点。
1、CreditRisk+模型简介
在财产保险精算思想和方法的启发下,瑞士信贷银行金融产品部开发出了基于财险精算方法的违约模型,记为CreditRisk+模型。
该模型只考虑违约或不违约两种状态,同时假定违约率是随机的,并以此为前提度量预期损失、未预期损失及其变化,所以CreditRisk+模型是一个违约模型
模型假设:(1)每笔贷款在给定期间内违约率不变;(2)每个借款人的违约率非常小,且违约数相互独立。所以违约事件发生的概率分布服从泊松分布。
定义:CreditRisk+模型仅仅考虑了违约风险,而没有考虑信用等级降级风险,属于信用违约风险度量模型。利用CreditRisk+模型可以得到贷款组合损失的概率分布。
流程:先用贷款组合中最大一笔风险暴露值与风险暴露频段值L相除并四舍五入为整数得到风险暴露频段总级数m;然后将每笔贷款的风险暴露数除以L四舍五入为整数将其归类到该整数对应的频段级,即将所有贷款分类在m个频段级里;再计算每个频段级的贷款违约数量的概率分布和违约损失的概率分布(贷款违约数服从泊松分布,违约损失=违约数量*平均风险暴露);最后计算贷款组合的违约损失的概率分布(相同的组合损失金额可能对应多种损失组合,所以要加总概率)
2、计算过程
2.1、模型所需特征
输入:贷款组合的风险暴露,风险暴露频段值L
中间:风险暴露频段级数m,各个频段级的贷款违约数量的概率分布和违约损失的概率分布
输出:贷款组合的违约损失的概率分布
2.2、计算过程
所需特征已经给出,那么接下来就是说明这些特征的处理或计算的过程了,这些过程主要分三步
2.2.1 第一步:风险暴露频段分级法
我们以N笔贷款构成的组合为例,具体介绍频段分级法:
(1)先根据所有贷款的风险暴露情况设定风险暴露频段值,记为L,例如可以取L=2万元作为一个频段值。
(2)用N笔贷款中最大一笔贷款风险暴露值除以频段值L,将计算数值按照四舍五入凑成整数,称之为风险暴露的频段总级数,设为m,于是,就得到m个风险暴露频段级,以此为v1、v2、…、vm,vi所对应的风险暴露量为Li。
(3)将每笔贷款的风险暴露量除以频段值L,再按照四舍五入的规则将计算数值凑成整数,然后将该笔贷款归类到该整数值岁对应的频段值,类似地,可将所有贷款归类。
2.2.2 第二步:各个频段级的违约概率和损失分布
假设处于vi频段级的贷款的平均违约数为λi,同时设将N笔贷款划级归类后处于vi频段级的贷款数目为Ni,显然,N1 + N2 + … + Nm = N于是,可得:
其中,Li = L × i 为vi频段级对应的风险暴露数,L为频段值。于是,我们可以得到处于vi频段级的违约概率分布及其对应的损失分布。
2.2.3 第三步:N笔贷款组合的违约概率和损失分布
求出各个频段级的贷款违约概率和预期损失后,要加总共m个风险暴露频段级的损失,以得到N笔贷款组合的损失分布。
(1)首先要考虑各种预期损失可能的结合来计算概率。
假设N笔贷款中处于vi频段级的违约数为ni,这样得到一个依次对应于m个频段级的违约组合(n1,n2,…,nm),于是,根据 Li = L × i 可计算出该违约组合对应的风险暴露量为:
(2)根据贷款违约事件的独立性假设和泊松分布假设,得到对应于违约组合(n1,n2,…,nm)的N笔贷款组合的违约概率为:
(3)我们用G表示满足的所有不同组合的违约组合(n1,n2,…,nm)的集合,即:
则N笔贷款组合的风险暴露或违约损失=nL的概率及其对应的预期损失分别为:
其中,n = 1,2,…,于是,通过上式就可以得到N笔贷款组合的违约概率和损失分布。
3、用到的python库及其方法
这里用到了两个库,分别是scipy和numpy。
3.1、scipy
scipy库建立在Numpy库之上,提供了大量科学算法,主要包括这些主题:
*特殊函数(scipy.special)
*积分(scipy.integrate)
*最优化(scipy.optimize)
*插值(scipy.interpolate)
*傅立叶变换(scipy.fftpack)
*信号处理(scipy.signal)
*线性代数(scipy.linalg)
稀疏特征值(scipy.sparse)
统计(scipy.stats)
多维图像处理(scipy.ndimage)
文件IO(scipy.io)
CreditRisk+模型引入第三方科学计算库模块scipy.stats,使用poisson(λ)****计算泊松分布的概率质量函数:
用法如下:
importscipy.statsasst
po=st.poisson(1)
[po.pmf(i)foriinrange(5)]#pmf:probabilitymassfunction,概率质量函数
Output:
[0.36787944117144233,
0.36787944117144233,
0.18393972058572114,
0.061313240195240391,
0.015328310048810101]
3.2、numpy
使用NumPy可以执行以下操作:
(1)数组的算数和逻辑运算。
(2)傅立叶变换和用于图形操作的例程。
(3)与线性代数有关的操作。NumPy拥有线性代数和随机数生成的内置函数。
这里使用了数组有关的操作。
4、模型演示
考察一家银行6笔贷款的情况,如下图,假设风险暴露频段值选定为L = 5万人民币,—个信贷组合中一年内发生1个违约事件,即 λ = 1
代码和计算过程一样分为3个部分:
第一部分为将6笔贷款除以风险暴露频段值,将贷款分成两类,输出字典变量label。
第二部分是计算各个频段级的违约概率和损失分布,输出的每一列对应每个频段级的概率分布arr。
第三部分计算更多了,先是计算各个违约损失组合的违约概率,然后整理成一个数组对象并计算出概率分布。最后得出未来一年内的预期损失期望,变量为E_loss。
代码如下,代码里用到的重要变量都有注释:
import numpy as np
import scipy.stats as st
money = [5,4,8,9,10,3]
L = 5
labelnum = round(max(money) / L) # 风险暴露总级数
label = {} # 频段级及对应的贷款贷款金额
for i in money:
for j in range(1, labelnum+1):
if round(i / L) == j:
if j not in label.keys():
label[j] = [i]
else:
label[j].append(i)
label
Output:{1: [5, 4, 3], 2: [8, 9, 10]}
—————————————————————————————————
arr = np.zeros((len(label[1])+1,labelnum))# 各个频段级对应的违约数的概率分布
# λ=1
rv = st.poisson(1)
for i in range(arr.shape[0]):
for j in range(arr.shape[1]):
arr[i][j] = round(rv.pmf(i), 4)
arr
Output:array([[ 0.3679, 0.3679],
[ 0.3679, 0.3679],
[ 0.1839, 0.1839],
[ 0.0613, 0.0613]])
—————————————————————————————————
pro = np.zeros((arr.shape[0], arr.shape[0])) # 联合违约概率
loss = np.zeros((arr.shape[0], arr.shape[0])) # 违约总损失
for i in range(pro.shape[0]):
for j in range(pro.shape[1]):
loss[i, j] = i * L + j * 2* L
pro[i, j] = round(arr[i, 0] * arr[j, 1], 4)
pro
Output:array([[ 0.1354, 0.1354, 0.0677, 0.0226],
[ 0.1354, 0.1354, 0.0677, 0.0226],
[ 0.0677, 0.0677, 0.0338, 0.0113],
[ 0.0226, 0.0226, 0.0113, 0.0038]])
loss
Output:array([[ 0., 10., 20., 30.],
[ 5., 15., 25., 35.],
[ 10., 20., 30., 40.],
[ 15., 25., 35., 45.]])
—————————————————————————————————
arr2 = {} # 整理之后的贷款违约损失的概率分布
for i in range(pro.shape[0]):
for j in range(pro.shape[1]):
if loss[i, j] not in arr2.keys():
arr2[loss[i, j]] = pro[i, j]
else:
arr2[loss[i, j]] = round((arr2[loss[i, j]] + pro[i, j]), 4)
arr2 = sorted(arr2.items(), key=lambda x: x[0])
arr2 = dict(arr2)
arr2
Output:{0.0: 0.13539999999999999,
5.0: 0.13539999999999999,
10.0: 0.2031,
15.0: 0.158,
20.0: 0.13539999999999999,
25.0: 0.090300000000000005,
30.0: 0.056399999999999999,
35.0: 0.0339,
40.0: 0.011299999999999999,
45.0: 0.0038}
—————————————————————————————————
“”“
绘制图像
”“”
plt.rcParams['font.sans-serif'] = ["SimHei"]
plt.rcParams["axes.unicode_minus"] = False
x_list = list(range(0,10,1))
height_list = list(accu_pro.values())
rects1 = plt.bar(x=x_list, height=height_list, width=0.5, alpha=0.8, color='red', linewidth=2)
# 设置x轴坐标点显示
tick_labels = list(accu_pro.keys())
tick_pos = x_list
plt.xticks(tick_pos, tick_labels)
plt.title("资产组合的预期违约损失分布", size=16)
plt.xlabel("期望损失金额", size=14)
plt.ylabel("不违约概率", size=14)
for a,b in zip(x_list,height_list):
plt.text(a, b+0.02, '%.4f' % b, ha='center', va= 'bottom',fontsize=10)
plt.show()
—————————————————————————————————
accu_pro = {} # 累积概率密度
for j in range(len(arr2)):
sum = 0
for i in range(j+1):
sum = sum + list(arr2.values())[i]
accu_pro[list(arr2.keys())[j]] = sum
accu_pro = sorted(accu_pro.items(), key=lambda x: x[0])
accu_pro = dict(accu_pro)
accu_pro
Output:{0.0: 0.13539999999999999,
5.0: 0.27079999999999999,
10.0: 0.47389999999999999,
15.0: 0.63190000000000002,
20.0: 0.76729999999999998,
25.0: 0.85760000000000003,
30.0: 0.91400000000000003,
35.0: 0.94790000000000008,
40.0: 0.95920000000000005,
45.0: 0.96300000000000008}
—————————————————————————————————
E_loss = [i*j for i,j in arr2.items()] # 期望损失
E_loss
Output:[0.0,
0.67699999999999994,
2.0310000000000001,
2.3700000000000001,
2.7079999999999997,
2.2575000000000003,
1.6919999999999999,
1.1864999999999999,
0.45199999999999996,
0.17100000000000001]
—————————————————————————————————
print(np.mean(E_loss))
print(np.std(E_loss))
Output:1.3545
0.93740327501
结果分析:该银行6笔贷款组成的贷款组合,未来一年期望的损失金额为1.35万人民币,大致可看出未来有95%的把握损失不会超过40万人民币。
5、总结
credit disk+模型优缺点总结如下:
优点:
(1)要求的估计量和输入数据较少,仅需要债务工具的违约和风险暴露的数据,模型应用比较简单
(2)不需要对违约原因做任何假设
(3)将违约率视为连续随机变量,并将违约率的波动率纳入模型体现违约率本身的不确定性这一特征。通过使用违约波动率参数,模型得到简化,而且不用考虑违约相关性特征
缺点:
(1)忽略了信用等级变化,因而贷款信用风险在计算期间内固定不变,与实际情况不符合
(2)分组时,对每笔贷款暴露近似到组,从而将高估投资组合的方差
(3)忽略了市场风险