企业信用评分卡模型实战(python,附代码)

企业信用评级在全球金融领域有广泛应用。它涉及到公司管理,企业债发行,企业融资,企业上市,企业并购,个人炒股和购买公司债券等多个场景。
企业债发行
企业主体信用评级越高,意味着该企业抗风险能力、盈利能力越强,发债融资成本越低。作为企业董事会,管理者,决策者应该了解企业主要财务指标,了解自身企业评级。
企业发债时都需要评级。国内评级这块主要分为AAA、AA+、AA、AA-、A+。企业评级过低会限制某些工具的发行额度、交易场所可质押性等等
如果是评级太低,企业发行债券没人买。目前广大投资者的投资门槛是AA。
企业上市
 企业上市融资时也需要信用评级。目前国内只有优质企业才能上市融资,上市牌照是很难拿的。
如果财务指标和资质不达标,则不能上市。
企业并购
企业并购是企业之间的兼并和收购行为。如果收购方不能很好了解对方企业评级,买来的企业可能是包装过的垃圾企业。
失败企业并购会让企业背上巨大债务负担。
个人炒股
个人炒股投资者如果不懂企业评级,也难以买到优质股,容易被人忽悠买到垃圾股。建议不会数据科学的人趁早离开股市和金融投资,否则可能欠下巨额债务。
如果个人通过学习机器学习模型,可以识别有价值企业,股票,债券,财富升值概率显著高于不懂模型的人。

 企业信用评分卡模型实战(python,附代码)_第1张图片

企业信用评级模型如何搭建?企业如何才能通过信用评级? 标准普尔、穆迪,惠誉国际,中诚信等知名评级机构的评级规则如何破解?

欢迎各位同学学习python信用评分卡建模视频系列教程(附代码, 博主录制) :

https://edu.csdn.net/course/detail/30611

企业信用评分卡模型实战(python,附代码)_第2张图片

 

 企业信用评分卡模型实战(python,附代码)_第3张图片

 

企业信用评分卡模型实战(python,附代码)_第4张图片企业信用评分卡模型实战(python,附代码)_第5张图片

 

 企业信用评分卡模型实战(python,附代码)_第6张图片

 

 

公司管理者应该学习企业信用评级

 企业主体信用评级越高,意味着该企业抗风险能力、盈利能力越强,发债融资成本越低。作为企业董事会,管理者,决策者应该了解企业主要财务指标,了解自身企业评级。

 企业信用评分卡模型实战(python,附代码)_第7张图片

企业发债时都需要评级。
国内评级这块主要分为AAA、AA+、AA、AA-、A+。

 企业信用评分卡模型实战(python,附代码)_第8张图片

企业评级过低会限制某些工具的发行额度、交易场所可质押性等等
如果是评级太低,企业发行债券没人买。目前广大投资者的投资门槛是AA

 

 企业信用评分卡模型实战(python,附代码)_第9张图片

  企业上市融资时也需要信用评级。目前国内只有优质企业才能上市融资,上市牌照是很难拿的。
如果财务指标和资质不达标,则不能上市。

个人炒股投资者如果不懂企业评级,也难以买到优质股,容易被人忽悠买到垃圾股。

企业信用评分卡模型实战(python,附代码)_第10张图片

企业并购是企业之间的兼并和收购行为。
如果收购方不能很好了解对方企业评级,买来的企业可能是包装过的垃圾企业。
失败企业并购会让企业背上巨大债务负担。

 企业信用评分卡模型实战(python,附代码)_第11张图片
课程中涉及到部分城投公司

企业信用评分卡模型实战(python,附代码)_第12张图片

 

企业信用评分卡模型实战(python,附代码)_第13张图片

 

 江苏城投企业建模数据部分展示企业信用评分卡模型实战(python,附代码)_第14张图片

 

课程中Python企业评级模型的AUC高于0.94,f1分数高达0.8,模型综合性能卓越

 企业信用评分卡模型实战(python,附代码)_第15张图片

 国内外知名评级公司包括:标准普尔、穆迪,惠誉国际,中诚信等公司。这些知名评级机构业务繁多,主要是通过自动化模型评级为主,人工审核为辅。

既然评级公司用模型评级,我们也可以用模型来逆向破解评级公司的规则。

机器学习模型可以逆向破解评级机构规则,让企业参加评级时把重要时间和精力放在评级机构关注指标上,显著提高高评级通过率。

企业信用评分卡模型实战(python,附代码)_第16张图片

企业信用评分卡模型实战(python,附代码)_第17张图片

 

 

企业信用评分卡模型实战(python,附代码)_第18张图片

 

 

 企业信用评分卡模型实战(python,附代码)_第19张图片

企业信用评分卡模型实战(python,附代码)_第20张图片

课程目录

章节1前言
课时1课程概述(必看)
课时2python金融风控评分卡模型和数据分析微专业课介绍(必看)
课时3欢迎项目合作

章节2python编程环境搭建
课时4风控建模语言,python,R,SAS优劣对比
课时5Anaconda快速入门指南
课时6Anaconda下载安装
课时7canopy下载和安装
课时8Anaconda Navigator导航器
课时9Anaconda安装不同版本python

章节3python安装包
课时10python第三方包安装(pip和conda install)
课时11Python非官方扩展包下载地址
课时12pip install --user --upgrade package升级包
课时13pip install失败报错五种解决方案

章节4Jupiter Notebook概述
课时14为什么使用jupyter notebook及如何安装
课时15如何用jupyter notebook打开指定文件夹内容?
课时16jupyter基本文本编辑操作
课时17jupyter生成在线PPT汇报文档
课时18jupyter notebook用matplotlib不显示图片解决方案

章节5 python编程基础知识
课时14 Python文件基本操作
课时15 变量_表达式_运算符_值
课时16 字符串string
课时17 列表list
课时18 程序的基本构架(条件,循环)
课时19 数据类型_函数_面向对象编程
课时20 python2和3的区别
课时21 编程技巧和学习方法

章节6 python机器学习基础
课时22 UCI机器学习常用数据库介绍
课时23 机器学习书籍推荐
课时24 如何选择算法
课时25 机器学习语法速查表
课时26 python数据科学常用的库
课时27 python数据科学入门介绍(选修)

章节7 德国信用评分数据下载和介绍
课时28 35德国信用评分数据下载和介绍

章节8 信用评分卡开发流程(上)
课时29 评分卡开发流程概述
课时30 第一步:数据收集
课时31 第二步:数据准备
课时32 变量可视化分析
课时33 样本量需要多少?
课时34 坏客户定义
课时35 第三步:变量筛选
课时36 变量重要性评估_iv和信息增益混合方法
课时37 衍生变量05:01
课时38 第四步:变量分箱01:38

章节9 信用评分卡开发流程(下)
课时39 第五步:建立逻辑回归模型
课时40 odds赔率
课时41 woe计算
课时42 变量系数
课时43 A和B计算
课时44 Excel手动计算坏客户概率
课时45 Python脚本计算坏客户概率
课时46 客户评分
课时47 评分卡诞生-变量分数计算
课时48 拒绝演绎reject inference
课时49 第六步:模型验证
课时50 第七步:模型部署
课时51 常见模型部署问题

章节10 模型开发基础知识python脚本讲解
课时61数据读取read_excel和read_csv
课时62数据划分train_test_split
课时63LogisticRegression()模型构建和训练fit()
课时64模型预测predict和predict_proba区别
课时65模型验证的python脚本讲解
课时66pickle保存模型包


章节11 Python信用评分卡-逻辑回归脚本
课时52 Python信用评分卡脚本运行演示
课时53 描述性统计脚本_缺失率和共线性分析
课时54 woe脚本(kmean分箱)
课时55 iv计算独家脚本
课时56 Excel手动推导变量woe和iv值
课时57 评分卡脚本1(sklearn)
课时58 评分卡脚本2(statsmodel)
课时59 生成评分卡脚本
课时60 模型验证脚本

章节12 PSI(population stability index)稳定指标
课时61 拿破仑远征欧洲失败/华尔街股灾真凶-PSI模型稳定指标揭秘
课时62 excel推导PSI的计算公式
课时63 PSI计算公式原理_独家秘密
课时64 PSI的python脚本讲解

章节13 难点1_坏客户定义
课时65 坏客户定义错误,全盘皆输
课时66 不同场景坏客户定义不一样,坏客户定义具有反复性
课时67 坏客户占比不能太低
课时68 vintage源于葡萄酒酿造
课时69 vintage用于授信策略优化

章节14 难点2_woe分箱
课时70 ln对数函数
课时71 excel手动计算woe值
课时72 python计算woe脚本
课时73 Iv计算推导
课时74 woe正负符号意义
课时75 WOE计算就这么简单?你想多了
课时76 Kmean算法原理
课时77 python kmean实现粗分箱脚本
课时78 自动化比较变量不同分箱的iv值
课时79 woe分箱第三方包脚本

章节15 难点3_逻辑回归是最佳算法吗?
课时80 逻辑回归是最优算法吗?No
课时81 xgboost_支持脚本下载
课时82 随机森林randomForest_支持脚本下载
课时83 支持向量SVM_支持脚本下载
课时84 神经网络neural network_支持脚本下载
课时85 多算法比较重要性_模型竞赛,百万奖金任你拿

章节16 难点4_变量缺失数据处理
课时86 imputer-缺失数据处理
课时87 xgboost简单处理缺失数据
课时88 catboost处理缺失数据最简单

章节17 难点5.模型验证
课时89 模型需要验证码?
课时90 商业银行资本管理办法(试行)
课时91 模型验证_信用风险内部评级体系监管要求
课时92 模型验证主要指标概述
课时93 交叉验证cross validation
课时94 groupby分类统计函数
课时95 KS_模型区分能力指标
课时96 混淆矩阵(accuracy,precision,recall,f1 score)
新增课时   模型排序能力-lift提升图


章节18 难点6.逻辑回归调参
课时97 菜鸟也能轻松调参
课时98 调参1_Penalty正则化选择参数
课时99 调参2_classWeight类别权重
课时100 调参3_solver优化算法选择参数
课时101 调参4_n_jobs
课时102 L-BFGS算法演化历史
课时103 次要参数一览

章节19难点7_非平衡样本数据imbalanced data
课时123非平衡数据是什么?对模型有什么坏处?
课时124解决非平衡数据方法(欠采样,过采样,SMOTE)
课时125SMOTE非平衡数据处理python脚本讲解


章节20 风控管理和诈骗中介(选修)
课时104 网络信贷发展史
课时105 诈骗中介
课时106 风控管理
课时107 告别套路贷,高利贷,选择正确贷款方式

章节21 2018-2019消费金融市场行情
课时108 揭秘:近年消费金融火爆发展根本原因
课时109 持牌照消费金融公司盈利排行榜
课时110 消费金融,风控技术是瓶颈
课时111 谁能笑到最后:2018-2019消费金融公司注册资本
课时112 萝卜加大棒:中央政策监管趋势独家预测
课时113 信用是金融交易的基石_P2P倒闭潮秘密

章节22 2018-2019年全球宏观经济
课时114 专家不会告诉你的秘密:美元和黄金真实关系
课时115 宏观经济主要指标:债务率和失业率
课时116 2019年中国宏观经济分析_赠人民银行发布2018n年中国金融稳定报告
课时117 2019年G20国家宏观经济信息汇总_供下载
课时118 全球系统金融风险
课时119 基尼系数_贫富差异指标
课时120 GDP_利率_通货膨胀
课时121 失业率_债务率
课时122 贸易差额_中美贸易战根本原因
课时123 信用评级_阿根廷金融危机独家解读


章节23 企业信用评分卡模型实战(python,基于真实江苏城投公司数据)
课时148描述性统计和缺失值处理
课时149woe第三方包分箱原理和主要语法
课时150python脚本woe分箱整体演示
课时151用woe数据生成模型包
课时152AUC大于0.9-模型验证效果非常好
课时153踢除高相关性变量后建模,模型性能有何变化?
课时154最小分箱数量调参测试
课时155逆向工程-破解评级机构秘密
课时156AAA评级企业
课时157AA+评级企业
课时158AA评级企业
课时159国内评级机构业务统计数据
课时160中诚信国际信用评级有限公司股权穿越图


章节24附录
课时121风控逾期指标字典
课时122金融风控术语中英文字典

评分卡开发流程

本课程通俗易懂,深度解析评分卡模型的各个细节,犹如庖丁解牛,各个击破。

企业信用评分卡模型实战(python,附代码)_第21张图片

课程会横向讲解评分卡模型是如何一步一步搭建的。

企业信用评分卡模型实战(python,附代码)_第22张图片

 

 数学原理

课程还会讲述逻辑回归的信用评分卡搭建背后的算法原理,数学公式。

企业信用评分卡模型实战(python,附代码)_第23张图片

 

取数

课程教会学员如何取数,什么是vintage?什么是样本窗口期?

 

企业信用评分卡模型实战(python,附代码)_第24张图片

 

变量筛选

课程教授如何筛选变量,如何构建衍生变量。

企业信用评分卡模型实战(python,附代码)_第25张图片

 

课程提供python脚本和数据下载

课程提供视频中展示脚本和建模数据,并定期更新优化。学员可以下载后跟着视频一起演练。

企业信用评分卡模型实战(python,附代码)_第26张图片

 

模型运行后输出详细信息,包括变量的统计分析。

企业信用评分卡模型实战(python,附代码)_第27张图片

评分卡生成(score card)

python脚本可以生成一个评分卡模块(score card),详细保存每个变量有哪些分箱,每个分箱如何计分。这方便业务方和领导参考决策。

企业信用评分卡模型实战(python,附代码)_第28张图片

拒绝推断reject reference

课程讲述了拒绝推断reject reference重要概念

企业信用评分卡模型实战(python,附代码)_第29张图片

模型验证

课程还讲述模型验证的概念,建模数据需要分为train训练数据,test测试数据,oot更远时间段验证数据。此教程是市面上最全面讲述评分卡教程。

企业信用评分卡模型实战(python,附代码)_第30张图片

企业信用评分卡模型实战(python,附代码)_第31张图片

(模型验证的部分指标展示)

企业信用评分卡模型实战(python,附代码)_第32张图片

                                                                                (模型验证方法论)

 

模型部署和监控

此教程还概述模型部署和监控知识。模型部署是存在众多问题的,模型具有操作风险,经常会遇到模型线上线下数据不一致情况,变量映射错误,数据传输丢包,脚本漏写等等各种复杂情况。

从模型训练,模型打包,模型验证,模型部署,模型监控,重新训练模型,最终形成了一个模型开发周期闭环。

企业信用评分卡模型实战(python,附代码)_第33张图片

 (模型开发周期流程图)

 

 

python部分建模脚本展示

randomForest.py

# -*- coding: utf-8 -*-
"""
博主python金融风控评分卡模型和数据分析微专业课:
https://edu.csdn.net/combo/detail/1927

"""
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
  
trees=1000
#读取文件
readFileName="data.xlsx"
#读取excel
df=pd.read_excel(readFileName)
list_columns=list(df.columns[:-1])
X=df.ix[:,:-1]
y=df.ix[:,-1]
names=X.columns
x_train,x_test,y_train,y_test=train_test_split(X,y,random_state=0)
#n_estimators表示树的个数,测试中100颗树足够
forest=RandomForestClassifier(n_estimators=trees,random_state=0)
forest.fit(x_train,y_train)
print("random forest with %d trees:"%trees)
print("accuracy on the training subset:{:.3f}".format(forest.score(x_train,y_train)))
print("accuracy on the test subset:{:.3f}".format(forest.score(x_test,y_test)))
print('Feature importances:{}'.format(forest.feature_importances_))
n_features=X.shape[1]
plt.barh(range(n_features),forest.feature_importances_,align='center')
plt.yticks(np.arange(n_features),names)
plt.title("random forest with %d trees:"%trees)
plt.xlabel('Feature Importance')
plt.ylabel('Feature')
plt.show()

决策树可视化

企业信用评分卡模型实战(python,附代码)_第34张图片

 

神经网络可视化

企业信用评分卡模型实战(python,附代码)_第35张图片

 

更多相关知识,请报名系列课《python金融风控评分卡模型和数据分析微专业课》

https://edu.csdn.net/combo/detail/1927

 

 

你可能感兴趣的:(python风控模型,机器学习,算法,概率论,python)