金融风控训练营金融风控基础知识学习笔记

一、赛题理解和学习目标:

 

本次挑战赛以个人信贷为背景,要求选手对金融风控之贷款是否违约进行预测,以此判断是否通过此项贷款的一项问题型比赛。通过学习Task1了解第一个学习内容,要求对金融风控的问题建立数学模型最后给定金融风险程度。

在此过程中要了解混淆矩阵、AUC评价指标、KS统计量、以及对python的认识。

二、学习内容和学习笔记:

【1】混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式,用n行n列的矩阵形式来表示。具体评价指标有总体精度、制图精度、用户精度等,这些精度指标从不同的侧面反映了图像分类的精度。在人工智能中,混淆矩阵(confusion matrix)是可视化工具,特别用于监督学习,在无监督学习一般叫做匹配矩阵。在图像精度评价中,主要用于比较分类结果和实际测得值,可以把分类结果的精度显示在一个混淆矩阵里面。混淆矩阵是通过将每个实测像元的位置和分类与分类图像中的相应位置和分类相比较计算的。

本题的混淆矩阵是一个2×2的矩阵分为真正类TP、真分类TN、假正类FT、假反类FN

 

AUC被定义在ROC曲线下与坐标轴围成的面积(ROC曲线:以真阳性率为纵坐标,以假阳性率为横坐标绘制的曲线,其中假阳性率的定义为真正类/真正类+假正类,真阳性率定义为真正类/真正类+真负类)在建立模型后进行模型评估过程中需要用到公式:KS=max(TPR-FPR),一般情况下KS值越大,模型区分能力越强,但是我们要注意的是KS过大会导致过拟合的情况出现。

其中KS<0.2,认为模型没有却分能力;0.20.75,模型异常。

 

三、学习总结:

本次的任务学习,我初步了解了什么是金融风控以及其大致内容,对我而言这完全是没有接触过的知识,对python有了一定的了解,获得分析题目的方法。

四、问题:

由于之前没有系统性学习过python,很多示例的地方根本看不懂,以及混淆矩阵的实际作用仍然不能了解。

【1】https://www.so.com/s?src=lm&ls=sm2354553&lm_extend=ctype:31&q=%E6%B7%B7%E6%B7%86%E7%9F%A9%E9%98%B5


你可能感兴趣的:(金融风控训练营金融风控基础知识学习笔记)