SDU项目实训记录1.1——项目介绍(6.28)

SDU项目实训记录1.1——项目介绍

  • 一、实训题目
  • 二、项目背景
  • 三、项目要求
  • 四、实训目标
  • 五、系统功能
  • 六、技术方案
  • 七、环境要求

一、实训题目

题目名称:基于信用评分卡算法模型的个人信用评级系统的设计与实现
题目来源:企业(中软国际)

二、项目背景

随着金融科技的高速发展,对金融数据数字化、智能化风控的需求越来越高。本课题聚焦个人信用评级信用评分卡业务场景,以金融科技产业典型的数字化、智能化信用评级的实际问题出发,使用金融大数据分析及信用卡算法模型模型,解决金融行业的信用评级复杂工程问题。作为本项目核心技术难点的信用评级评分卡算法模型是近年来兴起的一种为保障银行和其他金融部门的金融安全而设立的一种关于人生金融权限的划定模型。该模型指根据用户的信用历史资料,利用一定的信用评分模型,得到不同等级的信用分数。根据用户的信用分数,来决定是否放贷,以及相应的授信额度。
本课题强化学生对金融信用评级业务背景知识的理解和掌握,了解行业的规范和标准。系统性对金融工程全栈全流程全面了解和掌握。通过Python大数据分析及科学计算的知识以及机器学习算法知识,实现对金融行业的数据获取、预处理、数据重塑、数据规约、WOE分析、相关性分析及IV筛选等的基原理、方法及编码实现。与此同时,对信用卡算法模型的编程实现、模型性调优、最终实现算法的分类及预测以及对信用评分卡的算法创新实现。

三、项目要求

掌握和了解金融行业领域(信用评级)的行业规范、标准及专业术语。熟练使用Python编程语言完成数据处理、科学计算以及算法模型、数据可视化的实现。全面了解并掌握大数据在金融行业领域的全栈全周期的处理标准流程及各环节的专业知识及编程实现技巧。实现对金融行业的数据获取、预处理、数据重塑、数据规约、WOE分析、相关性分析及IV筛选等的基原理、方法及编码实现。根据风控模型理论知识建立评分卡模型,流程合理具有可解释性。软件设计结构模块化、程序结构化、数据格式标准化、代码统一化,各种文档资料规范化。

四、实训目标

  • 通过该课题项目的研究和实现,完成对金融行业领域(信用评级)的数字化风控的标准及规范标准的掌握;
  • 全面提升大数据分析技术在金融行业领域的应用能力,训练学生将金融问题转化成数学问题,将数学问题使用计算机编程技术快速解决能力;
  • 通过完整的业务需求实现,大幅度提升学生使用大数据分析及算法模型在金融行业领域解决实际问题的能力;
  • 锻炼学生解决金融信用评级全要素数据分析的复杂工程问题的能力。
  • 通过对信用卡模型的参数调优及算法创新优化,提升学生的研究能力和创新能力。强化学生对python语言科学计算领域的实际应用能力与数据分析、数据可视化能力,加强对于风控理论的理解;
  • 提高学生自主发现问题并解决问题的能力,提升团队协作能力。

五、系统功能

本项目核心信用风险评级模型的主要的研发及设计实现策略及流程如下:
(1) 数据获取,包括获取存量客户及潜在客户的数据。存量客户是指已经在证券公司开展相关融资类业务的客户,包括个人客户和机构客户;潜在客户是指未来拟在证券公司开展相关融资类业务的客户,主要包括机构客户,这也是解决证券业样本较少的常用方法,这些潜在机构客户包括上市公司、公开发行债券的发债主体、新三板上市公司、区域股权交易中心挂牌公司、非标融资机构等。
(2) 数据预处理,主要工作包括数据清洗、缺失值处理、异常值处理,主要是为了将获取的原始数据转化为可用作模型开发的格式化数据。
(3) 探索性数据分析,该步骤主要是获取样本总体的大概情况,描述样本总体情况的指标主要有直方图、箱形图等。
(4) 变量选择,该步骤主要是通过统计学的方法,筛选出对违约状态影响最显著的指标。主要有单变量特征选择方法和基于机器学习模型的方法 。
(5) 模型开发,该步骤主要包括变量分段、变量的WOE(证据权重)变换和逻辑回归估算三部分。
(6) 模型评估,该步骤主要是评估模型的区分能力、预测能力、稳定性,并形成模型评估报告,得出模型是否可以使用的结论。
(7) 信用评分,根据逻辑回归的系数和WOE等确定信用评分的方法。将Logistic模型转换为标准评分的形式。
(8) 建立评分系统,根据信用评分方法,建立自动信用评分系统。SDU项目实训记录1.1——项目介绍(6.28)_第1张图片

六、技术方案

金融大数据分析及数据挖掘方法可以依据其功能被分成4个环节:预估模型、分类、链接分析和时间序列预测。每一项功能都可以被开发和修改成为适应不同业务的应用。比如: 分类模型可以被运用到建立信用风险评分模型、信用风险评级模型、流失模型、欺诈预测模型和破产模型等。为实现数据挖掘的每一项功能,有许多不同的方法或算法可以使用。
本课题核心技术重点讨论的信用风险评分模型主要是属于分类模型,所以用到的方法主要有分类分析和分割分析。分类分析主要方法包括:决策树、神经网络、区别分析、逻辑回归、概率回归;分割分析主要方法包括:K-平均值、人口统计分割、神经网络分割。
SDU项目实训记录1.1——项目介绍(6.28)_第2张图片
编程语言:python 3.6以上
开发工具:Pycharm(非必须)
第三方模块库:numpy,pandas,skleran

七、环境要求

操作系统:win10/MacOS/linux
CPU:2GHz以上
内存:8G以上

你可能感兴趣的:(项目实训,评分算法)