个贷违约预测Baseline-2021 CCF BDCI 有代码和数据可直接运行

介绍

本赛题要求利用已有的与目标客群稍有差异的另一批信贷数据,辅助目标业务风控模型的创建,两者数据集之间存在大量相同的字段和极少的共同用户。此处希望大家可以利用迁移学习捕捉不同业务中用户基本信息与违约行为之间的关联,帮助实现对新业务的用户违约预测。

自己的代码分享使用tensorflow 框架搭建神经网络 

import warnings
import pandas as pd
# warnings.filterwarnings('ignore')

train_bank = pd.read_csv('./datasets/train_public.csv')
train_internet = pd.read_csv('./datasets/train_internet.csv')
train_bank
train_bank.columns
Index(['loan_id', 'user_id', 'total_loan', 'year_of_loan', 'interest',
       'monthly_payment', 'class', 'employer_type', 'industry', 'work_year',
       'house_exist', 'censor_status', 'issue_date', 'use', 'post_code',
       'region', 'debt_loan_ratio', 'del_in_18month', 'scoring_low',
       'scoring_high', 'known_outs

你可能感兴趣的:(自然语言处理-nlp-NLP,sklearn,人工智能,python,tensorflow,keras)