python实现随机森林算法

用决策树实现一个根据用户的信息判断用户是否逾期的分类算法代码实现。

首先,我们对数据进行预处理,填充缺失值,数据集的标签特征为‘还款状态’,包括‘按时还款’、‘部分逾期’、‘全部逾期’三个特征值。

数据预处理

写两个函数,分别用于获取数据集的香农熵并划分数据集。

获取香农熵,划分数据集

封装以上函数,形成一个用于判断最好数据集划分的函数。

数据集划分

进一步封装,写一个函数用于递归创建决策树,生成的决策树是一个字典结构。

递归创建决策树

创建两个函数分别用于构建决策树并用决策树进行判断。

构建决策树

封装构建决策树的功能,形成一个构建随机森林对象的函数,形成的随机森林是一个列表结构。

随机森林

用测试数据进行验证。

测试数据验证
验证结果

你可能感兴趣的:(python实现随机森林算法)