Python数据挖掘实战1:逻辑回归预测银行贷款拖欠率

Reference

《Python数据分析与挖掘实战(第2版)》
页码:P107,代码略有改进
bankloan.xls数据下载

Logistic回归建模

python version 3.7

#数据展示
import pandas as pd
data = pd.read_excel('bankloan.xls')
Data = pd.DataFrame(data)
Data.head()
image.png
#模型构建和模型的准确度
import pandas as pd
from sklearn.linear_model import LogisticRegression as LR
data = pd.read_excel('bankloan.xls')
Data = pd.DataFrame(data)

##参数初始化
x = Data.iloc[:,:8].values
y = Data.iloc[:,8].values

##建立逻辑回归模型
lr = LR(solver='liblinear')
##用筛选后的特征数据来训练模型
lr.fit(x,y)
print('模型的平均准确度为:%s' % lr.score(x,y))
##模型的平均准确度为:0.8057142857142857

由此可知,模型的平均准确度为80.6%

你可能感兴趣的:(Python数据挖掘实战1:逻辑回归预测银行贷款拖欠率)