1.8 分类问题

输出变量Y为离散的有限的值时,预测问题称为分类问题。学习得到的分类模型或者决策函数称为分类器。

分类器性能评估的指标
准确率(accuracy):分类正确占总样本的比值,也可看着是0-1损失函数在测试集上的准确率

一般二分类问题多,评价指标主要是精确率,召回率,准确率
在测试集上
TP:正类被预测为正类的数量
FN:正类被预测为负类的数量
FP:负类被预测为正类的数量
TN:负类被预测为负类的数量
精确率(precision):所有预测为正类的样本中,预测为正类且正确的比例
P=TP/(TP+NP)
召回率(recall):所有正类的样本中,预测为正类且正确的比例
R=TP/(TP+FN)

F1值:精确率和召回率的调和均值,当P和R都很高时,F1才高
2/F=1/P+1/R
F=2TP/(2TP+FP+FN)

银行分类模型:根据贷款风险大小进行分类。

你可能感兴趣的:(李航统计学习个人笔记)