kmeans及模型评估指标_机器学习模型评估指标总结

常用机器学习算法包括分类、回归、聚类等几大类型,以下针对不同模型总结其评估指标

一、分类模型

常见的分类模型包括:逻辑回归、决策树、朴素贝叶斯、SVM、神经网络等,模型评估指标包括以下几种:

(1)二分类问题

(a)混淆矩阵

准确率A:预测正确个数占总数的比例

精准率P:正例样本中有多少被预测正确了

召回率R:预测的正例样本中有多少是正确的

F1 Score(精准率与召回率集成):2P*R/(P+R)

(b)ROC曲线:ROC曲线应尽量偏离参考线,越靠近左上越好

(c)AUC:ROC曲线下面积,参考线面积为0.5,AUC应大于0.5,且偏离越多越好

(d)Lift曲线:表示“运用该模型”与“未运用该模型即随机选择”所得结果的比值,Lift应该移植大于1,且Lift(提升指数)越大,模型预测效果越好

(2)多分类问题

评价多分类模型一般采用准确率作为评估指标

二、回归模型

常见的回归模型包括线性回归、多项式回归、Lasso回归、岭回归、弹性网络、SVM、神经网络,评估指标见以下总结

(1)MSE

均方误差,SSE/m,值越小代表拟合效果越好,用来衡量不同模型对于同一数据集的拟合效果

(2)R^2

决定系数,1-SSE/SST,用于度量模型的解释能力,是相关系数的平方,取值范围为0~1,越接近1表示模型参考价值越高,在scikit-learn中LinearRegressio

你可能感兴趣的:(kmeans及模型评估指标)