机器学习总结

调和平均 和 F1值的关系:

调和平均容易受极端值的影响,F1值相当于把精准率和召回率放在同等重要的位置进行衡量。

链接:

为何选用F1值(调和平均数)衡量P与R? - weixin_39490983的博客 - CSDN博客  https://blog.csdn.net/weixin_39490983/article/details/88297899

调和平均数在F1上的应用 - 简书  https://www.jianshu.com/p/1384f5a19a52

 

 

对于P-R 曲线上的查全率和查准率的理解?

假如有5个样本,3个正例,2个负例,分别对这5个样本进行预测,得到为正样本为概率值为0.7  0.6  0.5  0.4  0.3

样本编号 预测为正样本的概率 真实标签值 查全率 查准率
3 0.7 1/3 1
1 0.6 2/3 1
0 0.5 2/3 2/3
2 0.4 1 3/4
4 0.3 1 3/5

夏殇的理解(个人觉得理解的很透彻):

P R值是两个越大越好,如果一个很大,一个很小,效果也不好,如果两个都小,效果也不好。所以需要一个综合指标去衡量它们。调和平均这个衡量指标很符合,(调和平均对于极端值很敏感)如果一个趋近于0 ,那么调和平均趋近于0,如果一个很大,那么调和平均就会很大,如果两个数接近,那么调和平均就会很接近。所以,P R 的调和平均就拿来当作一个综合性指标F。

ROC曲线  解释的很好的博文:

ROC曲线与AUC值 - gatherstars - 博客园  https://www.cnblogs.com/gatherstars/p/6084696.html

AUC,ROC我看到的最透彻的讲解 - u013385925的专栏 - CSDN博客  https://blog.csdn.net/u013385925/article/details/80385873

回归树的理解:Regression Tree 回归树 - 没有名字 - CSDN博客  https://blog.csdn.net/weixin_40604987/article/details/79296427

CART 树剪枝:CART 分类与回归树 - 简书  https://www.jianshu.com/p/b90a9ce05b28

你可能感兴趣的:(机器学习)