05机器学习

机器学习诊断法

能够了解算法问题出现在哪里

运用0/1错误分类度量进行评估假设

05机器学习_第1张图片

 模型选择

选择几次方程来假设,用d表示多项式最高次幂

将样本分为三类,用交叉验证集来确定模型选择

05机器学习_第2张图片

 05机器学习_第3张图片

判断是偏差bias问题还是方差variance问题,即是欠拟合还是过拟合

 05机器学习_第4张图片

选择恰当的正则化λ

05机器学习_第5张图片

 最终选择在交叉验证集上错误率最小的

05机器学习_第6张图片

不同方法适用于哪些情况

05机器学习_第7张图片

偏斜类(skewed classes):一个类中的数据比另一个类的数据多很多

评估度量值:

1.查准率:以预测癌症为例,在所有预测为得了癌症的人之中,真正得了癌症的占比

2.召回率:在所有真实得了癌症人中,预测正确的占比

ps:通常用y=1表示稀有类

05机器学习_第8张图片

 05机器学习_第9张图片

 提问:对于不同的算法,如何比较不同的查准率和召回率

答:通过F Score的值来判断

05机器学习_第10张图片

 

你可能感兴趣的:(机器学习,算法)