吃瓜1:模型评价指标

最近在读周志华老师的《机器学习》,在这里记录一些学习到的知识。内容编排比较比较随意,内容如有理解不够深入的地方还望指出

假设空间:我们把类似“长得高大概率会很帅”这样的可以当作经验学习的“假设”的集合

归纳偏执

  • 归纳偏执类似于“先验知识”是对某些“假设“的偏好
  • 奥卡姆剃刀:“简单的就是好的”
  • NFL“没有免费的午餐”定理(前提:所有问题同等重要;结论:不同算法与其期望性能无关)
    • 归纳偏执或算法的好坏需要结合问题考虑。

训练集与验证集的划分

  • 留出法(按照比例进行划分:2/3~4/5)
  • 交叉验证(k折验证,整个数据集分成k份,使用其中一份进行验证;由于划分方法的不同一般进行多次)
  • 自助法(使用”自助抽样“得到训练集约为0.632;会改变数据分布;适合小数据集)

性能评价指标(训练模型的最终目标是提高泛化误差):

  • 在训练集上的误差称为“训练误差”
  • 在新样本上的误差称之为“泛化误差”

混淆矩阵
吃瓜1:模型评价指标_第1张图片

  • TP(True Positive):将正类预测为正类数,真实为0,预测也为0
  • FN(False Negative):真实为0,预测为1的数量;
  • FP(False Positive): 真实为1,预测为0的数量;
  • TN(True Negative):真实为1,预测为1的数量;

另外基于混淆矩阵可以计算出其它模型性能指标(这里可以通过计算公式大致猜测其具体含义,不要过于在意其名称与定义):

  • Precision:精确率。
    在这里插入图片描述
  • Recall:召回率。
    在这里插入图片描述
  • Accuracy:准确率。
    吃瓜1:模型评价指标_第2张图片
  • F1 Score:F1分数。
    吃瓜1:模型评价指标_第3张图片

你可能感兴趣的:(机器学习,人工智能)