《机器学习》总复习(上)

**

第一章《绪论》

**
1.1从两个问题谈起
1.相关概念:
(1)机器学习:是人工智能的另一部分,也是核心技术。其利用经验、建立统计模型、概率模型,去解决问题。是对某个实际问题建立计算模型,并利用已知的经验来提升模型效果的一类方法。
(2)模式识别:用计算的方法根据样本的特征将样本划分到一定的类别中去。
2.相关流程:
(1)一个标准的模式识别流程:
“客观对象”——>“数值表示”——>“计算机算法”——>“识别结果”
3.相关区别:
(1)预测和数据挖掘的区别:
①预测是偏重得到决策结果,而数据挖掘是偏重分析决策原因和过程。
②预测问题主要是在生物特征鉴别、机器视觉、目标跟踪等领域,代替人进行决策。数据挖掘问题主要是在商业数据、医学数据里,给人提供参考。
4.两个问题:
(1)选择何种模型?
(2)如何最优化该模型?
1.2模型评估与模型参数选择
1.训练得到一个模型的最终目的:在未知的数据上得到尽可能准确的结果。
2.衡量一个模型泛化能力的重要标准:泛化误差。
3.区分误差:
①训练误差:训练集上的平均误差
②泛化误差:测试集上的误差
4.不能把训练误差作为模型参数选择的标准的原因:
①训练集样本太少,缺乏代表性。
②训练集中本身存在错误的样本&#x

你可能感兴趣的:(机器学习与模式识别,机器学习,决策树,算法)