Udacity 数据分析进阶课程笔记L33:支持向量机(SVM)

  1. SVM寻找一条直线或超平面,将输入数据分隔成两类。

    • 好的分隔线可以最大化间隔
    • Udacity 数据分析进阶课程笔记L33:支持向量机(SVM)_第1张图片
      最大化Margin
    • SVM首先考虑是否正确分类,其次才是最大化间隔。
    • 同时,可以做到忽略异常值,在忽略异常值和最大间隔之间找到平衡点。
  2. sklearn中的SVMimportfit()predict()

    • 相对于朴素贝叶斯,线性SVM提供一条笔直的决策边界
  3. Kernel Trick :特征(维度)变换,可以在构造分类器时通过kernel参数进行控制

    • Udacity 数据分析进阶课程笔记L33:支持向量机(SVM)_第2张图片
      Kernel Trick
  4. 参数

    • kernel
    • C:在决策边界的正确性和平滑性之间进行平衡。C值越大,分类越正确,边界越复杂。
    • gamma:此参数对线性核函数无影响
  5. SVM的优缺点

    • 在具有明显边界的数据上表现出色
    • 海量数据时非常耗时(训练时间与数据量的3次方成正比)
    • 噪声过大的数据同样表现不理想

你可能感兴趣的:(Udacity 数据分析进阶课程笔记L33:支持向量机(SVM))