dbscan matlab 负荷曲线聚类_机器学习中的聚类算法演变及学习笔记

【说在前面】本人博客新手一枚,象牙塔的老白,职业场的小白。以下内容仅为个人见解,欢迎批评指正,不喜勿喷![认真看图][认真看图]

【补充说明】聚类算法可以作为独立方法将数据聚成不同簇,也可以作为数据挖掘任务(例如分类、关联规则等)的预处理!

【补充说明】聚类算法与分类算法的主要区别在于训练时的样本有无标签,聚类算法无监督学习,分类算法有监督学习!

【再说一句】本文主要介绍机器学习中聚类算法的演变路径,和往常一样,不会详细介绍各算法的具体实现,望理解!

一、相似性衡量方法

1. 基于距离

  • 闵可夫斯基距离(Minkowski Distance):计算距离的通用的公式
3036d682ce7075c5a6411827263af42c.png
  • 曼哈顿距离(即城市块距离Manhattan distance):h=1(例如用于L1正则化等)
2ff6e56bf5678662b536e08fb9c3ce3e.png
  • 欧几里德距离(用的比较多):

你可能感兴趣的:(dbscan,matlab,负荷曲线聚类)