【论文精读】A Support Vector Clustering Method

A Support Vector Clustering Method

原文地址:A Support Vector Clustering Method

本文介绍了一种支持向量聚类的方法。

Abstract

本文展示了使用支持向量进行数据聚类的方法,使用核技巧将数据从低维映射到高维,在高维空间中,边界是超球面,低维中边界显示为不规则的几何形状。

Describing Cluster Boundaries with Support Vectors

与SVM for Clustering这篇博文的原理类似,通过拉格朗日法找到高维映射空间中能够包含所有样本点的半径最小的超球面。然后通过对偶,求解关于拉格朗日系数的最大值,引入高斯核和松弛变量,来解决欠拟合和过拟合的问题。

The Clustering Algorithm

再多类别聚类中,首先确定类别的个数,然后选择合适的点作为各类别的球心,通过求算各个样本点距离个球心的距离,选择最近的那个球心所对应的类别作为此样本点的类别(这里有点类似于K-means中归类的方法),每次有新的样本被分类,便可以根据算法重新计算分类的边界。最终每个类别的边界由 q q C C 两个参数决定。 q q 值越大对数据拟合程度越好,但容易出现过拟合; C C 越小边界越平滑,当满足 C<1 C < 1 时,可以出现离群点。

下图为SVC与K-means聚类效果比较:

【论文精读】A Support Vector Clustering Method_第1张图片

【论文精读】A Support Vector Clustering Method_第2张图片

但文中并未介绍overlapping的处理。

你可能感兴趣的:(【论文精读】A Support Vector Clustering Method)