sklearn.cluster.KMeans

sklearn.cluster.KMeans

1、api

class sklearn.cluster.KMeans(n_clusters=8, init='k-means++', n_init=10, max_iter=300, tol=0.0001, precompute_distances='auto', verbose=0, random_state=None, copy_x=True, n_jobs=None, algorithm='auto')

2、参数和属性

参数:

n_clusters 聚类中心的个数(k)
n_init 初始化聚类中心的次数(可能选的效果不好,所以多次random)
max_iter 迭代次数
tol 容忍值,最后不满足,会返回warning(不收敛)
algorithm
“full” 经典的EM-style算法
“elkan” 高效但不支持稀疏数据
”auto“ 密集数据选择“elkan”,稀疏数据选择“full”

属性:

cluster_centers_ 聚类中心的信息(坐标),(n_clusters,n_features)
labels_ 每个数据点的所属类别,(n_samples,)
inertia_ 所有样本点和其所属类中心的距离之和
n_iter_ 运行的迭代次数

3、方法

sklearn.cluster.KMeans_第1张图片

相关的项目可以在我的github下载

你可能感兴趣的:(sklearn,sklearn)