知识分享之Python——sklearn中K-means聚类算法输出各个簇中包含的样本数据

知识分享之Python——sklearn中K-means聚类算法输出各个簇中包含的样本数据

背景

日常我们开发时,我们会遇到各种各样的奇奇怪怪的问题(踩坑o(╯□╰)o),这个常见问题系列就是我日常遇到的一些问题的记录文章系列,这里整理汇总后分享给大家,让其还在深坑中的小伙伴有绳索能爬出来。
同时在这里也欢迎大家把自己遇到的问题留言或私信给我,我看看其能否给大家解决。

开发环境

  • 系统:windows10
  • 版本:Python3

内容

本节分享一个在sklearn中使用聚类算法时,比较常用的输出工具,输出各个簇中包含的样本数据,以下是其具体的实现方式:

            kmeans_model = KMeans(init="k-means++",n_clusters=t)
            kmeans_model.fit(tf_matrix)  # 训练是t簇,指定数据源
            # 输出各个簇中包含的样本数据
            labels = kmeans_model.predict(tf_matrix)
            clusters = {}
            n = 0
            for item in labels:
                if item in clusters:
                    clusters[item].append(all_data[n])
                else:
                    clusters[item] = [all_data[n]]
                n +=1
            for item in clusters:
                print("输出簇: ", item)
                for i2 in clusters[item]:
                    print(i2)
本文声明:

88x31.png

知识共享许可协议
本作品由 cn華少 采用 知识共享署名-非商业性使用 4.0 国际许可协议 进行许可。

你可能感兴趣的:(知识分享之Python——sklearn中K-means聚类算法输出各个簇中包含的样本数据)