层次聚类、k_means聚类-python源码

聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小。以空间中k个点为中心进行聚类,对最靠近他们的对象归类。逐次计算各簇中心的值为新的中心值,迭代更新,直至簇中心位置不再改变或者达到最大迭代次数。由这个定义,我们便可以知道,数据集并没有目标值。因此聚类算法属于无监督算法。

三特征值输入,单结果输出聚类。内含数据集、代码,可直接运行。

内含注释,结构清晰,代码简单,傻瓜式操作。

部分数据集:

层次聚类、k_means聚类-python源码_第1张图片

部分代码:

#聚类总程序,可以用于k_means聚类、层次聚类
import pandas
from sklearn.metrics import silhouette_score
from XJ_machine_learning1 import *

xj_plt_init()
jl_type='kmeans';test_num=500;open_save=1
filename_xlsx= 'jldata.xls'
filename_savetraintest='jl'+jl_type+'_1_0.csv';filename_savetrain= 'jl'+jl_type+'_1_1.csv';filename_savetest= 'jl'+jl_type+'_1_2.csv'
data=pandas.read_excel(filename_xlsx , header=0)
#1计算距离
data_distance=sch.distance.pdist(data,'euclidean')#欧氏距离产计算距离矩阵
Z=sch.linkage(data_distance,'average')
#1寻找最优分类数量
class_list=[2, 3, 4, 5, 6, 7]
class_scores=[]

 数据原图:

层次聚类、k_means聚类-python源码_第2张图片

聚类结果图:

层次聚类、k_means聚类-python源码_第3张图片

源码下载地址: 

链接:https://pan.baidu.com/s/1Hzk0trmkdHr0GfmBjk2KGA 
提取码:6666

-------------------------------------------------------我的其他代码--------------------------------------------------------

粒子群算法优化BP神经网络-matlab源码

粒子群算法优化BP和Elman神经网络-matlab源码

头脑风暴算法优化BP神经网络-matlab源码

Adaboost-python手推源码不调用库-有手就会

你可能感兴趣的:(机器学习,聚类,python,算法)