聚类分析--数学建模笔记

一、样品分类 Q型分类-->>>核心

1.样品间的相似度量--距离 怎么计算?

  两点之间的距离大于等于0 相反也相等 两点的距离小于求助某一点的距离 类似中介

2.具体方法

聚类分析--数学建模笔记_第1张图片

二、变量分类 R类--->>看变量的亲疏关系 实际 降维

变量之间相似度量--相似系数

 聚类分析--数学建模笔记_第2张图片

聚类分析--数学建模笔记_第3张图片

第一种 夹角余弦 

类间距离 最短距离 两类样品中之间的距离作为两类间的距离 最长距离 两类样品中之间的距离作为两类间的距离

三、方法步骤

聚类分析--数学建模笔记_第4张图片

例子

 聚类分析--数学建模笔记_第5张图片

 聚类分析--数学建模笔记_第6张图片

 聚类分析--数学建模笔记_第7张图片

 聚类分析--数学建模笔记_第8张图片

 代码:

b =[7.9000   39.7700    8.4900   12.9400   19.2700   11.0500    2.0400   13.2900
    7.6800   50.3700   11.3500   13.3000   19.2500   14.5900    2.7500   14.8700
    9.4200   27.9300    8.2000    8.1400   16.1700    9.4200    1.5500    9.7600
    9.1600   27.9800    9.0100    9.3200   15.9900    9.1000    1.8200   11.3500
   10.0600   28.6400   10.5200   10.0500   16.1800    8.3900    1.9600   10.8100];
d1=pdist(b);%两个样本之间的距离
D=tril(squareform(d1))%转化为下三角
z1=linkage(d1,'complete');
z2=linkage(d1,'average');
z3=linkage(d1,'centroid');
z4=linkage(d1,'ward');
T=cluster(z1,4)%z1是两点之间的距离 4代表分成几个类 谁和谁在一个类

你可能感兴趣的:(大数据)