有如下数据,试使用C-均值聚类将该数据集聚为2类。初始聚类中心为P1和P2,写出计算过程。
坐标点 | X | Y |
---|---|---|
P1 | 0 | 0 |
P2 | 1 | 2 |
P3 | 3 | 1 |
P4 | 8 | 8 |
P5 | 9 | 9 |
P6 | 10 | 7 |
解:6个点聚离P1,P2的距离分别如下:
( 0 , 5 , 10 , 8 2 , 9 2 , 149 (0, \sqrt 5,\sqrt {10}, 8\sqrt 2, 9\sqrt2,\sqrt {149} (0,5,10,82,92,149
( 5 , 0 , 5 , 85 , 113 , 106 ) (\sqrt 5,0, \sqrt {5}, \sqrt {85}, \sqrt{113},\sqrt {106}) (5,0,5,85,113,106)
可见P3,P4,P5和P6与P2是一个聚类,P1单独是一个聚类。P1的聚类中心是(0,0),P2,P3,P4,P5,P6的聚类中心是:
1 + 3 + 8 + 9 + 10 5 = 31 5 = 6.2 \frac{1+3+8+9+10}{5} = \frac{31}{5} = 6.2 51+3+8+9+10=531=6.2
2 + 1 + 8 + 9 + 7 5 = 27 5 = 5.4 \frac{2+1+8+9+7}{5} = \frac{27}{5} = 5.4 52+1+8+9+7=527=5.4
第二轮聚类,6点聚类聚类中心的距离分别为:
( 0 , 2.24 , 3.16 , 11.3 , 12.73 , 12.2 ) (0,2.24,3.16,11.3,12.73,12.2) (0,2.24,3.16,11.3,12.73,12.2)
( 8.22 , 6.21 , 5.44 , 3.16 , 4.56 , 4.12 ) (8.22,6.21,5.44,3.16,4.56,4.12) (8.22,6.21,5.44,3.16,4.56,4.12)
新的聚类为:P1,P2,P3和P4,P5,P6。新的聚类中心是:
1 + 3 3 = 4 3 = 1.33 \frac{1+3}{3} = \frac{4}{3} = 1.33 31+3=34=1.33
1 + 2 3 = 3 3 = 1 \frac{1+2}{3} = \frac{3}{3} = 1 31+2=33=1
8 + 9 + 10 3 = 27 3 = 9 \frac{8+9+10}{3} = \frac{27}{3} = 9 38+9+10=327=9
7 + 8 + 9 3 = 24 3 = 8 \frac{7+8+9}{3} = \frac{24}{3} = 8 37+8+9=324=8
第三轮聚类,6点聚类聚类中心的距离分别为:
( 1.66 , 1.05 , 1.67 , 9.67 , 11.08 , 10.54 ) (1.66,1.05,1.67,9.67,11.08,10.54) (1.66,1.05,1.67,9.67,11.08,10.54)
( 12.04 , 10.00 , 9.22 , 1.00 , 1.00 , 1.41 ) (12.04,10.00,9.22,1.00,1.00,1.41) (12.04,10.00,9.22,1.00,1.00,1.41)
新的聚类中心是(1.33,1)和(9,8),新的聚类结果是P1,P2,P3和P4,P5,P6。聚类结束。