聚类算法中的实验部分

聚类算法中的实验部分

最近到了论文的收尾部分,要开始做实验。
起初以为实验部分最简单了,就拿着数据跑一跑,记录结果,画图。直到自己真的做了,才发现里面要注意的特别多,根本不是一间容易事。
我们做实验一般分为两种:人工数据集和现实数据集。现实数据集怎么弄,自己找呗。起初老师让我们找数据,既要数据量大的,又要维数高的。搜索很久,才找到一个免费的数据集网址。http://archive.ics.uci.edu/ml/ 。里面大部分的数据集都很经典,使用起来对我们算法效果都很好,但是那些数据量大和维数高的就没有了。在网上搜了一下付费的大数据集,贵的吓人,就不贴出来了。后来找了个cup99的和sci14人脸的数据集,感觉勉强还凑合,就用了那两个。
再就说说人工数据集吧。在我们的算法里,需要的不是一幅幅的图,而是一个个的点,也就是说,我们要做的,就是把几个图形放在一张图里,并且把这些图拆成一个个的点,然后进行聚类,看聚类结果和它原本的图形差多少,像这样聚类算法中的实验部分_第1张图片

起初,我是实现与调优算法的,现在算法这块没我啥事了,便又每天开始造点画图,顺便多了个称呼“造点工程师”。每天我就倘佯在造点与画图的世界里。
导师常常说,“人家好的工作,就像一幅艺术品,不仅文字优美,而且图也赏心悦目”,接着又会数落我们一番,“你要多学学别人,看它们是怎么画图的,用了什么颜色,形状。。。”
我一边谨遵导师教诲,一边追赶着牛人的步伐。只是越想靠近,却发现距离越来越远。不多说了,上图
聚类算法中的实验部分_第2张图片

里面一半是艺术品,一半是我的赝品,看看谁能成功聚成两类。

你可能感兴趣的:(数据挖掘,数据,算法,数据集,实验)