#Kmeans 第55页

数据挖掘--kmeans聚类算法mapreduce实现代码

分类：数据挖掘算法 |标签：数据挖掘 kmeans mapreduce 2012-11-1413:36阅读(4148)评论(1)==================cluster.txt==

qq_26562641·2015-12-26 16:00

数据挖掘-基于Kmeans算法、MBSAS算法及DBSCAN算法的newsgroup18828文本聚类器的JAVA实现(下)

本文接数据挖掘-基于Kmeans算法、MBSAS算法及DBSCAN算法的newsgroup18828文本聚类器的JAVA实现(上).

qq_26562641·2015-12-26 16:00

数据挖掘-基于Kmeans算法、MBSAS算法及DBSCAN算法的newsgroup18828文本聚类器的JAVA实现(上)

(update2012.12.28关于本项目下载及运行的常见问题FAQ见 newsgroup18828文本分类器、文本聚类器、关联分析频繁模式挖掘算法的Java实现工程下载及运行FAQ )本文要点如下：对newsgroup文档集进行预处理，按照DF法及SVD分解法抽取特征词，实现降维实现了K-Means，MBSAS，DBSCAN三种聚类算法用weka工具进行newsgroup文档聚类计算各种算法聚

qq_26562641·2015-12-26 16:00

Kmeans算法学习与SparkMlLib Kmeans算法尝试

K-means算法是最为经典的基于划分的聚类方法，是十大经典数据挖掘算法之一。K-means算法的基本思想是：以空间中k个点为中心进行聚类，对最靠近他们的对象归类。通过迭代的方法，逐次更新各聚类中心的值，直至得到最好的聚类结果。该算法接受参数k；然后将事先输入的n个数据对象划分为k个聚类以便使得所获得的聚类满足：同一聚类中的对象相似度较高；而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象

超大的雪童子·2015-12-15 22:00

K均值聚类（Kmeans）

模式识别作业五Sigma=[1,0;0,1]; mu1=[1,-1]; x1=mvnrnd(mu1,Sigma,200); mu2=[5.5,-4.5]; x2=mvnrnd(mu2,Sigma,200); mu3=[1,4]; x3=mvnrnd(mu3,Sigma,200); mu4=[6,4.5]; x4=mvnrnd(mu4,Sigma,200); mu5=[9,0.0]; x5=mvnr

xy123001·2015-12-14 22:00

K-Means 算法(Java)

kMeans算法原理见我的上一篇文章。这里介绍K-Means的Java实现方法，参考了Python的实现方法。

苍穹2018·2015-12-12 11:00

opencv3中的机器学习算法之：EM算法

也能得到每个样本对应的标注值，类似于kmeans聚类（输入样本数据，输出样本数据的标注）。实际上，高斯混和模型GMM和kmeans都是EM算法

weixin_30737363·2015-12-10 15:00

学习笔记：聚类算法Kmeans/K-均值算法

前记 Kmeans是最简单的聚类算法之一，但是运用十分广泛，最近看到别人找实习笔试时有考到Kmeans，故复习一下顺手整理成一篇笔记。

u011089523·2015-12-08 21:00

数据挖掘学习清单

基础篇矩阵背后的现实意义概率分布无约束最优化方法拉格朗日乘子法和KKT条件推荐相关性检验协同过滤推荐算法分类朴素贝叶斯LRSVM聚类KMeansDBScanCHAMELEONGMM决策树ID3C4.5AdaboostGBDT

oywl2008·2015-11-30 12:00

谱聚类算法及图分割算法

转自：http://blog.csdn.net/aspirinvagrant/article/details/41700025谱聚类算法谱聚类算法由于其算法流程简单、计算简洁与Kmeans算法相比不容易陷入局部最优解

yy-captain·2015-11-30 11:03

抄书问题之二

Givennbooks(thepagenumberofeachbookisthesame)andanarrayofintegerwithsizekmeanskpeopletocopythebookandtheithintegeristhetimeithpersontocopyonebook

Jerry__Yang·2015-11-29 12:27

机器学习笔记_ 聚类_1：Kmeans+密度聚类

相似度Minkowski距离-dist(X,Y)=(∑i=1n|xi−yi|p)1p杰卡德相似系数-J(A,B)=|A∩B||A∪B|余弦相似度-cos(θ)=aTb|a||b|Person相似系数-ρxy=cov(X,Y)σxσy=E[(x−μx)(Y−μy)]σxσy相对熵(K-L)-D(p||q)=∑xp(x)logp(x)q(x)=Ep(x)logp(x)q(x)余弦相似度和Persion

mijian1207mijian·2015-11-28 12:00

[置顶] k-means像素聚类

因此，简单来说Kmeans是一种将输入数据划分为k个族的简

hongbochen1223·2015-11-26 10:00

R语言k-means聚类

可以通过枚举，令k从2到一个固定值如10，在每个k值上重复运行数次kmeans(避免局部最优解)，并计算当前k的平均轮廓系数，最后选取轮廓系数最大的值对应的k作为最终的集群数目。

u012432611·2015-11-24 13:00

Python实现K-means聚类

kmeans是最简单的聚类算法之一，但是运用十分广泛。最近在工作中也经常遇到这个算法。kmeans一般在数据分析前期使用，选取适当的k，将数据分类后，然后分类研究不同聚类下数据的特点。

geekmanong·2015-11-21 17:00

记录近期小改K-Means至MapReduce上的心得

背景：在所有聚类算法中KMeans算是表面上最简单的一种，没有过多恼人的古希腊符号公式，没有过分繁杂的公式嵌套。

·2015-11-13 22:49

python plot kmeans 演示版本

# -*- coding: utf-8 -*- """ Created on Sun Dec 09 14:43:47 2012 @author: Administrator """ import pylab import numpy import matplotlib.pyplot as plt docs=

·2015-11-13 19:07

R语言多元分析系列之五：聚类分析（完） | R blogs / lang

在R中使用 kmeans函数进行K均值聚类，cen

·2015-11-13 19:00

mahout源码KMeansDriver分析之五CIMapper初探

接着上篇，继续分析代码。下面就到了MR的循环了，这里MR应该算是比较好理解的，重点是退出循环的条件设置，即如何判断前后两次中心点误差小于给定阈值。首先，while循环： while (iteration <= numIterations) { conf.set(PRIOR_PATH_KEY, priorPath.toString());

·2015-11-13 18:47

mahout源码KMeansDriver分析之五CIMapper

接上文重点分析map操作： Vector probabilities = classifier.classify(value.get());// 第一行 Vector selections = policy.select(probabilities); // 第二行 for (Iterator<Element> it = select

·2015-11-13 14:12

Weka中EM算法详解

, j, k; 4 5 // 由于EM算法对初始值较敏感，故选择run k means 10 times and choose best solution 6 SimpleKMeans

·2015-11-13 10:51

kmeans 聚类 --- （代码为：博客数据聚类）（python ）

kmeans聚类迭代时间远比层次聚类的要少，处理大数据，kmeans优势极为突出.。

·2015-11-13 08:00

Spark之Scala学习

scala实现kmeans算法 http://www.thinksaas.cn/group/topic/93852/ 3.

·2015-11-13 07:36

matlab做聚类分析

说明：如果是要用matlab做kmeans聚类分析，直接使用函数kmeans即可。使用方法:kmeans(输入矩阵，分类个数k)。

·2015-11-13 06:15

FEKM: fast and extract out-of-core k-means clustering

;;Kmeans的时间复杂度是O(m)（《数据挖掘导论》，m是数据规模）。

·2015-11-13 05:08

文本挖掘之文本聚类（MapReduce）

本文结合Kmeans和DBSCAN算法，对上述算法进行改进，其中借鉴Kmeans聚类方法（类别个数的确定性）以及D

志青云集·2015-11-12 23:00

Spark MLBase分布式机器学习系统入门：以MLlib实现Kmeans聚类算法

1.什么是MLBaseMLBase是Spark生态圈的一部分，专注于机器学习，包含三个组件：MLlib、MLI、ML Optimizer。 ML Optimizer: This layer aims to automating the task of ML pipeline construction. The optimizer solves a search problem over f

·2015-11-12 22:30

GMM简单解释

2.GMM 模型初始化：　　即模型参数的初始化，一般采用kmeans或者LBG算法。模型初始化值对模型后期的收敛有极大影响

·2015-11-12 21:31

scala实现kmeans算法

scala.io.Source 2 import scala.util.Random 3 4 /** 5 * @author vincent 6 * 7 */ 8 object LocalKMeans

·2015-11-12 21:31

matlab中Kmeans使用方法

kmeans K-means clustering Syntax IDX = kmeans(X,k)[IDX,C] = kmeans(X,k)[IDX,C,sumd] = kmeans

·2015-11-12 20:40

K-Means in matlab

matlab-kmeans函数注释 X = [randn(100,2)+ones(100,2);...

·2015-11-12 20:39

Java版kmeans实现（jar包下载及使用+算法介绍+源码简介）

数据挖掘作业要做聚类，用OpenCV的kmeans函数，出的结果各种随机。

·2015-11-12 20:52

Hadoop vs Spark性能对比

Kmeans 数据：自己产生的三维数据，分别围绕正方形的8个顶点 {0, 0, 0}, {0, 10, 0}, {0, 0, 10}, {0, 10, 10}, {10, 0, 0}, {10,

·2015-11-12 18:30

·2015-11-12 17:37

Matalab之模糊KMeans实现

这节继续上节的KMeans进行介绍，上节主要是对模糊KMeans方法的原理做了介绍，没有实践印象总是不深刻，前段时间有个师姐让我帮着写了个模糊KMeans的算法，今天就拿她给出的例子来对这个方法做个实践讲解

·2015-11-12 10:41

Matalab之模糊KMeans原理

对Kmeans方法相信大家都会不陌生，这是一种广泛被应用的基于划分的聚类算法。

·2015-11-12 10:40

【原创】Kmeans算法优缺点分析

优点：原理简单（靠近中心点），实现容易（1、2 天），聚类效果中上（依赖K的选择）缺点： 1. 无法确定K的个数（根据什么指标确定K） 2. 对离群点敏感（容易导致中心点偏移） 3. 算法复杂度不易控制 O(NKm)，迭代次数可能较多（m可能会比较大） 4. 局部最优解而不是全局优（这个和初始点选谁有关） 5. 结果不稳定（受输入顺序影响） 6.

·2015-11-12 10:30

使用weka进行文本聚类的例子

java.io.File; import java.io.FileReader; import weka.clusterers.Clusterer; import weka.clusterers.SimpleKMeans

·2015-11-11 14:35

Mahout应用（一）

拿kmeans为列子 Mahout中的kmeans所需要的输入比较特殊需要的输入类型为VectorWritable类型并且是SequenceFile格式存储（一般来讲为了方便查看数据我比较喜欢直接用

·2015-11-11 07:09

MLlib-聚类

MLlib实现了一种k-means++的并行变种，叫做kmeansII。MLlib的实现包括以下参数： k 设定的聚类数目 maxIteratio

·2015-11-11 03:19

MapReduce Kmeans聚类算法

最近在网上查看用MapReduce实现的Kmeans算法，例子是不错，http://blog.csdn.net/jshayzf/article/details/22739063 但注释太少了，而且参数太多

·2015-11-11 02:50

kmeans python

前面写的JAVA版的KMEANS比较恶心，现在补上一个简单的python版本。

·2015-11-08 15:52

KMeans聚类算法Hadoop实现

Assistance.java 辅助类，功能详见注释 package KMeans; import org.apache.hadoop.conf.Configuration; import

·2015-11-08 13:14

python K-means工具包初解

2.若是直接算中心点的话，直接调用kmeans2函数即可，后面的绘图，仅仅为了可视化。

·2015-11-08 10:29

Kmeans && Kmeans++ && Davies-Bouldin && Dunn index

K-means is a very generic clustering algorithm, using four steps to separate the points into clusters. The following part show how it works: 1. Initialization, for every point, choose its cluster ID

·2015-11-07 09:46

【OpenCV】基于kmeans的细胞检测方法

问题是这样的，有一幅经过二值化处理之后的图像，我们希望统计其中细胞的个数，和不同粘连情况的细胞个数，比如，下图中有1个细胞组成连通区域的，也有2个细胞组成连通区域的，也有更多个细胞组成连通区域的，我们希望分别统计不同的情况。我想出的一种可行的方法是这样的：通过图像形态学的处理erode，将一些邻接的细胞分离开来，并减少单个像素的噪声干扰计算其中的连通域计算每一

·2015-11-05 08:28

利用模拟退火提高Kmeans的聚类精度

利用模拟退火提高Kmeans的聚类精度 Kmeans算法是一种非监督聚类算法，由于原理简单而在业界被广泛使用，一般在实践中遇到聚类问题往往会优先使用Kmeans尝试一把看看结果。

·2015-11-03 22:23

Kmeans && Kmeans++ && Davies-Bouldin && Dunn index

K-means is a very generic clustering algorithm, using four steps to separate the points into clusters. The following part show how it works: 1. Initialization, for every point, choose its cluster ID

·2015-11-03 21:11

机器学习（十六）无监督学习、聚类和KMeans聚类

无监督学习、聚类本文由@lonelyrains出品，转载请注明出处。文章链接：http://blog.csdn.net/lonelyrains/article/details/49562779聚类是在样本没有标注的情况下，对样本进行特征提取并分类，属于无监督学习的内容。有监督学习和无监督学习的区别就是需要分析处理的数据样本是否事先已经标注。如下图，左边是有监督，右边是无监督：应用场景也有所不同。无

lonelyrains·2015-11-02 23:00

数据挖掘的R包和函数的集合

数据挖掘的R包和函数的集合 1、聚类常用的包： fpc，cluster，pvclust，mclust 基于划分的方法: kmeans, pam, pamk, clara

·2015-11-02 19:00

推荐频道

#Kmeans

数据挖掘--kmeans聚类算法mapreduce实现 代码

数据挖掘-基于Kmeans算法、MBSAS算法及DBSCAN算法的newsgroup18828文本聚类器的JAVA实现(下)

数据挖掘-基于Kmeans算法、MBSAS算法及DBSCAN算法的newsgroup18828文本聚类器的JAVA实现(上)

Kmeans算法学习与SparkMlLib Kmeans算法尝试

K均值聚类（Kmeans）

K-Means 算法(Java)

opencv3中的机器学习算法之：EM算法

学习笔记：聚类算法Kmeans/K-均值算法

数据挖掘学习清单

谱聚类算法及图分割算法

抄书问题之二

机器学习笔记_ 聚类_1：Kmeans+密度聚类

[置顶] k-means像素聚类

R语言k-means聚类

Python实现K-means聚类

记录近期小改K-Means至MapReduce上的心得

python plot kmeans 演示版本

R语言多元分析系列之五：聚类分析（完） | R blogs / lang

mahout源码KMeansDriver分析之五CIMapper初探

mahout源码KMeansDriver分析之五CIMapper

Weka中EM算法详解

kmeans 聚类 --- （代码为： 博客数据聚类） （python ）

Spark之Scala学习

matlab做聚类分析

FEKM: fast and extract out-of-core k-means clustering

文本挖掘之文本聚类（MapReduce）

Spark MLBase分布式机器学习系统入门：以MLlib实现Kmeans聚类算法

GMM简单解释

scala实现kmeans算法

matlab中Kmeans使用方法

K-Means in matlab

Java版kmeans实现（jar包下载及使用+算法介绍+源码简介）

Hadoop vs Spark性能对比

Mahout分布式推荐引擎介绍

Matalab之模糊KMeans实现

Matalab之模糊KMeans原理

【原创】Kmeans算法 优缺点分析

使用weka进行文本聚类的例子

Mahout应用（一）

MLlib-聚类

MapReduce Kmeans聚类算法

kmeans python

KMeans聚类算法Hadoop实现

python K-means工具包初解

Kmeans && Kmeans++ && Davies-Bouldin && Dunn index

【OpenCV】基于kmeans的细胞检测方法

利用模拟退火提高Kmeans的聚类精度

Kmeans && Kmeans++ && Davies-Bouldin && Dunn index

机器学习（十六）无监督学习、聚类和KMeans聚类

数据挖掘的R包和函数的集合

数据挖掘--kmeans聚类算法mapreduce实现代码

kmeans 聚类 --- （代码为：博客数据聚类）（python ）

【原创】Kmeans算法优缺点分析