E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
#Kmeans
数据挖掘--
kmeans
聚类算法mapreduce实现 代码
分类:数据挖掘算法 |标签: 数据挖掘
kmeans
mapreduce 2012-11-1413:36阅读(4148)评论(1)==================cluster.txt==
qq_26562641
·
2015-12-26 16:00
数据挖掘-基于
Kmeans
算法、MBSAS算法及DBSCAN算法的newsgroup18828文本聚类器的JAVA实现(下)
本文接数据挖掘-基于
Kmeans
算法、MBSAS算法及DBSCAN算法的newsgroup18828文本聚类器的JAVA实现(上).
qq_26562641
·
2015-12-26 16:00
数据挖掘-基于
Kmeans
算法、MBSAS算法及DBSCAN算法的newsgroup18828文本聚类器的JAVA实现(上)
(update2012.12.28关于本项目下载及运行的常见问题FAQ见 newsgroup18828文本分类器、文本聚类器、关联分析频繁模式挖掘算法的Java实现工程下载及运行FAQ )本文要点如下:对newsgroup文档集进行预处理,按照DF法及SVD分解法抽取特征词,实现降维实现了K-Means,MBSAS,DBSCAN三种聚类算法用weka工具进行newsgroup文档聚类计算各种算法聚
qq_26562641
·
2015-12-26 16:00
Kmeans
算法学习与SparkMlLib
Kmeans
算法尝试
K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。该算法接受参数k;然后将事先输入的n个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象
超大的雪童子
·
2015-12-15 22:00
K均值聚类(
Kmeans
)
模式识别作业五Sigma=[1,0;0,1]; mu1=[1,-1]; x1=mvnrnd(mu1,Sigma,200); mu2=[5.5,-4.5]; x2=mvnrnd(mu2,Sigma,200); mu3=[1,4]; x3=mvnrnd(mu3,Sigma,200); mu4=[6,4.5]; x4=mvnrnd(mu4,Sigma,200); mu5=[9,0.0]; x5=mvnr
xy123001
·
2015-12-14 22:00
K-Means 算法(Java)
kMeans
算法原理见我的上一篇文章。这里介绍K-Means的Java实现方法,参考了Python的实现方法。
苍穹2018
·
2015-12-12 11:00
opencv3中的机器学习算法之:EM算法
也能得到每个样本对应的标注值,类似于
kmeans
聚类(输入样本数据,输出样本数据的标注)。实际上,高斯混和模型GMM和
kmeans
都是EM算法
weixin_30737363
·
2015-12-10 15:00
学习笔记:聚类算法
Kmeans
/K-均值算法
前记
Kmeans
是最简单的聚类算法之一,但是运用十分广泛,最近看到别人找实习笔试时有考到
Kmeans
,故复习一下顺手整理成一篇笔记。
u011089523
·
2015-12-08 21:00
k-means
KDD
数据挖掘学习清单
基础篇矩阵背后的现实意义概率分布无约束最优化方法拉格朗日乘子法和KKT条件推荐相关性检验协同过滤推荐算法分类朴素贝叶斯LRSVM聚类
KMeans
DBScanCHAMELEONGMM决策树ID3C4.5AdaboostGBDT
oywl2008
·
2015-11-30 12:00
谱聚类算法及图分割算法
转自:http://blog.csdn.net/aspirinvagrant/article/details/41700025谱聚类算法 谱聚类算法由于其算法流程简单、计算简洁与
Kmeans
算法相比不容易陷入局部最优解
yy-captain
·
2015-11-30 11:03
图形图像
机器学习/模式识别
抄书问题之二
Givennbooks(thepagenumberofeachbookisthesame)andanarrayofintegerwithsize
kmeans
kpeopletocopythebookandtheithintegeristhetimeithpersontocopyonebook
Jerry__Yang
·
2015-11-29 12:27
算法
机器学习笔记_ 聚类_1:
Kmeans
+密度聚类
相似度Minkowski距离-dist(X,Y)=(∑i=1n|xi−yi|p)1p杰卡德相似系数-J(A,B)=|A∩B||A∪B|余弦相似度-cos(θ)=aTb|a||b|Person相似系数-ρxy=cov(X,Y)σxσy=E[(x−μx)(Y−μy)]σxσy相对熵(K-L)-D(p||q)=∑xp(x)logp(x)q(x)=Ep(x)logp(x)q(x)余弦相似度和Persion
mijian1207mijian
·
2015-11-28 12:00
[置顶] k-means像素聚类
因此,简单来说
Kmeans
是一种将输入数据划分为k个族的简
hongbochen1223
·
2015-11-26 10:00
python
机器学习
聚类
k-means
R语言k-means聚类
可以通过枚举,令k从2到一个固定值如10,在每个k值上重复运行数次
kmeans
(避免局部最优解),并计算当前k的平均轮廓系数,最后选取轮廓系数最大的值对应的k作为最终的集群数目。
u012432611
·
2015-11-24 13:00
机器学习
R语言
kmeans
Python实现K-means聚类
kmeans
是最简单的聚类算法之一,但是运用十分广泛。最近在工作中也经常遇到这个算法。
kmeans
一般在数据分析前期使用,选取适当的k,将数据分类后,然后分类研究不同聚类下数据的特点。
geekmanong
·
2015-11-21 17:00
记录近期小改K-Means至MapReduce上的心得
背景: 在所有聚类算法中
KMeans
算是表面上最简单的一种,没有过多恼人的古希腊符号公式,没有过分繁杂的公式嵌套。
·
2015-11-13 22:49
mapreduce
python plot
kmeans
演示版本
# -*- coding: utf-8 -*- """ Created on Sun Dec 09 14:43:47 2012 @author: Administrator """ import pylab import numpy import matplotlib.pyplot as plt docs=
·
2015-11-13 19:07
python
R语言多元分析系列之五:聚类分析(完) | R blogs / lang
在R中使用
kmeans
函数进行K均值聚类,cen
·
2015-11-13 19:00
Blog
mahout源码
KMeans
Driver分析之五CIMapper初探
接着上篇,继续分析代码。下面就到了MR的循环了,这里MR应该算是比较好理解的,重点是退出循环的条件设置,即如何判断前后两次中心点误差小于给定阈值。 首先,while循环: while (iteration <= numIterations) { conf.set(PRIOR_PATH_KEY, priorPath.toString());
·
2015-11-13 18:47
Mahout
mahout源码
KMeans
Driver分析之五CIMapper
接上文重点分析map操作: Vector probabilities = classifier.classify(value.get());// 第一行 Vector selections = policy.select(probabilities); // 第二行 for (Iterator<Element> it = select
·
2015-11-13 14:12
Mahout
Weka中EM算法详解
, j, k; 4 5 // 由于EM算法对初始值较敏感,故选择run k means 10 times and choose best solution 6 Simple
KMeans
·
2015-11-13 10:51
算法
kmeans
聚类 --- (代码为: 博客数据聚类) (python )
kmeans
聚类 迭代时间远比层次聚类的要少,处理大数据,
kmeans
优势极为突出.。
·
2015-11-13 08:00
python
Spark之Scala学习
scala实现
kmeans
算法 http://www.thinksaas.cn/group/topic/93852/ 3.
·
2015-11-13 07:36
scala
matlab做聚类分析
说明:如果是要用matlab做
kmeans
聚类分析,直接使用函数
kmeans
即可。使用方法:
kmeans
(输入矩阵,分类个数k)。
·
2015-11-13 06:15
matlab
FEKM: fast and extract out-of-core k-means clustering
;;
Kmeans
的时间复杂度是O(m)(《数据挖掘导论》,m是数据规模)。
·
2015-11-13 05:08
cluster
文本挖掘之文本聚类(MapReduce)
本文结合
Kmeans
和DBSCAN算法,对上述算法进行改进,其中借鉴
Kmeans
聚类方法(类别个数的确定性)以及D
志青云集
·
2015-11-12 23:00
Spark MLBase分布式机器学习系统入门:以MLlib实现
Kmeans
聚类算法
1.什么是MLBaseMLBase是Spark生态圈的一部分,专注于机器学习,包含三个组件:MLlib、MLI、ML Optimizer。 ML Optimizer: This layer aims to automating the task of ML pipeline construction. The optimizer solves a search problem over f
·
2015-11-12 22:30
spark
GMM简单解释
2.GMM 模型初始化: 即模型参数的初始化,一般采用
kmeans
或者LBG算法。 模型初始化值对模型后期的收敛有极大影响
·
2015-11-12 21:31
简单
scala实现
kmeans
算法
scala.io.Source 2 import scala.util.Random 3 4 /** 5 * @author vincent 6 * 7 */ 8 object Local
KMeans
·
2015-11-12 21:31
scala
matlab中
Kmeans
使用方法
kmeans
K-means clustering Syntax IDX =
kmeans
(X,k)[IDX,C] =
kmeans
(X,k)[IDX,C,sumd] =
kmeans
·
2015-11-12 20:40
matlab
K-Means in matlab
matlab-
kmeans
函数注释 X = [randn(100,2)+ones(100,2);...
·
2015-11-12 20:39
matlab
Java版
kmeans
实现(jar包下载及使用+算法介绍+源码简介)
数据挖掘作业要做聚类,用OpenCV的
kmeans
函数,出的结果各种随机。
·
2015-11-12 20:52
jar包下载
Hadoop vs Spark性能对比
Kmeans
数据:自己产生的三维数据,分别围绕正方形的8个顶点 {0, 0, 0}, {0, 10, 0}, {0, 0, 10}, {0, 10, 10}, {10, 0, 0}, {10,
·
2015-11-12 18:30
hadoop
Mahout分布式推荐引擎介绍
当时我匆忙的看过
KMeans
的实现,这次我的工作是在搜索引擎日志记录中找相似query。我是按照query以及它对应的点击商品来进行相似query匹配的,其实就是一个协同推荐问题。
·
2015-11-12 17:37
Mahout
Matalab之模糊
KMeans
实现
这节继续上节的
KMeans
进行介绍,上节主要是对模糊
KMeans
方法的原理做了介绍,没有实践印象总是不深刻,前段时间有个师姐让我帮着写了个模糊
KMeans
的算法,今天就拿她给出的例子来对这个方法做个实践讲解
·
2015-11-12 10:41
mat
Matalab之模糊
KMeans
原理
对
Kmeans
方法相信大家都会不陌生,这是一种广泛被应用的基于划分的聚类算法。
·
2015-11-12 10:40
mat
【原创】
Kmeans
算法 优缺点分析
优点: 原理简单(靠近中心点),实现容易(1、2 天),聚类效果中上(依赖K的选择) 缺点: 1. 无法确定K的个数 (根据什么指标确定K) 2. 对离群点敏感 (容易导致中心点偏移) 3. 算法复杂度不易控制 O(NKm), 迭代次数可能较多 (m可能会比较大) 4. 局部最优解而不是全局优 (这个和初始点选谁有关) 5. 结果不稳定 (受输入顺序影响) 6.
·
2015-11-12 10:30
算法
使用weka进行文本聚类的例子
java.io.File; import java.io.FileReader; import weka.clusterers.Clusterer; import weka.clusterers.Simple
KMeans
·
2015-11-11 14:35
例子
Mahout应用(一)
拿
kmeans
为列子 Mahout中的
kmeans
所需要的输入比较特殊需要的输入类型为VectorWritable类型并且是SequenceFile格式存储(一般来讲为了方便查看数据我比较喜欢直接用
·
2015-11-11 07:09
Mahout
MLlib-聚类
MLlib实现了一种k-means++的并行变种,叫做
kmeans
II。MLlib的实现包括以下参数: k 设定的聚类数目 maxIteratio
·
2015-11-11 03:19
lib
MapReduce
Kmeans
聚类算法
最近在网上查看用MapReduce实现的
Kmeans
算法,例子是不错,http://blog.csdn.net/jshayzf/article/details/22739063 但注释太少了,而且参数太多
·
2015-11-11 02:50
mapreduce
kmeans
python
前面写的JAVA版的
KMEANS
比较恶心,现在补上一个简单的python版本。
·
2015-11-08 15:52
python
KMeans
聚类算法Hadoop实现
Assistance.java 辅助类,功能详见注释 package
KMeans
; import org.apache.hadoop.conf.Configuration; import
·
2015-11-08 13:14
hadoop
python K-means工具包初解
2.若是直接算中心点的话,直接调用
kmeans
2函数即可,后面的绘图,仅仅为了可视化。
·
2015-11-08 10:29
python
Kmeans
&&
Kmeans
++ && Davies-Bouldin && Dunn index
K-means is a very generic clustering algorithm, using four steps to separate the points into clusters. The following part show how it works: 1. Initialization, for every point, choose its cluster ID
·
2015-11-07 09:46
index
【OpenCV】基于
kmeans
的细胞检测方法
问题是这样的,有一幅经过二值化处理之后的图像,我们希望统计其中细胞的个数,和不同粘连情况的细胞个数,比如,下图中有1个细胞组成连通区域的,也有2个细胞组成连通区域的,也有更多个细胞组成连通区域的,我们希望分别统计不同的情况。 我想出的一种可行的方法是这样的: 通过图像形态学的处理erode,将一些邻接的细胞分离开来,并减少单个像素的噪声干扰 计算其中的连通域 计算每一
·
2015-11-05 08:28
opencv
利用模拟退火提高
Kmeans
的聚类精度
利用模拟退火提高
Kmeans
的聚类精度
Kmeans
算法是一种非监督聚类算法,由于原理简单而在业界被广泛使用,一般在实践中遇到聚类问题往往会优先使用
Kmeans
尝试一把看看结果。
·
2015-11-03 22:23
模拟
Kmeans
&&
Kmeans
++ && Davies-Bouldin && Dunn index
K-means is a very generic clustering algorithm, using four steps to separate the points into clusters. The following part show how it works: 1. Initialization, for every point, choose its cluster ID
·
2015-11-03 21:11
index
机器学习(十六)无监督学习、聚类和
KMeans
聚类
无监督学习、聚类本文由@lonelyrains出品,转载请注明出处。文章链接:http://blog.csdn.net/lonelyrains/article/details/49562779聚类是在样本没有标注的情况下,对样本进行特征提取并分类,属于无监督学习的内容。有监督学习和无监督学习的区别就是需要分析处理的数据样本是否事先已经标注。如下图,左边是有监督,右边是无监督:应用场景也有所不同。无
lonelyrains
·
2015-11-02 23:00
机器学习
聚类
kmeans
数据挖掘的R包和函数的集合
数据挖掘的R包和函数的集合 1、聚类 常用的包: fpc,cluster,pvclust,mclust 基于划分的方法:
kmeans
, pam, pamk, clara
·
2015-11-02 19:00
数据挖掘
上一页
51
52
53
54
55
56
57
58
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他