E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
#Kmeans
KMeans
聚类算法Hadoop实现
Assistance.java 辅助类,功能详见注释package
KMeans
; importorg.apache.hadoop.conf.Configuration; importorg.apache.hadoop.fs.FSDataInputStream
JDPlus
·
2014-04-17 21:00
hadoop
【hadoop】大规模中文网站聚类
kmeans
的 mapreduce 实现
这是一个课程设计,主要是应用mapreduce对大规模的中文网站使用
kmeans
进行聚类,最后将相关的网站标记为同一类输出。
Flood_Dragon
·
2014-04-17 10:00
聚类分析_matlab
Matlab最简单的聚类方法:
kmeans
聚类,使用方法:
kmeans
(X,k)。
sunny13love
·
2014-04-09 15:00
matlab
聚类
使用R完成
Kmeans
聚类
使用R完成
Kmeans
聚类需要调用
kmeans
方法,使用数据集iris完成一个小的聚类实验,代码如下:newiris<-iris; newiris$Species<-NULL;#对训练数据去掉分类标记
yucan1001
·
2014-04-07 18:00
Spark RDD Action 详解---Spark学习笔记8
这次拿根目录下的
kmeans
_data.txt当数据源来实践。reduce和transformation里面的reduceByKey差不多,但是这里没有根据key分组,只是单纯的2个参数。
u014388509
·
2014-04-04 17:00
jvm
scala
spark
RDD
Kmeans
、
Kmeans
++和KNN算法比较
资源来源:点击打开链接K-Means介绍 K-means算法是聚类分析中使用最广泛的算法之一。它把n个对象根据他们的属性分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。其聚类过程可以用下图表示:如图所示,数据样本用圆点表示,每个簇的中心点用叉叉表示。(a)刚开始时是原始数据,杂乱无章,没有label,看起来都一样,都是绿色的。(b)假设数据集可
zaozxueyuan
·
2014-03-30 21:00
机器学习
knn
means
K
K-means++
Hadoop传递参数的方法总结
最直接的方式就是使用Configuration的各种set方法,对于基本数据类型都有很好的支持,比如传递
kmeans
聚类算法的中心点个数。如何传递一个对象型参数?
陈振阳
·
2014-03-26 11:48
Hadoop
Fuzzy
Kmeans
,mahout实现
首先介绍一下,Fuzzy
KMeans
算法的主要思想。模糊C均值聚类(FCM),即众所周知的模糊ISODATA,是用隶属度确定每个数据点属于某个聚类的程度的一种聚类算法。
wangkr111
·
2014-03-13 14:00
FuzzyKmeans
mahout实现
解决Undefined function or method 'vgg_kmiter' for input arguments of type 'double'.
Errorin==>vgg_
kmeans
at32 [CX,sse]=vgg_kmiter(X,CX); 解决方法:由于高matlab版本不再支持mxCreateScalarDouble,而被变为mxCreateDoubleScalar
qykshr
·
2014-03-11 17:00
64位
vgg_kmiter
Kung fu
originPeopleinPrimitivesociety(原始社会)inordertosurvive,theyhavetohuntforfoodefficiently,sotheylearnedtheprimaryattac
kmeans
.Graduallystoneandwoodentoolsareaddedasweapon.Whenthewarbecomemoreandmore
u013491262
·
2014-03-08 16:00
KMeans
on Spark
思路:1.随机生成数据2.随机生成K个聚类中心3.计算每个点所属的类别4.计算新的聚类中心5.比较聚类中心的变化情况,大于阈值跳转至3;小于阈值停止。packagemyclass importjava.util.Random importorg.apache.spark.SparkContext importSparkContext._ importorg.apache.spark.util.V
li385805776
·
2014-02-27 11:00
hadoop
scala
spark
迭代
Kmeans
的改进-
kmeans
++算法的聚类中心初始点选取和蓄水池采样算法
要解决的问题
kmeans
算法存在的一个问题是初始中心的选取是随机的,造成聚类的结果也是随机的,一般的做法是进行多次重复整个聚类过程,然后选取聚类效果好的。
xyl520
·
2014-02-15 18:00
算法
聚类
kmeans++
蓄水池采样
Weka聚类算法的两个实现算法
Weka Version: 3.7.10 K-Means K-均值算法 import java.io.File; import weka.clusterers.Simple
KMeans
RangerWolf
·
2014-02-07 23:00
java
数据挖掘
weka
聚类
Weka聚类算法的两个实现算法
我也不太清楚这样聚类的效果如何sigh...WekaVersion:3.7.10K-MeansK-均值算法importjava.io.File;importweka.clusterers.Simple
KMeans
RangerWolf
·
2014-02-07 23:00
weka
聚类
算法
Weka聚类算法的两个实现算法
WekaVersion:3.7.10 K-MeansK-均值算法importjava.io.File; importweka.clusterers.Simple
KMeans
; importweka.core.DistanceFunction
RangerWolf
·
2014-02-07 15:00
算法
算法
weka
Kmeans
based indexing and Asymmetric Distance Computation for ANN search (Binary Local Feature):...
转自:http://www.cvchina.info/2012/01/13/
kmeans
-based-indexing-and-asymmetric-distance-computation-for-ann-search-binary-local-feature-part1
dake
·
2014-01-29 13:00
算法
image
search
query
byte
distance
ERROR common.AbstractJob: Unexpected o while proce
测试mahoutinaction中kmean实例的时候,输入命令: bin/mahout
kmeans
-ireuters-vectors/tfidf-vectors/\-creuters-initial-clusters
cookqq
·
2014-01-23 12:00
org.apache.mahout.math.function.IntDoubleProcedure
学习 Simple
KMeans
Clustering测试例子的时候,运行报错环境列表软件明称版本hadoop0.20.2mahout0.4eclipseKeplerServiceRelease1报错代码:
cookqq
·
2014-01-21 16:00
kmeans
的实现
function[Y,y]=
kmeans
(m,k,isRand)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
a200800170331
·
2014-01-11 20:00
clustering
C++ call matlab on
本文讲解如何在mac+xcode上用C/C++调用matlab,并给出一个极简单的应用,
kmeans
.
abcjennifer
·
2013-12-25 11:00
xcode
mac
4
c++调matlab
【OpenCV】基于
kmeans
的细胞检测方法
问题是这样的,有一幅经过二值化处理之后的图像,我们希望统计其中细胞的个数,和不同粘连情况的细胞个数,比如,下图中有1个细胞组成连通区域的,也有2个细胞组成连通区域的,也有更多个细胞组成连通区域的,我们希望分别统计不同的情况。我想出的一种可行的方法是这样的:通过图像形态学的处理erode,将一些邻接的细胞分离开来,并减少单个像素的噪声干扰计算其中的连通域计算每一个连通域的面积根据面积计算其中的聚类,
Arthurlr
·
2013-12-15 21:00
Hadoop vs Spark性能对比
基于Spark-0.4和Hadoop-0.20.21.
Kmeans
数据:自己产生的三维数据,分别围绕正方形的8个顶点{0,0,0},{0,10,0},{0,0,10},{0,10,10},{10,0,0
jmppok
·
2013-12-05 14:00
hadoop
性能
spark
Mahout系列----谱聚类
1.构造亲和矩阵W 2.构造度矩阵D 3.拉普拉斯矩阵L 4.计算L矩阵的第二小特征值(谱)对应的特征向量Fiedler 向量 5.以Fiedler向量作为kmean聚类的初始中心,用
kmeans
聚类
thd52java
·
2013-12-05 09:00
mapreduce
谱聚类
mahout系列之---谱聚类
1.构造亲和矩阵W2.构造度矩阵D3.拉普拉斯矩阵L4.计算L矩阵的第二小特征值(谱)对应的特征向量Fiedler向量5.以Fiedler向量作为kmean聚类的初始中心,用
kmeans
聚类亲和矩阵:W_ij
yueyedeai
·
2013-12-05 00:00
Mahout
Kmeans
(K均值)与
Kmeans
++和KNN(K近邻)算法比较
K-Means介绍 K-means算法是聚类分析中使用最广泛的算法之一。它把n个对象根据他们的属性分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。其聚类过程可以用下图表示: 如图所示,数据样本用圆点表示,每个簇的中心点用叉叉表示。(a)刚开始时是原始数据,杂乱无章,没有label,看起来都一样,都是绿色的。(b)假设数据集可以分为两类,令
zll0927
·
2013-11-28 09:00
聚类分析及k均值聚类(K-means)
p=17http://www.mathworks.cn/help/toolbox/stats/
kmeans
.htmlhttp://www.mathworks.cn/products/image/demos.html
ustcxcl
·
2013-11-14 17:38
k-means
聚类分析
k均值聚类
聚类分析及k均值聚类(K-means)
p=17http://www.mathworks.cn/help/toolbox/stats/
kmeans
.htmlhttp://www.mathworks.cn/products/p_w_picpath
ustcxcl
·
2013-11-14 17:38
K-means
聚类分析
k均值聚类
机器学习
Mahout系列之----
kmeans
聚类
Kmeans
是最经典的聚类算法之一,它的优美简单、快速高效被广泛使用。
Kmeans
算法描述 输入:簇的数目k;包含n个对象的数据集D。 输出:k个簇的集合。
thd52java
·
2013-11-10 12:00
Mahout
机器学习
Mahout系列之----
kmeans
聚类
Kmeans
是最经典的聚类算法之一,它的优美简单、快速高效被广泛使用。
Kmeans
算法描述输入:簇的数目k;包含n个对象的数据集D。输出:k个簇的集合。
yueyedeai
·
2013-11-09 14:00
Mahout
机器学习
Hierarchical Clustering 理解
这个算法其实很简单,与
Kmeans
相比,甚至没有自己的目标函数。HAC算法有两个思路:从上往下,和从下往上。什么意思呢?
Json_Nie
·
2013-11-08 22:15
Matlab
Mahout 算法
Mahout 包括协同过滤,基于User和Item的推荐;
kmeans
、Fuzzy-
kmeans
、Mean shift 、Dirichlet process 、LDA聚类;奇异值分解;并行频繁项集挖掘
yueyedeai
·
2013-11-08 16:00
机器学习
Mahout 算法
Mahour 包括协同过滤,基于User和Item的推荐;
kmeans
、Fuzzy-
kmeans
、Mean shift 、Dirichlet process
thd52java
·
2013-11-08 16:00
Mahout
Opencv
Kmeans
聚类算法
k-means算法接受输入量k;然后将n个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小1.算法基本步骤(1)从n个数据对象任意选择k个对象作为初始聚类中心;(2)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;(3)重新计算每个(有变化)聚类的均值(中心对象);(4)计算标准测度
xiao囡囡
·
2013-11-07 15:58
机器学习
Opencv
Kmeans
聚类算法
k-means算法接受输入量k;然后将n个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小1. 算法基本步骤(1)从n个数据对象任意选择k个对象作为初始聚类中心;(2)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;(3)重新计算每个(有变化)聚类的均值(中心对象);(4)计算标准测
KUAILE123
·
2013-11-07 15:00
opencv
聚类
kmeans
【数字图像处理】使用
kmeans
算法对TrueColor图片进行优化
实验的主要内容是将truecolor的图片通过一个优化算法得到其256色的最优表示。本实验采用kmean做算法对像素的色彩进行聚类的计算,分类得到一个色彩数为256的CodeBook,和一个包含有CodeBook索引的矩阵,原图片的颜色值都从CodeBook中获取,colorMap矩阵保存其中像素颜色的索引值,这样通过索引恢复出一个近似的图片文件,达到比传统的GIF图像更好的效果。由上图可见,25
Arthurlr
·
2013-10-31 21:00
opencv之
kmeans
源代码注释
如题
kmeans
并不必多做介绍,原理的内容可以参看如下链接:http://coolshell.cn/articles/7779.html。本文主要是对opencv中的kmeas函数进行简单解读。
antter0510
·
2013-10-28 11:00
注释
源代码
opencv
kmeans
Kmeans
、
Kmeans
++和KNN算法比较
K-Means介绍K-means算法是聚类分析中使用最广泛的算法之一。它把n个对象根据他们的属性分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。其聚类过程可以用下图表示:如图所示,数据样本用圆点表示,每个簇的中心点用叉叉表示。(a)刚开始时是原始数据,杂乱无章,没有label,看起来都一样,都是绿色的。(b)假设数据集可以分为两类,令K=2,随机在坐
Vincent乐
·
2013-10-24 14:28
机器学习
Kmeans
、
Kmeans
++和KNN算法比较
K-Means介绍 K-means算法是聚类分析中使用最广泛的算法之一。它把n个对象根据他们的属性分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。其聚类过程可以用下图表示: 如图所示,数据样本用圆点表示,每个簇的中心点用叉叉表示。(a)刚开始时是原始数据,杂乱无章,没有label,看起来都一样,都是绿色的。(b)假设数据集可以分为两类,令
chlele0105
·
2013-10-24 14:00
streaming kmean cluster 聚类算法实现和分析
在项目开始的时候,对聚类算法作了调研,总共调研了三种算法,分别是
kmeans
算法、streamingkmean算法、faststreamingkmean算法,这是在公司的第一个项目,收获还是很多的
xyl520
·
2013-10-14 23:00
算法
Streaming
聚类
kmeans
利用word2vec对关键词进行聚类
按照一般的思路,可以用新闻ID向量来表示某个关键词,这就像广告推荐系统里面用用户访问类别向量来表示用户一样,然后就可以用
kmeans
的方法进行聚类
memray
·
2013-10-10 11:00
Linux下C语言获取目录中的文件列表
编译即可#include#include#include#includeintmain(){DIR*dir;structdirent*ptr;dir=opendir("/home/zhangyang/
kmeans
missingu1314
·
2013-10-09 16:25
K-means算法实现
原文:http://blog.csdn.net/qll125596718/article/details/82434041.基本
Kmeans
算法[1][cpp] viewplaincopy选择K个点作为初始质心
u010064842
·
2013-10-05 23:00
k-means算法C++实现
数据挖掘的R包和函数的集合
数据挖掘的R包和函数的集合1、聚类常用的包:fpc,cluster,pvclust,mclust基于划分的方法:
kmeans
,pam,pamk,clara基于层次的方法:hclust,pvclust,agnes
gh624922876
·
2013-09-15 10:33
数据挖掘
kmeans
算法
//k-means.cpp:定义控制台应用程序的入口点。 // #include"stdafx.h" #include #include #include #include #definek3 usingnamespacestd; //存放元组的属性信息 structTuple { floatattr1; floatattr2; }; //计算两个元组的欧几里得距离 floatgetDi
xiaozz_m608c
·
2013-09-12 16:00
利用word2vec对关键词进行聚类
按照一般的思路,可以用新闻ID向量来表示某个关键词,这就像广告推荐系统里面用用户访问类别向量来表示用户一样,然后就可以用
kmeans
的方法进行聚类了。
Felven
·
2013-09-04 17:47
Felven在职场
利用word2vec对关键词进行聚类
按照一般的思路,可以用新闻ID向量来表示某个关键词,这就像广告推荐系统里面用用户访问类别向量来表示用户一样,然后就可以用
kmeans
的方法进行聚类了。
jj12345jj198999
·
2013-09-04 17:00
开源
Google
聚类
词语分析
word2vec
利用word2vec对关键词进行聚类
按照一般的思路,可以用新闻ID向量来表示某个关键词,这就像广告推荐系统里面用用户访问类别向量来表示用户一样,然后就可以用
kmeans
的方法进行聚类了。
jj12345jj198999
·
2013-09-04 17:00
开源
Google
聚类
词语分析
word2vec
cv
KMeans
2均值聚类分析+代码解析+灰度彩色图像聚类
1K-均值聚类算法的基本思想 K-均值聚类算法是著名的划分聚类分割方法。划分方法的基本思想是:给定一个有N个元组或者纪录的数据集,分裂法将构造K个分组,每一个分组就代表一个聚类,Kdata.fl[0]; doublecent1=centers->data.fl[1]; doublecent2=centers->data.fl[2];CV_IMPLintc
xidianzhimeng
·
2013-08-27 14:00
Algorithm
kmeans
Mahout源码MeanShiftCanopyDriver分析之三MeanShiftCanopyMapper数据逻辑流
继上篇博客,分析MeanShiftCanopyMapperFollow:首先要获得数据,MeanShiftCanopyMapperFollow的getMapData函数是改编自
KMeans
Driver中的一段代码
thecloud
·
2013-08-24 19:00
Mahout
Mahout源码MeanShiftCanopy聚类算法分析(3)
继上篇博客,分析MeanShiftCanopyMapperFollow:首先要获得数据,MeanShiftCanopyMapperFollow的getMapData函数是改编自
KMeans
Driver中的一段代码
fansy1990
·
2013-08-24 19:00
Mahout
源码分析
shift
mean
canopy聚类算
上一页
56
57
58
59
60
61
62
63
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他