E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
kmean
k-means的分类数目
假设分为一组时的总的离差平方和tot.wss<-(nrow(data)-1)*sum(apply(data,2,var))for(iin2:nc){#必须指定随机种子数set.seed(seed)tot.wss[i]<-
kmean
Distrlili
·
2017-01-20 10:31
data
mining
kmeans++
kmeans++是
kmean
算法的改进,原来
kmean
算法在原始数据的最小、最大区间内均等的选择K个聚类中心,然而kmeans++却是从原始数据中选择K个作为初始聚类中心,这种思路的效果优于
kmean
.
cutelily2014
·
2016-07-03 10:09
机器学习算法
kmean
算法理解
先放一段其他大神的理解,讲的已经很清楚了,后面结合代码说说我的理解在数据挖掘中,K-Means算法是一种clusteranalysis的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种子点最近均值的算法。问题K-Means算法主要解决的问题如下图所示。我们可以看到,在图的左边有一些点,我们用肉眼可以看出来有四个点群,但是我们怎么通过计算机程序找出这几个点群来呢?于是就出现了我们的K-Mea
jialeheyeshu
·
2016-05-07 22:00
Python
kmean
#-*-coding:utf-8-*-fromsklearn.clusterimportKMeansfromsklearn.externalsimportjoblibimportnumpyfeature =numpy.random.rand(40,20)#调用kmeans类clf=KMeans(n_clusters=9)s=clf.fit(feature)prints#9个中心printclf.c
ahuo
·
2016-04-01 17:00
canopy算法优化
kmean
聚类及在mahout上实现
a,x两个矩阵 [,1][,2] [1,] 1 1 [2,] 0 1 [3,] 0 0 [4,] 5 6 [5,] 6 5 [6,] 5 5 [7,] 10 2 [8,] 10 2 [9,] 11 3for(jin1:nrow(a)){for(iin1:nrow(x)){ w[i]<-dist(rbind(a[j,],x[i,]),method="euclidea
q383700092
·
2016-03-29 17:00
Mahout
机器学习
canopy算法
R语言k-means聚类
轮廓系数参考https://en.wikipedia.org/wiki/Silhouette_(clustering)K值选取在实际应用中,由于
Kmean
一般作为数据预处理,或者用于辅助分类贴标签。
u012432611
·
2015-11-24 13:00
机器学习
R语言
kmeans
kmeans 聚类 --- (代码为: 博客数据聚类) (python )
如图:包含两个聚类的
kmean
聚类过程: 总思路: 将所有要聚类的博客,全部用word表示成一个向量,即每篇博客都是由单词组成的,然后形成了一个单
·
2015-11-13 08:00
python
RBF network
nbsp; Output方法可以根据需求任意选取(比如使用SVM,logistic regression等) 关键在于:中心点选取,距离函数选择 2.使用
kmean
·
2015-11-12 09:37
NetWork
用eclipse打包mapreduce程序 运行出现解析路径错误的诡异问题
/hadoop jar ~/
kmean
.jar com.xiaoming.mapreduce.
Kmean
hdfs://ubuntu:8020/user/hadoop/
kmean
/
·
2015-11-11 08:01
mapreduce
Deep learning:二十一(随机初始化在无监督特征学习中的作用)
convolution尺寸和移动步伐等参数比网络的层次比网络参数的学习算法本身还要重要,也就是说即使是使用单层的网络,只要隐含层的节点数够大,convolution尺寸和移动步伐较小,用简单的算法(比如
kmean
·
2015-11-01 10:25
初始化
聚类笔记(上):基本概念
目录目录概述划分方法
Kmean
算法K中心法层次聚类簇间距离基于密度基于网格聚类评估聚类趋势确定簇数经验值对于层次聚类的簇数确定3聚类簇评估4非监督评估方法有监督评估方法参考概述划分方法、层次、基于密度、
zhzhji440
·
2015-09-25 18:00
kmeans聚类中的坑 基于R shiny 可交互的展示
龙君蛋君2015年5月24日1.背景介绍最近公司在用R建模,老板要求用shiny展示结果,建模的过程中用到诸如
kmean
聚类,时间序列分析等方法。
龙君蛋君
·
2015-05-24 12:00
全文检索、数据挖掘、推荐引擎系列6---基于
KMean
的文本自动算法
全文检索、数据挖掘、推荐引擎系列6---基于
KMean
的文本自动算法http://blog.csdn.net/clouderyu/article/details/6761915对一系列文章进行自动聚类可以做为基于内容的推荐引擎的基础
nysyxxg
·
2015-05-22 18:00
胡言乱语找节奏 —— 什么才是机器学习的未来
模板匹配什么才是描述像不像的最直白简单的算法——KNN什么才是学习出最贴近人的认知的模板匹配算法——
KMEAN
?KMEDOID?orotherclusteringmethods?
kuaitoukid
·
2015-04-27 17:00
ENVI自带的非监督分类测试情况
最近写了两个关于遥感图像的简单的非监督分类算法
KMEAN
和ISODATA,发现结果和ENVI的一直有差异,而且还蛮大的,找了好久也没有找到原因。于是用PS自己绘制了一个简单的图像用于测试。
liminlu0314
·
2015-01-13 21:00
kmean
ISODATA
【OpenCV学习】
Kmean
均值聚类对图片进行减色处理
#include #include #include #defineMAX_CLUSTERS(8) usingnamespacestd; intmain(intargc,char**argv) { IplImage*imgA=cvLoadImage("1.jpg",CV_LOAD_IMAGE_ANYDEPTH|CV_LOAD_IMAGE_ANYCOLOR);
wangyaninglm
·
2014-12-15 16:00
用Python做单变量数据集的异常点分析
laizi:http://my.oschina.net/taogang/blog/279402 目录[-]基于标准差得异常检测基于ZSCORE的异常检测基于
KMEAN
聚集的异常检测总结大数据时代,数据的异常分析被广泛的用于各个场合
fennvde007
·
2014-10-08 14:00
数据挖掘-机器学习:
Kmean
聚类思想
阅读更多一、概述数据聚类是对于静态数据分析的一门技术,在许多领域内都被广泛地应用,包括机器学习、数据挖掘、模式识别、图像分析、信息检索以及生物信息等。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集,这样让在同一个子集中的成员对象都有相似的一些属性,常见的包括在坐标系中更加短的空间距离等。K-means是一种基于距离的迭代式算法[1]。它将n个观察实例分类到k个聚类中,以使得每个观
dengqsintyt
·
2014-07-26 22:00
数据挖掘
K-means
聚类
数据挖掘-机器学习:
Kmean
聚类思想
一、概述 数据聚类是对于静态数据分析的一门技术,在许多领域内都被广泛地应用,包括机器学习、数据挖掘、模式识别、图像分析、信息检索以及生物信息等。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集,这样让在同一个子集中的成员对象都有相似的一些属性,常见的包括在坐标系中更加短的空间距离等。
dengqsintyt
·
2014-07-26 22:00
数据挖掘
K-means、聚类
用Python做单变量数据集的异常点分析
摘要本文讨论了使用Python对单变量数据的异常点分析的几种方法PythonDataanalysisMachineLearningPredictive目录[-]基于标准差得异常检测基于ZSCORE的异常检测基于
KMEAN
fennvde007
·
2014-07-07 17:00
ERROR common.AbstractJob: Unexpected o while proce
测试mahoutinaction中
kmean
实例的时候,输入命令: bin/mahoutkmeans-ireuters-vectors/tfidf-vectors/\-creuters-initial-clusters
cookqq
·
2014-01-23 12:00
kmean
算法java版
package com.anyec.math.base; import java.util.ArrayList; import java.util.HashMap; import java.util.List; import java.util.Map; import java.util.Random; import java.util.Set; public class K
qqggcc
·
2014-01-20 23:00
java
Mahout系列----谱聚类
1.构造亲和矩阵W 2.构造度矩阵D 3.拉普拉斯矩阵L 4.计算L矩阵的第二小特征值(谱)对应的特征向量Fiedler 向量 5.以Fiedler向量作为
kmean
聚类的初始中心,用kmeans聚类
thd52java
·
2013-12-05 09:00
mapreduce
谱聚类
mahout系列之---谱聚类
1.构造亲和矩阵W2.构造度矩阵D3.拉普拉斯矩阵L4.计算L矩阵的第二小特征值(谱)对应的特征向量Fiedler向量5.以Fiedler向量作为
kmean
聚类的初始中心,用kmeans聚类亲和矩阵:W_ij
yueyedeai
·
2013-12-05 00:00
Mahout
【数字图像处理】使用kmeans算法对TrueColor图片进行优化
本实验采用
kmean
做算法对像素的色彩进行聚类的计算,分类得到一个色彩数为256的CodeBook,和一个包含有CodeBook索引的矩阵,原图片的颜色值都从CodeBook中获取,colorMap矩阵保存其中像素颜色的索引值
Arthurlr
·
2013-10-31 21:00
KMean
clustering算法获取图片主色调
转自 http://www.kaixinwenda.com/article-lisztlee-8460245.html前几天在研究chromium代码的时候看到了一个取PNG图片主色调(dominantcolor)的算法,这个算法不是取图片中所有点的平均RGB值,也不是取同一RGB值最多的点的RGB。chromium中取图片主色调用的算法用的是KMeanclustering。可以算是KMeancl
leer168
·
2013-10-25 14:00
Weka入门实例之
KMean
聚类实现
/*上次我介绍了分类器的使用方法,这次我来介绍一下聚类算法。聚类算法在数据挖掘里面被称之为无监督学习(unsupervised learning),这是与分类算法(supervised learning)相对的。在它们两者之间还一种叫做半监督学习(semi-supervised learning)这个我会在后面的文章中重点介绍。所谓无监督学习就是在预先不知道样本类别的情况下,由聚类算法来判别样本的
ganliang13
·
2013-10-21 20:00
入门
实例
weka
聚类
kmeans
streaming
kmean
cluster 聚类算法实现和分析
在项目开始的时候,对聚类算法作了调研,总共调研了三种算法,分别是kmeans算法、streamingkmean算法、faststreamingkmean算法,这是在公司的第一个项目,收获还是很多的,无论是在项目还是在思维方式上,先说下自己在项目进行中的思维变化。 场景选择 之所以采用场景这个词,觉得还是很有代表性的,从学生到公司的员工,场景在变,学生的思维到员工的思维也在变,就拿算法
xyl520
·
2013-10-14 23:00
算法
Streaming
聚类
kmeans
KMean
聚类算法及其改进
KMean
聚类算法是一种比较简单而且常用的聚类算法,该算法有以下特点: a)聚类数目的一定的 b)选择一个样本的最近聚类时,需要将所有聚类的距离都计算一遍,然后选择最近的聚类作为该样本所属的类别
xyl520
·
2013-09-15 12:00
算法
聚类
mahout之
kmean
聚类
.Kmeans聚类 Kmeans算法思想也比较简单 :可见http://baike.baidu.com/view/3447609.htm首先从n个数据对象选择k个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始
july_2
·
2013-07-17 15:00
学习OpenCV——
Kmean
(C++)
从前也练习使用过OpenCV的
Kmean
算法,但是那版本低,而且也是基于C的开发。
sangni007
·
2012-09-12 16:00
C++
Random
Class
each
initialization
stdstring
hadoop下mahout kmeans算法研究(2)
如果对本文档有任何建议或者认为有错误的地方欢迎联系本人大家一起进步啊红色的字体:重点和注意事项蓝色的字体:出现的问题和解决/未解决绿色的字体:个人建议数据输入格式测试数据 每个数据和数据之间用空格分开,数据都是double型的
Kmean
zc55803903
·
2012-08-31 21:00
mapreduce
算法
hadoop
vector
input
output
全文检索、数据挖掘、推荐引擎系列6---基于
KMean
的文本自动算法
目前文本自动聚类算法中,用得最多是
KMean
算法,本文中就介绍
KMean
算法的应用。当然,
KMean
算法可以通过调用Mahout或WEKA这两个开源的机器学习算法库
clouderyu
·
2011-09-08 22:00
编程
算法
数据挖掘
null
全文检索
引擎
全文检索、数据挖掘、推荐引擎系列6---基于
KMean
的文本自动算法
目前文本自动聚类算法中,用得最多是
KMean
算法,本文中就介绍
KMean
算法的应用。当然,
KMean
算法可以通过调用Mahout或WEKA这两个开源的机器学习算法库来
Yt7589
·
2011-08-24 16:00
编程
算法
数据挖掘
null
全文检索
引擎
Standard
Kmean
Cluster的实现[Java]
Kmean
并不是一种高效的算法,理论可以证明,在欧几里得空间中的
Kmean
问题是NP-Hard(即使聚类数仅为2)。
grunt1223
·
2011-02-17 13:00
java
C++
c
算法
J#
hadoop 运行kmeans例子出错
org.apache.mahout.clustering.syntheticcontrol.kmeans.Job -i testdata -o output 10/09/20 14:46:07 INFO
kmean
此情此景
·
2010-11-03 16:00
java
apache
hadoop
sun
rack
图像颜色聚类分割算法_
KMean
/*******************************************************************************KMEANS********************************************************************************/#include#include#include#include#
yzm888
·
2010-03-06 18:00
算法
struct
vector
System
each
distance
An Application Example of K-Mean Algorithm
ClusterMain.java package eu.eodigos.
kmean
; import java.util.Iterator; import java.util.List; import
daoger
·
2008-07-04 09:00
C++
c
Hibernate
C#
J#
上一页
1
2
3
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他