E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
#Kmeans
Spark
Kmeans
算法
spark-submit--classcom.ones.soc.cf.
KMeans
Clustering--masteryarn--num-executors3--driver-memory5g--executor-memory4g
houston123
·
2016-08-17 14:00
机器学习
EM算法及OpenCV源码分析
如果使用了CvEM::START_AUTO_STEP,则会调用k-means算法估计最初的参数,K-means会随机地初始化类中心,
KMEANS
_PP_CENTERS,这会导致EM算法得到不同的结果,如果数据量越
Eason.wxd
·
2016-08-09 13:04
机器学习
常用聚类算法
支持向量机(SupportVectorMachine,SVM)LR算法FM算法:FM主要用SVDFeature;随机森林(RandomForest,RF)GBDT算法,SVD算法hac算法Canopy算法
kmeans
aoeace
·
2016-08-05 14:41
算法
kmeans
算法详解与spark实战
1.标准
kmeans
算法
kmeans
算法是实际中最常用的聚类算法,没有之一。
kmeans
算法的原理简单,实现起来不是很复杂,实际中使用的效果一般也不错,所以深受广大人民群众的喜爱。
bitcarmanlee
·
2016-08-02 10:01
ml
algorithm
Spark中saveAsTextFile至stage划分和job提交的源代码分析
阅读更多之前看了SparkStreaming和SparkSQL,自己还花了一些时间去玩了些machinelearning的算法,像线性回归,
kmeans
,协同过滤等。
humingminghz
·
2016-07-29 14:00
scala
spark
hadoop
Spark中saveAsTextFile至stage划分和job提交的源代码分析
阅读更多之前看了SparkStreaming和SparkSQL,自己还花了一些时间去玩了些machinelearning的算法,像线性回归,
kmeans
,协同过滤等。
humingminghz
·
2016-07-29 14:00
scala
spark
hadoop
spark高级数据分析---网络流量异常检测(升级实战)
在我的上一篇里我写的那个只是个人对
KMeans
聚类在这个项目中的一部分,今天花了很长时间写完和完整的运行测试完这个代码,篇幅很长,都是结合我前面写的加上自己完善的异常检测部分,废话不多说,直接代码实战:
汪本成
·
2016-07-24 22:10
大数据-SparkMllib
160715_发现md文档是一个很有趣的新奇玩意儿!
全文主要内容磷石灰晶体分类的朴素贝叶斯和决策树模型及时间性能评价超导转变温度预测的决策树模型
KMeans
模型Demo具体内容可查看附件zip文件中的pdf文档,其中详细解释了所有的工作内容。
u012251305
·
2016-07-15 10:00
工作
spark
毕业设计
基础算法(二):
Kmeans
聚类算法的基本原理与应用
Kmeans
聚类算法的基本原理与应用 内容说明:主要介绍
Kmeans
聚类算法的数学原理,并使用matlab编程实现
Kmeans
的简单应用,不对之处还望指正。
StayFoolish_Fan
·
2016-07-12 15:00
matlab
聚类分析
Kmeans算法
Kmeans的matlab实现
Kmeans
聚类-K值以及簇中心点的选取
转自:
Kmeans
聚类-K值以及簇中心点的选取,保存在此,学习本文主要基于AnandRajaraman和JeffreyDavidUllman合著,王斌翻译的《大数据-互联网大规模数据挖掘与分布式处理》一书
学战到底
·
2016-07-10 15:00
Kmeans
簇中心点选取
聚类
MachineLearning
SparkML之聚类(一)
Kmeans
聚类
------------------------------目录--------------------------------------------------
Kmeans
理论Matlab实现Spark
legotime
·
2016-07-06 07:20
SparkML
SparkML之聚类(一)
Kmeans
聚类
------------------------------目录--------------------------------------------------
Kmeans
理论Matlab实现Spark
legotime
·
2016-07-06 07:00
源码
spark机器学习
kmeans
++
kmeans
++是kmean算法的改进,原来kmean算法在原始数据的最小、最大区间内均等的选择K个聚类中心,然而
kmeans
++却是从原始数据中选择K个作为初始聚类中心,这种思路的效果优于kmean.
cutelily2014
·
2016-07-03 10:09
机器学习算法
R语言聚类分析
最常见的是
kmeans
法聚类> setwd("D:\\R_test")> data_in fit library(cluster)> clusplot(data_in, fit$cluster, color
qizok
·
2016-06-28 13:16
R
cluster
聚类
R语言
基于
Kmeans
的证件照背景色替换算法
[m,n,d]=size(I);data=[];fori=1:mforj=1:ndata=[data;I(i,j,1),I(i,j,2),I(i,j,3)];endend[IDX,C,sumd,D]=
kmeans
clickyeah
·
2016-06-24 10:33
Matlab
R语言-
kmeans
聚类理论篇K的选择(轮廓系数)
kmeans
是最简单的聚类算法之一,但是运用十分广泛。最近在工作中也经常遇到这个算法。
kmeans
一般在数据分析前期使用,选取适当的k,将数据分类后,然后分类研究不同聚类下数据的特点。
qq_34941023
·
2016-06-11 15:00
KMeans
聚类算法Hadoop实现
Assistance.Java辅助类,功能详见注释[java]viewplaincopypackage
KMeans
;importorg.apache.hadoop.conf.Configuration;
garfielder007
·
2016-06-08 14:04
Hadoop
mahout应用
kmeans
进行文本聚类——实例分析
输入分析:mahout下处理的文件必须是SequenceFile格式的,所以需要把txtfile转换成sequenceFile,而聚类必须是向量格式的,mahout提供下面两个命令来将文本转成向量形式1.mahoutseqdirectory:将文本文件转成SequenceFile文件,SequenceFile文件是一种二制制存储的key-value键值对,http://www.dongtaipin
arrow8071
·
2016-05-27 11:00
算法
机器学习
IRIS数据采用
Kmeans
方法的C++实现
IRIS数据采用
Kmeans
方法的C++实现参考:http://blog.csdn.net/cai0538/article/details/7061922#include#include#include
chenchunyue11
·
2016-05-24 22:02
机器学习中各种距离计算
比如KNN近邻的距离,
Kmeans
距离,相似度中的距离计算。这种距离不一定都是欧氏距离,针对不同需求,数据的不同特点,距离的计算方式不同。下面给出机器学习中常用的距离计算方式,及其应用特点。
qq_23617681
·
2016-05-21 16:56
数据挖掘——聚类算法
kmeans
整理
【
kmeans
算法原理】随机选取k个中心点遍历所有数据,将每个数据划分到最近的中心点中(根据距离的大小进行划分,即计算每个样本点到所有中心点的距离,选择距离最小的那个)计算每个聚类的平均值,并作为新的中心点重复
adminabcd
·
2016-05-16 23:40
数据挖掘
数据挖掘——聚类算法
kmeans
整理
【
kmeans
算法原理】随机选取k个中心点遍历所有数据,将每个数据划分到最近的中心点中(根据距离的大小进行划分,即计算每个样本点到所有中心点的距离,选择距离最小的那个)计算每个聚类的平均值,并作为新的中心点重复
adminabcd
·
2016-05-16 23:00
数据挖掘
kmeans
spark笔记-MLlib之
kmeans
{SparkConf,SparkContext} importorg.apache.spark.mllib.clustering.
KMeans
importorg.apache.spark.mllib.linalg.Vectors
q383700092
·
2016-05-13 20:00
spark
kmeans
Mlib
图像基本变换---
KMeans
聚类算法
本文将详细介绍K-Means均值聚类的算法及实现。 聚类是一个将数据集中在某些方面相似的数据成员进行分类组织的过程。K均值聚类是最著名的划分聚类算法,由于简洁和效率使得他成为所有聚类算法中最广泛使用的。给定一个数据点集合和需要的聚类数目k,k由用户指定,k均值算法根据某个距离函数反复把数据分入k个聚类中。 算法过程: 1,初始化聚类数目K,并任意选择K个初始化均值ui。 2,迭代图像中每个像素
bravebean
·
2016-05-13 08:00
图像基本变换
k-means初始点的选取
KMeans
算法是最常用的聚类算法,主要思想是:在给定K值和K个初始类簇中心点的情况下,把每个点(亦
hustlx
·
2016-05-10 13:56
机器学习
哈工大深研院数字图像处理第二次大作业:水果自动识别(2)HSV空间聚类及SIFT算法目标识别
ProgramewasdevelopedintheconditionofWindowsaswellasLinuxserver,programminglanguageisMatlab(www.mathworks.com).Classify.m,
Kmeans
.m
u013576018
·
2016-05-09 20:00
图像处理
数字图像处理
sift
KMeans
算法检测网络异常入侵
非监督学习技术在决策树算法预测森林植被中我们可以体会到属于监督学习的分类和回归技术的强大,可以预测“即将发生”的事情使用监督学习技术有一个很关键的前提:需要大量的数据对模型进行训练,模型能够从已知的数据中学习规律进而预测未知的数据然而在某些场景下,并不是都能提供监督学习所需要的样本数据来训练模型,有可能只能给出部分正确的输出,甚至一个输出都没有这种情况下,监督学习的技术就不能够使用了此时,对应监督
qq1010885678
·
2016-05-09 17:00
算法
spark
kmeans
SparkMLlib
了解
kmeans
算法和谱聚类算法
谱聚类算法
kmeans
算法拉普拉斯矩阵不过真正要直观地理解谱聚类,其实应该从物理的简正模振动的角度来理解。
u014787301
·
2016-05-09 11:00
ML—EM
华电北风吹日期:2016-05-07EM算法是与
kmeans
极其相似的一个迭代优化算法,主要用于带隐含变量的极大似然估计问题。EM与
kmeans
一样,能够保证收敛,但不能保证全局收敛,对初始值敏感。
zhangzhengyi03539
·
2016-05-07 19:00
【原】Spark之机器学习(Python版)(一)——聚类
kmeans
聚类相信大家都已经很熟悉了。在Python里我们用
kmeans
通常调用Sklearn包(当然自己写也很简单)。那么在Spark里能不能也直接使用sklean包呢?
Charlotte77
·
2016-05-06 14:00
【原】Spark之机器学习(Python版)(一)——聚类
kmeans
聚类相信大家都已经很熟悉了。在Python里我们用
kmeans
通常调用Sklearn包(当然自己写也很简单)。那么在Spark里能不能也直接使用sklean包呢?
Charlotte77
·
2016-05-06 14:00
python实现
Kmeans
文本聚类,通过PAC降维和Matplotlib显示聚类3d三维图像
首先感谢Eastmount写的内容http://blog.csdn.net/Eastmount/article/details/50545937。点击打开链接在此基础上,主要实现以下改进及结果1.替换使用sklearn.feature_extraction.text.TfidfVectorizer,将corpus文本转换为tfidf值的svm向量。2.通过PAC降维和Matplotlib显示聚类3
Eastmount
·
2016-05-05 17:00
python
SVM
kmeans
文本聚类
三维图像
数据挖掘--离群点检测
setwd("("D:/discrete")#读入数据Data=read.csv("D:/discrete/data/",header=T)Data=scale(Data)set.seed(12)km=
kmeans
u013153546
·
2016-05-03 00:00
数据挖掘
离群点检测
kmeans
优缺点 及改进
Kmeans
:优点:简单易实现缺点:可能收敛于局部最小值(对初始k个聚类中心的选择敏感),在大规模数据集上收敛较慢适用数据类型:数值型数据度量聚类效果的指标:SSE(sumofsquarederror,
u013593585
·
2016-04-29 10:00
第二个面试整理
面试题一道二叉树层序遍历的反转,然后就是实际文档如何提取成特征,手写
kmeans
(汗,都是手写这个,我还每次都是根据算法思路重写。。)
u010910436
·
2016-04-26 15:00
数据挖掘算法-k-means
k-means算法R实现#先用setwd设置工作空间,如D盘,并将相关数据拷贝到该目录下setwd("D:/k-means")#读入数据Data=read.csv("D:/k-means/data")km=
kmeans
u013153546
·
2016-04-26 07:00
算法
数据挖掘
k-means
Kmeans
算法详解及MATLAB实现
首先要来了解的一个概念就是聚类,简单地说就是把相似的东西分到一组,同Classification(分类)不同,对于一个classifier,通常需要你告诉它“这个东西被分为某某类”这样一些例子,理想情况下,一个classifier会从它得到的训练集中进行“学习”,从而具备对未知数据进行分类的能力,这种提供训练数据的过程通常叫做supervisedlearning(监督学习),而在聚类的时候,我们并
dulingtingzi
·
2016-04-25 16:53
Kmeans
MATLAB
python
分类识别
Kmeans
算法详解及MATLAB实现
首先要来了解的一个概念就是聚类,简单地说就是把相似的东西分到一组,同Classification(分类)不同,对于一个classifier,通常需要你告诉它“这个东西被分为某某类”这样一些例子,理想情况下,一个classifier会从它得到的训练集中进行“学习”,从而具备对未知数据进行分类的能力,这种提供训练数据的过程通常叫做supervisedlearning(监督学习),而在聚类的时候,我们并
dulingtingzi
·
2016-04-25 16:00
python
matlab
kmeans
Kmeans
例如要把一组数据分成两个簇: ?123456789101112131415161718192021222324252627282930313233>dataset=matrix(c(1,2,+1.2,2,+8,9,+0.9,1.8,+7,10,+8.8,9.2),nrow=6,byrow=T)>dataset [,1][,2][1,] 1.0 2.0[2,] 1.2 2.0[3,] 8.0
Real_Myth
·
2016-04-25 09:00
Spark 机器学习 ——
KMeans
创建模型所对应的类及模型训练importorg.apache.spark.mllib.clustering.
KMeans
val
kmeans
=new
KMeans
() valmodel=
kmeans
.run
lanchunhui
·
2016-04-23 16:00
Oryx2源码学习
简介oryx官网代码分析基于oryx-2.1.2代码目录结构+oryx|-app#基于oryx平台实现的可复用的als、
kmeans
、rdf算法应用和一个wordcount例子|-conf#样例的conf
CodingCatX
·
2016-04-20 16:54
源码
spark
kafka
oryx
Internet
学习总结
KMeans
的C++及Python实现
include usingnamespacestd; constintk=3; constintdims=4; constintdataNum=150; typedefvectorTuple; voiddo
Kmeans
u013593585
·
2016-04-20 15:00
k-means确定初始中心值的方法
KMeans
算法是最常用的聚类算法,主要思想是:在给定K值和K个初始类簇中心点的情况下,把每个点(亦即数据记录)分到离其最近的类簇中心点所代表的类簇中,所有点分配完毕之后,根据一个类簇内的所有点重新计算该类簇的中心点
lihaitao000
·
2016-04-15 20:00
数据挖掘
机器学习
关于聚类算法
Kmeans
/K-mediods/层次聚类/OPTICS较为详细的介绍
K-means算法将一群物理对象或者抽象对象的划分成相似的对象类的过程。其中类簇是数据对象的集合,在类簇中所有的对象都彼此相似,而类簇与类簇之间的对象是彼此相异。聚类除了可以用于数据分割(datasegmentation),也可以用于离群点检测(outlierdetection),所谓的离群点指的是与“普通”点相对应的“异常”点,而这些“异常”点往往值的注意。很多人在学习聚类之初,容易将聚类和分类
ann_hp
·
2016-04-14 22:56
聚类
零售户logistics回归分类
{LogisticRegressionWithLBFGS,LogisticRegressionWithSGD} importorg.apache.spark.mllib.clustering.
KMeans
u012432611
·
2016-04-14 15:00
spark
Logistic
烟草
零售户决策树分类
._ importorg.apache.spark.mllib.clustering.
KMeans
importorg.apache.spark.mllib.evaluation.BinaryClassificationMetrics
u012432611
·
2016-04-14 14:00
spark
决策树
基于Apache Spark的机器学习及神经网络算法和应用
英特尔公司软件开发工程师王以恒分享了《基于ApacheSpark的机器学习及神经网络算法和应用》的课程,介绍了大规模分布式机器学习在欺诈检测、用户行为预测(稀疏逻辑回归)中的实际应用,以及英特尔在LDA、Word2Vec、CNN、稀疏
KMeans
周建丁
·
2016-04-14 00:26
机器学习day15 机器学习实战聚类之k均值聚类算法
k均值聚类称为
kmeans
,是一种非监督学习的算法,下面写一下对监督学习和非监督学习的理解。
fuyan159357
·
2016-04-12 22:00
算法
python
机器学习
简易
kmeans
-c++版本
#include #include #include #include #include #include #include #include #include #include intconstN=1000; intconsteps=1e-3; usingnamespacestd; typedefdoubledtype; typedefvector::size_typevt; doubledis
justdoithai
·
2016-04-12 20:00
【机器学习算法1】——
kmeans
聚类的设计与实现
kmeans
算法属于非监督学习算法,因为在原始的数据集中没有类别标号。简单回顾一下
kmeans
聚类算法的思想:给定k的值,将原始的样本分为k个簇,使每个簇内的散度最小,簇与簇之间的散度最大。
qq_29828623
·
2016-04-10 14:00
算法
机器学习
Class
上一页
49
50
51
52
53
54
55
56
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他