E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Canopy
机器学习----聚类分析(Kmeans聚类算法)
一、什么是聚类分析二、算法流程三、优缺点四、K值确定4.1、肘部法则4.2、肘部法则代码部分五、算法效果衡量标准5.1、轮廓系数5.2、最近簇5.3、轮廓系数法代码如下5.4、
Canopy
算法配合初始聚类
sakura小樱
·
2018-07-03 16:26
机器学习
人工智能
K-means聚类
k-means++
k-means优化
聚类优化
聚类分析(K-means算法)
聚类算法及划分方法2聚类模型评估(优缺点)3K-means在sklearn方法4确定K值–肘部法则–SSE5模型评估指标–轮廓系数法–最近簇5.1轮廓系数5.2最近簇定义—平均轮廓系数[0,1]:5.3、
Canopy
SongpingWang
·
2018-05-28 22:44
机器学习—算法及代码
ImportError: DLL load failed:找不到指定的模块 解决方案
没想到windows的
canopy
里没有自带sklearn包。好吧,那去官方github下一个放文件里吧。兴冲冲地下过来放进去后,importsklearn没有问题,太好了,再来一句。
heidou_1123
·
2018-05-14 09:02
Canopy
算法实战总结
通过
canopy
算法实战了解了mapreduce的coding套路,job、input、output、format、map、reduce、configuration等的设置,文件序列化和反序列化sequenceFile
weimengfeiwu
·
2018-03-21 18:14
hadoop
canopy
Python科学计算发行版—Anaconda
anaconda/下载地址:https://mirrors-wan.geekpie.org/anaconda/archive/,分别2.7的版本(anaconda2)和3.4版本(anaconda3)
Canopy
thirsd
·
2018-01-27 02:22
裸Ubuntu14.04安装Conda
前言:Anaconda是一个和
Canopy
类似的科学计算环境,自带的包管理器Conda很强大。
梦幻贝壳
·
2018-01-23 13:03
ubuntu系统
Python网络爬虫《一》
1、内容:2、PythonIDE工具:科学计算和数据分析:
Canopy
、Anaconda3、Python网络爬虫与信息提取:Request库:(1)安装:pipinstallrequest(2)验证:pythonIDLE
女王の专属领地
·
2018-01-13 15:59
Python
Python全栈工程师
python实现
Canopy
算法
序前两个月在做项目突然发现
Canopy
算法发现网上直接用python实现的不多,因为Mahout已经包含了这个算法,需要使用的时候仅需要执行Mahout几条命令即可,并且多数和MapReduce以及Hadoop
AlanConstantineLau
·
2017-09-09 10:42
python
数据挖掘
数据可视化
机器学习
python
算法
clustering
wxPython:调用OCR模块实现图片识别
(读者电脑中应安装有
Canopy
)先下载tesseract-ocr模块:OCR模块将其安装在
Canopy
那个盘。安装了之后,下载代码:代码将代码解压至......
Nicetomeetu-
·
2017-06-09 20:03
多平台应用开发
ImportError: DLL load failed:找不到指定的模块 解决方案
没想到windows的
canopy
里没有自带sklearn包。好吧,那去官方github下一个放文件里吧。兴冲冲地下过来放进去后,importsklearn没有问题,太好了,再来一句。
lzhalan2016
·
2016-09-02 18:13
解决方案
python
sklearn
import
pip
机器学习
scikit-learn
常用聚类算法
DecisionTree,DT)支持向量机(SupportVectorMachine,SVM)LR算法FM算法:FM主要用SVDFeature;随机森林(RandomForest,RF)GBDT算法,SVD算法hac算法
Canopy
aoeace
·
2016-08-05 14:41
算法
准备工作
Canopy
安装Day1
说明:本文章为Python数据处理学习日志,主要内容来自书本《利用Python进行数据分析》,WesMcKinney著,机械工业出版社。安装和设置作者推荐Python安装包为ENthoughtPythonDistribution(现更名EnthoughtCanopy),译本发行时间距现在有2年时间,所以期间有版本更新,译者建议下载书中提到的安装包版本epd_free_7.3-1-win-x86.m
u010456562
·
2016-05-06 12:00
canopy
算法优化kmean聚类及在mahout上实现
a,x两个矩阵 [,1][,2] [1,] 1 1 [2,] 0 1 [3,] 0 0 [4,] 5 6 [5,] 6 5 [6,] 5 5 [7,] 10 2 [8,] 10 2 [9,] 11 3for(jin1:nrow(a)){for(iin1:nrow(x)){ w[i]<-dist(rbind(a[j,],x[i,]),method="euclidea
q383700092
·
2016-03-29 17:00
Mahout
机器学习
canopy算法
利用F#库
canopy
进行UI测试
InfoQ与
canopy
的作者ChrisHolt进行了一次访谈,以便更深入地了解
canopy
这个在Selenium的基础上所创建的F#库。InfoQ:你能否为我们介绍一下
canopy
?
Pierre-Luc Maheu
·
2016-03-19 00:00
IPython使用问题记录
pd.read_csv(upath,sep='::',header=None,names=unames,encoding=encoding) /Users/[your_name]/Library/Enthought/
Canopy
u012566895
·
2016-02-29 12:00
使用
canopy
生成和k-means聚类对新闻进行聚类
/**** *@authorYangXin *@info使用
canopy
生成和k-means聚类对新闻进行聚类 */ packageunitNine; importorg.apache.hadoop.conf.Configuration
u012965373
·
2016-02-27 11:00
以in-memory方式运行的
canopy
生成算法
/*** *@authorYangXin *@info */ packageunitNine; /*** *@authorYangXin *@info以in-memory方法运行的
canopy
*/
u012965373
·
2016-02-27 11:00
Canopy
使用教程 (3)
1. 2. plot函数: plot默认生成是曲线图,可以通过kind参数生成其他的图形,可选的值为:line, bar, barh, kde, density, scatter。散点图。使用kind='scatter',x和y指定x轴和y轴使用的字段。累积的柱状图,需要指定stacked=True。figsize参数可以指定绘图对象的宽度和高度,单位为英寸,figsize(X,Y)rot设置底行
dozeoo
·
2016-02-24 22:00
Canopy
使用教程 (2)
1.下载https://reputation.alienvault.com/reputation.dataalienvault公司的IP信誉数据库文件到本地,手动或者wget2.使用read_csv读入数据 3.也可以以hTML格式输出,方便阅读
dozeoo
·
2016-02-23 22:00
Canopy
v. 1.5.5 ubuntu安装流程
官网的下载超级慢,还总是断,一断就失败了我花费了7个小时终于在尝试了5次以后下载成功了,现在将网盘链接分享出来https://yunpan.cn/cxt28gM26mxQU 访问密码301d 1.5.5版为linux32位系统最新版本 Canopyv. 1.5.5 ·released July3,2015 32-bit Linux 371.9MBMD5:2305dee7456b7a7d9b3101
dozeoo
·
2016-02-23 19:00
[置顶] Spark
canopy
算法
canopy
算法概念与传统的聚类算法(比如K-means)不同,
Canopy
聚类最大的特点是不需要事先指定k值(即clustering的个数),因此具有很大的实际应用价值。
u012432611
·
2016-01-16 16:00
算法
spark
CANOPY
对需要聚类的数据使用
canopy
做初步的计算
这个cluster数目一般是通过
canopy
算法进行预处理来确定的。
canopy
具体描述可以参考这里。 下面是golang语言的一个实现(对经纬度距离计算进行cluster)。
GZ.Jackey
·
2016-01-11 11:00
Mahout之
Canopy
Clustering深入理解
转自:http://www.cnblogs.com/vivounicorn/archive/2011/09/23/2186483.html Mahout学习——
Canopy
Clustering
·
2015-11-13 10:52
cluster
Mahout聚类算法
Canopy
+K-means测试实例
Mahout是Apache的顶级开源项目,它由Lucene衍生而来,且基于Hadoop的,对处理大规模数据的机器学习的经典算法提供了高效的实现。其中,对经典的聚类算法即提供了单机实现,同时也提供了基于hadoop分布式的实现,都是非常好的学习资料。 &
·
2015-11-12 22:54
Mahout
Python科学计算利器——Anaconda
为此我尝试过Enthought
Canopy
,但
Canopy
感觉把问题搞得复杂化,管理Python扩展也不太方便。直到今天我发现了Anaconda。
·
2015-11-07 10:16
python
「2013-4-20」SciPy, Numerical Python, matplotlib, Enthought
Canopy
Express
《数值分析》这门课需要做一些实验,实现一些 Numerical Analysis 算法。科学计算最好的工具,自然是 Matlab 或者 Mathematica(符号运算);但是考虑到实验的重点在于「算法实现」,所以通用程序设计语言,也是不错的选择,于是就考虑 Python 咯。 1. http://goo.gl/AQViw,工具包简介。 Numpy is a language exten
·
2015-11-02 19:36
express
mahout中kmeans算法和
Canopy
算法实现原理
本文讲一下mahout中kmeans算法和
Canopy
算法实现原理。 一. Kmeans是一个很经典的聚类算法,我想大家都非常熟悉。
·
2015-11-01 14:15
Mahout
opencv实现
canopy
算法
#include "stdafx.h" using namespace cv; int main(int argc, char** argv) { Mat img=imread("d:/pic/lena.jpg"); imshow("src",img); CV_Assert(!img.empty()
·
2015-10-31 10:17
opencv
Python数据分析 EPD
参考用书 《利用Python进行技术分析:Python for Data Analysis》 官方把epd (https://www.enthought.com/products/
canopy
·
2015-10-30 13:27
python
数据挖掘-Mahout-
Canopy
聚类实践
(3)根据2中的距离d,把d小于T1的样本数据向量划到一个
canopy
中,同时把d小于T2的样本数据向量从List中移除。(4)重复2、3,直至List为空2、下载测试数据cd/tm
刀刀_高扬
·
2015-10-22 20:38
hadoop
大数据
Mahout
聚类
CANOPY
数据挖掘-Mahout-
Canopy
聚类实践
(3)根据2中的距离d,把d小于T1的样本数据向量划到一个
canopy
中,同时把d小于T2的样本数据向量从List中移除。(4)重复2、3,直至List为空2、下载测试数据cd/tm
刀刀_高扬
·
2015-10-22 20:38
hadoop
大数据
Mahout
聚类
CANOPY
数据挖掘-Mahout-
Canopy
聚类实践
(3)根据2中的距离d,把d小于T1的样本数据向量划到一个
canopy
中,同时把d小于T2的样本数据向量从List中移除。(4)重复2、3,直至List为空2、下载测试数据cd/tm
刀刀_高扬
·
2015-10-22 20:38
mahout
hadoop
canopy
大数据
Mahout学习之运行
canopy
算法错误及解决办法
一:将Text转换成Vector序列文件时 在Hadoop中运行编译打包好的jar程序,可能会报下面的错误: Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/mahout/common/AbstractJob 书中和网上给的解决办法都是:把Mahout根目录下的相应的jar包复制到Ha
Gamer_gyt
·
2015-10-11 13:00
File
Mahout
机器学习
squence
AbstractJob
canopy算法
Mahout聚类算法学习之
Canopy
算法的分析与实现
3.1
Canopy
算法3.1.1
Canopy
算法简介
Canopy
算法的主要思想是把聚类分为两个阶段:阶段一,通过使用一个简单、快捷的距离计算方法把数据分为可重叠的子集,称为“
canopy
”;阶段二
Gamer_gyt
·
2015-10-09 16:00
hadoop
Mahout
机器学习
canopy算法
配置Python开发环境
一、 EnthoughtCanopyDownloadWindows:双击运行安装包设置安装位置设置
Canopy
为默认Python开发环境(Recommended,ifnoreadarticle)
xjhznick
·
2015-09-09 16:10
python
Python科学计算环境推荐——Anaconda
Python科学计算环境推荐——AnacondaAnaconda是一个和
Canopy
类似的科学计算环境,但用起来更加方便。自带的包管理器conda也很强大。首先是下载安装。
hzyido
·
2015-07-26 21:21
机器学习算法库scikit-learn的安装
对于(2),我推荐的是
canopy
,在mac和win
hzyido
·
2015-07-26 08:40
scikit-learn 机器学习算法库scikit-learn的安装
对于(2),我推荐的是
canopy
,在mac和win
hzyido
·
2015-07-25 23:14
聚类算法
utf8=%E2%9C%93&q=
canopy
+clustering&type=Repositories&ref=searchresults4、https://ww
DSLZTX
·
2015-05-19 15:00
Mahout——
Canopy
Clustering
Mahout学习——CanopyCluster 聚类是机器学习里很重要的一类方法,基本原则是将“性质相似”(这里就有相似的标准问题,比如是基于概率分布模型的相似性又或是基于距离的相似性)的对象尽可能的放在一个Cluster中而不同Cluster中对象尽可能不相似。对聚类算法而言,有三座大山需要爬过去:(1)、alargenumberofclusters,(2)、ahighfeaturedime
浪朗森
·
2015-05-04 18:00
大数据
Mahout
云计算
推荐算法
CANOPY
自定义Enthought
Canopy
的在windows下的安装位置
关于
canopy
:https://www.enthought.com/products/
canopy
/EnthoughtCanopy默认安装到C盘。当以管理员身份执行安装包时候,可以自定义安装位置。
樂天
·
2015-04-26 11:00
Canopy
聚类算法分析
原文链接:http://blog.csdn.net/yclzh0522/article/details/6839643
Canopy
聚类算法是可以并行运行的算法,数据并行意味着可以多线程进行,加快聚类速度
wishchin
·
2015-04-15 22:46
聚类分析
推荐/Rank系统
Canopy
聚类算法分析
原文链接:http://blog.csdn.net/yclzh0522/article/details/6839643
Canopy
聚类算法是可以并行运行的算法,数据并行意味着可以多线程进行
wishchin
·
2015-04-15 22:00
数据挖掘算法之聚类分析(二)
canopy
算法
canopy
是聚类算法的一种实现它是一种快速,简单,但是不太准确的聚类算法
canopy
通过两个人为确定的阈值t1,t2来对数据进行计算,可以达到将一堆混乱的数据分类成有一定规则的n个数据堆由于
canopy
qq1010885678
·
2015-04-11 19:00
算法
Mahout
mahout运行测试与数据挖掘算法之聚类分析(一)kmeans算法解析
mahout之前要安装并启动hadoop集群将mahout的包上传至linux中并解压即可mahout下载地址:点击打开链接mahout中的算法大致可以分为三大类:聚类,协同过滤和分类其中常用聚类算法有:
canopy
qq1010885678
·
2015-04-10 20:00
Mahout
【Python】科学计算环境 —— Anaconda
Anaconda是一个和
Canopy
类似的科学计算环境,但用起来更加方便。自带的包管理器conda也很强大。首先是下载安装。
robinjwong
·
2015-04-06 23:00
python
Windows8下 安装Enthought
Canopy
(64-bit) IDLE 无响应的手动启动方式
在windows下,安装的enthoughtcanopy无法正常启动GUI,应该是安装的环境有问题,先把以前的python环境清干净。 如果在此时,还想使用里面的shellidle,可以采用如下方法,当然,此种方法比较笨。 在windows8下,EnthoughtCanopy(64-bit)的默认安装路径是:C:\Users\\AppData\L
xinxing__8185
·
2015-03-23 16:00
windows8
CANOPY
clustring testing -- robin
canopy
15/01/1217:12:29INFOcanopy.
Canopy
:parsingthearguments15/01/1217:12:30INFOcommon.AbstractJob:Commandlinearguments
cleverlzc
·
2015-01-12 18:00
command
heap
library
Mahout实战教程
课程大纲: 第一周 Mahout概述 Mahout安装 Mahout安装测试 Mahout算法库介绍 解析聚类算法 解析分类算法 协同过滤算法 第二周 聚类算法详解 一、
canopy
一二先生
·
2014-12-09 15:00
算法
hadoop
Mahout
Mahout进阶课程|Mahout视频教程
pqdk网盘失效的话,请加QQ:3113533060课程大纲:第一周Mahout概述Mahout安装Mahout安装测试Mahout算法库介绍解析聚类算法解析分类算法协同过滤算法第二周聚类算法详解一、
canopy
mahout技术
·
2014-12-09 14:19
Mahout
上一页
1
2
3
4
5
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他