E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
随机森林算法
机器学习-Random Forest算法简介
随机森林算法
只需要两个参数:构建的决策树的个数t,在决策树的每个节点进行分裂时
wenyusuran
·
2015-04-13 15:00
随机森林算法
实现
随机森林是一个包含多个决策树的分类器,该分类器的输出结果是由所有决策树输出结果的众数而定,每个决策树都生长于一个被称为bootstrap样本的训练数据集之上,所谓“bootstrap样本”的构造原理为:对于容量为n原始训练数据,采取重复抽样的方式抽样n次,形成一组新的训练数据,被称为原始数据的一个bootstrap样本。在bootstrap样本上构造决策树的原理与传统的构造决策树的方法大致相同,但
LJBlog2014
·
2014-10-02 17:18
数据挖掘与机器学习
[置顶] 随机森林--Random Forest
设具有N个样本的训练集(数据集):它们的标签为:
随机森林算法
的步骤:每一次建立一棵决策树的步骤第一步:从上述N个样本数据集中,进行N次有放回的抽样。
wxcdzhangping
·
2014-04-07 15:00
机器学习
Random
模式识别
随机森林
forest
Random forests, 随机森林,online random forests
RandomForests(随机森林)随机森林的思想很简单,百度百科上介绍的
随机森林算法
比较好理解。在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。
wangkr111
·
2014-03-13 14:00
Random
Random
online
随机森林
forest
forests
【mahout决策树算法】1-生成Describe
因为论文的关系,需要学习
随机森林算法
,老板告诉我mahout已经实现了这个算法,那么就开始看mahout的决策树实现吧!
ashqal
·
2014-03-10 14:00
Mahout
decisionfores
Mahout
随机森林算法
分布式策略
关于mahout中的randomforests算法在前面已经分析过,这里简要说下其并行策略。刚开始的时候,我以为这个算法好像没啥并行的地方,一开始就是对全部原始数据进行分析,也没有对原始数据进行分片。然后它的job任务也只有一个mapper,这样如何才能多建立几个mapper?然后这样才能达到几个节点并行吧(一个节点计算一个mapper,这样效率才高过一个节点计算多个mapper)。但是如果总共才
fansy1990
·
2013-09-29 01:00
Mahout
随机森林算法
分布式策略
Mahout
随机森林算法
源码分析(4)
Mahout版本:0.7,hadoop版本:1.0.4,jdk:1.7.0_2564bit。Mahout系列之DecisionForest写了几篇,其中的一些过程并没有详细说明,这里就分析一下,作为DecisionForest算法系列的结束篇。主要的问题包括:(1)在BuildForest中分析完了Step1Mapper后就没有向下分析了,而是直接进行TestForest的分析了,中间其实还是有很
fansy1990
·
2013-09-25 20:00
Mahout
源码分析
随机森林算法
Mahout
随机森林算法
源码分析(3)--TestForest
Mahout版本:0.7,hadoop版本:1.0.4,jdk:1.7.0_2564bit。首先贴上调用TestForest的代码(win7下面myeclipse调用TestForest,这里要设置Configuration,所以不能直接TestForest.main()来调用):packagemahout.fansy.partial.test; importorg.apache.hadoop.
fansy1990
·
2013-09-25 00:00
Mahout
源码分析
TestForest
随机森林算法
Mahout
随机森林算法
源码分析(2-4)
Mahout版本:0.7,hadoop版本:1.0.4,jdk:1.7.0_2564bit。接上篇,先来说说上篇最后的bestIg和bestIndex的求法。在说这个前,要首先明确一个数组的熵的求法,按照mahout中的源码针对这样的一个数组a=[1,3,7,3,0,2]其熵为:设sum=1+3+7+3+0+2,则其中pi对应于1/sum、3/sum、7/sum、3/sum、2/sum(其中若数组
fansy1990
·
2013-09-24 12:00
Mahout
源码分析
随机森林算法
建树
Mahout
随机森林算法
源码分析(2-3)
Mahout版本:0.7,hadoop版本:1.0.4,jdk:1.7.0_2564bit。接上篇,分析到OptIgSplitl类的computeSplit函数里面的numbericalSplit函数,看这个函数的输入参数data和attr,应该是针对data计算出一个和attr相关的值而已。往下看double[]values=sortedValues(data,attr);,这一句是干啥的?pr
fansy1990
·
2013-09-24 00:00
Mahout
源码分析
随机森林算法
Mahout
随机森林算法
源码分析(2-2)
Mahout版本:0.7,hadoop版本:1.0.4,jdk:1.7.0_2564bit。今天到BuildForest的主要Mapper操作,前面也说到BuildForest主要的操作都在Mapper里面,而reducer是没有的。本篇介绍其Mapper,Step1Mapper。首先贴上其仿制代码,如下:packagemahout.fansy.partial; importjava.io.IO
fansy1990
·
2013-09-23 21:00
Mahout
源码分析
随机森林算法
Mahout
随机森林算法
源码分析(2-1)BuildForest
尼玛,好坑呀!昨天遇到的问题原来是找错包了,那个Step1Mapper.class同时在mahout-core-0.7.jar mahout-core-0.7-job.jar mahout-examples-0.7-job.jar三个包中,但是用到的只是mahout-core-0.7.jar中的Step1Mapper.class,所以只用替换mahout-core-0.7.jar中相应的文件即
fansy1990
·
2013-09-22 22:00
Mahout
源码分析
随机森林算法
建树
Mahout
随机森林算法
源码分析(2)--BuildForest
Mahout版本:0.7,hadoop版本:1.0.4,jdk:1.7.0_2564bit。BuildForest是在mahout-examples-0.7-job.jar包的org\apache\mahout\classifier\df\mapreduce路径下。直接运行该类,可以看到该类的使用方式:Usage: [--data--dataset--selection--no-complete-
fansy1990
·
2013-09-21 23:00
Mahout
源码分析
建树
随机森林算法
Mahout
随机森林算法
源码分析(1)--Describe
Mahout版本:0.7,hadoop版本:1.0.4,jdk:1.7.0_2564bit。Mahout中实现决策树算法的有两个(quickstart),分别是PartialImplementation和BreimanExample,可以点击链接到相应的网页查看其官方实例。其中BreimanExample是单机版的,而PartialImplementation是可以使用map-reduce模式的。
fansy1990
·
2013-09-20 15:00
Mahout
DESCRIBE
随机森林算法
机器学习-Random Forest算法简介
随机森林算法
只需要两个参数:构建的决策树的个数t,在决策树的每个节点进行分裂
·
2012-09-22 22:00
Random
OpenCV学习笔记(四十五)——小试随机森林(random forest)算法ml
对于
随机森林算法
,原理我想大家都会去看论文,推荐两个老外的网址http://www.stat.berkeley.edu/users/breiman/RandomForests/和https://cwiki.apache.org
yang_xian521
·
2012-03-12 18:00
数据结构
算法
tree
测试
Random
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他