如何用hadoop自带的包计算pi值

一、计算pi的值的原理

 

 

        通过hadoop计算pi值确实是一件很酷的事情,我想你可能会有疑问,(Hadoop不是一个分布式计算的处理数据的吗?)当然,计算它能处理大量数据,我们可以通过这种方式来计算pi的值。究竟是怎么运算出它的值,大家请看下面:
通过万能的google,找到了它的原理图:

 

 

如何用hadoop自带的包计算pi值_第1张图片 如何用hadoop自带的包计算pi值_第2张图片这是通过扔飞镖计算概率,在第二象限里面,相当于是长款各自为1的正方形,里面有半径为1的四分之一的圆。那么这个在第二象限里面的正方形里面扔飞镖,在四分之一的圆的概率为pi/4,所以我们要求的pi就是这个求出的概率乘以4。所以大家是不是有一种恍然大悟的感觉。

二、如何运用hadoop自带的包进行计算

 

 

首先我们先找到你安装hadoop所在的目录里面,然后执行这个命令
当然我的这个是hadoop-2.7.5版本的,不能全部按照我的命令打,但是你可以通过找到hadoop文件夹,选择里面的share/hadoop/mapreduce这儿应该是没有错误的,然后如果路径没选择错误的话,你接着打hadoop-mapreduce-examples之后摁Tab键,linux它能自动帮助你补全。然后敲击回车执行这个命令,刚开始会出现这个
这句话的意思的有三次map任务,每个执行100000000.两个参数的乘积就是总的投掷次数,当然,如果你想为了结果更加准确,可以把这几个数值改大点。

所以hadoop还是比较强大的,大家了解之后是不是感觉还是蛮有趣的。

你可能感兴趣的:(大数据—hadoop)