chanson_22

全Hadoop2.x版本安装套路（以Hadoop2.6.0为例）

引言

本人是一枚大学生，初探大数据Hadoop安装套路，详细描述安装过程及其我所认知的步骤因果，作为一段时间学习的成果，也希望能与大家一起交流。
众所周知，自“大数据”概念劈头盖脸袭来后，各路人士都跃跃欲试想开一开大数据的车，那么鼎鼎大名的Hadoop理所当然被大家盯上啦，所以想掀开大数据的面纱就先得老老实实把Hadoop这头小象把玩一番。话不多说，今天的重头戏是Hadoop的安装。
再吐槽一下，互联网的发展导致信息共享更为便捷，但同时网络上许多文章的共通点就是只有步骤却没有清晰的注释，有时甚至会误导读者，即使通读按部就班操作，我们大部分也是只知其然而不知其所以然。
那么最稳的想法是饮水溯源，就让我们来啃一啃官方权威，Hadoop官网的安装文档(点击打开全英链接)以及《Hadoop权威指南》= =

安装步骤

准备所需材料

一台高配一点的电脑、VMware建好三个Centos7.2虚拟机，配置好网络与主机名

CMaster  192.168.83.137
CSlave01  192.168.83.138
CSlave02  192.168.83.139

Hadoop2.6.0的编译包

送上  各版本Hadoop下载地址，这里我们选择hadoop-2.6.0，于是就进入了一个下载页面

源码包的意思是要你自己编译，由于编译这工作对我们这些菜鸟来说成本太高啦，所以贴心的官方给出了已经编译好的包，有可能会遇到版本兼容以及插件编译问题哦。不过现在管他呢，且让我们安心下载编译包。

JDK安装包

踩过兼容性坑的伙伴们都知道，两个软件包如果发行版本不匹配的话，就意味着一只脚已经迈入了bug的深渊。为了避免未知的恐惧，我选择先瞄一眼官方老大哥怎么说。
“应该选择一个经过Hadoop产品供应商认证的，操作系统、Java和Hadoop的组合。Hadoop英文维基页面上列出了能够成功运行的组合(Hadoop权威指南第4版P284)”
好的明白了，这就前往  Hadoop英文维基页面
又是全英页面我有点晕，冷静一下

我用蹩脚的英语水平看出了Hadoop2.7以及之后的版本需要装JAVA7，Hadoop2.6以及之前的版本支持JAVA6

好，这就前往JAVA官网拿下  JAVA SE 6

解释一下，这里x86指的是32位、x64表示64位。这里我选择第三个rpm.bin进行下载

关闭防火墙与SELINUX

“注意，是CMaster、CSlave01、CSlave02均要操作”

防火墙和安全策略相关的SELINUX是个双刃剑，他既能保护我们系统不受侵犯也能限制我们大展拳脚操作Hadoop，为了避免不必要的麻烦，我们选择狠心关闭

关闭防火墙

systemctl stop firewalld.service
systemctl disable firewalld.service

关闭SELINUX

vi /etc/selinux/config

重启生效

创建用户账号

“注意，是CMaster、CSlave01、CSlave02均要操作”

你想嘛，无限权力之王root，不敢动不敢动，还是自己建个用户grid来玩吧。并且这也是官方建议的。

useradd grid

修改hosts

“注意，是CMaster、CSlave01、CSlave02均要操作”

建立ip和主机名之间的联系，以后需要指定某台主机的时候就不用写无规律的ip啦，只需要填入主机名。

vi /etc/hosts

安装配置JAVA

“注意，是CMaster、CSlave01、CSlave02均要安装”

嗯，怎么把JAVA包弄进去Centos我不管自己想办法啦哈哈哈，我用的方法是通过XShell上传至Linux
先检查一遍系统本身是否藏着个JAVA

rpm -qa | grep jdk

若有，则使用命令删除

rpm -e | grep jdk

下一步，解压rpm.bin包

./jdk-6u45-linux-x64-rpm.bin

此时你会惊喜的发现你并不能执行jdk-6u45-linux-x64-rpm.bin

究其原因，就是它不认可你，你没有能力开启它

于是我选择变成修改文件权限变成超能力者强上

chmod 777 jdk-6u45-linux-x64-rpm.bin

再次执行，果然听话了

不过出现一堆乱七八糟的东西，但不用管，JAVA6已经悄悄安装成功了,不信你看

java -version

为了让java的命令可以随时随地随心情执行，所以需要配置搜索目录，即环境变量

vi /etc/profile

#PATH
PATH=$PATH:$JAVA_HOME/bin:$JPS

#JAVA_ENVIRONMENT
JAVA_HOME=/usr/java/jdk1.6.0_45
CLASS_PATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

#EXPORT
export PATH JAVA_HOME CLASS_PATH

保存退出后，使文件生效

source /etc/profile

配置SSH

“注意，CMaster、CSlave01、CSlave02均要安装”

SSH是一套有关于公钥密钥的工具，用来让Master为所欲为任意支配Slaves，毕竟你是要让Slaves存放数据，所以这就是Hadoop联机操作的必要步骤啦。

先进入我们之前配置的用户grid

su - grid

各个节点先安装ssh工具

ssh-keygen –t rsa

一路回车，此时会生成一个.ssh的隐藏文件夹，里面存放的是公钥密钥文件

在CMaster节点上执行下述命令

cat ~/.ssh/id_rsa.pub >authorized_keys
chmod 600 authorized_keys 
scp authorize_keys grid@CSlave01:~/.ssh/
scp authorize_keys grid@CSlave02:~/.ssh/

这堆命令就能完成SSH的搭建，注意将我的主机名和用户名改成对应自己的哦。好奇宝宝们可以去看一下SSH的原理。

在CMaster上测试一下

ssh CSlave01

ssh CSlave02

结果能自由进出CSlave01和CSlave02的用户，就证明配置成功啦

上传并解压配置Hadoop包

“注意，只在CMaster上安装”

上传自己想办法，我再推一下XShell的上传下载的功能嘻嘻

解压.tar.gz文件

tar -zxvf hadoop-2.6.0.tar.gz

这时候已经生成了一个hadoop-2.6.0的文件夹，接下来就要配置一些文件能让我们的Hadoop能顺利运行

你要用hadoop的命令，难道还要进它的目录bin里面执行嘛？设置了环境变量之后，就可以随时随地执行hadoop命令啦

su - grid
vi .bashrc

解释一下，在用户家目录底下，有两个隐藏的能配置环境变量的文件，分别为.bash_profile和.bashrc，它们两个还是有微妙的区别的，不过在这里不是重点，我选用的是.bashrc

#HADOOP_ENVIRONMENT
HADOOP_HOME=/home/grid/hadoop-2.6.0
#PATH
PATH=$PATH:$HADOOP_HOME/bin
#EXPORT
export PATH HADOOP_HOME

wq保存，强制使配置文件生效

source .bashrc

配置env.sh文件和site.xml文件

“注意，以下操作只在CMaster上执行”

贴一张Hadoop权威指南的配置文件说明图

1.hadoop-env.sh

cd $HADOOP_HOME/etc/hadoop
vi hadoop-env.sh

Hadoop运行需要调用JVM，所以它会在hadoop-env.sh里面找JDK的路径在哪里，所以我们在文件内给它添上JAVA_HOME的位置

wq保存退出

2.yarn-env.sh

vi yarn-env.sh

同样道理，yarn也想知道JVM在哪里

不过值得注意的是，export前面的#号一定要去掉

3.core-site.xml

vi core-site.xml





fs.defaultFS
hdfs://CMaster:9000




io.file.buffer.size
131072




hadoop.tmp.dir
file:/home/grid/hadoop-2.6.0/tmp
Abase for other temporary directories.




hadoop.proxyuser.hduser.hosts
*




hadoop.proxyuser.hduser.groups
*

添上图里的内容，wq退出

解释一下：
fs.defaultFS就是描述HDFS文件系统的URI，其主机是namenode的主机或IP地址，端口是namenode监听RPC的端口。如果没有指定，那么默认端口是8020
io.file.buffer.size，io读写文件时的块大小，一般为131072K（128M）
hadoop再次启动时会自动寻找/tmp/hadoop-grid/dfs/name文件
由于重新启动Linux服务时，会自动清空/tmp目录，因此hadoop找不到文件就会出错，所以一定要先指明hadoop.tmp.dir目录

4.hdfs-site.xml

vi hdfs-site.xml



dfs.namenode.secondary.http-address
CMaster:9001




dfs.namenode.name.dir
file:/home/grid/hadoop-2.6.0/name




dfs.datanode.data.dir
file:/home/grid/hadoop-2.6.0/data




dfs.replication
3




dfs.webhdfs.enabled
true




dfs.permissions
fslse

这个文件指明了一些监听地址和端口号

5.mapred-site.xml.template

vi mapred-site.xml.template



mapreduce.framework.name
yarn




mapreduce.jobhistory.address
CMaster:10020




mapreduce.jobhistory.webapp.address
CMaster:19888

指明我们所用的框架是yarn，并且指定特定端口

wq退出后，还要改个名字

mv mapred-site.xml.template mapred-site.xml

6.yarn-site.xml

vi yarn-site.xml






yarn.nodemanager.aux-services
mapreduce_shuffle




yarn.nodemanager.aux-services.mapreduce.shuffle.class
org.apache.hadoop.mapred.ShuffleHandler




yarn.resourcemanager.address
CMaster:8032




yarn.resourcemanager.scheduler.address
CMaster:8030




yarn.resourcemanager.resource-tracker.address
CMaster:8031




yarn.resourcemanager.admin.address
CMaster:8033




yarn.resourcemanager.webapp.address
CMaster:8088

7.把上述配置文件提及的目录没有创建的都创建好

哈哈哈我知道如果有人要深究这些配置文件还有什么隐藏功能，我小白是讲不清楚的，献上官方说明文档与我的膝盖  官方全英安装配置说明文档

8.配置slaves文件

vi $HADOOP_HOME/etc/hadoop/slaves

分发配置好的Hadoop给其它节点

“注意，以下操作只在CMaster上执行”

scp -r ~/hadoop-2.6.0 grid@CSlave01:~
scp -r ~/hadoop-2.6.0 grid@CSlave02:~
scp ~/.bashrc grid@CSlave01:~
scp ~/.bashrc grid@CSlave02:~

格式化namenode

“注意，以下操作只在CMaster上执行”

cd $HADOOP_HOME/bin
./hdfs namenode –format

出现红圈中的successfully就表示格式化成功啦

启动Hadoop集群

“注意，以下操作只在CMaster上执行”

可以激动一下了，毕竟到临门一脚的时候了

cd $HADOOP_HOME/sbin
./start-all.sh

然后用JAVA里面自带的jps可以查看Hadoop的进程是否已经成功启动了

/usr/java/jdk1.6.0_45/bin/jps

CMaster

CSlave01、CSlave02

如果所有进程都成功了你就是人生赢家了

但是，如果其中有某个进程启动不起来也不要着急，最万能最稳的操作是先停止整个集群

cd $HADOOP_HOME/sbin
./stop-all.sh

然后查看启动日志

cd $HADOOP_HOME/logs

直接vi打开对应出问题的进程的log文件，查看具体问题再自行百度祝你一路顺风

PS：由于Hadoop调用本地库处理事务比用java快，因此hadoop为了提升性能，会加载本地库。以前会出现官方下载编译好的包是32位的，不过这次试验看来hadoop2.6.0的本地库包即是64位。否则需要编译源码。

总结

这种编辑器不熟，很难受

好啦总结一下，按照官方权威的要求来安装其实没有什么版本的障碍，包括其余的Hadoop2.x版本，甚至于目前最新的Hadoop-3.0.0，安装的方法其实也是一模一样的~

接下来我会更新一些hadoop的有趣操作，继续深入Hadoop，一起努力！

你可能感兴趣的:(hadoop安装)

《Hadoop系列》Docker安装Hadoop DATA数据猿 Hadoop Docker docker hadoop
文章目录Docker安装Hadoop1安装docker1.1添加docker到yum源1.2安装docker2安装Hadoop2.1使用docker自带的hadoop安装2.2免密操作2.2.1master节点2.2.2slave1节点2.2.3slave2节点2.2.4将三个容器中的authorized_keys拷贝到本地合并2.2.5将本地authorized_keys文件分别拷贝到3个容器中
【笔记】HDFS基础笔记哇咔咔哇咔 Hadoop hdfs 笔记 hadoop 大数据 ubuntu
启动hadoop命令（未配环境变量）：进入hadoop安装目录输入./sbin/start-dfs.sh已配环境变量：start-dfs.sh关闭hadoop命令：stop-dfs.sh启动完成后，可以通过命令jps来判断是否成功启动，若成功启动则会列出如下进程:"NameNode"、"DataNode"和"SecondaryNameNode"三种Shell命令方式：1.hadoopfs2.had
macos安装local模式spark SparklingTheo 大数据-linux macos spark 大数据
文章目录配置说明安装hadoop安装Spark测试安装成功配置说明Scala-3.18+Spark-3.5.0Hadoop-3.3.6安装hadoop从这里下载相应版本的hadoop下载后解压，配置系统环境变量>sudovim/etc/profile添加以下两行exportHADOOP_HOME=/Users/collinsliu/hadoop-3.3.6/exportPATH=$PATH:$HA
Hadoop搭建（完全分布式）莫噶搭建分布式 hadoop 大数据
节点分布：bigdata-masterbigdata-slave1bigdata-salve2NameNodeNodeManagerNodeManagerSecondaryNameNodeDataNodeDataNodeResourceManagerNodeManagerDataNode目录一、jdk安装：二、hadoop安装一、jdk安装：jdk-8u212链接：https://pan.baid
现成Hadoop安装和配置，图文手把手交你叫我小唐就好了一些好玩的事 hadoop 大数据分布式课程设计运维
为了可以更加快速的可以使用Hadoop，便写了这篇文章，想尝试自己配置一下的可以参考从零开始配置Hadoop，图文手把手教你，定位错误资源1.两台已经配置好的hadoop2.xshell+Vmware链接：https://pan.baidu.com/s/1oX35G8CVCOzVqmtjdwrfzQ?pwd=3biz提取码：3biz--来自百度网盘超级会员V4的分享两台虚拟机用户名和密码均为roo
CentOS7搭建Hadoop集群在下区区俗物 Hadoop集群安装部署 hadoop eclipse java
准备工作1、准备三台虚拟机，参考：CentOS7集群环境搭建（3台）-CSDN博客2、配置虚拟机之间免密登录，参考：CentOS7集群配置免密登录-CSDN博客3、虚拟机分别安装jdk，参考：CentOS7集群安装JDK1.8-CSDN博客4、下载Hadoop安装包，下载地址：链接：https://pan.baidu.com/s/1f1DmqNNFBvBDKi5beYl3Jg?pwd=6666搭建
linux安装hadoop详细步骤（伪分布式）红烧柯基 linux hadoop linux
今天重装了下hadoop，特在此记录下！一.准备好hdk和hadoop安装文件，上传到linux二.安装jdk，我之前博客有专门写过安装jdk步骤，这里就不重复了，有需要的小伙伴可以去翻翻之前的三.安装hadoop1.解压hadooptar-zxvfhadoop文件2.修改配置文件/usr/wangjian/software/hadoop/hadoop-2.10.0/etc/hadoop第一个：h
Hadoop环境搭建业里村牛欢喜 hadoop 大数据 hdfs
目录一、简介1.1、概念1.2、优势1.3、Hadoop组成部分二、Hadoop运行环境搭建2.1安装VM（虚拟机管理环境）2.2VM网络设置2.3安装CentOS7系统2.4master主机进行网络配置2.5同步时间2.6Xshell6的安装与使用2.7关闭防火墙2.8设置主机名2.9hosts设置2.10安装JDK2.11Hadoop安装与环境配置启动关闭Hadoop一、简介1.1、概念Had
解决There are 0 datanode(s) running and no node(s) are excluded in this operation. 有一束阳光叫温暖
出现上述问题可能是格式化两次hadoop，导致没有datanode解决方法1：重启linux,再使用start-dfs.sh和start-yarn.sh重启一下hadoop解决办法2：找到hadoop安装目录下hadoop-2.4.1/data/dfs/data里面的current文件夹删除然后从新执行一下hadoopnamenode-format再使用start-dfs.sh和start-yar
IDEA中Hadoop的环境配置 hhhhhhhhhhhnb intellij-idea java intellij idea hadoop linux
没有配置HadoopHome：在Windows下解压一份Hadoop安装包Hadoop使用log4j进行日志输出，明显没有配置log4j再次运行，显示了作业的运行情况
WARNING: HADOOP_SECURE_DN_USER has been replaced by HDFS_DATANODE_SECURE_USER. Using value of HADOOP W_yhhh hadoop hdfs 大数据
Hadoop启动时报错WARNING:HADOOP_SECURE_DN_USERhasbeenreplacedbyHDFS_DATANODE_SECURE_USER.UsingvalueofHADOOP_SECURE_DN_USER.原因是Hadoop安装配置于root用户下，对文件需要进一步的配置，应该是由于新版Hadoop这个配置的参数更新了，所以出现了警告。只需将参数更新即可。需要更新的文件
大数据[1] -- 安装hadoop 天下一般环境的配置与软件的使用操作系统大数据 linux
文章目录Hadoop安装以及配置一、安装1.安装SSH，设置SSH无密码登录2.安装jdk3.安装Hadoop二、配置三、其他配置四、出现的问题五参考文章Hadoop安装以及配置一、安装1.安装SSH，设置SSH无密码登录ssh可以让访问其他Linux虚拟机而不用输入密码，可以为集群做准备在被访问主机上生成公钥ssh-keygen-trsa-P''-f~/.ssh/id_rsa在访问主机上获取公钥
Hadoop搭建集群中输入hdfs namenode -format格式化节点时，提示：hdfs command not found 解决办法 drhrht java java 后端
分析原因：hadoop的安装路径没有加入到当前路径中解决办法：方法1：进入hadoop的安装目录，在执行hadoop命令时在前面加上：./bin./sbin方法2:进入/etc/profile文件中添加hadoop的安装路径sudovim/etc/profile添加：exportHADOOP_HOME=本机的hadoop安装路径exportPATH=$HADOOP_HOME/bin:$HADOOP
Hadoop中hdfs-default.xml的位置 BugEveryday Hadoop hadoop
在hadoop安装包中hadoop-2.7.2\share\hadoop\hdfs\hadoop-hdfs-2.7.jar里面
搭建vmware虚拟化平台的基础配置，以及Hadoop平台的搭建 rootwiki 云计算与大数据技术学习专栏 hadoop big data 大数据
需要准备的东西：vmwareworkstationscentos.isohadoop3.3.0mobaxterm/xshell/pietty/winscpjdk的tar包第一步：安装centos操作系统第二步：克隆虚拟机（也可以在hadoop安装后再克隆）我们这里需要选择完整克隆然后稍作等待，在列表中会刷新虚拟计算机第三步：配置虚拟网络3.1预备知识网络模式简介：VMWare提供了3种工作模式，它
hadoop安装遇到的一些障碍 GetIdea
一.start-dfs.sh（开启不成功）原因：1.dadoop文件所属者与执行时登陆者不一致（权限不足）报错：WARNING:HADOOP_SECURE_DN_USERhasbeenreplacedbyHDFS_DATANODE_SECURE_USER.UsingvalueofHADOOP_SECURE_DN_USER.Startingnamenodeson[centos7]centos7:Pe
基于CentOS7 Hadoop-2.7.2伪分布式部署程序员小H
1、基本环境Linux版本：CentOS7.0JDK版本：jdk-7u79-linux-x64.tar.gzHadoop版本：hadoop-2.7.2.tar.gzjdk以及Hadoop安装在/usr目录下2、安装JDK注意：若CentOS7已安装OpenJDK，可以使用以下命令进行卸载。2.1查看系统中的jdk#rpm-qa|grepjdk（查看目前系统中jdk版本）file2.2卸载#yum-
部署Hadoop集群 %HelloWorld% java 开发语言
在node1节点执行，以root身份1：在VMware虚拟机集群上部署HDFS集群1）准备好hadoop安装包；目前最新3.3.4；了解：2）上传解压hadoop①：上传hadoop到node1节点；②：解压安装包到/export/server（自己定的文件夹）中：tar-zxvfhadoop-3.3.4.tar.gz-C/export/server③：构建软连接也可改名（修改文件名用mv）cd/
Hadoop安装配置HBase m0_69595107 Hadoop hadoop hbase 大数据分布式 centos
1、文件准备http://archive.apache.org/dist/hbase/1.3.1/下载hbase-1.3.1-bin.tar.gz并上传到虚拟机/root目录下。2、安装切换目录[root@hadoop00~]#cd/usr/local新建文件夹[root@hadoop00local]#mkdirhbase解压文件[root@hadoop00local]#tarzxvf/root/
Linux修改hadoop配置文件及启动hadoop集群详细步骤 CatalinaCatherine Linux linux hadoop 运维
目录一、配置Hadoop环境1.查看Hadoop解压位置2.配置环境变量3.编辑环境变量4.重启环境变量5.查看Hadoop版本，查看成功就表示Hadoop安装成功了二、修改配置文件1.检查三台虚拟机：2.切换到配置文件目录3.修改hadoop-env.sh文件4.修改core-site.xml文件5.修改mapred-site.xml文件6.修改hdfs-site.xml文件7.修改yarn-s
hadoop dfs web页面访问增加鉴权花菜回锅肉大数据数据仓库 hadoop 前端大数据 dfs
前言装好了Hadoop，通过浏览器访问，发现竟然不需要鉴权就能访问，且暴露了很多服务器层文件路径信息，基于多年积累的安全意识，必须得配置些鉴权信息，就有了该文，仅做学习记录，下次自己再装时能提高效率。生成密码//hadoop安装目录下创建secret目录，存放密码mkdir-p/home/test/hadoop-3.2.2/secret//创建密码文件touchhadoop-http-auth-s
记录学习Spark+Kafka构建实时分析Dashboard案例中遇到的问题（一）安装白令屿大数据处理 spark kafka python 大数据
目录推荐环境系统和软件安装安装Ubuntu分辨率问题虚拟机桥接模式连不上网Hadoop安装Ubuntu16.04下用aria2下载百度网盘大文件其他在安装hadoop时遇到的问题hadoop用法小结单机模式伪分布式Spark、Kafka、python依赖包、pycharm安装SparkKafkaPyCharmPython依赖现阶段在学习大数据处理相关的项目，先通过厦门大学林子雨老师的案例教程学习S
Hadoop/Spark安装周倜吉
单机安装Hadoop安装Javasudoapt-getinstalldefault-jdkjava-version2.设置Hadoop用户和组sudoaddgrouphadoopsudoadduser--ingrouphadoophduser3.安装并配置SSH$sudoapt-getinstallssh$suhduser$ssh-keygen-trsa-P""cat~/.ssh/id_rsa.p
Hadoop安装遇到的一些问题博弈史密斯
image.pngimage.png解决选择CentOs.vmx无反应问题：image.png打开之后，选择Poweron之后，选择Imovedit：第一次点mved，以后点copiedroot登陆，密码：hadoop修改时间，选择时区打开一个终端查看ip查看主机名、防火墙状态在桌面中打开的终端，以root权限运行，否则一些文件没有修改权限
YARN 配置文件 capacity-scheduler.xml 参数解读我很ruo hadoop 大数据
capacity-scheduler.xml文件中配置了yarn资源调度器运行中的各项参数，位于hadoop安装目录/hadoop-2.7.2/etc/hadoop目录下。打开后可以看到默认配置。所有的配置有注有英文注释，考虑到可能对部分朋友不太友好，所以笔者结合自己的理解对这些注释进行了翻译，如有错误，恳请指正：#最多可以运行的应用数，默认10000yarn.scheduler.capacity
《数据采集与预处理环境》实验环境安装活下去. python mysql hadoop
文章目录1.安装Python及第三方库2.jupyternotebook安装3.jdk安装4.MySQL安装1.在根目录下创建文件my.ini2.初始化3.安装服务4.启动服务5.登录6.配置环境变量5.hadoop安装1.文件解压缩，删除bin文件，解压缩apache-hadoop-3.1.3-winutils-master.zip文件，将bin文件复制到hadoop根目录中。2.在根目录下，新
1.大数据概述流月up 大数据 hadoop 大数据发行版模块
目录概述hadoophadoop模块hadoop发行版apache社区版本CDP(CDH+HDP)其它云产商框架选择hadoop安装结束概述先了解几个常用的网站apache官网hadoop官网hadoopgithubhttps://github.com/apache/xxx[https://github.com/apache/spark(example)]hadoophadoop模块hadoop包
【2023】hadoop基础介绍方渐鸿数据分析 hadoop 大数据分布式 python
目录Hadoop组成HDFSHDFS操作HDFS分布式文件存储NameNode元数据数据读写流程YARN和MapReduceMapReduce：分布式计算YARN：资源管控调度YARN架构提交任务到**YARN中运行**Hadoop组成hadoop安装教程可以看我这篇文章===>hadoop通过docker安装HDFS组件：是Hadoop内的分布式存储组件，可以构建分布式文件系统用于数据存储。Ma
Linux Hadoop安装神游御风
Hadoop下载地址：http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.7.0.tar.gz
VitulBox中Ubuntu虚拟机安装JAVA环境——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项 Stitch . 我的大学笔记 Linux ubuntu java 笔记大数据 linux
前言在进行之后操作是请下载好JDK，之后的内容是以Ubuntu虚拟机中安装java环境续写。提示：以下操作是在虚拟机hadoop用户下操作的，并为安装java环境作准备一、更新APT为了确保Hadoop安装过程顺利进行，建议用hadoop用户登录Linux系统后打开一个终端，执行下面命令更新APT软件：sudoapt-getupdate二、安装SSH1，安装SSH服务端代码如下（示例）：sudoa
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后