E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop系列
Hadoop系列
之(三):使用Cloudera部署,管理Hadoop集群
1.Cloudera介绍Hadoop是一个开源项目,Cloudera对Hadoop进行了商业化,简化了安装过程,并对hadoop做了一些封装。 根据使用的需要,Hadoop集群要安装很多的组件,一个一个安装配置起来比较麻烦,还要考虑HA,监控等。使用Cloudera可以很简单的部署集群,安装需要的组件,并且可以监控和管理集群。 CDH是Cloudera公司的发行版,包含Hadoop,Spark,H
ee900222
·
2016-01-29 13:00
时空大数据研究进展
第一部分:
Hadoop系列
1.Hadoop-GIS项目:AHighPerformanceSpatialDataWarehousingSystemOverMapReduce简介:https://sites.google.com
wangshgeo
·
2016-01-19 10:00
Hadoop;Spark
(四)
hadoop系列
之__hadoop搭建(单机配置)
1.Ubuntu下用命令(自动下载并安装) $sudoapt-getinstallssh $sudoapt-getinstallrsync 2.redhatlinux9 i:默认已经安装 查看版本:#rpm-qopenssh-server ii:设置为开机自启动 ntsysv打开窗口(互动式操作界面)--启动或停止服务提供了简单的界面 如果sshd服务没有启动,则在sshd前面的
袁梓皓
·
2016-01-15 10:00
Hadoop系列
之六:分布式文件系统HDFS
1、MapReduce与分布式文件系统 前面的讨论中,我们已经得知,Hadoop中实现的MapReduce是一个编程模型和运行框架,它能够通过JobTracker接收客户提交的作业而后将其分割为多个任务后并行运行在多个TaskTracker上。而问题是,这些TaskTracker如何高效获取所要处理的数据?在传统的高性能集群中,计算节点和存储节点是各自独立的,它们之间通过高速网络完成互联,然而,在
马哥linux运维
·
2016-01-11 21:00
mapreduce
hadoop
大数据
hbase
hdfs
Hadoop系列
之五:MapReduce进阶(2)
1、MapReduce作业、集群及其逻辑架构 前文已经描述,MapReduce是一个编程框架,它为程序员提供了一种快速开发海量数据处理程序的编程环境,并能够让基于这种机制开发出的处理程序以稳定、容错的方式并行运行于由大量商用硬件组成的集群上。同时,MapReduce又是一个运行框架,它需要为基于MapReduce机制开发出的程序提供一个运行环境,并透明管理运行中的各个细节。每一个需要由MapRed
马哥linux运维
·
2016-01-11 21:00
mapreduce
hadoop
大数据
hbase
hdfs
Hadoop系列
之四:MapReduce进阶
1、mapper和reducerMapReduce对数据的处理分为两个阶段:map阶段和reduce阶段,这两个阶段分别由用户开发的map函数和reduce函数完成,在MapReduce运行环境中运行时,它们也分别被称为mapper和reducer。键值对(key-valuepair)是MapReduce的基础数据结构,mapper和reducer读入和输出的数据均为键值对。MapReduce中,
马哥linux运维
·
2016-01-11 21:00
mapreduce
hadoop
大数据
hbase
hdfs
Hadoop系列
之(二):Hadoop集群部署
1.Hadoop集群介绍Hadoop集群部署,就是以Clustermode方式进行部署。 Hadoop的节点构成如下:HDFSdaemon: NameNode,SecondaryNameNode,DataNodeYARNdamones:ResourceManager,NodeManager,WebAppProxyMapReduceJobHistoryServer2.集群部署本次测试的分布式环境为:
ee900222
·
2016-01-04 13:00
Hadoop系列
之(一):Hadoop单机部署
1.Hadoop介绍Hadoop是一个能够对海量数据进行分布式处理的系统架构。Hadoop框架的核心是:HDFS和MapReduce。 HDFS分布式文件系统为海量的数据提供了存储, MapReduce分布式处理框架为海量的数据提供了计算。 2.Hadoop安装2.1安装javaHadoop是使用JAVA写的,所以需要先安装JAVA环境。本次安装的是hadoop-2.7.0,需要JDK7以上版本。
ee900222
·
2015-12-30 16:00
spring
hadoop系列
(六)---HbaseSystemException
一、源码/***HBaseDataAccessexception.*@authorCostinLeau*/@SuppressWarnings("serial")publicclassHbaseSystemExceptionextendsUncategorizedDataAccessException{publicHbaseSystemException(Exceptioncause){super(
dalan_123
·
2015-11-30 09:00
hadoop
hbase
spring
hadoop系列
(六)---HbaseSystemException
阅读更多一、源码/***HBaseDataAccessexception.*@authorCostinLeau*/@SuppressWarnings("serial")publicclassHbaseSystemExceptionextendsUncategorizedDataAccessException{publicHbaseSystemException(Exceptioncause){su
dalan_123
·
2015-11-30 09:00
hbase
Hadoop
spring
hadoop系列
(五)---spring hadoop hbase之HbaseSynchronizationManager
一、源码如下/***SynchronizationmanagerhandlingthetrackingofHbaseresources(specificallytables).Usedeithermanuallyorthrough{@linkHbaseInterceptor}tobindatabletothethread.*Eachsubsequentcallmadethrough{@linkHb
dalan_123
·
2015-11-27 18:00
hbase
spring
hadoop系列
(五)---spring hadoop hbase之HbaseSynchronizationManager
阅读更多一、源码如下/***SynchronizationmanagerhandlingthetrackingofHbaseresources(specificallytables).Usedeithermanuallyorthrough{@linkHbaseInterceptor}tobindatabletothethread.*Eachsubsequentcallmadethrough{@li
dalan_123
·
2015-11-27 18:00
hbase
spring
hadoop系列
(四) --- spring hadoop hbase
一、源码分析/****hbase采用aop的拦截器,将hbasetable绑定对应的线程在被调用之前;*一旦对应的调用方法获取结果之后将关闭并移除*如果有一个已经绑定的table(来自前面的call或者transaction),*那么interceptor只是简单的操作*同时interceptor经常与HbaseSynchronizationManager结合使用*@authorCostinLea
dalan_123
·
2015-11-27 17:00
spring
AOP
thread
hadoop
hbase
spring-
hadoop系列
源码(一)
源码如下:/***HTableInterface工具类*用于createtable和releasetable*@since0.21.0*/@InterfaceAudience.Public@InterfaceStability.StablepublicinterfaceHTableInterfaceFactory{ /** *CreatesanewHTableInterface. *创建hba
dalan_123
·
2015-11-27 14:00
hbase
[
hadoop系列
]Pig的安装和简单演示样例
inkfish原创,请勿商业性质转载,转载请注明来源(http://blog.csdn.net/inkfish )。(来源:http://blog.csdn.net/inkfish) Pig是Yahoo!捐献给Apache的一个项目,眼下还在Apache孵化器(incubator)阶段,眼下版本号是v0.5.0。Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-like
·
2015-11-13 11:07
hadoop
[
hadoop系列
]Pig的安装和简单演示样例
inkfish原创,请勿商业性质转载,转载请注明来源(http://blog.csdn.net/inkfish )。(来源:http://blog.csdn.net/inkfish) Pig是Yahoo!捐献给Apache的一个项目,眼下还在Apache孵化器(incubator)阶段,眼下版本号是v0.5.0。Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-like
·
2015-11-13 03:26
hadoop
Hadoop系列
(一)hadoop2.2.0源码编译
操作系统:Centos 所需条件:能上网 编译所需工具: apache-ant-1.9.2-bin.tar.gz apache-maven-3.0.5-bin.tar.gz findbugs-2.0.2.tar.gz protobuf-2.5.0.tar.gz 编译工具还需配置环境变量到 /etc/profile,并加入的环境变量PATH中; &nbs
·
2015-11-12 08:19
hadoop2
Hadoop系列
(二)hadoop2.2.0伪分布式安装
一、环境配置 安装虚拟机vmware,并在该虚拟机机中安装CentOS 6.4; 修改hostname(修改配置文件/etc/sysconfig/network中的HOSTNAME=hadoop),修改IP到主机名的映射(vi /etc/hosts ,添加 127.0.0.1 hadoop); 按照JDK,下载jdk1.7.0_60
·
2015-11-11 03:17
hadoop2
(六)
hadoop系列
之__hadoop分布式集群环境搭建
配置hadoop(master,slave1,slave2) 说明: NameNode: master DataNode: slave1,slave2 -------------------------------------------------------- A. 修改主机的master 和 slaves i. 配置slaves
·
2015-11-07 10:20
hadoop
(四)
hadoop系列
之__hadoop搭建(单机配置)
1.Ubuntu下用命令 (自动下载并安装) $ sudo apt-get install ssh $ sudo apt-get install rsync 2.redhat linux9 i:默认已经安装 查看版本:# rpm -q openssh-server ii:设置为开机自启动 ntsysv 打开窗口 (互动式操作界面
·
2015-11-07 10:19
hadoop
(五)
hadoop系列
之__集群搭建SSH无密访问多台机器
免密码ssh设置 现在确认能否不输入口令就用ssh登录localhost: $ ssh localhost 如果不输入口令就无法用ssh登陆localhost,执行下面的命令: 1. 并修改hosts映射: 添加:(配置三台机器hosts,保证可以互相访问) $ vi /etc/hosts 127.0.0.1 localhost.localdom
·
2015-11-07 10:19
hadoop
(三)
hadoop系列
之__CRT(SecureCRTPortable)的使用
SecureCRTPortable 属于终端仿真程序,支持SSH(查看此处http://blog.csdn.net/macrossdzh/article/details/5691924)协议。利用CRT可以很方便操作虚拟机终端。进入正题...... 1. 首先,下载SecureCRTPortable软件。 2.直接执行SecureCRTPortable.exe文件即可。 3.执行效果图。
·
2015-11-07 10:18
secureCRT
(二)
hadoop系列
之__linux虚拟机搭建JDK和Eclipse环境
搭建JDK和Eclipse环境,首先需要把文件挂载或共享到linux虚拟机上。方式有两种: 1. 利用vwware自带的文件共享功能(建议用iso方式)。 2. 可以利用另外的软件工具。我这里用的是SSH(SshClient).大家可以打网上下载。 我再这里用的是挂载的方式,也就是把需要的软件打包为iso镜像文件,然后通过vmware的cd/dvd挂载到linu
·
2015-11-07 10:17
eclipse
(一)
hadoop系列
之__XP环境下搭建linux虚拟机
1.有关vmware worksation9的安装查找网上相关资料。(我的版本:VMware-workstation-full-9.0.2-1031769.exe) 下载地址:http://pan.baidu.com/share/link?shareid=377762&uk=3842943586 2.安装RedHat Linux9.需要下载的相关软件: A
·
2015-11-07 10:16
hadoop
spring
hadoop系列
二(MapReduce and Distributed cache)
关于MapReduceandDistributedCache一、创建HadoopJob在前面的系列一里面我们已经知道如何配置hadoop了,在完成配置工作之后,我们如何提交job,并运行这些job将是接下来我们讲述的使用SHDP创建job是相当简单的指定reduce 和我们用spring定义bean操作的写法很相似。上面的代码可以看到没有指定hadoopconfiguration,在默认情况下,则
dalan_123
·
2015-11-06 15:00
spring
hadoop系列
二(MapReduce and Distributed cache)
阅读更多关于MapReduceandDistributedCache一、创建HadoopJob在前面的系列一里面我们已经知道如何配置hadoop了,在完成配置工作之后,我们如何提交job,并运行这些job将是接下来我们讲述的使用SHDP创建job是相当简单的指定reduce和我们用spring定义bean操作的写法很相似。上面的代码可以看到没有指定hadoopconfiguration,在默认情况
dalan_123
·
2015-11-06 15:00
spring
hadoop系列
一
一、要求1、对于springhadoop2.1构建在jdk7上面(最低要求:jdk6及其以上),hadoop2.6默认构建在springframework4.1上。2、springforApachehadoop2.1支持如下hadoop版本 ApacheHadoop2.4.1 ApacheHadoop2.5.2 ApacheHadoop2.6.0 PivotalHD2.1 ClouderaCDH
dalan_123
·
2015-11-05 23:00
spring
hadoop系列
一
阅读更多一、要求1、对于springhadoop2.1构建在jdk7上面(最低要求:jdk6及其以上),hadoop2.6默认构建在springframework4.1上。2、springforApachehadoop2.1支持如下hadoop版本ApacheHadoop2.4.1ApacheHadoop2.5.2ApacheHadoop2.6.0PivotalHD2.1ClouderaCDH5(
dalan_123
·
2015-11-05 23:00
HBase: 看上去很美
缘起 随着
hadoop系列
的兴起,基于HDFS的大规模KV存储系统HBase也进入“大规模使用阶段”。网上的Hbase资料很多,学习成本正在下降。
·
2015-11-02 11:31
hbase
Facebook为何选择云计算开源Hadoop
前段时间Facebook的新版消息系统发布,Facebook对HBase的成功使用也使得很多的HBase案例得以出现,下文是Facebook的 Hadoop工程师Dhruba Borthakur发表的
Hadoop
·
2015-10-31 11:54
Facebook
Hadoop系列
相关优秀网站收集
Hadoop技术论坛:http://www.hadoopor.com HBase相关技术收集:http://hbase.info/ 趋势科技中国研发中心 SPN研发团队技术博客:http://www.spnguru.com/ 淘宝搜索技术博客:http://www.searchtb.com/ Alex的个人博客:http://www.gemini5201314.net/ 逖靖寒的世界:h
·
2015-10-30 15:19
hadoop
Hadoop系列
之实验环境搭建
实验环境基本配置 硬件:硬盘单节点50GB,1G内存,单核。 操作系统:CentOS6.4 64bit Hadoop:2.20 64bit(已编译) JDK:jdk1.7 磁盘分区: / 5GB /boot 100MB /usr 5GB /tmp 500MB swap 2GB /
·
2015-10-27 13:23
hadoop
我关注的一周技术动态 2015.10.25
hmsr=toutiao.io&utm_medium=toutiao.io&utm_source=toutiao.io要点: 一直非常不喜欢
hadoop系列
对JVM的重度依赖,可能是我不熟悉java的原因吧
zhengran_baidu
·
2015-10-25 08:00
从零自学
Hadoop系列
索引
本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作。文章是哥(mephisto)写的,SourceLink从零自学Hadoop(01):认识Hadoop从零自学Hadoop(02):环境准备从零自学Hadoop(03):Linux准备上从零自学Hadoop(04):Linux准备下从零自学Hadoop(05):Ambari从零自学Hadoop(06):集群
sinodzh
·
2015-09-24 16:00
Hadoop之倒排索引
本文作为
Hadoop系列
的第二篇,将介绍分布式情况下搜索引擎的基础实现,即“倒排索引”。1.问题描述将所有不同文件里面的关键词进行存储,并实现快速检索。
Sea_Sky
·
2015-09-19 00:00
Hadoop系列
之十:Hadoop配置文件及常用配置参数详解(未完成)
版权声明:原创作品,如需转载,请与作者联系。否则将追究法律责任。学习联系QQ:1660809109、1661815153、2813150558更多资讯:www.magedu.com1、Hadoop的配置文件 hadoop-env.sh:用于定义hadoop运行环境相关的配置信息,比如配置JAVA_HOME环境变量、为hadoop的JVM指定特定的选项、指定日志文件所在的目录路径以及master和s
马哥教育Linux
·
2015-09-12 16:00
mapreduce
hadoop
大数据
hbase
hdfs
Hadoop系列
之六:分布式文件系统HDFS
版权声明:原创作品,如需转载,请与作者联系。否则将追究法律责任。1、MapReduce与分布式文件系统前面的讨论中,我们已经得知,Hadoop中实现的MapReduce是一个编程模型和运行框架,它能够通过JobTracker接收客户提交的作业而后将其分割为多个任务后并行运行在多个TaskTracker上。而问题是,这些TaskTracker如何高效获取所要处理的数据?在传统的高性能集群中,计算节点
magedu_Linux
·
2015-09-11 11:57
云计算相关
Hadoop系列
之九:Hadoop集群伪分布式模式的实现详解
版权声明:原创作品,如需转载,请与作者联系。否则将追究法律责任。1、Hadoop依赖软件Hadoop基于Java语言开发,因此其运行严重依赖于JDK(JavaDevelopmentKit),并且Hadoop的许多功能依赖于Java6及以后的版本才提供的特性。Hadoop可以良好地运行于经过测试的各JDK,如SunJDK、OpenJDK、OracleJRockit、IBMJDK各自实现的某些版本。但
马哥教育Linux
·
2015-09-11 10:00
mapreduce
hadoop
大数据
hbase
hdfs
Hadoop系列
之九:Hadoop集群伪分布式模式的实现详解
版权声明:原创作品,如需转载,请与作者联系。否则将追究法律责任。1、Hadoop依赖软件Hadoop基于Java语言开发,因此其运行严重依赖于JDK(JavaDevelopmentKit),并且Hadoop的许多功能依赖于Java6及以后的版本才提供的特性。Hadoop可以良好地运行于经过测试的各JDK,如SunJDK、OpenJDK、OracleJRockit、IBMJDK各自实现的某些版本。但
马哥教育Linux
·
2015-09-11 10:00
mapreduce
hadoop
大数据
hbase
hdfs
Hadoop系列
之八:Hadoop集群
版权声明:原创作品,如需转载,请与作者联系。否则将追究法律责任。1、合并MapReduce集群与HDFS集群在调度运行一个作业时,将map任务等直接运行于要处理的数据所存储的HDFS的数据节点上,可避免大量的数据传输,实现数据处理的本地性,进而大大提高整个过程的完成效率,这也正是Hadoop集群的部署方式。如下图所示。在一个小于50个节点的小规模集群中,可以将NameNode与JobTracker
马哥教育Linux
·
2015-09-11 10:00
mapreduce
hadoop
大数据
hbase
hdfs
Hadoop系列
之七:分布式文件系统HDFS(2)
版权声明:原创作品,如需转载,请与作者联系。否则将追究法律责任。1、访问HDFS文件系统HDFS是工作于用户空间的文件系统,它的树状文件系统是独立的,不能像传统上工作于内核空间的文件系统一样挂载至当前操作系统的目录树上对HDFS进行访问,传统上实现文件或目录管理的命令如ls、cat等此处也无法正常使用。对HDFS文件系统上的文件进行访问,需要通过HDFS的API或者由hadoop提供的命令行工具进
马哥教育Linux
·
2015-09-11 10:00
mapreduce
hadoop
大数据
hbase
hdfs
Hadoop系列
之六:分布式文件系统HDFS
版权声明:原创作品,如需转载,请与作者联系。否则将追究法律责任。1、MapReduce与分布式文件系统 前面的讨论中,我们已经得知,Hadoop中实现的MapReduce是一个编程模型和运行框架,它能够通过JobTracker接收客户提交的作业而后将其分割为多个任务后并行运行在多个TaskTracker上。而问题是,这些TaskTracker如何高效获取所要处理的数据?在传统的高性能集群中,计算节
马哥教育Linux
·
2015-09-11 10:00
mapreduce
hadoop
大数据
hbase
hdfs
Hadoop系列
之五:MapReduce进阶(2)
版权声明:原创作品,如需转载,请与作者联系。否则将追究法律责任。1、MapReduce作业、集群及其逻辑架构 前文已经描述,MapReduce是一个编程框架,它为程序员提供了一种快速开发海量数据处理程序的编程环境,并能够让基于这种机制开发出的处理程序以稳定、容错的方式并行运行于由大量商用硬件组成的集群上。同时,MapReduce又是一个运行框架,它需要为基于MapReduce机制开发出的程序提供一
马哥教育Linux
·
2015-09-11 10:00
mapreduce
hadoop
大数据
hbase
hdfs
Hadoop系列
之四:MapReduce进阶
版权声明:原创作品,如需转载,请与作者联系。否则将追究法律责任。1、mapper和reducerMapReduce对数据的处理分为两个阶段:map阶段和reduce阶段,这两个阶段分别由用户开发的map函数和reduce函数完成,在MapReduce运行环境中运行时,它们也分别被称为mapper和reducer。键值对(key-valuepair)是MapReduce的基础数据结构,mapper和
马哥教育Linux
·
2015-09-10 21:00
hadoop系列
:zookeeper(3)——zookeeper核心原理(事件)
1、概述上一篇文章,我们对zookeeper中的数据组织结构、Leader选举原理进行了讲述(http://blog.csdn.net/yinwenjie/article/details/47613309)。这篇文章我们紧接上文讲解zookeeper中的事件机制。并通过示例代码告诉读者怎么使用zookeeper中的事件通知器:watcher。2、zookeeper中的监听机制按照上文中的讲解,我们
yinwenjie
·
2015-08-18 20:00
hadoop
zookeeper
Watcher
系统架构
hadoop系列
:zookeeper(2)——zookeeper核心原理(选举)
1、前述上篇文章《
hadoop系列
:zookeeper(1)——zookeeper单点和集群安装》(http://blog.csdn.net/yinwenjie/article/details/47361419
yinwenjie
·
2015-08-15 13:00
hadoop
zookeeper
分布式
FastLeader
hadoop系列
:zookeeper(1)——zookeeper单点和集群安装
1、概述8月份的第一周,忙得晕头转向,为了解决OSGI-Felix下hibernateJPA的ClassLoader问题,就耽误了至少两天时间,还好在周五系统成功在servicemix上运行了。已经几天时间没有碰博客了,刚好下周有安排给实验室的几个大神讨论zookeeper相关技术。我这么一想,咦~~刚好这周末准备PPT的时候,还不如就预先做几篇关于zookeeper的文章,这样既可以两件工作合成
yinwenjie
·
2015-08-08 23:00
hadoop
zookeeper
Htrace on Hadoop, Hbase and HbaseClient
Hadoop2.6的新特性包含了Trace功能,一个类似于GoogleDapper的分布式跟踪工具,为
Hadoop系列
应用提供请求跟踪和性能分析。
hustsselbj
·
2015-06-23 11:00
hadoop
hbase
ycsb
htrace
设置XX_HOME环境变量的目的
安装
Hadoop系列
工具的时候,动不动就要设置XX_HOME,有时候很是费解。因为我在MacOSX上用brew套件安装器去安装这些工具,然后我没有设置XX_HOME也能在终端运行命令。
liaoqianwen123
·
2015-05-02 17:00
Hadoop 2.2.0和HBase 0.98.11伪分布式
前期准备
Hadoop系列
软件软件功用HBase数据库Hive数据仓库Mahout机器学习算法、数据挖掘Pig数据分析Avro数据序列化Chukwa日志处理、监控系统Zookeeper协调服务Hadoopversionsupportmatrix
liuyuan185442111
·
2015-04-21 16:00
hadoop
hbase
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他