E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop2
Hadoop知识点归纳1
应用领域:农业、地震台监测、医疗、可穿戴设备、无人驾驶汽车2.课程目标•了解YARN的基本工作原理•了解
Hadoop2
.0的两大核心模块的工作原理•熟悉
Hadoop2
.0环境搭建、配置与管理•熟练向Hadoop
PP_zi
·
2020-08-01 11:56
Hadoop
Hadoop2
.0架构
打开Hadoop的官网,我们可以看到
Hadoop2
.0包括两个module:HDFS–HadoopFileSystem。
OnlyQi
·
2020-08-01 10:23
spark集群搭建并配置hive on spark
hive-versionspark-versionmaster2.3.03.0.x2.3.02.3.x2.0.02.2.x1.6.02.1.x1.6.02.0.x1.5.01.2.x1.3.11.1.x1.2.01、准备工作1、java1.8安装及配置2、
hadoop2
.7.7
Iwg1021767001
·
2020-08-01 10:10
spark
spark
hive
on
spark
Hadoop基本原理
Hadoop的组成Hadoop目前主要包括Hadoop1.x和
hadoop2
.x,两种版
鬼~离未罔两
·
2020-08-01 09:10
hadoop
hadoop之旅5-idea通过maven搭建hdfs环境
hadoop集群start-dfs.sh或者start-all.sh//一键启动hadoop集群和yarn集群打开idea在pom.xml文件里加入hadoop的依赖,我这里使用的是我搭建的一样版本的依赖
hadoop2
.7.32.7.3org.apache.hadoophado
尔以凡
·
2020-08-01 09:49
hadoop2
.7.3在集群中配置多个namenode(federation cluster)
hadoop2
.7.3在集群中配置多个namenode(federationcluster)首先需要说明的是,在集群中配置多个namenode和在集群中使用secondaryNamenode是完完全全的两码事
0day__
·
2020-08-01 06:44
linux
hadoop
hadoop
namenode
hadoop集群
分布式
PysparkNote001---Mac下JupyterNoteBook配置pyspark
1.环境Mac:macOSHighSierra10.13.4Spark:spark-2.3.0-bin-
hadoop2
.62.Spark安装2.1java安装 比较坑爹
维格堂406小队
·
2020-08-01 06:51
★★★PySpark
#
★★Pyspark基础
Spark Standalone模式与测试
版本配置:spark-2.1.1-bin-
hadoop2
.7.tgz
hadoop2
.7.3Standalone模式概述构建一个由Master+Slave构成的Spark集群,Spark运行在集群中。
滑冰选手库里
·
2020-08-01 05:31
spark
hadoop修改HDFS默认块大小的配置
首先叙述一下:1.hadoop1.x的HDFS默认块大小为64MB;
hadoop2
.x的默认块大小为128MB。
飘羽
·
2020-08-01 01:29
Hadoop2
.6.1安装
JDK下载地址:jdk-8u66-linux-x64.tar.gzLinux安装JDK及环境变量配置,参见:http://blog.csdn.net/yuan_xw/article/details/499482852、Hadoop下载:hadoop-2.7.1.tar.gz3、Zookeeper下载:zookeeper-3.4.5.tar.gz首先安装JDK安装好jdk之后vim~/.bashrc
暗夜困觉觉
·
2020-08-01 01:11
大数据学习
HDFS 系列三:HDFS 数据流
文章目录3.HDFS数据流3.1HDFS写数据流程3.1.1剖析文件写入3.1.2网络拓扑概念3.1.3机架感知(副本节点选择)3.1.3.1低版本Hadoop副本节点选择3.1.3.2
Hadoop2
.9.2
super_man_0820
·
2020-08-01 00:30
hadoop
Big Data (二):Spark入门教程
一、准备工作详见《Spark处理框架搭建【VM15+CentOS7+
Hadoop2
.7.2+Scala2.12.7+Spark2.3.1】》二、示例运行在.
流浪中的UncleLivin
·
2020-08-01 00:35
大数据
vmware配置hadoop 实现伪分布式
vmware配置hadoop实现伪分布式一、实验环境编号项目软件及版本1操作系统CentOS62环境软件VMware123jdk环境jdk1.8.0_1814Hadoop
Hadoop2
.8.55本机操作系统
lily_cai
·
2020-07-31 23:44
Linux
hadoop
【hadoop】HDFS-HA工作机制
3)
Hadoop2
.0之前,在HDFS集群中NameNode存在单点故障(SPOF)。4)NameNode主要在以下两个方面影响HDFS集群:1.NameNode机器发生意外,如宕机,集群将无法
SmallScorpion
·
2020-07-31 22:24
hadoop
hadoop生态系统的架构图(转载)
转自:http://blog.csdn.net/babyfish13/article/details/525276651、hadoop1.0时期架构2、
hadoop2
.0时期架构3、hdfs架构ActiveNamenode
晴天哥_374
·
2020-07-31 22:15
hadoop HA机制
基础配置2.2hadoop配置2.3HA启动及测试回顾:今天任务1.什么是HA2.HA的实现场景3.配置HA环境教学目标1.理解HA的机制2.掌握HA环境的配置流程第一节:HADOOPHA概述1.1背景在
Hadoop2
.0
cloudera首席用户
·
2020-07-31 22:13
Hadoop
HDFS文件块(block)大小设定依据
CSDN搜了半天也没有确切答案,查询资料思考后总结如下:我们在HDFS中存储数据是以块(block)的形式存放在DataNode中的,块(block)的大小可以通过设置dfs.blocksize来实现;在
Hadoop2
人蠢多读书
·
2020-07-31 22:48
大数据运维之hadoop日常
Hadoop 2.7.2 伪分布式安装笔记
环境UbuntuKylin14.04
Hadoop2
.7.2下载地址安装目录/home/hadoop/hadoop-2.7.2/hadoop用户创建之后一直使用hadoop用户操作添加hadoop用户创建
Mr_Curiosity
·
2020-07-31 20:01
Hadoop2
.2.0伪分布式安装及测试笔记
一:环境准备:基于Windows下的VM9的ubuntu12.04-64server.下载免费的VMwarePlayer并安装好;下载免费的Ubuntu12.04server版并在VMware中安装好;二:基础安装:执行如下命令升级部分软件和把ssh安装好:(1)sudoapt-getupdate;(2)sudoapt-getupgrade;(3)sudoapt-getinstallopenssh
程序员成长史
·
2020-07-31 19:46
自己记录
hbase on yarn 安装笔记,私货,浅显易懂
比如hbase-0.98.2-
hadoop2
-bin.tar.gz1:集群机器间要建立ssh互信先到所有机器执行下面代码创建rsamkdir~/.sshchmod700~/.sshssh-keyge
zhoushuai3066
·
2020-07-31 18:28
hadoop
SPARK集群配置
搭建好HADOOP高可用后发现
HADOOP2
.7.x版本并不能支持SPARK1.6.x因此重新搭建了
HADOOP2
.6.5高可用集群节点配置如下hadoop1192.168.1.111
hadoop2
192.168.1.112hadoop3192.168.1.113hadoop4192.168.1.114
0_9f3a
·
2020-07-31 18:31
##[镜像sequenceiq/hadoop-docker]在Docker Container中运行Hadoop程序
sequenceiq/hadoop-docker:Hadoopdockerimagehttps://github.com/sequenceiq/hadoop-docker在Docker上运行Apache
Hadoop2
.4.0
葡萄喃喃呓语
·
2020-07-31 17:54
ZooKeeper节点数据量限制引起的Hadoop YARN ResourceManager崩溃原因分析
>>>环境Hadoop版本:Apache
Hadoop2
.6.3ZooKeeper版本:ZooKeeper3.4.10两个ResourceManager节点:主节点RM01,从节点RM02背景最近有一次我们的
Viking_bird
·
2020-07-31 17:32
Hadoop
hadoop 查看对应组件版本号
[liuqiang@mu01sbin]$hadoopversion
Hadoop2
.10.0Subversionssh://git.corp.linkedin.com:29418/hadoop/hadoop.git-re2f1f118e465e787d8567dfa6e2f3b72a0eb9194Compiledbyjhungon2019
飞火流云
·
2020-07-31 16:48
tableau怎么连接hadoop
tableau连接服务器ClouderaHadoop,直接打开tableau连接肯定不行啦工具/原料Tableau2018.3.1(64位)VMwareWorkstationUbuntu
hadoop2
.5.0hive0.13.1
Saropetry
·
2020-07-31 14:24
数据分析
浅谈YARN架构与原理
一、什么是YARNYARN是
Hadoop2
.0版本引进的资源管理系统,直接从MR1演化而来核心思想:将MR1中的JobTracker的资源管理和作业调度两个功能分开,分别由ResourceManager
拾荒路上的开拓者
·
2020-07-31 14:26
hadoop
【大数据】PageRank网页排名图算法(MapReduce Java+Spark Scala)
实验环境:ubuntu18.04
hadoop2
.7.1JDK1.8spark2.3.3scala2.11.8目录一、实验原理二、用MapReduce实现PageRank三、用Spark实现PageRank
倏然希然_
·
2020-07-31 14:39
#
spark
#
hadoop
大数据
PageRank
spark
MapReduce
scala
hadoop
Spark Standalone与Spark on YARN的几种提交方式
1.spark-shellclientguo@drguo1:/opt/spark-1.6.1-bin-
hadoop2
.6$bin/spark-shell--masterspark://dr
光于前裕于后
·
2020-07-31 13:43
Spark
大数据动物园
HDFS文件块大小(重点)
HDFS中的文件在物理上是分块存储(Block),块的大小可以通过配置参数(dfs.blocksize)来规定,默认大小在
Hadoop2
.x版本中是128M,老版本中是64M。
孙晨c
·
2020-07-31 13:58
Hadoop
HBase节点掉线问题排查
环境信息:
Hadoop2
.7.2+HBase1.2.2+Zookeeper3.4.1011台服务器,1主10从,基本配置:128G内存,2个CPU12核48线程服务器上运行了HDFS(11台),HBase
梦回从前
·
2020-07-31 12:30
HBase
从零搭建大数据集群环境:
Hadoop2
.7.4 + Spark2.4.5 分布式部署
此部署教程为基于虚拟机的
Hadoop2
.7.4+Spark2.4.5完全分布式部署文档,虚拟机系统为centos7,读者可根据自己实际部署环境情况进行相应调整。
单字一个箫
·
2020-07-31 10:04
hadoop
spark
分布式
Oozie4.2 安装部署、以及example测试
编译:使用的环境是:
Hadoop2
.6.0、Spark1.4.0、Hive0.13.1、Sqoop1.4.4编译Oozie的命令:.
weixin_34362991
·
2020-07-31 10:02
Linux安装oozie(填坑手记)
安装原文链接版本和系统要求本文安装oozie版本:oozie-5.2.0.tar.gzoozie官网安装系统要求:Unixbox(testedonMacOSXandLinux)JavaJDK1.8+Maven3.0.1+
Hadoop2
.6.0
lebboop-L
·
2020-07-30 23:03
oozie
hadoop 2.6.5 + hive 集群搭建
2019独角兽企业重金招聘Python工程师标准>>>
hadoop2
.6.5+hive集群搭建概念了解主从结构:在一个集群中,会有部分节点充当主服务器的角色,其他服务器都是从服务器的角色,当前这种架构模式叫做主从结构
weixin_34318272
·
2020-07-30 20:27
大数据
数据库
开发工具
Hadoop 2.6.0单节点安装参考
1.环境说明本例介绍了
hadoop2
.6.0在单节点上的分布式安装方法。在安装Hadoop前,请确保你的机器上已安装了JDK1.7或更高版本,并配置了SSH无密码登陆本机。
jack-zhu
·
2020-07-30 20:47
hadoop
Hadoop-2.5伪分布式+Hive-1.0.1+mysql
echo$JAVA_HOME)core-site.xml:fs.defaultFS#用来指定hdfs的namenode的地址hdfs://hostname:9000hadoop.tmp.dir/opt/
hadoop2
.5
UpUpUpUpUpUpUp
·
2020-07-30 20:15
hadoop
XLearning 安装说明文档
一、版本说明
hadoop2
.7.3TensorFlow1.1.0xlearning1.1java1.8.0pyton2.7.5二、系统环境安装1.安装java下载jdk-8u73-linux-x64.tar.gz
红象云腾大讲堂
·
2020-07-30 20:41
离线部署
hadoop2
.6.5+hive1.2.0+flink1.72
首先要有三台虚拟机环境系统:centos7-1908hadoop:2.6.5hive:1.2.0flink:1.7.2配置查看虚拟网络编辑器查看自己的子网查看子网的网段可以将ip设置为192.168.32.128到192.168.32.254之间。我的网关是192.168.32.2在/etc/sysconfig/network-scripts/ifcfg-ens33配置好网络,保证节点之间可以互通
wxdoop
·
2020-07-30 20:07
大数据
hadoop2
.2完全分布式集群+hive+mysql存储元数据配置
一直在忙公司的项目,也没时间学些东西,最近刚闲下来就学一学hive和hbase的东东,本次只讲述hadoop完全分布式环境下用mysql存储元数据的hive的配置完全分布式集群环境virtualBoxcentos6.4minihadoop-master192.168.1.252mastercentos6.4minihadoop-slave1192.168.1.251slave机子配置不太好只能两个
姜龙
·
2020-07-30 19:02
Hadoop2
.6.5搭建HA(高可用)
一、环境操作系统:CentOS6.9软件版本:
Hadoop2
.6.5,Zookeeper3.4.13集群架构:我手上有3台服务器,一台作为主NameNode,一台作为备NameNode和DataNode1
andyguan01_2
·
2020-07-30 19:41
hadoop
Hadoop YARN常见问题以及解决方案
本文汇总了几个hadoopyarn中常见问题以及解决方案,注意,本文介绍解决方案适用于
hadoop2
.2.0以及以上版本。
我爱大海V5
·
2020-07-30 18:14
Hadoop
kafka spark steam 写入elasticsearch的部分问题
应用版本elasticsearch5.5spark2.2.0
hadoop2
.7依赖包版本dockercp/Users/cclient/.ivy2/cache/org.elasticsearch/elasticsearch-spark
weixin_30426879
·
2020-07-30 17:23
Mapreduce执行过程分析(基于
Hadoop2
.4)——(一)
1概述该瞅瞅MapReduce的内部运行原理了,以前只知道个皮毛,再不搞搞,不然怎么死的都不晓得。下文会以2.4版本中的WordCount这个经典例子作为分析的切入点,一步步来看里面到底是个什么情况。2为什么要使用MapReduceMap/Reduce,是一种模式,适合解决并行计算的问题,比如TopN、贝叶斯分类等。注意,是并行计算,而非迭代计算,像涉及到层次聚类的问题就不太适合了。从名字可以看出
weixin_30420305
·
2020-07-30 17:22
HDFS学习记录(数据单位的比较、读写流程)
BlockSize:
Hadoop2
.7.3开始默认为128M,
Hadoop2
.7.3以下默认为64M。
晓之木初
·
2020-07-30 17:41
Hadoop
Hadoop2
.8.5 RPC机制 一
RPC是“RemoteProcedureCall”即“远地过程调用”的缩写。这个机制的目的,是让一台机器上的程序能像调用本地的“过程”那样来调用别的机器上的某些过程。需要特别说明的是,RPC并非针对远地的所有过程,并不是对远地所有的过程都可以随心所欲地通过RPC加以调用,而只能针对预先确定的某些过程,并且在程序上得有些准备和安排。RPC交互的两方,总有一方是通信的主动发起方,也是某种服务的需求方;
SherlockCharlie
·
2020-07-30 17:04
Hadoop
Linux下Apache
Hadoop2
.7.2的集群安装以及WordCount示例
摘要:为了研究Hadoop与本系统Linux的兼容性,使用最新的hadoop版本2.7.2进行兼容性测试以及WordCount示例运行。Hadoop简介Hadoop下载首先,根据自己系统的内核情况以及操作系统版本下载所需的软件。此次测试系统的Linux内核:3.10.0-327.el7.x86_64,类似RHEL7.2前往:http://hadoop.apache.org/releases.htm
skymfc
·
2020-07-30 16:04
高可用集群软件搭建
MapReduce_Job提交流程源码详解
版本:Apache
Hadoop2
.7.2运行环境:Windows10EclipseDebug:https://blog.csdn.net/qq_40794973/article/details/87876772
嘤 嘤 嘤
·
2020-07-30 16:38
大数据
Spark-集群安装、部署、启动、测试(1.6.3)稳定版
spark.apache.org/releases/spark-release-1-6-3.html二、安装将其放在Linux的目录中,解压我解压的目录是:/usr/local/spark-1.6.3-bin-
hadoop2
.6
JAVA和人工智能
·
2020-07-30 15:52
spark
Hadoop,MapReduce,YARN和Spark的区别与联系
(2)
Hadoop2
.0第二代Hadoop,为克服Hadoop1.0中HDFS和
DigitalNexus
·
2020-07-30 15:37
hadoop
Sparkstreaming读取kafka数据写入hive和es
一、主要流程此demo用到的软件如下,软件需先自行安装springboot1.5.9.RELEASE、
hadoop2
.7.2、spark2.1.1、elasticsearch5.2.2、kafka0.10.2.1
天涯到处跑
·
2020-07-30 15:35
上一页
33
34
35
36
37
38
39
40
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他