E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop2
Hadoop,Spark,Tez的区别与联系
文章目录1.0什么是
Hadoop2
.0什么是Spark3.0什么是Tez4.0三者之间的关系5.0Mr,Tez,Spark的对比1.0什么是Hadoop1)hadoop简介 Hadoop是一个由Apache
Fang GL
·
2022-09-10 07:46
#
大数据技术
hadoop
spark
大数据
《大数据分析技术》教学上机实验报告
安装三台CentOS7的主机练习使用Linux命令要求:1使用“计算节点”模式2地址要求192.168.128.100hadoop0192.168.128.101hadoop1192.168.128.102
hadoop2
3
司沐夜枫
·
2022-09-09 16:25
实验报告
数据分析
linux
hadoop
Hadoop大数据综合案例5-SSM可视化基础搭建
Hadoop大数据招聘网数据分析综合案例Hadoop大数据综合案例1-
Hadoop2
.7.3伪分布式环境搭建Hadoop大数据综合案例2-HttpClient与Python招聘网数据采集Hadoop大数据综合案例
CDHong.it
·
2022-09-09 07:48
Hadoop大数据
可视化
ssm
数据库
Yarn资源管理器
Yarn被引入
Hadoop2
.0,最初是为了改善MapReduce的实现,但是因为具有足够的通用性,同样也可以支持其他的分布式计算模式,比如Spark,Tez等计算框架。Yarn的设计
稷下小鲤鱼
·
2022-09-09 07:44
Yarn
CentOS7下基于
Hadoop2
.7.3集群搭建
一、准备工作1.修改Linux主机名2.修改IP3.修改主机名和IP的映射关系4.关闭防火墙5.ssh免登陆6.安装JDK,配置环境变量等7.集群规划:主机名IP所需安装工具运行进程hadoop01220.192.10.10jdk、hadoop、zookeeperDataNode、NodeManager、JournalNode、QuorumPeerMainhadoop02220.192.10.11
sunggff
·
2022-09-06 15:44
hadoop集群搭建
CentOS7
Hadoop
集群
HDFS 伪分布式环境搭建
HDFS伪分布式环境搭建作者:Grey原文地址:博客园:HDFS伪分布式环境搭建CSDN:HDFS伪分布式环境搭建相关软件版本
Hadoop2
.6.5CentOS7OracleJDK1.8安装步骤在CentOS
Grey Zeng
·
2022-09-05 21:00
SparkCore入门编程
一、Spark的概述1.1Hadoop的回顾版本号的发展hadoop1.x:hdfs和mapreduce
hadoop2
.x:hdfs、mapreduce、yarn、commonhadoop3.x:hdfs
默主归沙
·
2022-08-24 15:49
大数据那些事
Spark
大数据开发
HDFS的高可用HA
HDFS的高可用HA 在
Hadoop2
.X之前,Namenode是HDFS集群中可能发生单点故障的节点,每个HDFS集群中只有一个Namenode,一旦这个节点不可用,则整个HDFS集群将处于不可用状态
loser与你
·
2022-08-22 23:30
Hadoop
hadoop
big
data
hdfs
大数据运维工程师面试
当前你们公司使用的Hadoop版本是什么ambari2.5.1
Hadoop2
.7.3.2.6.2.14-5HDFS常见的数据压缩格式有哪些,介绍其中一种详细的实现方式1gzip压缩优点:压缩率比较高,而且压缩
龚帅立
·
2022-08-21 15:07
大数据
大数据
运维
面试
大数据运维实战第二十九课 Hadoop 跨集群数据迁移应用实践
CDH5.8版本的Hadoop是基于
Hadoop2
.x的,此次升级计划从
Hadoop2
.x版本升级到3.x版本,相关依赖组件也一并升级。大数据平
办公模板库 素材蛙
·
2022-08-21 15:30
云原生
大数据
教程
大数据
hadoop
运维
hdfs
spark
大数据入门-大数据技术概述(一)
目录大数据入门系列文章1.大数据入门-大数据是什么一、概念二、技术详解1.基础架构:
Hadoop2
.分布式文件系统:HDFS3.数据仓库:Hive4.存储引擎:Kudu5.分布式数据库:HBase6.实时框架
水坚石青
·
2022-08-15 09:34
大数据理论
大数据
实时大数据
hadoop
hdfs
hive
Centos6下安装伪分布式hadoop
安装环境:Centos6Hadoop版本:2.7.2用户名:huwei
Hadoop2
.7.2下载链接:https://pan.baidu.com/s/1AK4CXh2jBKOSa-bN4NA8nQ提取码
胡微_
·
2022-08-10 16:45
大数据
centos
linux
hadoop
ssh
HDFS基础入门
HDFS中的重要概念分块存储HDFS中的文件在物理上是分块存储的,块的大小可以通过配置参数来规定;
Hadoop2
.x版本默认的block大小是128M命名空间H
女友在高考
·
2022-08-06 09:00
spark筑基篇-00-Spark集群环境搭建
说明1效果图2实验环境3配置ssh免登陆集群搭建1配置环境变量2配置
hadoop2
1core-sitexml22hdfs-sitexm23mapred-sitexml24yarn-sitexml25hadoop
hylexus
·
2022-08-05 12:25
spark-筑基篇
spark
hadoop
集群
ssh
scala
spark 写 hbase 数据库,遇到Will not attempt to authenticate using SASL (unknown error)
观察ambari的hosts显示然后我开始配置hostsip1a.
hadoop2
.comip2
格格巫 MMQ!!
·
2022-07-25 16:31
hbase
hadoop
hbase
数据库
spark
Hadoop 生产调优 (一) --------- HDFS 核心参数
Hadoop2
.x系列,配置NameNode内存NameNode内存默认2000m,如果服务器内存4G,NameNode内存可以配置3g。在hadoop-env.sh文件中配置
在森林中麋了鹿
·
2022-07-21 07:23
Hadoop
hadoop
hdfs
大数据
大数据学习之Hadoop生态圈(一)
文章目录前言1、什么是
hadoop2
、Hadoop起源3、Hadoop的四大特点4、Hadoop的三大发行版本5、Hadoop的版本迭代6、Hadoop的优点及缺点7、Hadoop组成前言上篇文章讲述了大数据的发展及历程
Lnn_CSDN
·
2022-07-18 13:06
大数据
hadoop
big
data
Spark入门到精通-番外篇(Standaone集群的运维和简单操作)
安装包下载Indexof/dist/sparkspark集群的master和work单独启动要单独启动那么必须先启动master,然后在启动worktar-zxvfspark-3.0.0-bin-
hadoop2
.7
顶尖高手养成计划
·
2022-07-16 15:26
spark
大数据
Hadoop HA 高可用集群搭建
搭建环境:环境版本地址地址CentOS6.564x点击下载
hadoop2
.5.1点击下载Zookeeper3.4.5点击下载HadoopHa配置null点击下载nullnullnullch01192.168.128.121NNDNRMch02192.168.128.122NNDNNMch03192.168.128.123DNNM
wespten
·
2022-07-16 12:38
ELK
Hadoop
Spark
大数据安全
大数据
Centos hadoop-2.7.7安装
安装过程参考了林子雨教程Hadoop安装教程_伪分布式配置_CentOS6.4/
Hadoop2
.6.0_厦大数据库实验室博客(xmu.edu.cn)http://dblab.xmu.edu.cn/blog
嘻水流年
·
2022-07-13 13:28
虚拟机
hadoop
centos
大数据
Spark3.1.2 on TDH622
这里选择spark-3.1.2-bin-
hadoop2
.7版本。
李_少
·
2022-07-13 08:24
spark
spark
hadoop
big
data
Flink Iceberg 测试
组件版本组件版本Java1.8.251Scala1.12.14Flink1.12.5Iceberg0.12.0
Hadoop2
.9.2Hive2.3.6将hdfs-site.xml,core-site.xml
訾零
·
2022-07-13 08:41
Flink
Iceberg
flink
scala
big
data
【图文步骤】CentOS7 搭建Hadoop3.x 完全分布式
自行安装Centos7系统)hadoop3.x安装包(linux版本)java1.8安装包(linux版本)1使用root用户登录创建hadoop用户[root@hadoop102~]#useradd
hadoop2
菜鸟进阶站
·
2022-07-11 09:18
大数据
Hadoop
Linux
大数据
hadoop
centos
Hadoop学习记录4--Maven、HDFS API编程
目录1.Windows下安装
hadoop2
.Maven2.1Maven简介2.2Maven安装与配置2.3通过pom文件下载hadoop的客户端依赖3.API之文件操作3.1API之文件系统对象3.3API
枫茗、
·
2022-07-03 13:01
大数据
学习
大数据
maven
Hadoop总结(更新)
面试题:hadoop组成hadoop1.XMapReduce(计算+资源调度)HDFS(数据存储)
hadoop2
.XMapReduce(计算)Yarn(资源调度)HDFS(数据存储)HDFS有一个ResourceManager
宁然也
·
2022-07-03 13:00
大数据
hadoop
HDFS存储目录分析
本文基于
Hadoop2
.6版本介绍HDFSNamenode本地目录的存储结构和Datanode数据块存储目录结构,也就是hdfs-site.xml
一寸HUI
·
2022-07-02 10:00
spark python pickle对象_cPickle.PicklingError:无法序列化对象:NotImplementedError
Createdbroadcast12frombroadcastatNativeMethodAccessorImpl.java:0pyspark_1|Traceback(mostrecentcalllast):pyspark_1|File"/home/ubuntu/spark-2.4.4-bin-
hadoop2
.7
weixin_39884100
·
2022-06-29 07:21
spark
python
pickle对象
比较 Spark 和 MapReduce 执行迭代应用Pagerank的性能差异
2.实验设置1)Ubuntu18.04、jdk1.8、云主机、IDEA2020.3.42)
Hadoop2
.10.1、Spark2
张嘉睿大聪明
·
2022-06-27 10:34
分布式计算系统
spark
mapreduce
hadoop
Spark开发环境的搭建
小编下载spark的版本是:spark-2.3.2-bin-
hadoop2
.7.tgz。
鄙人阿彬
·
2022-06-26 07:37
hadoop
windows系统搭建spark+hadoop环境
hadoop版本hadoop-2.7.7,spark版本spark-2.2.0-bin-
hadoop2
.7,搭建步骤如下:1.配置hadoop的环境变量F:igdatatoolhadoop-2.7.7in
m0_67394230
·
2022-06-20 14:51
java
java
后端
Hadoop史诗级入门详解
1.2Hadoop发展历史1.3Hadoop的三大发行版本1)Apache
Hadoop2
)ClouderaHadoop3)HortonworksHadoop1.4Hadoop具有什么优势呢?
红糖番薯
·
2022-06-20 12:33
hadoop
mapreduce
big
data
Spark Streaming之流式词频统计(Socket数据源)
Maven3.6.0JDK1.8Scala2.11.11Spark2.4.3Spark运行环境:系统:LinuxCentOS7(两台机:主从节点)master:192.168.190.200slave1:192.168.190.201JDK1.8
Hadoop2
碣石观海
·
2022-06-14 22:18
Spark
干货丨MapReduce的工作流程是怎样的?
分片操作:指的是将源文件划分为大小相等的小数据块(
Hadoop2
.x中默认128M),也就是分片(split),H
Blue92120
·
2022-06-09 19:09
mapreduce
hadoop
大数据
Centos下安装Hadoop【历时三天亲测有效】
版本说明:VMwareCentos6.8SecureCRT工具jdk1.8
hadoop2
.7点击获取安装包:https://pan
孙和龚
·
2022-06-08 07:46
自学大数据之深似海
hadoop
centos
linux
Hudi 集成 Hive
环境:hudi0.10.1spark2.4.5hive2.3.7
hadoop2
.7.5将编译好的hudijar,copy到hivelib目录下:cp/Users/xxx/cloudera/lib/hudi
雾岛与鲸
·
2022-05-31 07:42
数据湖
spark
sql
big
data
Centos7安装
Hadoop2
.8步骤
第一步,准备3台机器或虚拟机,分别作为hadoop安装集群的master和2个slave。3台机器安装好JDK,并配置好JAVA_HOME(请参考《Centos7安装OracleJDK》)。然后在3台机器之间建立信任关系(请参考《在两台Centos服务器之间建立信任关系》)。然后,在3台机器上分别执行hostnameaeolus-vm0,hostnameaeolus-vm1,hostnameaeo
郑再鹏
·
2022-05-27 08:18
Hadoop
hadoop
集群
hadoop2.8
centos7
安装
CentOS7搭建Hadoop集群的详细操作流程
CentOS的可参考:LinuxCentOS安装教程Haddop的下载可以到https://mirrors.cnnic.cn/apache/hadoop/common/这个网址下载,下载的时候版本是选择
Hadoop2
小嗯子
·
2022-05-27 08:16
hadoop
大数据
hadoop
hadoop集群搭建
1、创建虚拟机及规划下面是我本地的环境信息机器名IP操作系统hadoop1192.168.68.120CentOS7
hadoop2
192.168.68.121CentOS7hado
wang03
·
2022-05-08 20:00
大数据-离线数据处理
文章目录Hive离线分析回顾业务流程准备搭建环境1.启动
Hadoop2
.修改flume配置文件3.启动flume4.启动jt-logserver5.测试准备数据离线数据处理Hive管理数据数据清洗数据处理
DayDayUp-Panda
·
2022-04-24 14:33
big
data
hdfs
hadoop
HDFS基础-安装伪分布式Hadoop
使用工具①centos6.5②jdk1.8③
Hadoop2
.7.1【*】虚拟机使用Linux作为操作系统,这也是在生产情况下运行Hadoop的唯一指定操作系统。
AGi_
·
2022-04-21 09:43
分布式存储
hadoop
hdfs
HDFS基础-安装Hadoop出错
Error:Cannotfindconfigurationdirectory:/etc/hadoop【错误】在安装
Hadoop2
.7.1时,使用命令start-all.sh启动,出现Error:Cannotfindconfigurationdirectory
AGi_
·
2022-04-21 09:43
分布式存储
hadoop
hdfs
大数据
Idea——Hadoop3.2.1版idea插件安装超详细版
另外本教程虽然是为Hadoop3.2.1版本安装的插件,但实际
Hadoop2
.Xidea插件也可以这样安装,只是修改pom中hadoop版本参数稍有不同而已。二、准备阶段下载Idea2
JiaM丶
·
2022-04-11 15:22
Hadoop
软件与系统
java
hadoop
intellij
idea
Linux_
hadoop2
.2.0伪分布式搭建安装
一:准备Linux环境1.1开启网络,ifconfig指令查看ip1.2修改主机名为自己名字(hadoop)centos7连接:https://zhuanlan.zhihu.com/p/375497418vim/etc/sysconfig/networkNETWORKING=ye
and脱发周大侠
·
2022-04-10 20:00
Ubuntu下单机安装Hadoop详细教程(附所需安装包下载)
五、安装单机Hadoop1.下载安装
Hadoop2
.运行示例总结前言本文安装的Hadoop及Java环境基于林子雨老师的《大数据技术原理与应用(第3版)》中所要求,其中Java版本为1.8.0_301,
hjseo_seg
·
2022-03-31 11:51
java
java
后端
(超详细)基于Zookeeper的Hadoop HA集群的搭建
HadoopHA是
hadoop2
.0后新添加的特性,包括NameNodeHA和ResourceManagerHA。NameNodeHA
IT路上的军哥
·
2022-03-31 10:04
大数据学习之路
hadoop
zookeeper
big
data
Hadoop2
.x与Hadoop3.x副本选择机制
HDFS上的文件对应的Block保存多个副本,且提供容错机制,副本丢失或者宕机自动恢复,默认是存3个副本。2.8.x之前的副本策略官方文档说明:https://hadoop.apache.org/docs/r2.8.0/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html#Data_ReplicationForthecommoncase,whenthere
DawnLewis
·
2022-03-26 11:00
spark on yarn集群搭建
其他两个为从节点)实验环境:服务器节点数量:3系统版本:LinuxJava版本:jdk-8u261-linux-x64Hadoop版本:hadoop-2.7.6Spark版本:spark-2.3.0-bin-
hadoop2
.7
GXX_xxg
·
2022-03-25 07:24
大数据
hadoop
spark
大数据
初识Hadoop
2.所用版本目前Hadoop版本以
Hadoop2
.7.x为主,我们的课程选择
Hadoop2
.7.3。3.Hadoop核心组件与应用组件介绍:HDF
Iiversse
·
2022-03-25 07:50
初学Hadoop
hadoop
hdfs
Spark on YARN 部署
YARN完成.相关路径根据实际情况修改.1.4和1.6版本部署过程类似.2.部署下载从官网(http://spark.apache.org/)下载对应Hadoop版本的包,如spark-1.6.1-bin-
hadoop2
.4
liam08
·
2022-03-25 07:40
Spark
spark
hadoop
yarn
hadoop集群
hadoop2
和hadoop3的比较
title:
hadoop2
和hadoop3的比较date:2022-03-2311:47:10tags:[hadoop,大数据]categories:[大数据,翻译]本文为翻译版本,请欣赏。
chenzuoli
·
2022-03-25 07:08
大数据
hadoop
大数据
hadoop
上一页
11
12
13
14
15
16
17
18
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他