E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop集群
周末杂谈:关于
Hadoop集群
中,其创建文件的touch命令和touchz命令有什么区别?以及在什么样的情况下创建文件使用不同的命令。
touch命令案例:使用touch来在当前路径下创建一个文件,命名为file.txthadoopfs-touch/file.txttouchz命令案例:使用touchz来在当前路径下创建一个文件,命名为file.txthadoopfs-touchz/file.txt同touch命令与touchz命令都用于创建一个空文件。异touch命令将在指定路径下创建一个空文件,如果该文件不存在,则创建一个新文
放下华子我只抽RuiKe5
·
2023-10-14 01:31
hadoop
大数据
分布式
运维
运维开发
走进Flink
可伸缩的、容错的流处理引擎,它支持批处理和流处理,并提供了丰富的API和库,是实时数据处理的理想选择由Java和Scala实现的,所以所有组件都会运行在Java虚拟机【单个JVM也可以】上不需要依赖于
hadoop
、小H
·
2023-10-13 20:18
flink
apache atlas 案例_元数据治理 Apache Atlas
ApacheAtlas是Hadoop社区为解决Hadoop生态系统的元数据治理问题而产生的开源项目,它为
Hadoop集群
提供了包括数据分类、集中策略引擎、数据血缘、安全和生命周期管理在内的元数据治理核心能力
CelioHsu
·
2023-10-13 18:47
apache
atlas
案例
Apache Atlas元数据 最全资料
第1章介绍atlas是apache下的大数据的元数据管理和数据治理平台,是Hadoop社区为解决Hadoop生态系统的元数据治理问题而产生的开源项目,它为
Hadoop集群
提供了包括数据分类、集中策略引擎
丨Apricity丨
·
2023-10-13 18:46
Atlas
大数据
Hadoop生态系统的元数据管理和数据治理平台--Atlas 学习
最近在规划数据治理的功能,所以研究了一下ApacheAltasAtlas介绍Atlas是apache下的大数据的元数据管理和数据治理平台,是Hadoop社区为解决Hadoop生态系统的元数据治理问题而产生的开源项目,它为
Hadoop
m0_67401660
·
2023-10-13 18:16
java
hadoop
学习
大数据
运维
后端
Hadoop的元数据治理--Apache Atlas0.8
Hadoop的元数据治理--ApacheAtlasApacheAtlas是Hadoop社区为解决Hadoop生态系统的元数据治理问题而产生的开源项目,它为
Hadoop集群
提供了包括数据分类、集中策略引擎
大跃ET
·
2023-10-13 18:15
数据仓库
hive小文件合并机制_Hive小文件合并迁移
因为两个
Hadoop集群
都开启了kerberos身份认证,直接进行数据迁移不太好实现,所以需要先将A集群的数据下载到本地,再迁移到B集群本地,最后从B本地上传到B集群的Hive库里。
辰予
·
2023-10-13 08:56
hive小文件合并机制
大数据学习(6)-hive底层原理Mapreduce
乃是开启智慧的大门如果觉得博主的文章还不错的话,请点赞+收藏⭐️+留言支持一下博>主哦MapReduce是一个分布式运算程序的编程框架,核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个
Hadoop
viperrrrrrr
·
2023-10-13 07:47
大数据
学习
hive
mapreduce
从零开始搭建
hadoop集群
(二)虚拟机网络和文件配置+虚拟机克隆
一、虚拟机环境准备。1.安装一下vim,自带的vi不太好用,也可以不装。yum-yinstallvim。[root@hadoop102~]#yum-yinstall vim2.打开下面的目录,修改静态IP。保证三者IP相同,即第2步,第3步,第4步,很重要,如果网络有问题,ping不通主机,shell连不上等原因就是因为这个,有问题私聊博主,博主之后也会写一篇网络ping不通的博客。[root@h
枫锦旧曾谙
·
2023-10-12 05:16
大数据
hadoop
linux
大数据
Hadoop集群
启动从节点没有DataNode
目录一、问题背景二、解决思路三、解决办法:一、问题背景之前启动
hadoop集群
的时候都没有问题,今天启动
hadoop集群
的时候,从节点的DataNode没有启动起来。
小-枝-丫
·
2023-10-12 05:44
hadoop
hadoop
Hadoop分布式集群搭建教程
目录前言环境准备一、创建虚拟机二、虚拟机网络配置三、克隆虚拟机四、Linux系统配置五、Hadoop的部署配置六、
Hadoop集群
的启动前言大数据课程需要搭建Hadoop分布式集群,在这里记录一下搭建过程环境准备搭建
韭菜盖饭
·
2023-10-12 05:12
大数据
分布式
hadoop
大数据
hadoop-3.1.0启动
hadoop集群
时还有可能可能会报如下错误
[root@localhostsbin]#start-all.shStartingnamenodeson[hadoop]ERROR:AttemptingtooperateonhdfsnamenodeasrootERROR:butthereisnoHDFS_NAMENODE_USERdefined.Abortingoperation.StartingdatanodesERROR:Attempting
回忆de天空
·
2023-10-11 16:40
hadoop
hdfs
java
Hive实战(03)-深入了解Hive JDBC:在大数据世界中实现数据交互
在大数据领域,Hive作为一种数据仓库解决方案,为用户提供了一种SQL接口来查询和分析存储在
Hadoop集群
中的数据。
JavaEdge.
·
2023-10-11 12:23
Hive
大数据
hive
交互
Hadoop+Zookeeper+HA错题总结(一)
题目3:下列哪项通常是
hadoop集群
运行时的最主要瓶颈?
十七✧ᐦ̤
·
2023-10-11 06:08
hadoop
zookeeper
大数据
Apache Ranger的安装及部署
一.ApacheRanger简介Apacheranger是一个
Hadoop集群
权限框架,提供操作、监控、管理复杂的数据权限,它提供一个集中的管理机制,管理基于yarn的Hadoop生态圈的所有数据权限。
jianmin0920
·
2023-10-11 02:08
hdfs
大数据
Hadoop2.5.2+Zookeeper3.4.6 + HBase0.98.8-hadoop2环境搭建
Hadoop集群
Zookeeper集群1配置11zoocfg12分发到集群的其它机器13设置myid身份唯一标识14一些配置参数的解释2启动关闭3启动日志分析4测试验证5注意事项Hbase集群1配置11
码上笔记
·
2023-10-10 16:30
hbase
hadoop
hbase
zookeeper
Python操作Hive数据仓库
Python连接Hive需要使用Impala查询引擎由于
Hadoop集群
节点间使用RPC通信,所以需要配置Thrift依赖环境Thrift是一个轻量级、跨语言的RPC框架,主要用于服务间的RPC通信。
对许
·
2023-10-10 11:32
#
Python
#
Hive
#
数据分析
数据仓库
python
hive
Python+大数据-Hadoop生态-hadoop(二)--Apache Hadoop
Python+大数据-Hadoop生态-hadoop(二)–ApacheHadoop今日课程学习目标了解Hadoop发展历史、生态圈掌握
Hadoop集群
架构、角色掌握
Hadoop集群
分布式安装部署掌握JobHistoryServer
呆猛的呆呆小哥
·
2023-10-10 02:10
python+大数据
hadoop
大数据
apache
大数据集群(Hadoop生态)安装部署
目录1.简介2.前置要求3.
Hadoop集群
角色4.角色和节点分配5.调整虚拟机内存6.Zookeeper集群部署7.
Hadoop集群
部署7.1下载Hadoop安装包、解压、配置软链接7.2修改配置文件
时光の尘
·
2023-10-10 02:33
Linux学习
大数据
hadoop
分布式
开机启动
hadoop集群
(虚拟机)
一、背景在学习hadoop的时候,在本地通过VMware搭建了一个
hadoop集群
,但是由于每天电脑都需要重启,所以虚拟每天都会被关掉,所以想要写一个脚本一键启动虚拟机+
hadoop集群
二、实现方案一1
believe-xin
·
2023-10-09 17:16
Hadoop
vmware
linux
hadoop
【Linux】免密登录
hadoop完全分布式的集群的搭建,涉及到集群中各个机器之间的互访,因为
Hadoop集群
中各个机器间会相互地通过ssh访问,每次访问都输入密码是不现实的,所以要配置各个机器间的ssh是无密码登录的。
bkdl047
·
2023-10-09 13:19
Linux
linux
免密登录
hdfs shell的基本操作以及hdfsWeb查看文件
在安装好
hadoop集群
并成功的启动了hdfs之后,我们就可以利用hdfs对文件进行操作了,一下是对文件的一些基本操作hdfs基本操作1、查询命令hadoopdfs-ls/查询/目录下的所有文件和文件夹
音乐与咖啡Bean
·
2023-10-09 02:06
Hadoop(林子雨慕课课程)
文章目录2.Hadoop2.1Hadoop简介2.2Hadoop版本演变2.3Hadoop项目结构2.4
Hadoop集群
的部署和使用2.Hadoop2.1Hadoop简介Hadoop可以支持多种编程语言
几窗花鸢
·
2023-10-09 00:05
大数据应用
hadoop
hadoop
大数据
分布式
Hadoop2.x安全:
hadoop集群
之kerberos认证(一、原理+安装配置)
微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读一、为什么启用Kerberos安全认证大家都知道,Hadoop1.0.0或者CDH3版本以前,并没有安全认证的概念,用户与HDFS文件系统或者提交分布式任务(Mapreduce、Spark)都是不需
大数据开发运维架构
·
2023-10-08 15:16
Python数据攻略-
Hadoop集群
中PySpark数据处理
Hadoop是一个开源的分布式存储和计算框架。它让我们可以在多台机器上存储大量的数据,并且进行高效的数据处理。简而言之,Hadoop就像一个巨大的仓库,可以存放海量的数据,并且有高效的工具来处理这些数据。文章目录PySparkPySpark的基础操作创建RDDRDD转换操作(map,filter等)RDD动作操作(collect,reduce等)DataFrame创建DataFrameDataFr
Mr数据杨
·
2023-10-07 08:33
Python
数据攻略
python
hadoop
开发语言
Linux免密ssh自身不成功怎么解决,centos配置ssh免密码登录后仍要输入密码的解决方法...
前言在搭建linux集群服务的时候,主服务器需要启动从服务器的服务,如果通过手动启动,集群内服务器几台还好,要是像阿里1000台的云梯
Hadoop集群
的话,轨迹启动一次集群就得几个工程师一两天时间,是不是很恐怖
蒲玉恩
·
2023-10-07 07:16
Hadoop 伪分布式环境搭建
1、
hadoop集群
环境搭建之伪分布式集群环境搭建(一)https://blog.csdn.net/qq_33689414/article/details/792231862、CentOS7常用命令https
qlzx921
·
2023-10-07 06:41
Linux和Hadoop的学习
目录1.Linux的常用快捷键2.
Hadoop集群
部署问题汇总1.Linux的常用快捷键复制:Ctrl+shift+C粘贴:Ctrl+shift+VTAB:补全命令编写输入:i退出编写:esc保存并退出
蓝翔技校的码农
·
2023-10-07 05:26
linux
hadoop
学习
id_rsa id_pub 公钥与私钥
本文基于实际Linux管理工作,实例讲解工作中使用ssh证书登录的实际流程,讲解ssh证书登录的配置原理,基于配置原理,解决实际工作中,windows下使用SecureCRT证书登录的各种问题,以及实现
hadoop
LTIven
·
2023-10-06 09:38
前端开发
需要回头看的文章
js
成长轨迹
计算机其他技术知识
大数据实战 Linux Ubuntu 20.04.1 hadoop 2.8.5 在MapReduce平台 编写单词计数程序
详细如何搭建hadoop环境可以点击这里2.在server最小化系统进行单词计数2.1切换用户,查看进程目的:保证
hadoop集群
开启su-angel主节点进程从节点进程2.3建立测试文档测试文档的路径是
十旬叶大叔
·
2023-10-05 07:42
Linux
大数据
hadoop
mapreduce
java
HDFS基础
块名称节点和数据节点在搭建
hadoop集群
时配置core-site.xml文件配置了hadoop.tmp.dir是NameNode的主目录。
_小许_
·
2023-10-05 05:15
大数据
hdfs
dfs
大数据
配置
hadoop集群
常见报错汇总
配置
hadoop集群
常见报错汇总1、使用hdfsnamenode-format格式化报错找不到JAVAHOME该问题只需在对应的窗口导入JAVAHOME即可,注意,此处为对应环境安装的JDK路径,笔者为
m0_67402341
·
2023-10-05 04:18
java
hadoop
hdfs
大数据
分布式
ubuntu
【译】Apache Hadoop 系列之三(用户指南)
目的该文档是用户使用Hadpoop分布式文件系统(HDFS)的起点,不管是作为
hadoop集群
的一部分来使用还是独立的通用分布式文件系统。
Kooola大数据
·
2023-10-04 16:02
hadoop wordcount示例运行
0.安装
hadoop集群
前提是
hadoop集群
已经安装好1.在本地建立1.txt文件txt中内容.png2.将文件拷贝至hdfs创建文件夹hdfsdfs-mkdir文件夹名拷贝文件hdfsdfs-put
五百一十七XX
·
2023-10-03 20:38
hadoop面试题!这6个!经常问!
例如,1GB(即1024MB)文本文件可以拆分为16*128MB文件,并存储在
Hadoop集群
中的8个不同节点上。每个拆分可以复
yoku酱
·
2023-10-03 17:41
大数据技术之Hadoop(三)
➢伪分布式模式:也是单机运行,但是具备
Hadoop集群
的所有功能,一台服务器模拟一个分布式的环境。个别缺钱的公司用来测试,生产环境不用。➢完全分布式模式:多台服务器组成分布式环境。生产环境使用。
pauls
·
2023-10-03 14:03
Hadoop2.x安全:Window下Kerberos客户端安装及浏览器配置
问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读
Hadoop集群
启用Kerberos认证后,我们平时需要在Window
大数据开发运维架构
·
2023-10-02 16:05
hadoop报错,ERROR Invalid HADOOP_COMMON_HOME)
hadoop报错,ERROR:InvalidHADOOP_COMMON_HOME在
hadoop集群
中,运行hadoop报错,ERROR:InvalidHADOOP_COMMON_HOME,的一个解决办法
web15285868498
·
2023-10-02 16:16
java
java
后端
Kafka学习笔记01
是使用接口这种方式怎么将日志文件导入到
Hadoop集群
呢?可以使用Flume,它可以时刻监控文件里面数据的变化,每产生一条日志,我都能监控得到,然后呢?并把这些数据传到
Hadoop集群
。
突然好想你之路在脚下
·
2023-10-02 06:38
Kafka
kafka
学习
笔记
Ambari2.6.2 和HDP2.6.5搭建
Hadoop集群
-02_CentOS7.5 常用配置与基础优化
配置yum源把系统自带的源移动到别处,也可以直接删了mkdir-p/tmp/repo-bakmv/etc/yum.repos.d/*/tmp/repo-bak/配置阿里云基础yum源和epel源cd/etc/yum.repos.d/curlhttp://mirrors.aliyun.com/repo/Centos-7.repo-oCentos-7.repocurlhttp://mirrors.al
wk86
·
2023-09-30 20:37
hadoop集群
作用
Hadoop主要解决海量数据存储与计算的问题,是大数据技术中的基石。Hadoop具体是做:1、海量数据存储;2、资源管理,调度和分配;3、并行数据处理。Hadoop以一种可靠、高效、可伸缩的方式进行数据处理。
是草莓熊吖
·
2023-09-30 07:21
Educoder
hadoop
大数据
hadoop
6个人如何维护上千规模的大数据集群?
其中6人的离线团队需要维护大数据集群规模如下:
Hadoop集群
规模1300+HDFS存量数据40+PB,Read3.5PB+/天,Write500TB+/天14WMRJob/天,10WSparkJob/
Alukar
·
2023-09-29 22:41
mac docker部署
hadoop集群
1.安装docker确保电脑已经安装dockerdocker安装过程可自行查找资料,mac下docker可以使用brew命令安装安装之后,查看docker版本,确认安装成功docker-v2.下载jdk最好下载jdk-8,jdk的版本过高可能hadoop2.x不支持jdk-8的下载地址:JavaDownloads|Oracle3.下载hadoop我下载的是hadoop3.3.4版本,下tar.gz
几窗花鸢
·
2023-09-29 12:20
hadoop
macos
docker
hadoop
Hadoop集群
配置HA,开启故障自动转移后NameNode未正常切换问题解决
集群做了HA,bigdata01机器默认为active,bigdata02机器为standby,为了测试高可用,认为kill掉bigdata01节点的Namenode进程,发现bigdata02上的NameNode进程并没有像预想中的称为active状态解决办法,在bigdata01和bigdata02节点[所以启动Namenode进程节点]上执行如下命令sudoyuminstallpsmisc然
Java_rainbow
·
2023-09-28 19:44
hadoop
大数据
java
Hadoop集群
安装部署
目录
Hadoop集群
安装部署1、集群环境准备2、建立免密通道3、集群时间同步4、jdk1.8安装5、hadoop安装部署6、Hadoop配置文件配置7、格式化操作8、启动
hadoop集群
启动HDFS集群
Wangsh@
·
2023-09-28 02:50
大数据
hadoop
linux
大数据
一、大数据技术基础——分布式文件系统HDFS
目录1.引入1.1.传统存储系统面临的难题1.2.解决之道2.
Hadoop集群
架构3.HDFS1.03.1.概念3.2.Block块3.3.NameNode维护文件:fsimage与editlog3.4
百颂伊
·
2023-09-28 02:48
大数据技术基础学习笔记
hadoop
大数据
Hadoop集群
大数据解决方案之搭建Hadoop3.X+HA模式
whyhadoop2.X?IBM上有篇论文讲的够详细了:文章链接。 最直观的改进就是是2.X多了Yarn资源管理器优化资源分配,以及新增有HA模式防止单点故障,搭建时可以用申请一年或者半年的免费云服务,当然也可以自己用虚拟机,若影用的呢是虚拟机模式的。 whyhadoop3.X?个人是纯属装逼来玩玩,可以参考官方文档更新,切记!企业用的时候千万不要用最新版,为啥?举个例子,Flink更新版
脆弱的天炎
·
2023-09-26 01:02
云计算与大数据——部署
Hadoop集群
并运行MapReduce集群(超级详细!)
云计算与大数据——部署
Hadoop集群
并运行MapReduce集群(超级详细!)
星川皆无恙
·
2023-09-25 05:13
大数据
系统运维
Linux
大数据
云计算
hadoop
分布式
运维
运维开发
database
Hive3远程模式安装
本文环境:Hadoop3.2.2JDK1.8.0_291MySQL5.7.35Hive3.1.2一、安装
Hadoop集群
Hadoop集群
部署参考这篇文章:《Hadoop完全分布式集群搭建详细图文教程》二
Yunis尤尼斯
·
2023-09-24 13:17
大数据
Hive
hive
大数据
hadoop
大数据学习技术栈及书籍推荐
一、
Hadoop集群
Hadoop是一个开源的分布式计算框架,用于存储和处理大规模数据集。它提供了可靠性、可扩展性和容错性,使得处理大数据变得更加高效
AI_Frank
·
2023-09-24 01:14
大数据
大数据
ambari
clickhouse
elasticsearch
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他