E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
——Hadoop集群
CentOS-7
Hadoop集群
部署
Hadoop集群
部署环境Hadoop目录结构
Hadoop集群
规划Hadoop下载Hadoop安装配置解压文件夹重命名赋予权限设置软连接配置环境变量配置文件修改HDFS集群workershadoop-env.shcore-site.xmlhdfs-site.xmlYARN
HeZaoCha
·
2023-11-03 15:37
大数据基础
Linux
centos
hadoop
linux
大数据平台搭建——基于mysql上搭建hive(基于CentOS-7)
说明:hive搭建必须建立在hadoop的基础上,如果想要了解如何搭建
hadoop集群
下面文章对你可能会有帮助,本次hive搭建主要采用MySQL8.1.0版本,Hive为3.1.1版本。
爱吃炸鸡的boy~~
·
2023-11-03 15:07
大数据
mysql
hive
大数据平台搭建——
hadoop集群
(基于CentOS-7)的搭建
目录总序一、下载相关软件的压缩包二、配置虚拟机上主节点相关设置1、修改主机用户名2、进行ip地址映射3、配置虚拟机网络设置三、解压并配置java、hadoop环境1、解压jdk、hadoop压缩文件2、配置jdk、hadoop环境3、修改hadoop中的相关配置文件信息(最重要)四、克隆两个子节点1、克隆虚拟机2、修改子节点机器的相关配置五、设置免密登录1、关闭防火墙和禁止启动防火墙(三个节点都需
爱吃炸鸡的boy~~
·
2023-11-03 15:06
大数据
hadoop
分布式
生产环境评估机器
学习了kafka的原理知识后,还要学会如何评估生产环境集群,如果是一个大数据架构师,这个是必须要会的,比如kafka集群、Hbase集群、
hadoop集群
,评估集群的方式差不多,现在以kafka为例。
yx️
·
2023-11-03 05:32
kafka
kafka
ubuntu部署flink集群 ,运行wordcount 例子
说明:事先完成了以下的准备工作:ubuntu16安装了
hadoop集群
(完全分布式)
hadoop集群
有5个节点:hadoop1~hadoop6(没有hadoop2)每个节点都安装了flink-1.12.0
Sonder_s
·
2023-11-03 03:47
flink
flink
java
大数据
HIve部署
文章目录1.部署
hadoop集群
2.部署HIVE1.部署
hadoop集群
机器准备3台,关闭防火墙hadoop1192.168.200.41hadoop2192.168.200.43hadoop2192.168.200.43
L白眸
·
2023-11-02 19:06
hadoop
hive
hadoop
数据仓库
viewfs://为Hadoop 中的一个特殊文件系统
要使用viewfs://,你需要了解以下几个步骤:配置ViewFS:在
Hadoop集群
中的配置文
言之。
·
2023-11-01 11:10
hadoop
大数据
分布式
报错:-bash: /usr/local/jdk/bin/java: Permission denied
问题:在搭
hadoop集群
格式化hdfs时的报错,-bash:/usr/local/jdk/bin/java:Permissiondenied,发现jdk用不了,/usr/local/jdk/bin/java
黄丕理
·
2023-11-01 07:52
报错
java
bash
hadoop
UDF 编写与注册
功能对数据加解密方式处理环境hadoop2.6.0+cdh5.11.2hive1.1.0+cdh5.11.2java1.8.xxx配置新加入
hadoop集群
的服务器需要放/opt/logs/env.properties
大怀特
·
2023-11-01 07:20
bigdata
hive
spark
大数据环境搭建
大数据环境搭建linux环境安装VM虚拟机centos创建用户并赋予权限ssh免密登录配置编写集群分发脚本xsync安装jdk集群所有进程查看脚本hadoop环境配置
Hadoop集群
Hadoop环境
hadoop
yulishi12
·
2023-11-01 07:36
大数据框架
大数据
linux
运维
hadoop
hive
hadoop权威指南第四版
允许其他分布式系统对
hadoop集群
数据运行。迭代处理(iterativeprocess
春风不会绿大地
·
2023-10-31 17:11
hadoop
大数据
分布式
(四)大数据集群运维
大数据集群运维ES常见运维命令windows和linux常用命令文章目录大数据集群运维1:集群扩容均衡1.1:hdfs均衡1.2:kafka均衡1.3:es均衡2:
hadoop集群
服务角色汇总2.1:hdfs2.2
猿来如此dj
·
2023-10-31 12:39
hadoop专栏
运维
hadoop
大数据
hdfs
监控cpu使用率大于500%的任务并发送告警信息
背景:
hadoop集群
节点存在cpu告警的信息,不知道具体哪个应用造成cpu告警的,编写了脚本获取到占用cpu使用最高的前5个进程,并发送告警。
临风赏月
·
2023-10-31 12:08
hadoop
大数据
分布式
6个人如何维护上千规模的大数据集群?
其中6人的离线团队需要维护大数据集群规模如下:
Hadoop集群
规模1300+HDFS存量数据40+PB,Read3.5PB+/天,Write500TB+/天14WMRJob/天,10WSparkJob/
郭首志
·
2023-10-31 12:05
大数据-Storm流式框架(八)---Storm案例
中国移动项目部署文档一、项目架构二、启动集群1、启动Zookeeper集群2、启动Hbase(完全分布式需要先启动
Hadoop集群
)在conf/hbase-env.sh中设置JAVA_HOME在conf
30岁老阿姨
·
2023-10-31 06:49
Storm
大数据
storm
windows平台使用Docker搭建分布式Spark 与
hadoop集群
若不关心具体搭建过程,只想运行分布式集群,请直接前往3.2开始(本人已上传镜像至服务器)续前节windows平台使用Docker搭建分布式
hadoop集群
安装分布式Spark篇1.运行windows平台使用
CMCST
·
2023-10-30 18:10
spark
BigData学习日志
hadoop
spark
分布式
spark
sparkSpark可以将
Hadoop集群
中的应用在内存中的运行速度提升100倍,甚至能够将应用在磁盘上的运行速度提升10倍。
haobu枳
·
2023-10-30 08:07
spark
ajax
javascript
Hadoop问题:The auxService:mapreduce_shuffle does not exist
mapreduce_shuffledoesnotexist问题分析:yarn-site.xml配置文件有问题(注意单词拼写)问题解决:vim/usr/local/hadoop/etc/hadoop/yarn-site.xml重启
hadoop
红叶゜
·
2023-10-30 07:26
报错
hadoop
大数据之 impala教程
Impala是用于处理存储在
Hadoop集群
中的大量数据的MPP(大规模并行处理)SQL查询引擎。它是一个用C++和Java编写的开源软件。与其他Hadoop的SQL引擎相比,它提供了高性能和低延迟。
种麦南山下
·
2023-10-30 07:45
hadoop
大数据
hadoop
hive
Hadoop的一些常见错误解决方案
1、启动hadoop时没有NameNode的可能原因:(1)NameNode没有格式化(2)环境变量配置错误(3)Ip和hostname绑定失败2、搭建
hadoop集群
使用ssh不成功①查看防火墙②检查用户权限
魂落忘川犹在川
·
2023-10-30 00:00
大数据
Hadoop
Ambari删除节点
停止节点上所有组件3.删除节点在删除节点的命令行执行ambari-agentstop4.重启HDFS所有组件重启过程中可以看到NameNode一直在等待退出安全模式,执行退出安全模式的指令(切换用户为hdfs,在
Hadoop
字节侠
·
2023-10-29 22:10
大数据
Ambari
Hadoop报错Permission denied: user=dr.who, access....
一、提出问题:
Hadoop集群
上tmp文件夹上方出现红色代码串“Permissiondenied:user=dr.who,access=READ_EXECUTE,inode="/tmp":root:supergroup
玖玖1704
·
2023-10-29 02:07
hadoop
hdfs
sqoop与mysql的连接_sqoop连接mysql导入数据到hive
hadoop集群
环境,hadoop1.0.4192.168.1.23hadoopmaster192.168.1.25hadoopnodeone192.168.1.27hadoopnodetwomysql5.5.29database
weixin_39765588
·
2023-10-28 20:01
sqoop与mysql的连接
Hadoop学习总结(搭建
Hadoop集群
(伪分布式模式))
如果前面有搭建过
Hadoop集群
完全分布式模式,现在搭建Hadoop伪分布式模式可以选择直接克隆完全分布式模式中的主节点(hadoop001)。
Qinqin.J
·
2023-10-27 14:52
分布式
hadoop
学习
大数据
Spark On Hive原理和配置
MySQL密码三、Hive安装配置(1)修改Hadoop的core-site.xml(2)创建hive-site.xml(3)修改配置文件hive-env.sh(4)上传mysql连接驱动(5)初始化元数据(
Hadoop
吗喽也是命
·
2023-10-27 11:40
spark
hive
大数据
云计算中的大数据处理:尝试HDFS和MapReduce的应用
和MapReduce的应用一、前言二、第一题1、命令方式2、javaAPI方式三、第二题1、创建CSV文件并将其上传到HDFS2、编写利用MapReduce框架的java代码3、打包java项目4、在
Hadoop
-北天-
·
2023-10-26 19:48
大数据学习
云计算
hadoop
大数据
【智能大数据分析】实验1 MapReduce实验:单词计数
实验原理1MapReduce编程2JavaAPI解析四、实验步骤1启动Hadoop2验证HDFS上没有wordcount的文件夹3上传数据文件到HDFS4编写MapReduce程序5使用命令将代码打包6在
Hadoop
-北天-
·
2023-10-26 19:05
大数据学习
数据分析
mapreduce
大数据
hadoop集群
搭建
hadoop有三种部署方式1、Local(Standalone)Mode(单机模式)数据存储在本地2、Pseudo-DistributedMode(伪集群模式)数据存储在HDFS3、Fully-DistributedMode(集群模式)集群部署,数据存储在HDFS一、安装JDK因为hadoop是Java语言开发的,所以依赖jdk环境,需要先安装jdkJDK安装教程二、安装hadoop2.1、下载h
有人看我吗
·
2023-10-25 16:51
#
hadoop
hadoop
大数据
分布式
ubuntu服务器版本搭建
Hadoop集群
实验环境:虚拟化软件:VMware®Workstation16Pro镜像:ubuntu-22.04.2-live-server-amd64.isoHadoop版本:hadoop-3.3.4.tar.gzubuntu镜像链接hadoop文件链接配置虚拟机(1)新建虚拟机,选择实验镜像【ubuntu-22.04.2-live-server-amd64.iso】(2)调整硬件配置,配置如图安装操作系统(
junqiduhang
·
2023-10-24 20:36
服务器
ubuntu
hadoop
配置伪分布式
hadoop集群
(附常见配置问题)
实验目的安装单机伪分布式Hadoop并运行程序,熟悉
hadoop集群
的部署操作。目录见右边实验内容每人在自己本地电脑上正确安装和运行伪分布式Hadoop系统。安装完成后,自己寻找一组英文网页数据
ckqqqqq
·
2023-10-24 16:07
大数据
hadoop
阿里云
分布式
分布式集群上安装hive及问题解决
因为hive是数据仓库,它主要就是将执行的sql语句转化为mapreduce任务,存储结构化数据,其实数据还是存储在hdfs上的,所以依赖
hadoop集群
,在此我们将hive安装到master节点。
技多不压身
·
2023-10-24 15:10
hive
hive
mysql
hadoop
hive01
hive提供了HiveQL方言来查询存储在
hadoop集群
中的数据。h
流光丶
·
2023-10-24 06:51
大数据
手把手带你搭建Hadoop分布式集群
文章目录手把手带你搭建
Hadoop集群
虚拟机配置修改网络配置文件⚠ens33找不到三台机子--关闭防火墙三台机子--关闭selinux三台机子--修改主机名三台机子--主机名与ip地址映射三台机子--时钟同步三台机子
J1ay
·
2023-10-24 04:46
hadoop
分布式
hdfs
在mac上进行
hadoop集群
搭建
一、环境说明软件版本环境&软件版本操作系统&macOs11.2.1虚拟机&VMwareFusion12.1服务器&CentOS7.8jdk1.8hadoop2.9.2集群规划框架linux01linux02linux03HDFSNameNode、DataNodeDataNodeSecondaryNameNode、DataNodeYARNNodeManagerNodeManagerNodeManag
大鱼1995
·
2023-10-24 01:40
hadoop
hadoop
Mac-搭建
Hadoop集群
Youhavetoworkveryhardtobelievethatyouarereallypowerless.Mac-搭建
Hadoop集群
我用到了:VMwareFusion、CentOS7、FileZilla
weixin_30932215
·
2023-10-24 01:08
java
运维
数据库
大数据学习-Hadoop
离线计算预测分析:机器学习(对未来趋势进行预测)2.分布式与集群分布式:多台机器,不同组件分布式存储,分布式集群,多台机器集群:多台机器,相同组件3.Hadoop(卡大爷创建)hadoop简介4.docker搭建
hadoop
小七fighting
·
2023-10-24 01:30
大数据
hadoop
大数据
hdfs
在mac上如何安装和搭建
Hadoop集群
在macOS上安装和搭建
Hadoop集群
可以分为以下步骤:1、安装JavaHadoop需要依赖Java运行环境,因此需要先安装Java。
百态老人
·
2023-10-24 01:56
经验分享
hadoop
macos
大数据
hadoop调用HDFS java api实现在HDFS上创建文件夹
目录一、前期准备1、
Hadoop集群
已配置完毕2、Linux系统安装jdk3、安装并破解IntelliJIDEA二、通过JAVAAPI操纵HDFS1.在IDEA中创建项目2.在hdfs项目的src->main
db-冯春香-2064
·
2023-10-24 01:55
hadoop
java
hdfs
分布式
【Hadoop】创建
Hadoop集群
(3个节点)—— 安装部署一个3个节点构成的hbase集群
前言此实验搭建3个虚拟节点,一个mater,一个slave1,一个slave2集群简介
HADOOP集群
具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但在物理上常在一起。
db_lxm_2072
·
2023-10-23 14:22
hadoop
hdfs
大数据
Hadoop集群
环境配置及安装配置(详细过程包含安装包)
目录一、集群环境准备一、虚拟机安装二、克隆三、快照二、主机名,IP,ssh免密登录1.修改主机名2.设置IP(各节点的IP从主节点依次排序,node1为30,node2则为31,以此类推)3.主机映射4.ssh免密登录三、JDK安装部署(三台虚拟机都要安装)四.关闭防火墙和SElinux五、修改时区并配置自动时间同步Hadoop的前置环境基本配置完成,建议快照保存六、Hadoop安装与部署一、Ha
菜鸟一千零八十六号
·
2023-10-23 05:25
大数据
hadoop
linux
大数据
Hadoop集群
主节点迁移
主要目的是实现异地容灾主要迁移的服务有:•namenode(journalnodezkfc)•resourcemanager•hiveserver2•hivemetastore•hive元数据库mysql•zookeeper•freeipaservernamenode迁移先对现有的主从namenode进行一次主备切换a.先重启从节点,再重启主节点,使其完成一次元数据同步;在节点上启用hdfsran
卢说
·
2023-10-22 01:08
大数据
Hadoop
hadoop
大数据
分布式
记一次
Hadoop集群
数据上传缓慢案例分析
项目场景手上管理的其中一个
Hadoop集群
,承接着大量的数据流量,一直以来运行平稳,最近突然发现集群有时会出现MR作业运行缓慢,put文件至HDFS偶发速度慢的问题,像大数据集群这种问题,有点疑难杂症的味道
卢说
·
2023-10-22 01:37
Hadoop
hadoop
hdfs
大数据学习(17)-mapreduce task详解
乃是开启智慧的大门如果觉得博主的文章还不错的话,请点赞+收藏⭐️+留言支持一下博主哦MapReduceLocalTask和提交到YARN上运行的MapReduce任务有以下区别:执行环境:LocalTask是在本地执行,而YARN任务是在
Hadoop
viperrrrrrr
·
2023-10-22 00:54
大数据
学习
mapreduce
Hadoop学习总结(搭建
Hadoop集群
(完全分布式模式))
学习搭建
Hadoop集群
(完全分布式模式)链接:https://pan.baidu.com/s/1wwTKk-XxHbccHjE-Xk2PTA提取码:q7j7在SecurityCRT或者在Xshell进行虚拟机链接
Qinqin.J
·
2023-10-21 19:00
hadoop
学习
linux
大数据
启用Kerberos后,Windows上浏览器访问CDH页面的那些事
前言在对
Hadoop集群
施加安全认证的过程中,往往会有需要开启对应服务组件WebUI认证的需求。在启用认证后,如果直接使用浏览器打开WebUI页面,都会提示需要进行认证。
咕噜咕噜大数据
·
2023-10-20 08:47
大数据安全
CDH
大数据
kerberos
hadoop
大数据之Hadoop-MapReduce(1)
MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个
Hadoop集群
上。
jackyan163
·
2023-10-20 08:58
大数据
hadoop
mapreduce
big
data
Hive编程指南
第1章基础知识前言Hive提供了一个被称为Hive查询语言(简称HiveQL或HQL)的SQL语言,来查询存储在
Hadoop集群
中的数据;Hive可以将大多数的查询转换为MapReduce任务;Hive
weixin_43177696
·
2023-10-20 06:04
大数据经典书籍笔记
hadoop
hive
数据仓库
Hive篇面试题+详解
Hive是一个基于Hadoop的数据仓库工具,它提供了一个类SQL的查询语言(HiveQL)来查询和分析存储在
Hadoop集群
中的大规模数据。
Young_IT
·
2023-10-19 22:39
大数据开发
hadoop
hive
大数据
Hive知识梳理(好文)
可以将SQL查询转换为MapReduce的job在
Hadoop集群
上执行。元数据Hive元数据信息存储在HiveMetaStore中,或者mysql中。
英雄111888
·
2023-10-19 13:20
hive
hadoop
数据仓库
spark-shell启动失败
背景公司小组分配了三台虚拟机,在虚拟机上面意欲装
hadoop集群
及sparkonyarn版本Hadoop2.7.2spark2.3.2问题配置好
hadoop集群
与spark配置后,启动spark-shell
望山不是山
·
2023-10-19 08:20
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他