E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
——Hadoop集群
Apache Ranger的安装及部署
一.ApacheRanger简介Apacheranger是一个
Hadoop集群
权限框架,提供操作、监控、管理复杂的数据权限,它提供一个集中的管理机制,管理基于yarn的Hadoop生态圈的所有数据权限。
jianmin0920
·
2023-10-11 02:08
hdfs
大数据
Hadoop2.5.2+Zookeeper3.4.6 + HBase0.98.8-hadoop2环境搭建
Hadoop集群
Zookeeper集群1配置11zoocfg12分发到集群的其它机器13设置myid身份唯一标识14一些配置参数的解释2启动关闭3启动日志分析4测试验证5注意事项Hbase集群1配置11
码上笔记
·
2023-10-10 16:30
hbase
hadoop
hbase
zookeeper
Python操作Hive数据仓库
Python连接Hive需要使用Impala查询引擎由于
Hadoop集群
节点间使用RPC通信,所以需要配置Thrift依赖环境Thrift是一个轻量级、跨语言的RPC框架,主要用于服务间的RPC通信。
对许
·
2023-10-10 11:32
#
Python
#
Hive
#
数据分析
数据仓库
python
hive
Python+大数据-Hadoop生态-hadoop(二)--Apache Hadoop
Python+大数据-Hadoop生态-hadoop(二)–ApacheHadoop今日课程学习目标了解Hadoop发展历史、生态圈掌握
Hadoop集群
架构、角色掌握
Hadoop集群
分布式安装部署掌握JobHistoryServer
呆猛的呆呆小哥
·
2023-10-10 02:10
python+大数据
hadoop
大数据
apache
大数据集群(Hadoop生态)安装部署
目录1.简介2.前置要求3.
Hadoop集群
角色4.角色和节点分配5.调整虚拟机内存6.Zookeeper集群部署7.
Hadoop集群
部署7.1下载Hadoop安装包、解压、配置软链接7.2修改配置文件
时光の尘
·
2023-10-10 02:33
Linux学习
大数据
hadoop
分布式
开机启动
hadoop集群
(虚拟机)
一、背景在学习hadoop的时候,在本地通过VMware搭建了一个
hadoop集群
,但是由于每天电脑都需要重启,所以虚拟每天都会被关掉,所以想要写一个脚本一键启动虚拟机+
hadoop集群
二、实现方案一1
believe-xin
·
2023-10-09 17:16
Hadoop
vmware
linux
hadoop
【Linux】免密登录
hadoop完全分布式的集群的搭建,涉及到集群中各个机器之间的互访,因为
Hadoop集群
中各个机器间会相互地通过ssh访问,每次访问都输入密码是不现实的,所以要配置各个机器间的ssh是无密码登录的。
bkdl047
·
2023-10-09 13:19
Linux
linux
免密登录
hdfs shell的基本操作以及hdfsWeb查看文件
在安装好
hadoop集群
并成功的启动了hdfs之后,我们就可以利用hdfs对文件进行操作了,一下是对文件的一些基本操作hdfs基本操作1、查询命令hadoopdfs-ls/查询/目录下的所有文件和文件夹
音乐与咖啡Bean
·
2023-10-09 02:06
Hadoop(林子雨慕课课程)
文章目录2.Hadoop2.1Hadoop简介2.2Hadoop版本演变2.3Hadoop项目结构2.4
Hadoop集群
的部署和使用2.Hadoop2.1Hadoop简介Hadoop可以支持多种编程语言
几窗花鸢
·
2023-10-09 00:05
大数据应用
hadoop
hadoop
大数据
分布式
Hadoop2.x安全:
hadoop集群
之kerberos认证(一、原理+安装配置)
微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读一、为什么启用Kerberos安全认证大家都知道,Hadoop1.0.0或者CDH3版本以前,并没有安全认证的概念,用户与HDFS文件系统或者提交分布式任务(Mapreduce、Spark)都是不需
大数据开发运维架构
·
2023-10-08 15:16
Python数据攻略-
Hadoop集群
中PySpark数据处理
Hadoop是一个开源的分布式存储和计算框架。它让我们可以在多台机器上存储大量的数据,并且进行高效的数据处理。简而言之,Hadoop就像一个巨大的仓库,可以存放海量的数据,并且有高效的工具来处理这些数据。文章目录PySparkPySpark的基础操作创建RDDRDD转换操作(map,filter等)RDD动作操作(collect,reduce等)DataFrame创建DataFrameDataFr
Mr数据杨
·
2023-10-07 08:33
Python
数据攻略
python
hadoop
开发语言
Linux免密ssh自身不成功怎么解决,centos配置ssh免密码登录后仍要输入密码的解决方法...
前言在搭建linux集群服务的时候,主服务器需要启动从服务器的服务,如果通过手动启动,集群内服务器几台还好,要是像阿里1000台的云梯
Hadoop集群
的话,轨迹启动一次集群就得几个工程师一两天时间,是不是很恐怖
蒲玉恩
·
2023-10-07 07:16
Hadoop 伪分布式环境搭建
1、
hadoop集群
环境搭建之伪分布式集群环境搭建(一)https://blog.csdn.net/qq_33689414/article/details/792231862、CentOS7常用命令https
qlzx921
·
2023-10-07 06:41
Linux和Hadoop的学习
目录1.Linux的常用快捷键2.
Hadoop集群
部署问题汇总1.Linux的常用快捷键复制:Ctrl+shift+C粘贴:Ctrl+shift+VTAB:补全命令编写输入:i退出编写:esc保存并退出
蓝翔技校的码农
·
2023-10-07 05:26
linux
hadoop
学习
id_rsa id_pub 公钥与私钥
本文基于实际Linux管理工作,实例讲解工作中使用ssh证书登录的实际流程,讲解ssh证书登录的配置原理,基于配置原理,解决实际工作中,windows下使用SecureCRT证书登录的各种问题,以及实现
hadoop
LTIven
·
2023-10-06 09:38
前端开发
需要回头看的文章
js
成长轨迹
计算机其他技术知识
大数据实战 Linux Ubuntu 20.04.1 hadoop 2.8.5 在MapReduce平台 编写单词计数程序
详细如何搭建hadoop环境可以点击这里2.在server最小化系统进行单词计数2.1切换用户,查看进程目的:保证
hadoop集群
开启su-angel主节点进程从节点进程2.3建立测试文档测试文档的路径是
十旬叶大叔
·
2023-10-05 07:42
Linux
大数据
hadoop
mapreduce
java
HDFS基础
块名称节点和数据节点在搭建
hadoop集群
时配置core-site.xml文件配置了hadoop.tmp.dir是NameNode的主目录。
_小许_
·
2023-10-05 05:15
大数据
hdfs
dfs
大数据
配置
hadoop集群
常见报错汇总
配置
hadoop集群
常见报错汇总1、使用hdfsnamenode-format格式化报错找不到JAVAHOME该问题只需在对应的窗口导入JAVAHOME即可,注意,此处为对应环境安装的JDK路径,笔者为
m0_67402341
·
2023-10-05 04:18
java
hadoop
hdfs
大数据
分布式
ubuntu
【译】Apache Hadoop 系列之三(用户指南)
目的该文档是用户使用Hadpoop分布式文件系统(HDFS)的起点,不管是作为
hadoop集群
的一部分来使用还是独立的通用分布式文件系统。
Kooola大数据
·
2023-10-04 16:02
hadoop wordcount示例运行
0.安装
hadoop集群
前提是
hadoop集群
已经安装好1.在本地建立1.txt文件txt中内容.png2.将文件拷贝至hdfs创建文件夹hdfsdfs-mkdir文件夹名拷贝文件hdfsdfs-put
五百一十七XX
·
2023-10-03 20:38
hadoop面试题!这6个!经常问!
例如,1GB(即1024MB)文本文件可以拆分为16*128MB文件,并存储在
Hadoop集群
中的8个不同节点上。每个拆分可以复
yoku酱
·
2023-10-03 17:41
大数据技术之Hadoop(三)
➢伪分布式模式:也是单机运行,但是具备
Hadoop集群
的所有功能,一台服务器模拟一个分布式的环境。个别缺钱的公司用来测试,生产环境不用。➢完全分布式模式:多台服务器组成分布式环境。生产环境使用。
pauls
·
2023-10-03 14:03
Hadoop2.x安全:Window下Kerberos客户端安装及浏览器配置
问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读
Hadoop集群
启用Kerberos认证后,我们平时需要在Window
大数据开发运维架构
·
2023-10-02 16:05
hadoop报错,ERROR Invalid HADOOP_COMMON_HOME)
hadoop报错,ERROR:InvalidHADOOP_COMMON_HOME在
hadoop集群
中,运行hadoop报错,ERROR:InvalidHADOOP_COMMON_HOME,的一个解决办法
web15285868498
·
2023-10-02 16:16
java
java
后端
Kafka学习笔记01
是使用接口这种方式怎么将日志文件导入到
Hadoop集群
呢?可以使用Flume,它可以时刻监控文件里面数据的变化,每产生一条日志,我都能监控得到,然后呢?并把这些数据传到
Hadoop集群
。
突然好想你之路在脚下
·
2023-10-02 06:38
Kafka
kafka
学习
笔记
Ambari2.6.2 和HDP2.6.5搭建
Hadoop集群
-02_CentOS7.5 常用配置与基础优化
配置yum源把系统自带的源移动到别处,也可以直接删了mkdir-p/tmp/repo-bakmv/etc/yum.repos.d/*/tmp/repo-bak/配置阿里云基础yum源和epel源cd/etc/yum.repos.d/curlhttp://mirrors.aliyun.com/repo/Centos-7.repo-oCentos-7.repocurlhttp://mirrors.al
wk86
·
2023-09-30 20:37
hadoop集群
作用
Hadoop主要解决海量数据存储与计算的问题,是大数据技术中的基石。Hadoop具体是做:1、海量数据存储;2、资源管理,调度和分配;3、并行数据处理。Hadoop以一种可靠、高效、可伸缩的方式进行数据处理。
是草莓熊吖
·
2023-09-30 07:21
Educoder
hadoop
大数据
hadoop
6个人如何维护上千规模的大数据集群?
其中6人的离线团队需要维护大数据集群规模如下:
Hadoop集群
规模1300+HDFS存量数据40+PB,Read3.5PB+/天,Write500TB+/天14WMRJob/天,10WSparkJob/
Alukar
·
2023-09-29 22:41
mac docker部署
hadoop集群
1.安装docker确保电脑已经安装dockerdocker安装过程可自行查找资料,mac下docker可以使用brew命令安装安装之后,查看docker版本,确认安装成功docker-v2.下载jdk最好下载jdk-8,jdk的版本过高可能hadoop2.x不支持jdk-8的下载地址:JavaDownloads|Oracle3.下载hadoop我下载的是hadoop3.3.4版本,下tar.gz
几窗花鸢
·
2023-09-29 12:20
hadoop
macos
docker
hadoop
Hadoop集群
配置HA,开启故障自动转移后NameNode未正常切换问题解决
集群做了HA,bigdata01机器默认为active,bigdata02机器为standby,为了测试高可用,认为kill掉bigdata01节点的Namenode进程,发现bigdata02上的NameNode进程并没有像预想中的称为active状态解决办法,在bigdata01和bigdata02节点[所以启动Namenode进程节点]上执行如下命令sudoyuminstallpsmisc然
Java_rainbow
·
2023-09-28 19:44
hadoop
大数据
java
Hadoop集群
安装部署
目录
Hadoop集群
安装部署1、集群环境准备2、建立免密通道3、集群时间同步4、jdk1.8安装5、hadoop安装部署6、Hadoop配置文件配置7、格式化操作8、启动
hadoop集群
启动HDFS集群
Wangsh@
·
2023-09-28 02:50
大数据
hadoop
linux
大数据
一、大数据技术基础——分布式文件系统HDFS
目录1.引入1.1.传统存储系统面临的难题1.2.解决之道2.
Hadoop集群
架构3.HDFS1.03.1.概念3.2.Block块3.3.NameNode维护文件:fsimage与editlog3.4
百颂伊
·
2023-09-28 02:48
大数据技术基础学习笔记
hadoop
大数据
Hadoop集群
大数据解决方案之搭建Hadoop3.X+HA模式
whyhadoop2.X?IBM上有篇论文讲的够详细了:文章链接。 最直观的改进就是是2.X多了Yarn资源管理器优化资源分配,以及新增有HA模式防止单点故障,搭建时可以用申请一年或者半年的免费云服务,当然也可以自己用虚拟机,若影用的呢是虚拟机模式的。 whyhadoop3.X?个人是纯属装逼来玩玩,可以参考官方文档更新,切记!企业用的时候千万不要用最新版,为啥?举个例子,Flink更新版
脆弱的天炎
·
2023-09-26 01:02
云计算与大数据——部署
Hadoop集群
并运行MapReduce集群(超级详细!)
云计算与大数据——部署
Hadoop集群
并运行MapReduce集群(超级详细!)
星川皆无恙
·
2023-09-25 05:13
大数据
系统运维
Linux
大数据
云计算
hadoop
分布式
运维
运维开发
database
Hive3远程模式安装
本文环境:Hadoop3.2.2JDK1.8.0_291MySQL5.7.35Hive3.1.2一、安装
Hadoop集群
Hadoop集群
部署参考这篇文章:《Hadoop完全分布式集群搭建详细图文教程》二
Yunis尤尼斯
·
2023-09-24 13:17
大数据
Hive
hive
大数据
hadoop
大数据学习技术栈及书籍推荐
一、
Hadoop集群
Hadoop是一个开源的分布式计算框架,用于存储和处理大规模数据集。它提供了可靠性、可扩展性和容错性,使得处理大数据变得更加高效
AI_Frank
·
2023-09-24 01:14
大数据
大数据
ambari
clickhouse
elasticsearch
spark技术架构、工作机制,及安装使用
Spark对于反复用到的数据进行缓存,减少中间结果写入磁盘和不必要的sort、shuffle,并对于DAG进行了高度的优化,划分不同的stage和使用了延迟计算技术,可以将
Hadoop集群
中的应用在内存中的运行速度提升
沉思的雨季
·
2023-09-23 18:26
Flink的部署模式:Local模式、Standalone模式、Flink On Yarn模式
部署、执行模式Flink的部署模式Flink的执行模式Local本地模式下载安装启动、停止Flink提交测试任务停止作业Standalone独立模式会话模式单作业模式应用模式YARN运行模式会话模式启动
Hadoop
CodeDevMaster
·
2023-09-23 07:42
#
Flink
flink
大数据
yarn
hadoop
Ranger通过keberos认证安装Hive插件
在普通
hadoop集群
下网上已经有很多讲解,一般参考官方wiki就可以,整体安装也比较简单,这里可以参考。
HelloWide
·
2023-09-22 16:00
Hadoop集群
之HDFS
HDFS简介HDFS全称HadoopDistributedFileSystem,是一个分布式文件系统,基于Google三大论文之一的GoogleFileSystem开发。主要为了解决在多个普通的节点(廉价的机器,只要有存储空间,cpu和内存要求不高)上存储并访问日益增长的业务数据,并且在理论上可以实现横向无限扩展。架构介绍HDFS采用的是主从架构(Master/Slave),其中namenode是
风起云端
·
2023-09-22 03:33
虚拟机搭建
Hadoop集群
环境-CentOS篇
文章目录Linux环境安装虚拟机环境准备虚拟机克隆修改虚拟机IP修改主机名创建普通用户重启虚拟机使用Xshell远程访问集群搭建安装JDK安装Hadoop关闭防火墙其它节点虚拟机克隆配置SSH无密钥登录编写文件集群分发脚本修改Hadoop配置为集群配置集群时间同步Linux环境安装具体步骤参考博客。虚拟机环境准备虚拟机克隆在前一步骤中准备好安装了CentOS7的虚拟机,克隆一个虚拟机出来,过程如下
书隐辞
·
2023-09-22 02:16
大数据开发
大数据
hadoop
centos
大数据运维---
hadoop集群
基础环境的配置
准备三台虚拟机,三个节点,CentOS1.配置静态ip(三台都要配置):进入网卡ens33的配置页面[root@localhost~]#vi/etc/sysconfig/network-scripts/ifcfg-ens33TYPE=EthernetPROXY_METHOD=noneBROWSER_ONLY=noBOOTPROTO=static//修改:将原先的dhcp修改为staticDEFRO
w_sunset
·
2023-09-22 02:16
大数据运维
运维
hadoop
编程语言
linux
VMware VMnet8 模式共享主机网络配置静态 IP 和 DNS
一、简介NAT网络模式:1.宿主机可以看做一个路由器,虚拟机通过宿主机的网络来访问Internet;2.可以安装多台虚拟机,组成一个小型局域网,例如:搭建
hadoop集群
、分布式服务。
WGH100817
·
2023-09-22 00:30
Sqoop(SQL to Hadoop)数据传输工具:用于在Hadoop和关系数据库服务器之间传输数据
Sqoop使数据工程师和数据科学家能够轻松地在
Hadoop集群
和传统关系数据库之间移
源代码杀手
·
2023-09-21 18:11
快速入门大数据与机器学习基础
hadoop
sqoop
sql
hadoop集群
搭建
vim/etc/hosts192.168.1.2Master.Hadoop192.168.1.3Slave1.Hadoop192.168.1.4Slave2.Hadoop192.168.1.5Slave3.Hadoop若能用主机名进行ping通,说明刚才添加的内容,在局域网内能进行DNS解析。hadoop:https://dlcdn.apache.org/hadoop/common/hadoop-
我有甜甜
·
2023-09-21 15:45
hadoop
大数据
分布式
Hadoop集群
搭建的总结
准备工作虚拟机安装三台linux,可以先安装一台虚拟器,然后进行克隆。这里我使用的是:centos6.5ip配置配置网络虚拟编辑器。如果是采用克隆的机器,注意修改mac地址,和ip地址。修改主机名vi/etc/sysconfig/network设置一台机器为master,另外两台为:node1,node2。集群搭建步骤1.设置ip:使用命令servicenetworkrestart重启网卡2.关闭
qq_40178533
·
2023-09-21 05:43
大数据学习
hadoop
大数据
centos
java
Hadoop学习总结(搭建
Hadoop集群
的安装准备)
目录一、安装jdk1、查看电脑中安装的jdk版本2、安装jdk173、配置path(配置jdk)4、对jdk8和jdk17版本做自由切换二、安装vmware三、安装centos7(虚拟机)四、虚拟机设置五、虚拟机网络配置1、查看NAT的网段2、修改主机名(1)修改虚拟机的hosts(2)修改虚拟机的hostname3、在Windows中ping虚拟机六、其他的配置1、使用远程工具2、安装一些必要的
Qinqin.J
·
2023-09-21 05:07
hadoop
学习
java
linux
Hadoop集群
--(2)启动&初体验
1.启动方式要启动
Hadoop集群
,需要启动HDFS和YARN两个集群注意:首次启动HDFS时,必须对其进行格式化操作。
周凡_07b2
·
2023-09-21 02:06
Hdoop伪分布式集群搭建
配置时钟同步(4)关闭防火墙(二)正文(1)配置hosts列表(2)SSH免密钥登录配置①master虚拟机上②slave01虚拟机上③slave02虚拟机上④验证免密登录(3)安装JDK(4)安装部署
Hadoop
陈七.
·
2023-09-20 22:27
Linux开发
分布式
hadoop
大数据
hiveserver2 和beeline_Beeline连接Hiveserver2错误
错误定位最近给
hadoop集群
配置了kerberos认证,之后准备配置sentry进行权限管理。安装并启用sentry服务后需要在beeline进行Grant等授权操作。
weixin_39633134
·
2023-09-20 22:36
hiveserver2
和beeline
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他