E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
********HDFS
K8S集群创建用户并赋权访问特定namespace
文章目录环境集群搭建创建
HDFS
集群目的创建用户赋权切换用户验证环境软件版本centos7.4-1708docker18.03.0-cekubernetes1.17.0集群搭建https://blog.csdn.net
再看我把你吃掉
·
2023-11-10 10:57
Kubernetes
kubernetes
docker
linux
hadoop
数据湖浅析(以hudi为例)
hive的痛点:hive主要特性是提供了sql解析和元数据管理的功能,统一管理了存储在
hdfs
上数据的shcmea信息。
weixin_45626756
·
2023-11-10 06:44
hive
大数据
hadoop
数据湖
hudi
hadoop、zookeeper、mysql等pid文件权限不对无法启动问题
在学习大数据的阶段,难免会遇到没有一步步关闭
hdfs
、yarn之类就直接关电脑的情况,下次来的时候就会发现,咦,怎么打不开了,一看报错是xxx.pid拒绝访问什么的,这时候就是pid的问题,这里对PID
努力改掉拖延症的小白
·
2023-11-10 05:05
Linux
MySQL
hadoop
linux
java
mysql
hadoop
数据库
大数据开发笔记(十):Hbase实践
✨大数据开发笔记推荐:大数据开发面试知识点总结_GoAI的博客-CSDN博客_大数据开发面试本文详细介绍大数据hadoop生态圈各部分知识,包括不限于
hdfs
、yarn、mapreduce、hive、sqoop
GoAI
·
2023-11-10 02:56
#
Hbase
大数据笔记
大数据
hadoop
mysql
zookeeper
hbase
HBase学习笔记(1)—— 知识点总结
目录HBase概述HBase基本架构HBase安装部署启动HBaseShellHBase数据读写流程HBase优化HBase概述HBase是以
hdfs
为数据存储的,一种分布式、非关系型的、可扩展的NoSQL
THE WHY
·
2023-11-10 02:21
数据库
大数据
hbase
nosql
时序数据库
数据库
Hadoop原理,
HDFS
架构,MapReduce原理
Hadoop原理,
HDFS
架构,MapReduce原理2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开测开的话,你就得学数据库,sql,oracle
冰露可乐
·
2023-11-10 00:27
国考
数据挖掘
hadoop
hdfs
架构
MapReduce
国考网警
Hadoop相关
hdfs
getconf-confKeydfs.namenode.http-address查看Hadoop工作端口的信息
hdfs
getconf-confKeydfs.datanode.http.address
小美美大白蛋
·
2023-11-09 23:56
hadoop
大数据
分布式
spark on yarn idea错误: 找不到或无法加载主类org.apache.spark.deploy.yarn.ExecutorLauncher
依赖的jar包目录.set("spark.yarn.jars","C:\\Users\\han\\Desktop\\test\\dns_project\\target\\dns_project.jar,
hdfs
一位不愿透露姓名的肥宅
·
2023-11-09 20:17
bug
spark
大数据
intellij-idea
yarn
java spark读写
hdfs
文件_Spark读取
HDFS
中的Zip文件
1.任务背景近日有个项目任务,要求读取压缩在Zip中的百科HTML文件,经分析发现,提供的Zip文件有如下特点(=>指代对应解决方案):(1)压缩为分卷文件=>只需将解压缩在同一目录中的一个分卷zip即可解压缩出整个文件(2)压缩文件中又包含不同的两个文件夹,且各包含n个小zip文件,小zip文件中包含目录及对应的HTML文本文件采用第一方案:依次解压缩各小zip文件,存放在一个目录中,然后上传到
中国青年郑国成
·
2023-11-09 14:58
java
spark读写hdfs文件
Spark—文件的读取与保存
文件格式分为:text文件、csv文件、sequence文件以及Object文件;文件系统分为:本地文件系统、
HDFS
、HBASE以及数据库。1、text文件//读取输入文件valinputRDD
Jerry Hong
·
2023-11-09 14:58
Spark
spark
scala
大数据
Spark--RDD文件读取与保存
文件格式分为:text文件、csv文件、sequence文件以及Object文件文件系统分为:本地文件系统、
HDFS
、HBASE以及数据库objectSpark_rdd_01{defmain(args:
小陈菜奈-
·
2023-11-09 14:55
Scala&Spark
spark
scala
big
data
SparkCore和SparkSql读取与保存
hdfs
文件的方法
/IP地址:7077”)//这里你可以写local,我这样写是可以看做是在用spark-on-yarnvalsc=newSparkContext(conf);valdata=sc.textFile(“
hdfs
尘世壹俗人
·
2023-11-09 14:24
大数据Spark技术
spark
大数据
【Hadoop】Hadoop体系知识点梳理(目录)
Hadoop体系知识点梳理(目录)核心点第一章:Hadoop背景知识与起源第二章:搭建Hadoop环境第三章:
HDFS
体系架构第四章:
HDFS
第五章:MapReduce第六章:Hbase第七章:Hive
lys_828
·
2023-11-09 11:49
大数据开发工程师
大数据
hadoop
java
目录
2. Spark报错,Task is Failed,errorMsg: FileNotFoundException xxxx
完整报错信息21304,TaskisFailed,errorMsg:FileNotFoundException:Filedoesnotexist:
hdfs
://xxxx-bigdata-nameservice
helloooi
·
2023-11-09 10:27
#
Spark
spark
大数据
分布式
Hadoop学习笔记(持续更新中)
文章目录HadoopHadoop的组成
HDFS
特点NameNode和DataNode文件系统命名空间数据块块缓存MapReducejob、task、inputsplitcombiner其他示例HadoopHadoop
东河西
·
2023-11-09 09:19
大数据
hadoop
SpringBoot整合 MinIO 分布式对象存储
对象存储可以充当主存储层,以处理Spark、Presto、TensorFlow、H2O.ai等各种复杂工作负载以及成为Hadoop
HDFS
的替代品。可扩展性:
码小呆~
·
2023-11-09 09:36
Springboot
java
docker
spring
boot
minio
hbase2.5.5安装 hadoop3.3.5
true"exportHBASE_MANAGES_ZK=false2.hbase-site.shhbase.tmp.dir/opt/module/hbase-2.5.5/tmphbase.rootdir
hdfs
weixin_54735428
·
2023-11-09 08:16
hbase
java.lang.IllegalArgumentException: Wrong FS://expected: file:///
有错误提示file:///的提示信息是想需要本地文件系统(file:///为本地文件系统标识),代码无法识别
HDFS
文件系统,需要在Configuration中配置相应的参数。
ZL小屁孩
·
2023-11-09 05:16
hadoop生态
hdfs
6、NIFI综合应用场景-离线同步Mysql数据到
HDFS
中
NIFI处理器介绍、FlowFlie常见属性、模板介绍和运行情况信息查看4、集群部署及验证、监控及节点管理5、NiFiFileFlow示例和NIFI模板示例6、NIFI应用场景-离线同步Mysql数据到
HDFS
一瓢一瓢的饮 alanchan
·
2023-11-09 04:22
大数据相关组件介绍
hdfs
mysql
大数据
big
data
分布式
数仓面经大框架
1.计算机及编程基础:操作系统:进程、线程等数据结构:算法题计算机网络:分层等Linux:常用的指令MySQL(重点)Java/Python基础排序算法(快排、归并等)2.大数据组件Hadoop:
HDFS
Young_IT
·
2023-11-09 02:03
大数据开发
大数据
数据仓库
数据分析
启动hive时报: Call From hadoop /192.168.1.128 to hadoop :9000 failed on connection
core-site.xml文件配置时,目录写错,导致无法正确找到namenode相关信息,修改后保存解决办法:格式化namenode进入hadoop/bin输入命令格式化hadoopnamenode-format(
hdfs
namenode-format
M_y_y
·
2023-11-08 23:58
linux
异常解决
yarn+MapReduce入门
yarn+MapReduce入门yarn主要模块MapReduceonyarnSchedulerMapReduce入门
hdfs
存储yarn资源调度分配MapReduce计算yarn主要模块ResourceManger
zhangyujie12138
·
2023-11-08 20:49
hadoop
yarn
mapreduce
Flink -- 状态与容错
2、CheckPoint:1、CheckPoint:定时将Flink的计算的状态持久化到
Hdfs
上,如果Flink的任务
新手小农
·
2023-11-08 17:37
Flink
1.15.2
flink
大数据
Automatic failover is enabled for NameNode at PS-DEVICE-ID-YDGZ-112012/10.198.112.12:8020 Refusing t
/bin/
hdfs
haadmin-transitionToActivenn1--forceactive执行报错:AutomaticfailoverisenabledforNameNodeatPS-DEVICE-ID-YDGZ
不吃饭的猪
·
2023-11-08 16:20
hadoop
本教程旨在为正在构建,部署和使用CarbonData的最终用户和开发人员提供故障排除。
加载数据时,出现tablestatus.lock问题症状:17/11/1116:48:13ERRORLocalFileLock:main
hdfs
:/localhost:9000/carbon/store
不吃饭的猪
·
2023-11-08 16:20
大数据
rancher或者其他容器平台使用非root用户启动jar
场景:java程序打成镜像,在rancher上运行,默认是root账户,发现
hdfs
或者hive不允许root账户操作;所以打算用费root账户启动jar,使其具有hive和
hdfs
的操作权限。
早退的程序员
·
2023-11-08 13:24
rancher
jar
java
hadoop 安装到配置-2021-11-4
的配置更改主机名配置本地域名解析(host)设置linux防火墙关闭防火墙:防火墙配置文件:配置ssh(免密连接)安装java安装hadoop安装配置文件描述:独立安装hadoop-env.shcore-site.xml
hdfs
-site.xmlmapred-site.xmlyarn-site.xmlarn
JiaJunRun
·
2023-11-08 09:32
工具安装
测试分栏
hadoop
linux
大数据
Spark提交代码到集群中运行
一、将Spark代码提交到集群:1、将setMaster注释:2、注意输入和输出的路径,必须是
HDFS
存在的某个路径3、使用maven将代码打成jar包并上传4、构建提交命令(使用的是cluster):
新手小农
·
2023-11-08 09:23
Spark
spark
大数据
分布式
Kafka(消息队列)--简介
1、kafka:是一个高吞吐的分布式消息系统,与
Hdfs
比较相似,但是与
hdfs
的区别是在于
hdfs
是存储的是历史的、海量的数据,然而kafka存储的是实时的、最新的数据。
新手小农
·
2023-11-08 09:14
Kafka
2.11-1.0.0
kafka
分布式
airflow mysql_Airflow 使用及原理分析
这个平台拥有和Hive、Presto、MySQL、
HDFS
、Postgres等数据源
weixin_39549110
·
2023-11-08 06:40
airflow
mysql
Hadoop中Yarn资源调度器、Yarn工作机制、作业提交全过程、Yarn调度器和调度算法、先进先出调度器(FIFO)、容量调度器(Capacity Scheduler)、公平调度器(Fair Sc
文章目录16.Yarn资源调度器16.1Yarn基础架构16.2Yarn工作机制16.3作业提交全过程16.3.1
HDFS
、YARN、MapReduce三者关系16.3.2作业提交过程值YARN16.3.3
Redamancy_06
·
2023-11-08 05:03
#
Hadoop
hadoop
大数据
分布式
Hadoop不主动退出安全模式
hdfs
dfsadmin-safemodeget查看安全模式的状态
hdfs
dfsadmin-safemodeleave主动关闭安全模式或者
hdfs
fsck/查看损坏的数据块
hdfs
fsck/-delete
南城守护
·
2023-11-07 22:26
hadoop
大数据
分布式
Hadoop从入门到入土(第五天)
cd/opt/module/hadoop文件名>ll>cdetc/hadoop/>复制(fs.defaultFS
hdfs
://hadoop102:8020hadoo
南城守护
·
2023-11-07 22:56
hadoop
hdfs
big
data
云服务器搭建flink集群
2.修改集群配置3.访问WebUI4.提交作业方式5.Yarn部署模式配置5.1会话模式部署(SessionMode)5.2单作业模式(Per-jobMode)5.3应用模式部署(推荐)5.3.1上传
HDFS
几窗花鸢
·
2023-11-07 22:47
大数据应用
hadoop
服务器
flink
大数据
DataX数据同步工具
DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、
HDFS
、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS
躺着听Jay
·
2023-11-07 17:23
大数据
数据仓库
Hadoop知识点全面总结
文章目录什么是HadoopHadoop发行版介绍Hadoop版本演变历史Hadoop3.x的细节优化Hadoop三大核心组件介绍
HDFS
体系结构NameNode介绍总结SecondaryNameNode
小崔的技术博客
·
2023-11-07 08:40
大数据学习
hadoop
大数据
分布式
Haddop,
HDFS
和MapDeduce简单理论
HadoopHadoop1Hadoop2
HDFS
3.MapDeduceHadoop1Hadoop开源的分布式存储+分布式计算平台核心组件:
HDFS
:分布式文件系统,存储海量数据。
杰KaMi
·
2023-11-07 06:25
linux
hadoop
大数据
面试最新整理常问Spark知识点
RDD的五个特性:1.AlistofpartitionsRDD是一个由多个partition(某个节点里的某一片连续的数据)组成的的list;将数据加载为RDD时,一般会遵循数据的本地性(一般一个
hdfs
000X000
·
2023-11-07 05:13
Spark
Spark知识点
面试
Spark Streaming知识点总结
而结果也能保存在很多地方,如
HDFS
,数
「miraitowa」
·
2023-11-07 05:41
Spark
大数据
spark
Spark基础知识点
分布式文件系统(HadoopDistributedFileSystem)当数据集达到一定规模,单机无法处理把数据分布到各个独立的机器上(多机器共同协作)网络
HDFS
优缺点优点:构建在廉价的机器上使用大数据处理高容错硬件错误流式数据访问大规模数据集简单的一致性模型
蛋炒双黄蛋
·
2023-11-07 05:04
Spark
数据库
Java-Hbase介绍
HDFS
为Hbase提供可靠的底层数据存储服务,MapReduce为Hbase提供高性能的计算能力,Zookeeper为Hbase提供稳定服务和Failover机制,因此我们说Hbase是一个通过大量廉价的机器解决海量数据的高速存储和读取的分布式数据库解决方案
狠情
·
2023-11-06 23:05
hbase
数据库
大数据
Hadoop分布式系统架构详解
分组:比如有一个大型数据,那么他就会将这个数据按照算法分成多份,每份存储在从属主机上,并且在从属主机上进行计算,主节点主要负责Hadoop两个关键功能模块
HDFS
、MapReduce的监督。
25577033_malong
·
2023-11-06 19:30
大数据
hadoop
架构
big
data
HDFS
速通之一文详解
HDFS
全部知识点
文章目录
HDFS
介绍
HDFS
体系
HDFS
的Shell介绍
HDFS
的常见Shell操作
HDFS
案例实操Java操作
HDFS
配置环境
HDFS
的回收站
HDFS
的安全模式实战:定时上传数据至
HDFS
HDFS
的高可用和高扩展
小崔的技术博客
·
2023-11-06 18:49
大数据学习
hdfs
hadoop
大数据
Flume从入门到精通一站式学习笔记
文章目录什么是FlumeFlume的特性Flume高级应用场景Flume的三大核心组件Source:数据源channelsinkFlume安装部署Flume的使用案例:采集文件内容上传至
HDFS
案例:采集网站日志上传至
小崔的技术博客
·
2023-11-06 18:49
大数据学习
flume
学习
笔记
基于
HDFS
实现的简易云盘系统
文章目录前言一、实验简介二、分析与设计1.功能需求分析:2.系统设计三、效果展示四、环境配置五、功能实现1.基础部分2.用户管理3.文件管理六、项目资源七、其他八、参考文件前言基于
HDFS
的云盘系统实现了云盘的基本数据存储和访问功能
putaojuzi
·
2023-11-06 16:02
学习总结
Hadoop
hdfs
hadoop
大数据
java
【大数据处理框架】Hadoop大数据处理框架,包括其底层原理、架构、编程模型、生态圈
首先,我们来了解一下
HDFS
。
HDFS
是Hadoop的核心组件之一,它是一个分布式文件系统,将文件分成多个数据块,并存储在集群中的不同节点上,每个数据块的默认
我是廖志伟
·
2023-11-06 15:41
#
大数据开发
hadoop
架构
大数据
阿里终面:10亿数据如何快速插入MySQL
假设和面试官明确后,有如下约束10亿条数据,每条数据1Kb数据内容是非结构化的用户访问日志,需要解析后写入到数据库数据存放在
Hdfs
或S3分布式文件存储里10亿条数据并不是1个大文件,而是被近似切分为100
TNT报社
·
2023-11-06 13:49
mysql
数据库
大数据量
批量插入
Zookeeper监控机制
Zookeeper是有⼀个⼼跳监控机制存在的,⼀般都是每隔2秒就⼼跳⼀下来确认Controller是否还存活,如果不存在的话就会把资源节点让给其他的Controller,这个⼼跳检测机制是⽐较常⻅的,⽐如
HDFS
冷艳无情的小妈
·
2023-11-06 11:23
java
大数据
开发语言
zookeeper
kafka
mapreduce详细工作流程
mapreduce工作流程map任务处理1.1框架使用InputFormat类的子类把输入文件(夹)划分为很多InputSplit,默认,每个
HDFS
的block对应一个InputSplit。
瞌死在大数据
·
2023-11-06 09:57
hadoop
mapreduce
hadoop
hdfs
【Hadoop】MapReduce工作流程
MapReducer工作流程读数据1.客户端提交作业任务;2.Job根据作业任务获取文件信息;3.InputFormat将文件按照设定的切片大小(一般切片大小等于
HDFS
中的Block块大小)进行切片操作
温wen而雅
·
2023-11-06 09:57
大数据
hadoop
mapreduce
上一页
25
26
27
28
29
30
31
32
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他