E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
分布式文件系统HDFS
关于HDP的20道高级运维面试题
HDP(HortonworksDataPlatform)的主要组件包括Hadoop框架、
HDFS
、MapReduce、YARN以及Hadoop生态系统中的其他关键工具,如Spark、Flink、Hive
编织幻境的妖
·
2024-03-26 15:34
运维
服务器虚拟化和云平台,云平台和服务器虚拟化区别
云平台和服务器虚拟化区别内容精选换一换云硬盘(ElasticVolumeService,EVS)可以为云服务器提供高可靠、高性能、规格丰富并且可弹性扩展的块存储服务,可满足不同场景的业务需求,适用于
分布式文件系统
木子Hui
·
2024-03-20 05:14
服务器虚拟化和云平台
【笔记】
HDFS
基础笔记
启动hadoop命令(未配环境变量):进入hadoop安装目录输入./sbin/start-dfs.sh已配环境变量:start-dfs.sh关闭hadoop命令:stop-dfs.sh启动完成后,可以通过命令jps来判断是否成功启动,若成功启动则会列出如下进程:"NameNode"、"DataNode"和"SecondaryNameNode"三种Shell命令方式:1.hadoopfs2.had
哇咔咔哇咔
·
2024-03-20 04:12
Hadoop
hdfs
笔记
hadoop
大数据
ubuntu
hive库表占用空间大小的命令
1、查每个hive表占用的空间大小
hdfs
dfs-du-h/user/hive/warehouse2、按占用空间大小降序排列
hdfs
dfs-du/user/hive/warehouse/ipms.db|
刀鋒偏冷
·
2024-03-15 13:13
hive
hadoop
数据仓库
HDFS
(一)
HDFS
简介及其基本概念
HDFS
(HadoopDistributedFileSystem)是hadoop生态系统的一个重要组成部分,是hadoop中的的存储组件,在整个Hadoop中的地位非同一般
weixin_51987187
·
2024-03-12 14:32
笔记
大数据
大数据开发(Hadoop面试真题-卷二)
2、请解释一下
HDFS
架构中NameNode和DataNode之间是如何通信的?3、请解释一下Hadoop的工作原理及其组成部分?4、
HDFS
读写流程是什么样子?
Key-Key
·
2024-03-12 02:15
大数据
hadoop
面试
大数据开发(Hadoop面试真题-卷九)
2、既然HBase底层数据是存储在
HDFS
上,为什么不直接使用
HDFS
,而还要用HBase?3、Sparkmapjoin的实现原理?4、Spark的stage如何划分?
Key-Key
·
2024-03-09 10:06
大数据
hadoop
面试
大数据开源框架技术汇总
目录系统平台(Hadoop、CDH、HDP)监控管理(CM、Hue、Ambari、Dr.Elephant、Ganglia、Zabbix、Eagle)文件系统(
HDFS
、GPFS、Ceph、Gluster
浪尖聊大数据-浪尖
·
2024-03-08 20:48
数据仓库
hive
flume
分布式
scipy
makefile
crm
lighttpd
hbase、hive、clickhouse对比
概念架构hbasemaster存储元数据、regionServer实际控制表数据,存储单位是Region,底层数据存储使用
HDFS
hive通过driver将sql分解成mapreduce任务元数据需要单独存储到一个关系型数据库
freshrookie
·
2024-03-05 16:40
hbase
hive
hadoop
【Hadoop】使用Metorikku框架读取hive数据统计分析写入mysql
一、定义作业文件作业文件该文件将包括输入源、输出目标和要执行的配置文件的位置,具体内容如下metrics:-/user/xrx/qdb.yaml#此位置为
hdfs
文件系统目录inputs:output:
方大刚233
·
2024-03-03 06:23
Hadoop
Scala
hadoop
hive
mysql
SeaweedFS部署
SeaweedFS介绍SeaweedFS是一个
分布式文件系统
应用场景:主要用于存储处理小文件、大文件分块成小文件上传Githup地址:https://github.com/chrislusf/seaweedfs
仙女陈
·
2024-03-02 04:46
linux
基于Docker搭建
hdfs
分布式实验环境
理论知识DockerDocker是一个开源的应用容器引擎,基于Go语言并遵从Apache2.0协议开源。Docker可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口,容器性能开销极低。Docker能够将应用程序与基础架构分开,从而可以快速交付软件。借助Docker,开发者可以与管
dejiedoor
·
2024-02-20 22:38
hadoop
大数据
docker
docker搭建hadoop
hdfs
完全分布式集群
这里注意,在做好的镜像里,要安装which工具,否则在执行
hdfs
命令时会报命令不存在异常。
shangcunshanfu
·
2024-02-20 22:08
hadoop
docker
big
data
基于docker安装
HDFS
1.docker一键安装见docker一键安装2.拉取镜像sudodockerpullkiwenlau/hadoop:1.03.下载启动脚本gitclonehttps://github.com/kiwenlau/hadoop-cluster-docker4.创建网桥由于Hadoop的master节点需要与slave节点通信,需要在各个主机节点配置节点IP,为了不用每次启动都因为IP改变了而重新配置
core512
·
2024-02-20 22:02
大数据
虚拟机&容器
docker
hdfs
HIVE中MAP和REDUCE数量
1、输入就不用说了,数据一般放在
HDFS
上面就可以了,而且文件是被分块的。关于文件块和文件分片的关系,在输入分片中说明。2、输入分片:在进行Map阶段之前,MapReduce框架会根据输入文件计算输
这孩子谁懂哈
·
2024-02-20 20:38
HIVE
hive
hadoop
mapreduce
Hadoop生态圈
生态圈1.HBase的数据存储在
HDFS
里2.MapReduce可以计算HBase里的数据,也可以计算
HDFS
里的数据3.Hive是数据分析数据引擎,也是MapReduce模型,支持SQL4.Pig也是一个数据分析引擎
陈超Terry的技术屋
·
2024-02-20 19:47
16.用Hadoop命令向CDH集群提交MR作业
OS为CentOS6.5前置条件CDH集群运行正常本地开发环境与集群网络互通且端口放通16.2示例这里使用的代码是没有加载CDH集群的xml配置的,因为使用hadoop命令提交时会加载集群的配置信息(如
hdfs
大勇任卷舒
·
2024-02-20 19:27
记一次 Flink 作业启动缓慢
记一次Flink作业启动缓慢背景应用发现,Hadoop集群的
hdfs
较之前更加缓慢,且离线ELT任务也以前晚半个多小时才能跑完。
卢说
·
2024-02-20 18:38
Hadoop
大数据
Flink
flink
大数据
hadoop
hdfs
航班数据预测与分析
数据清洗:数据存储到
HDFS
:使用pyspark对数据进行分析://数据导入frompysparkimportSparkContextfrompyspark.sqlimportSQLContextsc=
林坰
·
2024-02-20 16:15
大数据
spark
航班数据分析
杜艳辉
Excel导出显示服务器,javaexcel导出到远程服务器
不支持直接导出文件到
HDFS
文件系统。CN只负责任务的规划及下发,把数据导出的工作交给了D需要确保每一
weixin_39946029
·
2024-02-20 12:50
Excel导出显示服务器
测试环境搭建整套大数据系统(三:搭建集群zookeeper,
hdfs
,mapreduce,yarn,hive)
一:搭建zkhttps://blog.csdn.net/weixin_43446246/article/details/123327143二:搭建hadoop,yarn,mapreduce。1.安装hadoop。sudotar-zxvfhadoop-3.2.4.tar.gz-C/opt2.修改java配置路径。cd/opt/hadoop-3.2.4/etc/hadoopvimhadoop-env.
宇智波云
·
2024-02-20 08:05
大数据项目
zookeeper
hdfs
mapreduce
hive
Hadoop Streaming原理
Streaming简介•MapReduce和
HDFS
采用Java实现,默认提供Java编程接口•Streaming框架允许任何程序语言实现的程序在HadoopMapReduce中使用•Streaming
可乐加冰丶丶
·
2024-02-20 07:18
论文阅读-Hydra: 用于持久内存和RDMA网络的分散文件系统
然而,现有的
分布式文件系统
采用为传统磁盘设计的传统集中式客户端-服务器架构,导致访问延迟
向来痴_
·
2024-02-20 07:26
负载均衡论文
网络
2024.2.19 阿里云Flink
两大问题,乱序和延迟Stateful:有状态Flink的三个部分Source:Transactions,logs,iot,clicksTransformation:事件驱动,ETL,批处理Sink:输出
HDFS
白白的wj
·
2024-02-20 07:05
flink
大数据
生产环境下,应用模式部署flink任务,通过
hdfs
提交
前言 通过通过yarn.provided.lib.dirs配置选项指定位置,将flink的依赖上传到
hdfs
文件管理系统1.实践 (1)生产集群为cdh集群,从cm上下载配置文件,设置环境exportHADOOP_CONF_DIR
但行益事莫问前程
·
2024-02-20 07:04
flink
flink
以内存为核心的开源分布式存储系统
此外,Tachyon还能够整合众多现有的存储系统(如AmazonS3,Apache
HDFS
,RedHatGlusterFS,OpenStackSwift等),为用
这次靠你了
·
2024-02-20 05:26
大数据
Tachyon
hdfs
大数据
HBase——基础概念介绍
HBase底层存储基于
HDFS
实现,集群的管理基于ZooKeeper实现。
zhanglf1016
·
2024-02-20 04:43
#
HBase
hbase
数据库
大数据
马士兵 day4_Yarn和Map/Reduce配置启动和原理讲解
分布式计算原则:移动计算,而不是移动数据hadoop默认包含了
hdfs
、yarn、mapReduce三个组件yarn(YetAnotherResourceNegotiater)是资源调度系统,yarn调配的是内存和
PC_Repair
·
2024-02-19 20:28
ClickHouse--07--Integration 系列表引擎
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录Integration系列表引擎1
HDFS
1.1语法1.2示例:2MySQL2.1语法2.2示例:3Kafka3.1语法3.2示例
知行合一。。。
·
2024-02-19 20:33
数据库
clickhouse
GlusterFS:开源
分布式文件系统
的深度解析与应用场景实践
GlusterFS作为一款开源的、高度可扩展的
分布式文件系统
,以其独特的无中心元数据设计和灵活的卷管理机制,在众多场景中脱颖而出,为解决大规模数据存储难题提供了强有力的支持。
超逮虾户
·
2024-02-19 19:20
企业级工具
开源
系统架构
java
kerberos 合并keytab文件 ktutil
非交互式:printf"%b""rkt/root/keytab/
hdfs
.keytab\nrkt/root/keytab/hive.keytab\nwkt/root/keytab/merged.keytab
brandblue
·
2024-02-19 19:51
合并keytab文件
ktutil
kerberos
hadoop硬件配置 高可用 datanode namenode硬件配置
每个
分布式文件系统
分块在NameNode的内存中大小约为250个字节,此外还要加上文件和目录所需的250字节空间。
xcagy
·
2024-02-19 13:07
HADOOP
K8S
hadoop硬件
田尚滨
精彩回顾 I DatenLord Hackathon 2023圆满结束!
达坦科技基于其跨云
分布式文件系统
DatenLord项目,结合AI大模型时代背景,搭建了擂台。我们邀请参赛者为DatenLord的极端场景设计并实现缓存p2p传输和同步模块。
·
2024-02-19 12:34
【2019-04-28】Hadoop
分布式文件系统
Hadoop自带
HDFS
(hadoopdistributefilesystem)。
HDFS
默认数据块128M。
BigBigFlower
·
2024-02-19 11:56
Hadoop搭建之 start-yarn.sh 报错
在搭建伪分布式的Hadoop集群环境时,在配置基础环境了并成功开启了
HDFS
组件后,jps查看已运行的名称节点和数据节点进程,[hadoop@masterhadoop]$jps8994NameNode10396Jps9087DataNode9279SecondaryNameNode
万里长江雪
·
2024-02-19 11:58
java
hadoop
hdfs
大数据
运维
网络
分布式文件系统
SpringBoot+FastDFS+Vue.js【四】
分布式文件系统
SpringBoot+FastDFS+Vue.js【四】八、文件的下载和删除功能8.1.FastDFSClient.java8.2.FileServerController.java8.3
良辰美景好时光
·
2024-02-19 10:21
vue
springboot
spring
boot
vue.js
后端
分布式文件系统
SpringBoot+FastDFS+Vue.js【二】
分布式文件系统
SpringBoot+FastDFS+Vue.js【二】六、实现上传功能并展示数据6.1.创建数据库6.2.创建springboot项目fastDFS-java6.3.引入依赖6.3.fastdfs-client
良辰美景好时光
·
2024-02-19 10:20
springboot
vue
spring
boot
vue.js
后端
分布式文件系统
SpringBoot+FastDFS+Vue.js【三】
分布式文件系统
SpringBoot+FastDFS+Vue.js【三】七、创建后台--分角色管理7.1.创建后台数据库表7.2.创建实体类7.2.1.Admin7.2.2.Menu7.2.3.MenuBean7.2.4
良辰美景好时光
·
2024-02-19 10:20
vue
springboot
spring
boot
vue.js
配置hive on spark
配置hiveonspark1、上传Spark纯净版jar包到
HDFS
:
hdfs
dfs-mkdir/spark-jars
hdfs
dfs-put/opt/spark/jars/*/spark-jars2、修改
空白格2519
·
2024-02-15 10:51
数据采集
big
data
hive
spark
hadoop
hive on spark配置经验
常规配置配置完,开启hadoop,开启spark(如果在
hdfs
上上传了纯净版的spark则不需要开启),开启hive注:当前节点一定要是namenode的active节点,因为hadoop长时间不用namenode
小五冲冲冲
·
2024-02-15 10:21
Spark
hive
spark
hadoop
分布式文件系统
SpringBoot+FastDFS+Vue.js
分布式文件系统
SpringBoot+FastDFS+Vue.js一、
分布式文件系统
1.1.文件系统1.2.什么是
分布式文件系统
1.3.
分布式文件系统
的出现1.3.主流的
分布式文件系统
1.4.分布式文件服务提供商
良辰美景好时光
·
2024-02-15 05:20
springboot
vue
spring
boot
vue.js
后端
大数据集群环境启动总结
hadoop启动与停止单个节点逐一启动在主节点上使用以下命令启动
HDFS
NameNode:hadoop-daemon.shstartnamenode在每个从节点上使用以下命令启动
HDFS
DataNode
我还不够强
·
2024-02-14 23:04
HDFS
用户及权限配置
HDFS
用户及权限配置使用linux用户bruce,格式化hadoop的namenode,那么bruce成为
hdfs
的超级用户在bruce用户下运行命令:#创建/user/hadoop目录hadoopfs-mkdir-p
wpheternal
·
2024-02-14 21:42
hadoop笔记
hadoop
hdfs
Hadoop(
HDFS
)的超级用户
Hadoop(
HDFS
)的超级用户超级用户超级用户即运行namenode进程的用户。宽泛的讲,如果你启动了namenode,你就是超级用户。超级用户干任何事情,因为超级用户能够通过所有的权限检查。
zinger.wang
·
2024-02-14 21:12
大数据
hadoop
hdfs
0564-6.1.0-
HDFS
超级用户(Superuser)和
HDFS
管理员(Administrator)的区别
1文档编写目的在前面的文章《0550-6.1-如何将普通用户增加到
HDFS
的超级用户组supergroup》中Fayson介绍过如何将普通用户设置为
HDFS
的超级用户,从而可以让普通用户也可以执行如dfsadmin
Hadoop_SC
·
2024-02-14 21:41
Hadoop实操
HDFS
的超级用户
一.解释原因
HDFS
(HadoopDistributedFileSystem)和linux文件系统管理一样,也是存在权限控制的。
重剑DS
·
2024-02-14 21:41
大数据
hdfs
hadoop
大数据
hive中的Load data 和 insert的区别
OVERWRITE]INTOTABLEtablename[PARTITION(partcol1=val1,partcol2=val2...)]local关键字:有,表示从本地文件系统中导入没有,表示从
HDFS
日写BUG八百行
·
2024-02-14 19:10
hive
mysql
大数据
java
数据库
学习总结 - swift适配器 为 Hadoop 的存储层增加对 OpenStack Swift 的支持
虽然文档内所涉及的版本有点旧,但内容很精彩,值得推荐背景在Hadoop中有一个抽象文件系统的概念,它有多个不同的子类实现,由DistributedFileSystem类代表的
HDFS
便是其中之一。
天地不仁以万物为刍狗
·
2024-02-14 07:37
分布式解决方案
hadoop
HDFS
的API封装
FSDataInputStream和FSDataOutputStream:这两个类是
HDFS
中的输入输出流。
Cynicism_Kevin
·
2024-02-14 07:37
大数据
java
hadoop
hdfs
linux中du的常见用法和查看文件大小并排序
du-s应用在想知道目录具体有多大的时候du-h这样方便看,常常du-s查询的时候也可以加上-h但是有一种情况例外,就是如下这种查看文件大小并排序前两天我想看下有个目录下(
HDFS
的和linux的用法一样
早点起床晒太阳
·
2024-02-13 23:18
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他