E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
分布式文件系统HDFS
测试环境搭建整套大数据系统(三:搭建集群zookeeper,
hdfs
,mapreduce,yarn,hive)
一:搭建zkhttps://blog.csdn.net/weixin_43446246/article/details/123327143二:搭建hadoop,yarn,mapreduce。1.安装hadoop。sudotar-zxvfhadoop-3.2.4.tar.gz-C/opt2.修改java配置路径。cd/opt/hadoop-3.2.4/etc/hadoopvimhadoop-env.
宇智波云
·
2024-02-20 08:05
大数据项目
zookeeper
hdfs
mapreduce
hive
Hadoop Streaming原理
Streaming简介•MapReduce和
HDFS
采用Java实现,默认提供Java编程接口•Streaming框架允许任何程序语言实现的程序在HadoopMapReduce中使用•Streaming
可乐加冰丶丶
·
2024-02-20 07:18
论文阅读-Hydra: 用于持久内存和RDMA网络的分散文件系统
然而,现有的
分布式文件系统
采用为传统磁盘设计的传统集中式客户端-服务器架构,导致访问延迟
向来痴_
·
2024-02-20 07:26
负载均衡论文
网络
2024.2.19 阿里云Flink
两大问题,乱序和延迟Stateful:有状态Flink的三个部分Source:Transactions,logs,iot,clicksTransformation:事件驱动,ETL,批处理Sink:输出
HDFS
白白的wj
·
2024-02-20 07:05
flink
大数据
生产环境下,应用模式部署flink任务,通过
hdfs
提交
前言 通过通过yarn.provided.lib.dirs配置选项指定位置,将flink的依赖上传到
hdfs
文件管理系统1.实践 (1)生产集群为cdh集群,从cm上下载配置文件,设置环境exportHADOOP_CONF_DIR
但行益事莫问前程
·
2024-02-20 07:04
flink
flink
以内存为核心的开源分布式存储系统
此外,Tachyon还能够整合众多现有的存储系统(如AmazonS3,Apache
HDFS
,RedHatGlusterFS,OpenStackSwift等),为用
这次靠你了
·
2024-02-20 05:26
大数据
Tachyon
hdfs
大数据
HBase——基础概念介绍
HBase底层存储基于
HDFS
实现,集群的管理基于ZooKeeper实现。
zhanglf1016
·
2024-02-20 04:43
#
HBase
hbase
数据库
大数据
马士兵 day4_Yarn和Map/Reduce配置启动和原理讲解
分布式计算原则:移动计算,而不是移动数据hadoop默认包含了
hdfs
、yarn、mapReduce三个组件yarn(YetAnotherResourceNegotiater)是资源调度系统,yarn调配的是内存和
PC_Repair
·
2024-02-19 20:28
ClickHouse--07--Integration 系列表引擎
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录Integration系列表引擎1
HDFS
1.1语法1.2示例:2MySQL2.1语法2.2示例:3Kafka3.1语法3.2示例
知行合一。。。
·
2024-02-19 20:33
数据库
clickhouse
GlusterFS:开源
分布式文件系统
的深度解析与应用场景实践
GlusterFS作为一款开源的、高度可扩展的
分布式文件系统
,以其独特的无中心元数据设计和灵活的卷管理机制,在众多场景中脱颖而出,为解决大规模数据存储难题提供了强有力的支持。
超逮虾户
·
2024-02-19 19:20
企业级工具
开源
系统架构
java
kerberos 合并keytab文件 ktutil
非交互式:printf"%b""rkt/root/keytab/
hdfs
.keytab\nrkt/root/keytab/hive.keytab\nwkt/root/keytab/merged.keytab
brandblue
·
2024-02-19 19:51
合并keytab文件
ktutil
kerberos
hadoop硬件配置 高可用 datanode namenode硬件配置
每个
分布式文件系统
分块在NameNode的内存中大小约为250个字节,此外还要加上文件和目录所需的250字节空间。
xcagy
·
2024-02-19 13:07
HADOOP
K8S
hadoop硬件
田尚滨
精彩回顾 I DatenLord Hackathon 2023圆满结束!
达坦科技基于其跨云
分布式文件系统
DatenLord项目,结合AI大模型时代背景,搭建了擂台。我们邀请参赛者为DatenLord的极端场景设计并实现缓存p2p传输和同步模块。
·
2024-02-19 12:34
【2019-04-28】Hadoop
分布式文件系统
Hadoop自带
HDFS
(hadoopdistributefilesystem)。
HDFS
默认数据块128M。
BigBigFlower
·
2024-02-19 11:56
Hadoop搭建之 start-yarn.sh 报错
在搭建伪分布式的Hadoop集群环境时,在配置基础环境了并成功开启了
HDFS
组件后,jps查看已运行的名称节点和数据节点进程,[hadoop@masterhadoop]$jps8994NameNode10396Jps9087DataNode9279SecondaryNameNode
万里长江雪
·
2024-02-19 11:58
java
hadoop
hdfs
大数据
运维
网络
分布式文件系统
SpringBoot+FastDFS+Vue.js【四】
分布式文件系统
SpringBoot+FastDFS+Vue.js【四】八、文件的下载和删除功能8.1.FastDFSClient.java8.2.FileServerController.java8.3
良辰美景好时光
·
2024-02-19 10:21
vue
springboot
spring
boot
vue.js
后端
分布式文件系统
SpringBoot+FastDFS+Vue.js【二】
分布式文件系统
SpringBoot+FastDFS+Vue.js【二】六、实现上传功能并展示数据6.1.创建数据库6.2.创建springboot项目fastDFS-java6.3.引入依赖6.3.fastdfs-client
良辰美景好时光
·
2024-02-19 10:20
springboot
vue
spring
boot
vue.js
后端
分布式文件系统
SpringBoot+FastDFS+Vue.js【三】
分布式文件系统
SpringBoot+FastDFS+Vue.js【三】七、创建后台--分角色管理7.1.创建后台数据库表7.2.创建实体类7.2.1.Admin7.2.2.Menu7.2.3.MenuBean7.2.4
良辰美景好时光
·
2024-02-19 10:20
vue
springboot
spring
boot
vue.js
配置hive on spark
配置hiveonspark1、上传Spark纯净版jar包到
HDFS
:
hdfs
dfs-mkdir/spark-jars
hdfs
dfs-put/opt/spark/jars/*/spark-jars2、修改
空白格2519
·
2024-02-15 10:51
数据采集
big
data
hive
spark
hadoop
hive on spark配置经验
常规配置配置完,开启hadoop,开启spark(如果在
hdfs
上上传了纯净版的spark则不需要开启),开启hive注:当前节点一定要是namenode的active节点,因为hadoop长时间不用namenode
小五冲冲冲
·
2024-02-15 10:21
Spark
hive
spark
hadoop
分布式文件系统
SpringBoot+FastDFS+Vue.js
分布式文件系统
SpringBoot+FastDFS+Vue.js一、
分布式文件系统
1.1.文件系统1.2.什么是
分布式文件系统
1.3.
分布式文件系统
的出现1.3.主流的
分布式文件系统
1.4.分布式文件服务提供商
良辰美景好时光
·
2024-02-15 05:20
springboot
vue
spring
boot
vue.js
后端
大数据集群环境启动总结
hadoop启动与停止单个节点逐一启动在主节点上使用以下命令启动
HDFS
NameNode:hadoop-daemon.shstartnamenode在每个从节点上使用以下命令启动
HDFS
DataNode
我还不够强
·
2024-02-14 23:04
HDFS
用户及权限配置
HDFS
用户及权限配置使用linux用户bruce,格式化hadoop的namenode,那么bruce成为
hdfs
的超级用户在bruce用户下运行命令:#创建/user/hadoop目录hadoopfs-mkdir-p
wpheternal
·
2024-02-14 21:42
hadoop笔记
hadoop
hdfs
Hadoop(
HDFS
)的超级用户
Hadoop(
HDFS
)的超级用户超级用户超级用户即运行namenode进程的用户。宽泛的讲,如果你启动了namenode,你就是超级用户。超级用户干任何事情,因为超级用户能够通过所有的权限检查。
zinger.wang
·
2024-02-14 21:12
大数据
hadoop
hdfs
0564-6.1.0-
HDFS
超级用户(Superuser)和
HDFS
管理员(Administrator)的区别
1文档编写目的在前面的文章《0550-6.1-如何将普通用户增加到
HDFS
的超级用户组supergroup》中Fayson介绍过如何将普通用户设置为
HDFS
的超级用户,从而可以让普通用户也可以执行如dfsadmin
Hadoop_SC
·
2024-02-14 21:41
Hadoop实操
HDFS
的超级用户
一.解释原因
HDFS
(HadoopDistributedFileSystem)和linux文件系统管理一样,也是存在权限控制的。
重剑DS
·
2024-02-14 21:41
大数据
hdfs
hadoop
大数据
hive中的Load data 和 insert的区别
OVERWRITE]INTOTABLEtablename[PARTITION(partcol1=val1,partcol2=val2...)]local关键字:有,表示从本地文件系统中导入没有,表示从
HDFS
日写BUG八百行
·
2024-02-14 19:10
hive
mysql
大数据
java
数据库
学习总结 - swift适配器 为 Hadoop 的存储层增加对 OpenStack Swift 的支持
虽然文档内所涉及的版本有点旧,但内容很精彩,值得推荐背景在Hadoop中有一个抽象文件系统的概念,它有多个不同的子类实现,由DistributedFileSystem类代表的
HDFS
便是其中之一。
天地不仁以万物为刍狗
·
2024-02-14 07:37
分布式解决方案
hadoop
HDFS
的API封装
FSDataInputStream和FSDataOutputStream:这两个类是
HDFS
中的输入输出流。
Cynicism_Kevin
·
2024-02-14 07:37
大数据
java
hadoop
hdfs
linux中du的常见用法和查看文件大小并排序
du-s应用在想知道目录具体有多大的时候du-h这样方便看,常常du-s查询的时候也可以加上-h但是有一种情况例外,就是如下这种查看文件大小并排序前两天我想看下有个目录下(
HDFS
的和linux的用法一样
早点起床晒太阳
·
2024-02-13 23:18
利用 Docker 安装 Hadoop 集群并通过 Java API 访问
HDFS
前言最近刚好在学习Hadoop,在安装过程中遇到了一些小麻烦,正好将此次过程记录并分享出来,希望能对准备学习本块内容的读者们有所帮助。本次操作在Ubuntu中完成,如何安装Ubuntu本文不再赘述。本文所涉及到的代码及配置文件可在微信公众号「01二进制」后台回复「hadoop」获取。在Ubuntu中安装配置Docker使用官方安装脚本自动安装安装命令如下:curl-fsSLhttps://get.
qq_33419925
·
2024-02-13 21:38
docker
hadoop
linux
java
大数据
hadoop 分布式集群安装与原理
我们分享一套能让您轻松完成集群搭建的方法,包括Hadoop的源码编译、企业级环境安装与配置和常用大数据组件的基本原理,请点击下面连接按笔记顺序进行学习服务器基础环境批量操作多台服务器zookeeper编译hadoop源码高可用(HA)
HDFS
海牛大数据_青牛老师
·
2024-02-13 12:44
分区表
分区表:分区表实际上就是对应一个
HDFS
文件系统上的独立的文件夹,该文件夹下是该分区所有的数据文件。Hive中的分区就是分目录,把一个大的数据集根据业务需要分割成小的数据集。
incover
·
2024-02-12 22:34
GFS
分布式文件系统
目录引言一、文件系统的作用1.1、文件系统的挂载使用二、GlusterFS简介三、GlusterFS特点3.1、扩展性和高性能3.2、高可用性3.3、全局同一命名空间3.4、弹性卷管理3.5、基于标准协议四、GlusterFS术语五、GlusterFS构成六、GlusterFS的工作流程理解:七、弹性HASH算法弹性HASH算法优点八、GFS支持七种卷8.1、分布式卷(Distributevolu
IT.cat
·
2024-02-12 14:56
linux服务
运维
linux
服务器
缓存
GFS
分布式文件系统
一、GlusterFS概述1.GlusterFS简介GlusterFS是一个开源的
分布式文件系统
。由存储服务器、客户端以及NFS/Samba存储网关(可选,根据需要选择使用)组成。
「已注销」
·
2024-02-12 14:56
big
data
gfs
详解 GFS
分布式文件系统
(条带卷/复制卷/分布式条带卷/分布式复制卷)
GFS
分布式文件系统
一.GlusterFS概述1.GlusterFS简介2.GlusterFS特点3.GlusterFS术语4.模块化堆栈式架构5.GlusterFS工作流程6.弹性HASH算法7.GlusterFs
W.scaler
·
2024-02-12 14:55
linux
gfs
linux
运维
gfs
分布式
分布式存储
畅购商城(十二):接入微信扫码支付
好好学习,天天向上本文已收录至我的Github仓库DayDayUP:github.com/RobodLee/DayDayUP,欢迎Star畅购商城(一):环境搭建畅购商城(二):
分布式文件系统
FastDFS
Robod
·
2024-02-12 07:05
Hadoop-MapReduce-Yarn集群搭建
搭建的部署节点图如下:
hdfs
和yarn是两个不同概念,两者搭建不会冲突。注意一点是DataNode和NodeManager必须要部署在同一台机器,它们的比例是1比1关系的。
qq_2368521029
·
2024-02-12 07:44
搭建 Hadoop-3.1.3 HA 集群
本文目录1.集群部署分布规划2.Zookeepr集群安装3.
HDFS
-HAⅠ.配置core-site.xmlⅡ.配置
hdfs
-site.xmlⅢ.配置分发4.YARN-HAⅠ.配置yarn-site.xmlⅡ
扛麻袋的少年
·
2024-02-12 07:43
#
Hadoop
hadoop
hdfs
大数据
Hadoop-HA高可用集群部署
HA严格来说应该分成各个组件的HA机制:
HDFS
的HA和YARN的HA。
魔笛Love
·
2024-02-12 07:13
hadoop
hdfs
big
data
org.apache.hadoop.fs.ChecksumException: Checksum error: file:/root/test.txt at 0
上传文件到集群遇到以下异常:org.apache.hadoop.fs.ChecksumException:Checksumerror:file:/root/test.txtat0[root@master~]#
hdfs
dfs-puttest.txt
橙汁啤酒厂
·
2024-02-12 05:24
hadoop
大数据
Flume总结
1.概述2.角色(source、Channel、sink、event)3.使用(1)监控端口(2)实时读取本地文件到
HDFS
(3)实时读取目录文件到
HDFS
(4)Flume与Flume之间数据传递:单Flume
我是嘻哈大哥
·
2024-02-12 01:56
clickhouse之表引擎
对于ck来说,目前位置包含了以下部分引擎:1.集成外部系统的表引擎,支持方式有kafka,JDBC,ODBC,
HDFS
等2.合并树家族(最为常用且重要)3.日志
落花流水i
·
2024-02-11 22:53
ClickHouse
极限挑战:使用 Go 打造百亿级文件系统的实践之旅
JuiceFS企业版是一款为云环境设计的
分布式文件系统
,单命名空间内可稳定管理高达百亿级数量的文件。构建这个大规模、高性能的文件系统面临众多复杂性挑战,其中最为关键的环节之一就是元数据引擎的设计。
·
2024-02-11 18:49
go运维人工智能
HBase知识点总结
是建立在
HDFS
之上,提供高可靠性、高性能、列存储、可伸缩、实时读写NoSql的数据库系统。
·
2024-02-11 17:17
hbase大数据数据库
【大数据】Flume-1.9.0安装➕入门案例
目录前言一、Flume概述Flume基础架构二、Flume-1.9.0安装➕入门案例1.下载1.9.0解压2.监控端口数据官方案例3.实时读取本地文件(hive.log)到
HDFS
案例4.实时读取目录文件到
欧叶冲冲冲
·
2024-02-11 09:34
flume
大数据
flume
学习
分布式
大数据入门--Flume(一)安装教程与案例
Flume(一)安装教程与案例安装教程案例监控端口数据官方案例(netcat-logger)实时监控单个追加文件(exec-
hdfs
)进阶版存在的问题实时监控目录下多个新文件(taildir)实时监控目录下多个新文件
许中宝
·
2024-02-11 09:34
大数据
flume
大数据
Hive与ClickHouse的区别
Hive的存储引擎使用
HDFS
,计算引擎使用MapReduce或Spark。Hive本质上是一个元数据管理平台,通过对存储于
HDFS
上的数据文件附加元数据,赋予
HDFS
上的文件以数据库表的语义。
晓之以理的喵~~
·
2024-02-11 08:18
Hadoop
大数据
hive
hive
clickhouse
hadoop
Hadoop(三)通过C#/python实现Hadoop MapReduce
MapReduceHadoop中将数据切分成块存在
HDFS
不同的DataNode中,如果想汇总,按照常规想法就是,移动数据到统计程序:先把数据读取到一个程序中,再进行汇总。
dotNET跨平台
·
2024-02-11 08:17
hadoop
mapreduce
spark
大数据
python
ClickHouse的特征,性能,优点,缺点,应用场景以及什么是OLAP,Clickhouse的相关优化
可以存储海量数据;因为clickhouse是分布式存储海量数据,所以解决了高并发的问题;clickhouse中的数据底层是列式存储clickhouse不仅可以管理自己的数据,也可以读取别人的数据,比如masql,
hdfs
晓晓很可爱
·
2024-02-11 08:15
clickhouse
大数据
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他