E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
分布式文件系统HDFS
一篇文章,掌握所有开源数据库的现状
本次分享聚焦于数据库既结构化数据存储OLTP及NoSQL领域,不会涉及OLAP、对象存储、
分布式文件系统
。1开源RDBMS与互联网的崛起很长时间以来,关系型数据库一直是大公司的专利,市场被
M偶遇在沙漠
·
2023-12-01 01:00
java后端
mysql
Java
数据库
mysql
mariadb
flink1.12配置滚动日志(超详细)
官方建议详细配置完整的log4j.properties配置文件如下:flink1.12kafka的BUG配置滚动生成的目的1.当yarn配置了日志聚集功能时,yarn上的任务停止时,会将程序运行日志信息上传到
HDFS
重生之我在异世界打工
·
2023-11-30 22:03
flink
log4j
flink
Hadoop之
HDFS
一.
HDFS
概述1.1
HDFS
产生的背景定义1)背景:随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件
小猫旺财
·
2023-11-30 20:11
Hadoop
hadoop
hdfs
big
data
大数据
HDFS
基础知识(个人总结)
HDFS
存储优缺点:优点高容错,因为它有多个副本可处理大数据,文件数量可达百万缺点
HDFS
可以追加,但不能修改某一条数据,若实在想修改,只能下载下来原文件进行修改后重新上传覆盖不适合低延迟数据访问,如毫秒级无法高效存储大量小文件小文件导致数量太多
hellosrc | forward
·
2023-11-30 20:41
Hadoop
1024程序员节
hadoop
大数据
HDFS
概述
文章目录一、
HDFS
概述1.什么是
HDFS
2.
HDFS
基本架构3.搭建[
HDFS
]4.安装hadoop5.hadoop配置文件的配置etc/hadoop6.namenode的格式化7.启动hadoop守护进程
~chun
·
2023-11-30 20:11
数据
HDFS
简介
统一管理分布在集群上的文件系统称为
分布式文件系统
。而一旦在系统中,引入网络,就不可避免地引入了所有网络编程的复杂性,例如挑战之一是如果保证在节点不可用的时候数据不丢失。
武汉小旭旭
·
2023-11-30 20:40
Hadoop
hdfs
hadoop
大数据
HDFS
详解
HDFS
架构剖析
HDFS
,HadoopDistributeFileSystem(Hadoop
分布式文件系统
)的简称,它是Hadoop核心组件之一,是大数据生态圈最底层的分布式存储服务。
liuhanyuu
·
2023-11-30 20:09
hdfs
hadoop
大数据
大数据-
HDFS
的定义、使用场景、优缺点、组成架构
HDFS
定义
HDFS
(HadoopDestributedFileSystem)是一个分布式的文件系统,用于存储文件,通过目录树来定位文件
HDFS
使用场景适合一次写入,多次读取的场景,不支持文件的修改
HDFS
hmyqwe
·
2023-11-30 20:08
HDFS
大数据
【Hadoop】
分布式文件系统
HDFS
目录一、介绍二、
HDFS
设计原理2.1
HDFS
架构2.2数据复制复制的实现原理三、
HDFS
的特点四、图解
HDFS
存储原理1.写过程2.读过程3.
HDFS
故障类型和其检测方法故障类型和其检测方法读写故障的处理
和瑚
·
2023-11-30 20:06
#
Hadoop
hadoop
hdfs
大数据
Hyper-v虚拟机Hadoop集群搭建
Hadoop实现了一个
分布式文件系统
(HadoopDistributedFileSystem),简称
HDFS
。
真.电脑人
·
2023-11-30 16:16
hadoop
大数据
分布式
【
HDFS
】ActiveNamenodeResolver#getNamespaces 方法调用点梳理
获取所有的注册在router里的active状态的集群。/***Getalistofallnamespacesthatareregisteredandactiveinthe*federation.**@returnListofnamespacesinthefederation*@throwsIOExceptionThrowsexceptionifthenamespacelistisnot*avai
叹了口丶气
·
2023-11-30 14:17
HDFS全方位实战
hdfs
hadoop
大数据
01数仓平台 Hadoop介绍与安装
HDFS
架构概述HadoopDistributedFileSystem,简称
HDFS
,是一个
分布式文件系统
。包含
kk_io
·
2023-11-30 13:38
数据仓库
hadoop
大数据
分布式
在centos7上搭建hadoop大数据平台
Hadoop安装1、下载2、准备启动Hadoop集群2.1配置Hadoop守护进程的环境2.2配置系统环境变量2.3配置etc/hadoop/core-site.xml文件2.4配置etc/hadoop/
hdfs
-site.xml
船长灬普朗克
·
2023-11-30 13:03
大数据
hadoop
大数据
java
2019-12-11
本质是:将HQL转化成MapReduce程序image.pngimage.png1)Hive处理的数据存储在
HDFS
2)Hive分析数据底层的实现是MapReduce3)执行程
diedfish_qyf
·
2023-11-30 11:41
Apache Flink(二):数据架构演变
豹哥教你大数据的个人空间-豹哥教你大数据个人主页-哔哩哔哩视频目录1.业务处理-单体架构2.业务处理-微服务架构3.数据分析-大数据Lambda架构4.有状态流计算架构近年来随着越来越多的大数据技术被开源,例如:
HDFS
IT贫道
·
2023-11-30 11:19
大数据计算体系技术栈
Apache
Flink
apache
flink
架构
Hadoop-
HDFS
详解与HA,完全分布式集群搭建(细到令人发指的教程)
目录一、引入
hdfs
是什么
hdfs
的由来
hdfs
架构体系
hdfs
的优缺点优点缺点二、
HDFS
_block简介和注意事项Block拆分标准三、
HDFS
_block安全与管理Block数据安全Block的管理效率四
毫无感情的dj
·
2023-11-30 10:06
hadoop
hdfs
大数据
分布式
zookeeper
Hadoop-
HDFS
角色工作机制
一、角色职责介绍 HadoopDistributedFileSystem(
HDFS
,
分布式文件系统
):
HDFS
是Hadoop应用程序使用分布式存储,
HDFS
集群主要由管理文件系统元数据的NameNode
H.S.T不想卷
·
2023-11-30 10:33
大数据
hadoop
hdfs
大数据
【大数据Hadoop】
HDFS
-Namenode-format格式化的源码步骤分析
Namenodeformat流程格式化命令源码解读初始化操作格式化操作本地写VERSION文件JournalManager的格式化持久化FsImage文件流程根据配置项获取nameserviceId、namenodeId判断配置项dfs.namenode.support.allow.format是否允许格式化,一般生产环境建议配置,防止误操作格式化了已有数据。获取格式化的目录(fsImage和ed
笑起来贼好看
·
2023-11-30 10:30
Hadoop
大数据
服务运维部署
hadoop
大数据
hdfs
大数据技术之Hadoop(
HDFS
)
1.
HDFS
概述1.1
HDFS
产生背景和意义1.
HDFS
产生背景随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件
江苏彭与晏
·
2023-11-30 10:23
hadoop
大数据
hdfs
大数据 - Hadoop -
HDFS
Hadoop=
HDFS
(文件系统,数据存储技术相关)+Mapreduce(数据处理),Hadoop的数据来源可以是任何形式,在处理半结构化和非结构化数据上与关系型数据库相比有更好的性能,具有更灵活的处理能力
蒙蒙的林先生
·
2023-11-30 10:21
大数据
大数据
大数据
hadoop
hdfs
大数据Hadoop-
HDFS
_架构、读写流程
大数据Hadoop-
HDFS
基本系统架构
HDFS
架构包含三个部分:NameNode,DataNode,Client。NameNode:NameNode用于存储、生成文件系统的元数据。运行一个实例。
大沙头三马路
·
2023-11-30 09:48
BigDate
Linux
大数据
hadoop
hdfs
HCIA
大数据-hadoop-
hdfs
Hadoop
分布式文件系统
(
HDFS
)是指被设计成适合运行在通用硬件(commodityhardware)上的
分布式文件系统
(DistributedFileSystem)。
像影子追着光梦游_
·
2023-11-30 09:48
大数据
hadoop
hdfs
大数据Hadoop-
HDFS
_元数据持久化
大数据Hadoop-
HDFS
_元数据持久化(1)在
HDFS
第一次格式化后,NameNode(即图中的主NameNode)就会生成fsimage和editslog两个文件;(2)备用NameNode(即图中的备
大沙头三马路
·
2023-11-30 09:14
BigDate
Linux
大数据
hadoop
hdfs
linux
【物联网与大数据应用】Hadoop数据处理
Hadoop利用分而治之的思想为大数据提供了一整套解决方案,如
分布式文件系统
HDFS
、分布式计算框架MapReduce、NoSQL数据库HBase、数据仓库工具Hive等。
Bosenya12
·
2023-11-30 09:06
大数据
hadoop
分布式
Map和Reduce在Hadoop与Python中有何异同?
Hadoop作为一个分布式系统,可以将不同的机器设备连接起来进行存储,也就是人们常说的
HDFS
,这也是Hadoop的一个构成部分;而hadoop的另一个构成部分就是MapReduce了,前者负责数据的存储
值得一看的喵
·
2023-11-30 09:25
Hadoop入门学习笔记-第六天(hive数据库命令相关操作)
hive命令行操作/user/hive/warehouse(
hdfs
目录))说明:hive创建的数据库和数据库表都存在
hdfs
,一般默认目录为:/user/hive/warehouse1…创建hive的数据库
渣男程序员007
·
2023-11-30 05:44
Hadoop入门学习笔记
hadoop
数据库
java
hive
mysql
Hadoop入门学习笔记-第四天(wordCount实例代码编写笔记)
文件中引入以下jar包org.apache.hadoophadoop-client2.7.3org.apache.hadoophadoop-common2.7.3org.apache.hadoophadoop-
hdfs
2.7.3org.apache.hadoophadoop-client2.7.33
渣男程序员007
·
2023-11-30 05:43
Hadoop入门学习笔记
java
大数据
hadoop
mapreduce
spark
Hadoop入门学习笔记-第二天 (
HDFS
:NodeName高可用集群配置)
说明:
hdfs
:nn单点故障,压力过大,内存受限,扩展受阻。
hdfs
ha:主备切换方式解决单点故障
hdfs
Federation联邦:解决鸭梨过大。
渣男程序员007
·
2023-11-30 05:13
Hadoop入门学习笔记
hadoop
java
大数据
hdfs
Hadoop入门学习笔记-第三天(Yarn高可用集群配置及计算案例)
什么是mapreduce首先让我们来重温一下hadoop的四大组件:
HDFS
:分布式存储系统MapReduce:分布式计算系统YARN:hadoop的资源调度系统Common:以上三大组件的底层支撑组件
渣男程序员007
·
2023-11-30 05:13
Hadoop入门学习笔记
分布式
hadoop
大数据
spark
mapreduce
【Spark】on yarn集群模式安装部署
官方文档http://spark.apache.org/docs/latest/running-on-yarn.html前提安装启动Hadoop(需要使用
HDFS
和YARN)安装单机版Spark不需要集群
没去过埃及的法老
·
2023-11-30 03:23
Sprak
大数据
spark
on
yarn集群模式
安装部署
云计算/大数据
Spark on YARN的部署
SparkonYARN的原理就是依靠yarn来调度Spark,比默认的Spark运行模式性能要好的多,前提是首先部署好hadoop
HDFS
并且运行在yarn上,然后就可以开始部署sparkonyarn了
GoodInSun
·
2023-11-30 03:23
spark
spark
on
yarn
ambari运维问题记录
ambari综合问题记录1、
hdfs
无法启动错误:2018-04-2514:36:09,293-Retryingafter10seconds.Reason:Executionof'/usr/hdp/current
人生匆匆
·
2023-11-30 03:23
ambari
ambari
运维
hadoop
【Ambari】
HDFS
基于Ambari的常规运维
目录一、简介1.1Ambari介绍1.2关于本手册二、综合运维2.1Ambari一览2.1.1命令行操作2.1.2登入和登出2.1.3.管理界面首页三、服务的管理和运维3.1
HDFS
运维3.1启动/停止
阿龙先生啊
·
2023-11-30 03:52
#
【====
Ambari
====】
ambari
hdfs
运维
服务重启
添加配置
core-site.xml
Spark完全分布式搭建(On Yarn)
目录一、集群规划二、配置Spark路径三、修改配置文件1.spark-env.sh2.修改slaves文件四、启动集群1.先起动Hadoop的
HDFS
和Yarn2.启动Spark五、Web查看集群启动情况六
Congee小周
·
2023-11-30 02:00
大数据
hadoop
spark
完全分布式
spark-env.sh
slaves
Docker 安装 FastDFS
简述FastDFS是一个开源的轻量级
分布式文件系统
,它的主要功能包括:文件存储、文件同步、文件访问(文件上传、文件下载)等,解决了大容量存储和负载均衡的问题。
虹猫日志
·
2023-11-29 23:50
【解决】
HDFS
JournalNode启动慢问题排查
文章目录一.问题描述二.问题分析1.排查机器性能2.DNS的问题三.问题解决1.修复DNS服务2.添加主机映射为0.0.0.03.修改hadoop源码一句话:因为dns的问题导致journalnode启动时很慢,通过修复dns对0.0.0.0域名解析,修复此问题。一.问题描述从journalnode启动到服务可用,完成RPCListen,需要花费大概1分多钟的问题,而这不符合安装预期。二.问题分析
roman_日积跬步-终至千里
·
2023-11-29 20:12
hadoop运维
hdfs
网络
hadoop
大数据之HBase教程
Hadoop使用
分布式文件系统
,用于存储大数据,并使用MapReduce来处理。Hadoop擅长于存储各种格式的庞大的数据,任意的格式甚至非结构化的处理。
@轻流
·
2023-11-29 20:00
Hbase
大数据
大数据技术之HBase
①HBase是以
hdfs
为数据存储,一个面向
Red-P
·
2023-11-29 20:57
大数据基础
hbase
大数据
数据库
大数据之HBase
HBase介绍Apache的三篇论文,GFS谷歌文件系统->
HDFS
;MR->MR;BigTable->HBase;HBase是hadoop数据库,一种分布式、可扩展的大数据NoSQL数据库之一。
十七✧ᐦ̤
·
2023-11-29 20:55
大数据
hbase
数据库
如何能打进去idea引入外部jar包
org.apache.maven.pluginsmaven-war-plugin3.2.3${project.basedir}/libWEB-INF/lib/**/*.jar然后导入依赖即可comhadoop-
hdfs
-client2.7
一个正在努力的小白码农
·
2023-11-29 19:57
intellij-idea
jar
HBase初识之学生心得总结
c、HBase:理解为Hadoopbase--3.大数据框架:a、数据的存储:
hdfs
/hive/hbaseb、数据的传输:flume/sqoopc、数据的计算
程序员驴子酱
·
2023-11-29 15:33
大数据
fastdfs部署详解
创建存储文件目录拷贝配置文件修改配置文件启动检验上传三、添加nginx显示配置fastdfs-nginx-module安装nginx修改nginx配置文件启动nginx网页检验官方github支持官方解释:FastDFS是一个开源的高性能
分布式文件系统
(~ ̄▽ ̄)~凤凰涅槃
·
2023-11-29 14:31
linux
网络
FastDFS 部署
二、FastDFS官方介绍FastDFS是一款类GoogleFS的开源
分布式文件系统
,它用纯C语言实现,支持Linux、FreeBSD、AIX等UNIX系统。它只能通过专有API对文件进行存取访问,不
点滴Java
·
2023-11-29 14:59
JAVA
FastDFS部署
简介FastDFS是一个开源的轻量级
分布式文件系统
,它对文件进行管理,功能包括:文件存储、文件同步、文件访问(文件上传、文件下载)等,解决了大容量存储和负载均衡的问题。
一码归一码@
·
2023-11-29 14:54
分布式理论&中间件搭建
服务器
java
HCIA-Big Data华为认证大数据工程师 习题册 含答案
查看课堂笔记(含习题册)目录1.大数据发展趋势与鲲鹏大数据2.
HDFS
分布式文件管理系统和ZooKeeper3.Hive分布式数据仓库4.HBase技术原理5.MapReduce和Yarn技术原理6.Spark
k Chivalrous man
·
2023-11-29 08:16
大数据
大数据
华为
SparkStreaming基本数据源
SparkStreaming基本数据源案例1.文件流案例SparkStreaming支持各种文件系统中的文件流,如:
HDFS
、本地文件系统创建文件流的方式:读取
HDFS
上面的文件:streamingConte
简丶致
·
2023-11-29 07:06
spark
big
data
spark
Spark Streaming提取数据
它支持的流资包括
HDFS
、Kafka、Flume以及自定义流等。SparkStreaming操作可以从故障中自动恢复,这对于在线数据处理十分重要。
简单不过l
·
2023-11-29 07:29
Spark
spark
streaming
Spark Streaming的基本数据流
在大数据环境中,尤其是使用Hadoop
分布式文件系统
(
HDFS
)时,数据通常被认为是静态的,这是因为
HDFS
被设计成适合一次写入和多次读取的场景
俺会hello我的
·
2023-11-29 07:55
spark
大数据
数据仓库
MapReduce计算任务的步骤
MapReduce计算任务的步骤第1步:InputFormatInputFormat到
hdfs
上读取数据将数据传给Split第2步:Split//设置读取数据的路径TextInputFormat.addInputPath
未烬丶
·
2023-11-29 06:47
MapReduce
阿里云服务器搭建Hadoop报错“Incompatible clusterIDs”“Excluding datanode”“Cannot assign requested address”
hadoophome下logs文件夹的内容,看具体报错原因1.IncompatibleclusterIDs大致意思是说namenode和datanode的clusterIDs不一致,出现这个的原因应该是多次的
hdfs
namenode-format
暮月七
·
2023-11-29 06:40
云计算
Hadoop
hadoop
服务器
阿里云
上一页
21
22
23
24
25
26
27
28
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他