E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs日常维护
flink1.12配置滚动日志(超详细)
官方建议详细配置完整的log4j.properties配置文件如下:flink1.12kafka的BUG配置滚动生成的目的1.当yarn配置了日志聚集功能时,yarn上的任务停止时,会将程序运行日志信息上传到
HDFS
重生之我在异世界打工
·
2023-11-30 22:03
flink
log4j
flink
Hadoop之
HDFS
一.
HDFS
概述1.1
HDFS
产生的背景定义1)背景:随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件
小猫旺财
·
2023-11-30 20:11
Hadoop
hadoop
hdfs
big
data
大数据
HDFS
基础知识(个人总结)
HDFS
存储优缺点:优点高容错,因为它有多个副本可处理大数据,文件数量可达百万缺点
HDFS
可以追加,但不能修改某一条数据,若实在想修改,只能下载下来原文件进行修改后重新上传覆盖不适合低延迟数据访问,如毫秒级无法高效存储大量小文件小文件导致数量太多
hellosrc | forward
·
2023-11-30 20:41
Hadoop
1024程序员节
hadoop
大数据
HDFS
概述
文章目录一、
HDFS
概述1.什么是
HDFS
2.
HDFS
基本架构3.搭建[
HDFS
]4.安装hadoop5.hadoop配置文件的配置etc/hadoop6.namenode的格式化7.启动hadoop守护进程
~chun
·
2023-11-30 20:11
数据
HDFS
简介
介绍 在现代的企业环境中,单机容量往往无法存储大量数据,需要跨机器存储。统一管理分布在集群上的文件系统称为分布式文件系统。而一旦在系统中,引入网络,就不可避免地引入了所有网络编程的复杂性,例如挑战之一是如果保证在节点不可用的时候数据不丢失。 传统的网络文件系统(NFS)虽然也称为分布式文件系统,但是其存在一些限制。由于NFS中,文件是存储在单机上,因此无法提供可靠性保证,当很多客户端同时访问N
武汉小旭旭
·
2023-11-30 20:40
Hadoop
hdfs
hadoop
大数据
HDFS
详解
HDFS
架构剖析
HDFS
,HadoopDistributeFileSystem(Hadoop分布式文件系统)的简称,它是Hadoop核心组件之一,是大数据生态圈最底层的分布式存储服务。
liuhanyuu
·
2023-11-30 20:09
hdfs
hadoop
大数据
大数据-
HDFS
的定义、使用场景、优缺点、组成架构
HDFS
定义
HDFS
(HadoopDestributedFileSystem)是一个分布式的文件系统,用于存储文件,通过目录树来定位文件
HDFS
使用场景适合一次写入,多次读取的场景,不支持文件的修改
HDFS
hmyqwe
·
2023-11-30 20:08
HDFS
大数据
【Hadoop】分布式文件系统
HDFS
目录一、介绍二、
HDFS
设计原理2.1
HDFS
架构2.2数据复制复制的实现原理三、
HDFS
的特点四、图解
HDFS
存储原理1.写过程2.读过程3.
HDFS
故障类型和其检测方法故障类型和其检测方法读写故障的处理
和瑚
·
2023-11-30 20:06
#
Hadoop
hadoop
hdfs
大数据
时间序列异常检测14篇顶会论文合集,附必备工具和数据集
今天来聊聊一个在量化交易、网络安全检测、自动驾驶汽车和大型工业设备的
日常维护
等领域都有重要作用的研究主题:时间序列异常检测。
深度之眼
·
2023-11-30 19:43
人工智能干货
深度学习干货
人工智能
异常检测
时间序列
Hyper-v虚拟机Hadoop集群搭建
Hadoop实现了一个分布式文件系统(HadoopDistributedFileSystem),简称
HDFS
。
真.电脑人
·
2023-11-30 16:16
hadoop
大数据
分布式
【
HDFS
】ActiveNamenodeResolver#getNamespaces 方法调用点梳理
获取所有的注册在router里的active状态的集群。/***Getalistofallnamespacesthatareregisteredandactiveinthe*federation.**@returnListofnamespacesinthefederation*@throwsIOExceptionThrowsexceptionifthenamespacelistisnot*avai
叹了口丶气
·
2023-11-30 14:17
HDFS全方位实战
hdfs
hadoop
大数据
01数仓平台 Hadoop介绍与安装
HDFS
架构概述HadoopDistributedFileSystem,简称
HDFS
,是一个分布式文件系统。包含
kk_io
·
2023-11-30 13:38
数据仓库
hadoop
大数据
分布式
在centos7上搭建hadoop大数据平台
Hadoop安装1、下载2、准备启动Hadoop集群2.1配置Hadoop守护进程的环境2.2配置系统环境变量2.3配置etc/hadoop/core-site.xml文件2.4配置etc/hadoop/
hdfs
-site.xml
船长灬普朗克
·
2023-11-30 13:03
大数据
hadoop
大数据
java
2019-12-11
本质是:将HQL转化成MapReduce程序image.pngimage.png1)Hive处理的数据存储在
HDFS
2)Hive分析数据底层的实现是MapReduce3)执行程
diedfish_qyf
·
2023-11-30 11:41
Apache Flink(二):数据架构演变
豹哥教你大数据的个人空间-豹哥教你大数据个人主页-哔哩哔哩视频目录1.业务处理-单体架构2.业务处理-微服务架构3.数据分析-大数据Lambda架构4.有状态流计算架构近年来随着越来越多的大数据技术被开源,例如:
HDFS
IT贫道
·
2023-11-30 11:19
大数据计算体系技术栈
Apache
Flink
apache
flink
架构
Hadoop-
HDFS
详解与HA,完全分布式集群搭建(细到令人发指的教程)
目录一、引入
hdfs
是什么
hdfs
的由来
hdfs
架构体系
hdfs
的优缺点优点缺点二、
HDFS
_block简介和注意事项Block拆分标准三、
HDFS
_block安全与管理Block数据安全Block的管理效率四
毫无感情的dj
·
2023-11-30 10:06
hadoop
hdfs
大数据
分布式
zookeeper
Hadoop-
HDFS
角色工作机制
一、角色职责介绍 HadoopDistributedFileSystem(
HDFS
,分布式文件系统):
HDFS
是Hadoop应用程序使用分布式存储,
HDFS
集群主要由管理文件系统元数据的NameNode
H.S.T不想卷
·
2023-11-30 10:33
大数据
hadoop
hdfs
大数据
【大数据Hadoop】
HDFS
-Namenode-format格式化的源码步骤分析
Namenodeformat流程格式化命令源码解读初始化操作格式化操作本地写VERSION文件JournalManager的格式化持久化FsImage文件流程根据配置项获取nameserviceId、namenodeId判断配置项dfs.namenode.support.allow.format是否允许格式化,一般生产环境建议配置,防止误操作格式化了已有数据。获取格式化的目录(fsImage和ed
笑起来贼好看
·
2023-11-30 10:30
Hadoop
大数据
服务运维部署
hadoop
大数据
hdfs
大数据技术之Hadoop(
HDFS
)
1.
HDFS
概述1.1
HDFS
产生背景和意义1.
HDFS
产生背景随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件
江苏彭与晏
·
2023-11-30 10:23
hadoop
大数据
hdfs
大数据 - Hadoop -
HDFS
Hadoop=
HDFS
(文件系统,数据存储技术相关)+Mapreduce(数据处理),Hadoop的数据来源可以是任何形式,在处理半结构化和非结构化数据上与关系型数据库相比有更好的性能,具有更灵活的处理能力
蒙蒙的林先生
·
2023-11-30 10:21
大数据
大数据
大数据
hadoop
hdfs
大数据Hadoop-
HDFS
_架构、读写流程
大数据Hadoop-
HDFS
基本系统架构
HDFS
架构包含三个部分:NameNode,DataNode,Client。NameNode:NameNode用于存储、生成文件系统的元数据。运行一个实例。
大沙头三马路
·
2023-11-30 09:48
BigDate
Linux
大数据
hadoop
hdfs
HCIA
大数据-hadoop-
hdfs
Hadoop分布式文件系统(
HDFS
)是指被设计成适合运行在通用硬件(commodityhardware)上的分布式文件系统(DistributedFileSystem)。
像影子追着光梦游_
·
2023-11-30 09:48
大数据
hadoop
hdfs
大数据Hadoop-
HDFS
_元数据持久化
大数据Hadoop-
HDFS
_元数据持久化(1)在
HDFS
第一次格式化后,NameNode(即图中的主NameNode)就会生成fsimage和editslog两个文件;(2)备用NameNode(即图中的备
大沙头三马路
·
2023-11-30 09:14
BigDate
Linux
大数据
hadoop
hdfs
linux
【物联网与大数据应用】Hadoop数据处理
Hadoop利用分而治之的思想为大数据提供了一整套解决方案,如分布式文件系统
HDFS
、分布式计算框架MapReduce、NoSQL数据库HBase、数据仓库工具Hive等。
Bosenya12
·
2023-11-30 09:06
大数据
hadoop
分布式
Map和Reduce在Hadoop与Python中有何异同?
Hadoop作为一个分布式系统,可以将不同的机器设备连接起来进行存储,也就是人们常说的
HDFS
,这也是Hadoop的一个构成部分;而hadoop的另一个构成部分就是MapReduce了,前者负责数据的存储
值得一看的喵
·
2023-11-30 09:25
Hadoop入门学习笔记-第六天(hive数据库命令相关操作)
hive命令行操作/user/hive/warehouse(
hdfs
目录))说明:hive创建的数据库和数据库表都存在
hdfs
,一般默认目录为:/user/hive/warehouse1…创建hive的数据库
渣男程序员007
·
2023-11-30 05:44
Hadoop入门学习笔记
hadoop
数据库
java
hive
mysql
Hadoop入门学习笔记-第四天(wordCount实例代码编写笔记)
文件中引入以下jar包org.apache.hadoophadoop-client2.7.3org.apache.hadoophadoop-common2.7.3org.apache.hadoophadoop-
hdfs
2.7.3org.apache.hadoophadoop-client2.7.33
渣男程序员007
·
2023-11-30 05:43
Hadoop入门学习笔记
java
大数据
hadoop
mapreduce
spark
Hadoop入门学习笔记-第二天 (
HDFS
:NodeName高可用集群配置)
说明:
hdfs
:nn单点故障,压力过大,内存受限,扩展受阻。
hdfs
ha:主备切换方式解决单点故障
hdfs
Federation联邦:解决鸭梨过大。
渣男程序员007
·
2023-11-30 05:13
Hadoop入门学习笔记
hadoop
java
大数据
hdfs
Hadoop入门学习笔记-第三天(Yarn高可用集群配置及计算案例)
什么是mapreduce首先让我们来重温一下hadoop的四大组件:
HDFS
:分布式存储系统MapReduce:分布式计算系统YARN:hadoop的资源调度系统Common:以上三大组件的底层支撑组件
渣男程序员007
·
2023-11-30 05:13
Hadoop入门学习笔记
分布式
hadoop
大数据
spark
mapreduce
【Spark】on yarn集群模式安装部署
官方文档http://spark.apache.org/docs/latest/running-on-yarn.html前提安装启动Hadoop(需要使用
HDFS
和YARN)安装单机版Spark不需要集群
没去过埃及的法老
·
2023-11-30 03:23
Sprak
大数据
spark
on
yarn集群模式
安装部署
云计算/大数据
Spark on YARN的部署
SparkonYARN的原理就是依靠yarn来调度Spark,比默认的Spark运行模式性能要好的多,前提是首先部署好hadoop
HDFS
并且运行在yarn上,然后就可以开始部署sparkonyarn了
GoodInSun
·
2023-11-30 03:23
spark
spark
on
yarn
ambari运维问题记录
ambari综合问题记录1、
hdfs
无法启动错误:2018-04-2514:36:09,293-Retryingafter10seconds.Reason:Executionof'/usr/hdp/current
人生匆匆
·
2023-11-30 03:23
ambari
ambari
运维
hadoop
【Ambari】
HDFS
基于Ambari的常规运维
目录一、简介1.1Ambari介绍1.2关于本手册二、综合运维2.1Ambari一览2.1.1命令行操作2.1.2登入和登出2.1.3.管理界面首页三、服务的管理和运维3.1
HDFS
运维3.1启动/停止
阿龙先生啊
·
2023-11-30 03:52
#
【====
Ambari
====】
ambari
hdfs
运维
服务重启
添加配置
core-site.xml
Spark完全分布式搭建(On Yarn)
目录一、集群规划二、配置Spark路径三、修改配置文件1.spark-env.sh2.修改slaves文件四、启动集群1.先起动Hadoop的
HDFS
和Yarn2.启动Spark五、Web查看集群启动情况六
Congee小周
·
2023-11-30 02:00
大数据
hadoop
spark
完全分布式
spark-env.sh
slaves
【解决】
HDFS
JournalNode启动慢问题排查
文章目录一.问题描述二.问题分析1.排查机器性能2.DNS的问题三.问题解决1.修复DNS服务2.添加主机映射为0.0.0.03.修改hadoop源码一句话:因为dns的问题导致journalnode启动时很慢,通过修复dns对0.0.0.0域名解析,修复此问题。一.问题描述从journalnode启动到服务可用,完成RPCListen,需要花费大概1分多钟的问题,而这不符合安装预期。二.问题分析
roman_日积跬步-终至千里
·
2023-11-29 20:12
hadoop运维
hdfs
网络
hadoop
大数据技术之HBase
①HBase是以
hdfs
为数据存储,一个面向
Red-P
·
2023-11-29 20:57
大数据基础
hbase
大数据
数据库
大数据之HBase
HBase介绍Apache的三篇论文,GFS谷歌文件系统->
HDFS
;MR->MR;BigTable->HBase;HBase是hadoop数据库,一种分布式、可扩展的大数据NoSQL数据库之一。
十七✧ᐦ̤
·
2023-11-29 20:55
大数据
hbase
数据库
如何能打进去idea引入外部jar包
org.apache.maven.pluginsmaven-war-plugin3.2.3${project.basedir}/libWEB-INF/lib/**/*.jar然后导入依赖即可comhadoop-
hdfs
-client2.7
一个正在努力的小白码农
·
2023-11-29 19:57
intellij-idea
jar
HBase初识之学生心得总结
c、HBase:理解为Hadoopbase--3.大数据框架:a、数据的存储:
hdfs
/hive/hbaseb、数据的传输:flume/sqoopc、数据的计算
程序员驴子酱
·
2023-11-29 15:33
大数据
HCIA-Big Data华为认证大数据工程师 习题册 含答案
查看课堂笔记(含习题册)目录1.大数据发展趋势与鲲鹏大数据2.
HDFS
分布式文件管理系统和ZooKeeper3.Hive分布式数据仓库4.HBase技术原理5.MapReduce和Yarn技术原理6.Spark
k Chivalrous man
·
2023-11-29 08:16
大数据
大数据
华为
SparkStreaming基本数据源
SparkStreaming基本数据源案例1.文件流案例SparkStreaming支持各种文件系统中的文件流,如:
HDFS
、本地文件系统创建文件流的方式:读取
HDFS
上面的文件:streamingConte
简丶致
·
2023-11-29 07:06
spark
big
data
spark
Spark Streaming提取数据
它支持的流资包括
HDFS
、Kafka、Flume以及自定义流等。SparkStreaming操作可以从故障中自动恢复,这对于在线数据处理十分重要。
简单不过l
·
2023-11-29 07:29
Spark
spark
streaming
Spark Streaming的基本数据流
在大数据环境中,尤其是使用Hadoop分布式文件系统(
HDFS
)时,数据通常被认为是静态的,这是因为
HDFS
被设计成适合一次写入和多次读取的场景
俺会hello我的
·
2023-11-29 07:55
spark
大数据
数据仓库
MapReduce计算任务的步骤
MapReduce计算任务的步骤第1步:InputFormatInputFormat到
hdfs
上读取数据将数据传给Split第2步:Split//设置读取数据的路径TextInputFormat.addInputPath
未烬丶
·
2023-11-29 06:47
MapReduce
阿里云服务器搭建Hadoop报错“Incompatible clusterIDs”“Excluding datanode”“Cannot assign requested address”
hadoophome下logs文件夹的内容,看具体报错原因1.IncompatibleclusterIDs大致意思是说namenode和datanode的clusterIDs不一致,出现这个的原因应该是多次的
hdfs
namenode-format
暮月七
·
2023-11-29 06:40
云计算
Hadoop
hadoop
服务器
阿里云
hadoop启动datanode报错:Incompatible clusterIDs in
例如我datanode数据目录为/home/hadoop/
hdfs
/data/,将这/home/hadoop/
hdfs
/data里面的文件都删掉即可。
兔帮大人
·
2023-11-29 06:09
大数据
hadoop
修炼k8s+flink+
hdfs
+dlink(七:flinkcdc)
一:flinkcdc官网链接。https://ververica.github.io/flink-cdc-connectors/release-2.1/content/about.html二:在flink中添加jar包。在flinklib目录下增加你所需要的包。https://kdocs.cn/join/gv467qi?f=101邀请你加入共享群「工作使用重要工具」一起进行文档协作三:申请资源。c
宇智波云
·
2023-11-29 05:34
flink
flinkcdc
flink
hdfs
大数据
面试篇spark(spark core,spark sql,spark 优化)
spark执行框架示意图spark的执行中间结果是存储在内存当中的,而
hdfs
的执行中间结果是存储在
hdfs
中的。所以在运算的时候,spark的执行效率是reduce的3-5倍。二:spark是什么?
宇智波云
·
2023-11-29 05:21
面试
spark
sql
hadoop集群环境搭建和常用命令
或者echo$JAVA_HOME3.解压安装包tar-zxvf4.修改配置文件cd$HADOOP_HOME/etc/hadoop/下面是需要修改的配置文件hadoop-env.shyarn-env.sh
hdfs
-site.xmlcore-site.xmlmapred-site.xmlyarn-site.xm
Logan_addoil
·
2023-11-29 05:04
大数据学习之旅
hadoop
大数据
分布式
Hive数据库与表操作
一)Hive数据存储(二)创建数据库(三)查看数据库(四)修改数据库信息一、准备工作二、Hive数据库操作(一)Hive数据存储(二)创建数据库(三)查看数据库注意,我们创建的hive数据库,对应的是
HDFS
howard2005
·
2023-11-29 05:59
数仓技术Hive入门
数据库
表
hive
上一页
19
20
21
22
23
24
25
26
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他