E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs集群搭建
hdfs
元数据为什么分fsimage和edits,合并操作怎么进行的
在NameNode中,命名空间(namespace,指文件系统中的目录树、文件元数据等信息)是被全部缓存在内存中的,一旦NameNode重启或者宕机,内存中的所有数据将全部丢失,所以必须要有一种机制能够将整个命名空间持久化保存,并且能在NameNode重启时重建命名空间。这里就是通过fsimage(FSImage类)和edits(FSEditLog类)共同实现的。fsimage:命名空间镜像,存储
sf_www
·
2024-01-20 11:53
hadoop
hdfs
hadoop
big
data
Quorum Journal实现
HDFS
HA配置dfs.ha.fencing.methods
1.为什么使用QuorumJournal方式实现
hdfs
ha配置dfs.ha.fencing.methods只需要写shell(true)?
sf_www
·
2024-01-20 11:22
hadoop
hadoop
hdfs
Hadoop配置文件加载
hadoop使用org.apache.hadoop.conf.Configuration类来加载配置文件2.一般我们在写客户端程序等需要连接hadoop集群时,需要自己准备好core-site.xml和
hdfs
-site.xml
sf_www
·
2024-01-20 11:52
hadoop
hadoop
大数据
hdfs
HDFS
垃圾回收源码解析
1.TrashPolicy类:所有的垃圾回收策略都需要实现该类,
hdfs
默认的实现方式是:TrashPolicyDefault,可通过fs.trash.classname来配置。
sf_www
·
2024-01-20 11:52
hadoop
hadoop
hdfs
大数据
Hadoop基础知识
狭义上说,Hadoop指Apache这款开源框架,它的核心组件有:
HDFS
(分布式文件系统):解决海量数据存储YARN(作业调度和集群资源管理的框架):解决资源任务调度MAPREDUCE(分布式运算编程框架
坐在风口上de猪
·
2024-01-20 10:10
hadoop
大数据
分布式
Spring Cloud详细入门使用
文章目录SpringCloud服务注册与发现EurekaServer启动服务注册服务发现NacosServer启动(nacos2.2.0)服务注册服务发现服务集群命名空间配置中心
集群搭建
负载均衡RPC远程过程调用
怡人蝶梦
·
2024-01-20 08:59
JAVA
spring
cloud
spring
后端
Kafka系列(二)、架构原理及存储机制
kafkaeagle安装使用滴滴开源的kafka-manager编译及部署使用kafka管理监控系统CMAK(yahoo的kafka-manager)部署及使用Kafka系列(一)、2.6.0版本kafka
集群搭建
架构原理架构
王义凯_Rick
·
2024-01-20 08:56
#
Kafka
kafka
架构
控制器
存储机制
原理
hdfs
命令参考1-判断文件存在后删除
#cleanoutputPath
hdfs
dfs-test-e$outputPathif[$?
liuzx32
·
2024-01-20 05:24
Kylin基础教程(一)
一、Kylin介绍1.1现状Hadoop于2006年初步实现,改变了企业级的大数据存储(基于
HDFS
)和批处理(主要基于MR)问题,10几年过去了,数据量随着互联网的发展井喷式增长,如何高速、低延迟的分析数据成为后续面临的挑战
GOD_WAR
·
2024-01-20 03:43
Kylin
技术博览
Kylin
大数据学长面试之OPPO面试题
1)技术部分(1)SparkStreaming消费方式及区别,Spark读取
HDFS
的数据流程(2)Kafka高性能(3)Hive调优,数据倾斜(4)Zookeeper怎么避免脑裂,什么是脑裂。
大数据小理
·
2024-01-19 16:01
大数据1
大数据
面试
职场和发展
Elasticsearch8
集群搭建
(二)配置篇:(2)系统配置
此篇记录Elasticsearch8的一些系统配置。1、更改文件描述符的限制Elasticsearch使用了大量的文件描述符,它用于表示系统打开的文件的标识符。文件描述符是非负整数,它在操作系统层面被用来唯一标识一个打开的文件、套接字或其他I/O资源。每个进程都有一组文件描述符,这些描述符用于跟踪它当前打开的文件和网络连接。操作系统为每个进程分配一定数量的文件描述符。这个数量是由操作系统的配置和限
要薪贫气和哦
·
2024-01-19 13:55
Elasticsearch
elasticsearch
大数据
详解SpringCloud微服务技术栈:Nacos配置管理
Nacos的
集群搭建
,感觉太复杂了,就一台电脑要弄很久去模拟,所以不
布布要成为最负责的男人
·
2024-01-19 12:49
微服务技术全家桶
spring
cloud
微服务
java
nacos
springboot
大数据开发之Hadoop(优化&新特征)
第1章:
HDFS
-故障排除注意:采用三台服务器即可,恢复到Yarn开始的服务器快照。
Key-Key
·
2024-01-19 10:50
大数据
hadoop
分布式
centos中安装nfs实现服务器文件共享
如果一个服务使用集群方式部署,在文件读写时就需要考虑多个服务之间文件共享的问题,在共享文件时可以考虑部署一个单独的文件服务器,比如
hdfs
、minio、fastdfs等,也可以使用简单的文件目录共享方式实现
腊笔不小新xingo
·
2024-01-19 09:18
服务器
centos
linux
任务15:使用Hive进行全国气象数据分析
进行数据分析重点:掌握Hive基本语句熟练使用Hive对天气数据进行分析内容:使用Hive创建外部表使用Hive对数据进行统计分析任务指导1.使用Hive创建基础表将China_stn_city.csv文件上传到
HDFS
Dija-bl
·
2024-01-19 08:44
hive
数据分析
hadoop
Eureka整合seata分布式事务
修改conf目录中flie.conf文件1.3、修改conf目录中registry.conf文件1.4、初始化seata数据库二、微服务整合Seata2.1、父工程项目创建引入依赖2.2、Eureka
集群搭建
人生就像一场戏!
·
2024-01-19 07:52
springcloud
eureka
分布式
云原生
Jackson标签的高阶使用样例--多继承/子类、对象id、JsonIdentityInfo、JsonTypeInfo、JsonSubTypes
我们支持的资产类型不仅有关系数据库表,也支持Kafka主题,
hdfs
上的文件等。
OkGogooXSailboat
·
2024-01-19 06:19
java
json
Spark基础学习--基础介绍
首先我们回顾一下MapReduce的架构:MR基于
HDFS
实现大数据存储,基于Yarn做资源调度,且MR是基于进程处理数据的总结一下MR的缺点:1.MR是基于进程进行数据处理,进程相对
Yan_bigdata
·
2024-01-19 06:37
spark
学习
大数据
mapreduce
对比
入门案例
词频统计
FineBI实战项目一(25):实战项目一总结
没有集群,
hdfs
、hive、spark、kafka、flink等等都没有2解决方案mysql数据同步尽量和业务系统保持一致,以便后期出现问题排查。mysql同步到数仓,数仓
不死鸟.亚历山大.狼崽子
·
2024-01-19 02:39
FineBI
finebi
HBase第一章:
集群搭建
系列文章目录HBase第一章:
集群搭建
文章目录系列文章目录前言一、环境准备二、上传HBase三、上传HBase四、配置参数五、分发测试六、高可用总结前言Hive的内容基本算是学完了,太深入的东西,现在没有必要死磕
超哥--
·
2024-01-19 00:57
HBase
hbase
hadoop
大数据
hbase学习笔记-hbase集群安装部署
tar-zxvfhbase-2.0.0-bin.tar.gz-C/opt/bigdata5、重命名解压目录mvhbase-2.0.0hbase6、修改配置文件1、需要把hadoop中的配置core-site.xml、
hdfs
陈同学:
·
2024-01-19 00:22
hbase
hbase
zookeeper
HBase集群部署
前提条件安装hbse的前提条件是jdk已经搭建完成,虚拟机具有Hadoop伪分布式或完全分布式的
集群搭建
,以及zookeeper环境搭建完成。
Golden life
·
2024-01-19 00:21
hbase
数据库
大数据
HBase学习三:集群部署
>启动HBase—>关闭HBase—>关闭Hadoop1环境准备1.0环境前期准备参考基础环境配置1.1机器准备hostnameipvm1ip1vm2ip2vm3ip31.2机器分配
hdfs
Studying!!!
·
2024-01-19 00:50
中间件
HBase
HDFS
使用QJM(Quorum Journal Manager)实现的高可用性以及备份机制
目录前言1.NameNode的启动和对edits和QJM相关配置文件的解析2.使用FSImage和FSEditLog类对image和editlog文件进行读写和管理3.EditsDoubleBuffer双缓存,让flush和write同时进行,互不干扰4.AsyncLoggerSetl类代理对QJM集群的读写6.QuorumCall封装了对基于paxos算法的QJM集群的异步操作7.StandBy
麦兜和小可的舅舅
·
2024-01-18 22:56
hadoop
namenode
QJM
HA
HDFS
HADOOP
Hadoop的心脏:中央异步调度器AsyncDispatcher代码和设计解析
以Yarn、
HDFS
和MapReduce为主要组成的Hadoop,涉及到大量复杂的、交互的事件处理、状态转换,同时,这些事件调度和状态转换又对实时性和效率提出了极高的要求。
麦兜和小可的舅舅
·
2024-01-18 22:56
yarn
hadoop
hadoop
yarn
dispatcher
异步调度器
Hadoop RPC Server基于Reactor模式和Java NIO 的架构和原理
尤其是作为Master/Slave结构的Hadoop设计,比如
HDFS
NameNode或者YarnResourceMan
麦兜和小可的舅舅
·
2024-01-18 22:26
hadoop
yarn
open-source
hadoop
reactor
yarn
nio
RPC
HDFS
Web
HDFS
读写文件分析及HTTP Chunk Transfer Encoding相关问题探究
文章目录前言需要回答的首要问题DataNode端基于Netty的Web
HDFS
Service的实现基于重定向的文件写入流程写入一个大文件时Web
HDFS
和HadoopNative的块分布差异基于重定向的数据读取流程尝试读取一个小文件尝试读取一个大文件读写过程中的
麦兜和小可的舅舅
·
2024-01-18 22:52
大数据架构
实现
hadoop
open-source
hdfs
http
hadoop
Redis
集群搭建
为什么要有集群之前我们已经讲了主从的概念,一主可以多从,如果同时的访问量过大(1000w),主服务肯定就会挂掉,数据服务就挂掉了或者发生自然灾难大公司都会有很多的服务器(华东地区、华南地区、华中地区、华北地区、西北地区、西南地区、东北地区、台港澳地区机房)集群的概念集群是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理。一个客户与集群相互作用时,集群像是一个独
仲夏那片海
·
2024-01-18 22:14
运维文档
redis
数据库
缓存
【数据采集与预处理】数据传输工具Sqoop
Sqoop原理三、Sqoop安装配置(一)下载Sqoop安装包并解压(二)修改配置文件(三)拷贝JDBC驱动(四)验证Sqoop(五)测试Sqoop是否能够成功连接数据库四、导入数据(一)RDBMS到
HDFS
Francek Chen
·
2024-01-18 22:19
大数据技术基础
sqoop
hadoop
大数据
数据库
Hive入门
Hive把表和字段转换成
HDFS
中的文件夹和文件,并将这些元数据保持在关系型数据库中,如derby或mysql。Hive查询的数据存储在
HDFS
上,运行在Yarn上。Hive适合做离线数
kongxx
·
2024-01-18 17:11
k8s
集群搭建
的一些坑
k8s集群部署的时候会遇到很多的坑,即使看网上的文档也可能遇到各种的坑。安装准备1、虚拟机两台(ip按自己的网络环境相应配置)(master/node)192.168.100.215k8s-master192.168.100.216k8s-node12、关闭防火墙(master/node)systemctlstopfirewalldsystemctldisablefirewalld3、关闭seli
ByteX
·
2024-01-18 15:29
k8s
kubernetes
容器
云原生
大数据小白初探Hbase从零到入门
目录1.前言2.初识Hbase2.1有了
HDFS
为什么还需要HBase呢?2.2HBase主要做什么的?2.3HBase架构特点?2.4HBase的适用场景?2.5HBase的数据模型和物理储存格式?
北京-景枫
·
2024-01-18 09:10
hbase
大数据
列簇式存储
HBASE学习一:原理架构详解
HBase的存储是基于
HDFS
的,
HDFS
有着高容错性的特点,被设计用来部署在低廉的硬件上,基于Hadoop意味着HBase与生俱来的超强的扩展性和吞吐量。HBase采用的时ke
Studying!!!
·
2024-01-18 08:34
中间件
hbase
学习
架构
大数据分析之ClickHouse技术选型
文章目录1.快速入门2.企业应用与实践3.踩坑4.优化最近公司的战略上需要更多的数据支撑,目前在构思打造一个用户数据分析平台,由于团队人力有限,没有
Hdfs
生态的技术人员。
凡尘技术
·
2024-01-18 08:12
数据库
数据分析
clickhouse
数据挖掘
ElasticSearch学习之一:基础知识+单节点/
集群搭建
一、ES相关知识ES基于RESTfulweb接口并且构建在Apachelucene之上的开源分布式搜索引擎。同时ES是一个分布式文档数据库,每个字段均可被索引、每个字段数据均可被搜索,能够横向扩展数以百计的服务器存储以及处理PB级的数据。1.可以在极短时间内存储、搜索和分析大量的数据2.通常作为具有复杂搜索场景下的核心发动机ES高可用且高扩展。一方面同升级硬件完成系统扩展,称为垂直或向上扩展,另一
HackQ_sxj
·
2024-01-18 08:39
JAVA
WEB
Elasticsearch8
集群搭建
(一)基础篇
记录下工作中搭建Elasticsearch8集群的过程,此篇为第一部分,后续会陆续更新其他部分。前提:安全组配置:确保集群内所有服务器在同一安全组内。(或在不同安全组但互相可以通信)以下步骤需要在每台要安装Elasticsearch的服务器上执行。1、创建Elasticsearch专属用户Elasticsearch禁止以root身份启动,必须创建一个专属用户来运行:图片来源:Elasticsear
要薪贫气和哦
·
2024-01-18 08:38
Elasticsearch
elasticsearch
大数据
Elasticsearch8
集群搭建
(二)配置篇:(1)节点和集群配置
安装完Elasticsearch后,需要对其进行配置,包括以下几部分:节点和集群配置、系统配置、安全配置。此篇记录节点和集群配置的内容,后续将更新系统配置和安全配置。节点和集群配置:通过编辑/usr/local/elasticsearch-8.10.2/config/elasticsearch.yml文件进行配置,在集群内每个节点上都要进行配置。1、Cluster部分:cluster.name:设
要薪贫气和哦
·
2024-01-18 08:38
Elasticsearch
elasticsearch
大数据
Spark—shell,Hbase—shell
Spark:SPARKSQLresults=spark.sql("SELECT*FROMpeople")//读取JSON文件valuserScoreDF=spark.read.json("
hdfs
://
꧁༺朝花夕逝༻꧂
·
2024-01-18 07:21
spark
大数据
分布式
基于华为MRS实时消费Kafka通过Flink落盘至
HDFS
的Hive外部表的调度方案
文章目录1Kafka1.1Kerberos安全模式的认证与环境准备1.2创建一个测试主题1.3消费主题的接收测试2Flink1.1Kerberos安全模式的认证与环境准备1.2Flink任务的开发3
HDFS
大数据程序终结者
·
2024-01-18 06:25
Hadoop生态
Flink
华为
kafka
flink
fusioninsight
hdfs
hive
sqoop事务如何实现
场景1:如Sqoop在导出
hdfs
数据到Mysql时,某个字段过长导致任务失败,该错误记录之前的数据正常导入,之后的数据无法导入。如何保证错误发生后数据回滚?
qzWsong
·
2024-01-18 06:50
sqoop
sqoop
hadoop
hive
【centos7系统】Redis-6.2.2版本
集群搭建
前redis最新版本已经是6.2.4,在
集群搭建
上和redis3.x、redis4.x区别很大。
SRE成长记
·
2024-01-18 05:16
数据库
redis
数据库
缓存
部署
阿里云大数据ACA及ACP复习题(21~40)
(D)A:
HDFS
B:DFSC:RDDD:MapReduce解析:MAPREDUCE(分布式运算编程框架)22.以下选项中不属于MaxCompute特点的是(D)A:支持多种多种经典的分布式计算模型B:
周周的奇妙编程
·
2024-01-18 03:08
阿里云
大数据
云计算
HDFS
系统架构
HDFS
ArchitectureIntroductionHadoopDistributedFileSystem(
HDFS
)是设计可以运行于普通商业硬件上的分布式文件系统。
偷油考拉
·
2024-01-18 03:52
RabbitMQ常见问题之高可用
文章目录一、集群分类二、普通
集群搭建
1.准备2.配置3.运行三、镜像集群1.介绍2.启用方式3.测试四、仲裁队列1.介绍2.创建五、Java连接RabbitMQ集群方式一、集群分类RabbitMQ的是基于
木子dn
·
2024-01-18 01:31
Server架构
#
RabbitMQ
rabbitmq
ruby
分布式
Ceph分布式文件系统
集群搭建
详解
1、Ceph分布式文件系统简介Ceph是一种为优秀的性能、可靠性和可扩展性而设计的统一的、分布式文件系统。Ceph独一无二地在一个统一的系统中同时提供了对象、块、和文件存储功能。基开发目标是:可轻松扩展到数PB容量支持多种工作负载的高性能(每秒输入/输出操作[IOPS]和带宽)高可靠性Ceph不仅仅是一个文件系统,还是一个有企业级功能的对象存储生态环境。中文学习网址:CEPH中文学习网2.Ceph
蔚蓝色天空sky
·
2024-01-18 00:11
分布式
ceph
分布式文件系统
Ceph分布式文件系统
集群搭建
目录一、规划设计二、环境准备三、部署ceph集群四、开启Dashboard一、规划设计准备四台虚拟机(部署三台服务器和一台计算机更好),分别安装centos-7-x86_64操作系统,使用的ceph的版本minic版,网络地址及规划随机。节点名称IP地址系统版本部署进程数据盘Ceph1192.168.239.150Centos-7-x86_64MON+mgr+OSD/dev/sdbCeph2192
疯狂运维的树懒
·
2024-01-18 00:10
ceph
云存储
云计算
七牛云存储
linux
运维
spark-udf函数
frompyspark.sqlimportSparkSessionfrompyspark.sql.typesimport*创建连接ss=SparkSession.builder.getOrCreate()读取
hdfs
中长跑路上crush
·
2024-01-17 23:34
Spark阶段
spark
大数据
分布式
常用图算法实现--Spark
1211523242526273134251151261676871788189810914911011013111211112113141412151网页:123456789101112131415将这两个文件放入
HDFS
zealscott
·
2024-01-17 19:45
本地运行Flink退出时java.nio.file.DirectoryNotEmptyException、目录没有正常删除解决方法
1.背景在开发大数据平台XSailboat中的查看Flink任务的状态数据工具时,用StateProcessAPI解析保存点数据,将其从
HDFS
上读取出来再将其解析过后下沉到
HDFS
以CSV格式保存,然后由其它接口提供对这个文件的分页加载功能
OkGogooXSailboat
·
2024-01-17 18:05
大数据平台开发问题解决笔记
flink
java
nio
HDFS
简介与常用API
HDFS
简介
HDFS
是一个文件系统(HadoopDocumentFileSystem),通过目录树来定位文件。其次,它是分布式的。
HDFS
适用于:一次写入,多次读出的场景。
正橙橙橙橙
·
2024-01-17 16:45
Hadoop入门
hadoop
hdfs
java
上一页
8
9
10
11
12
13
14
15
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他