E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs集群搭建
2024-02-06(Sqoop)
Hadoop生态包括:
HDFS
,Hive,Hbase等。RDBMS体系包括:Mysql,Oracle,DB2等。Sq
陈xr
·
2024-02-06 23:29
随记日志
sqoop
大数据
分布式文件系统
HDFS
的组成架构,及相关知识点归纳。
1.每存一个文件,需要消耗150字节,不管你是1kb,还是128m,2.分布式文件系统
HDFS
的组成架构namenode——4个功能1-管理
hdfs
的名称空间2-配置副本策略3-管理数据块映射信息4-处理客户端的读写请求
小米的南瓜洲
·
2024-02-06 23:37
K8S
集群搭建
1.28.x
1、Kubernetes集群规划主机名IP地址说明master192.168.33.201主节点node1192.168.33.202从节点noide2192.168.33.202从节点2、准备环境1、关闭防火墙systemctlstopfirewalldsystemctldisablefirewalld2、关闭selinuxsed-i's/enforcing/disabled/'/etc/sel
程丶的摆烂日常
·
2024-02-06 18:26
k8s
kubernetes
云原生
redis
集群搭建
(基于redis5.0+)
一、前戏1.1下载软件去官网下载软件:https://redis.io/download,笔者使用的是5.0.12,理由就是本人公司使用的也是这个版本。1.2物理机配置本人搭建的是3主3从。使用3台虚拟机,保证主从分配不在一台机器上,避免某台机器挂掉而影响整个集群的运行。物理配置:1.192.168.37.133:63702.192.168.37.133:63803.192.168.37.130:
She_lock
·
2024-02-06 12:51
redis
redis5.0集群
redis集群常见错误
redis启动脚本
redis集群最简配置
RabbitMQ
集群搭建
rabbitMQ的两种重要特性,异步化提高系统抗峰值能力和系统及功能解耦,这两个特点决定了rabbitMQ在我们的系统中占据了重要的地位,所以为了让RabbitMQ高可用,我们今天就来讲解下RabbitMQ的集群环境搭建应用常识一般情况下,一个单机版的rabbitMQ能承受大运1000/s的消息量(跟网络和消息的大小有关,数值存在波动),但是如果是集群环境中,就可以将访问的压力分摊到集群中的其他节
AmosZhu
·
2024-02-06 10:12
热数据存储在
HDFS
,冷备数据存储于对象存储中
1.场景分析生产环境均为腾讯云服务器,日志数据计划存储于
HDFS
中,由于日志数据较大(压缩后1T/天),不断扩充云盘成本消耗大。鉴于对象存储的存储成本较为低廉,但是日常频繁使用会产生流量费用。
tuoluzhe8521
·
2024-02-06 10:11
云原生
hdfs
hadoop
大数据
cos
对象存储
加速
hdfs
balance速度
hdfs
默认配置指定DataNode用于balancer的带宽为10Mdfs.datanode.balance.bandwidthPerSec1048576su
hdfs
hdfs
dfsadmin-setBalancerBandwidth104857600
迷茫_小青年
·
2024-02-06 09:05
minio
集群搭建
(纠删码模式)
搭一个4个节点,16块硬盘的minio集群。1.先做一些准备工作,新建了4个centos7的虚拟机,各新添加4块硬盘我用的虚拟机软件是VirtualBox,先搭建4个虚拟机,即4个节点,建虚拟机就不讲了用VirtualBox添加硬盘,这几台虚拟机硬盘我都添加过了,我用一个其他node35这个机器介绍硬盘添加添加磁盘这块我也不是特别懂,但是在搭建minio集群的过程中我是这么做的,而且成功了下一步,
hahaha 1hhh
·
2024-02-06 09:52
minio
centos
Kafka 使用手册
2.kafka基础架构3.kafka
集群搭建
4.kafka命令行操作主题命令行【topic】生产者命令行【producer】消费者命令行【consumer】5.kafka生产者生产者消息发送流程Producer
@lihewei
·
2024-02-06 08:01
kafka
分布式
ELFK日志采 - QuickStart
文章目录架构选型ELKEFLKElasticsearchES
集群搭建
常用命令Filebeat功能介绍安装步骤Filebeat配置详解filebeat常用命令Logstash功能介绍安装步骤Input插件
@lihewei
·
2024-02-06 07:25
elk
Redis(三)主从架构、Redis哨兵架构、Redis集群方案对比、Redis高可用
集群搭建
、Redis高可用集群之水平扩展
转自极客时间Redis主从架构redis主从架构搭建,配置从节点步骤:1、复制一份redis.conf文件2、将相关配置修改为如下值:port6380pidfile/var/run/redis_6380.pid#把pid进程号写入pidfile配置的文件logfile"6380.log"dir/usr/local/redis-5.0.3/data/6380#指定数据存放目录#需要注释掉bind#b
_蓝天IT_
·
2024-02-06 07:37
分布式
redis
架构
java
MongoDB分片
集群搭建
----前言mongodb分片一般用得比较少,需要较多的服务器,还有三种的角色一般把mongodb的副本集应用得好就足够用了,可搭建多套mongodb复本集mongodb分片技术mongodb副本集可以解决数据备份、读性能的问题,但由于mongodb副本集是每份数据都一模一样的,无法解决数据量过大问题mongodb分片技术能够把数据分成两份存储,假如shijiange.myuser里面有1亿条数据
ZzzkiYoumi
·
2024-02-06 06:21
MongoDB
mongodb
数据库
dba
HDFS
入门基础
HDFS
总结在现代的企业环境中,海量数据超过单台物理计算机的存储能力,分布式文件系统应运而生,对数据分区存储于若干物理主机,管理网络中跨多台计算机存储的文件系统。
nucty
·
2024-02-06 05:33
大数据
hdfs
hadoop
大数据
Apache Hadoop
ApacheHadoop_狭义上说,Hadoop指Apache一款java语言开发的开源框架,它的核心组件有:
HDFS
(分布式文件系统):解决海量数据存储YARN(作业调度和集群资源管理的框架):解决资源任务调度
VincentLeon
·
2024-02-06 05:28
2.RocketMQ
集群搭建
与消息发送样例
1.RocketMQ
集群搭建
1.1各角色介绍mqGroup.png角色NameServer:Broker的管理者。Broker自己去上报NameServer自己的存在Broker:消息的存储者。
lambdaCC
·
2024-02-06 00:58
Hadoop Start(1) ——Google与Hadoop的前世今生
参考文档:《Hadoop权威指南(第4版)》网址:http://hadoop.apache.org/[1]
HDFS
:HadoopDistributionFileSystemHadoop分布式文件系统[2
bclz
·
2024-02-05 18:41
Kafka2.13
集群搭建
并配置hosts172.17.0.2 node0172.17.0.3 node1172.17.0.4 node2在其中一台服务器中搭建Zookeeper(单机或集群都可以)Zookeeper
集群搭建
参考链接下载
咩哥无敌
·
2024-02-05 17:57
kafka
kafka
zookeeper
分布式
HDFS
的 DataNode 工作机制
1DataNode工作机制1)一个数据块在DataNode上以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是元数据包括数据块的长度,块数据的校验和,以及时间戳。2)DataNode启动后向NameNode注册,通过后,周期性(1小时)的向NameNode上报所有的块信息。3)心跳是每3秒一次,心跳返回结果带有NameNode给该DataNode的命令如复制块数据到另一台机器,或删除某个
求学旅途
·
2024-02-05 16:41
Java大数据
hdfs
datanode
hadoop
大数据
java
【
HDFS
实战】
HDFS
上的数据均衡
HDFS
上的数据均衡简介文章目录
HDFS
上的数据均衡简介重新平衡多DN之间的数据相关命令重新平衡单DN内磁盘间的数据相关命令PlanExecuteQueryCancelReport相关配置调试
HDFS
上的
顧棟
·
2024-02-05 16:09
hdfs
hadoop
大数据
如何对
HDFS
进行节点内(磁盘间)数据平衡
1.文档编写目的当
HDFS
的DataNode节点挂载多个磁盘时,往往会出现两种数据不均衡的情况:1.不同DataNode节点间数据不均衡;2.挂载数据盘的磁盘间数据不均衡。
格格巫 MMQ!!
·
2024-02-05 16:39
hadoop
hdfs
hdfs
hadoop
大数据
HDFS
源码解析---Balancer
概述在输入启动命令的那台机器上会启动一个进程,为了避免给namenode带来过大的负担,整个balance过程由balanceserver而不是namenode来控制。Balancer的最终结果是namenode上记录的一个block的一个副本从一个datanode转移到另一个datanode上。PS:副本放置策略第2个副本存放于不同于第1个副本所在的机架第3个副本存放于第2个副本所在的机架,但是
请叫我算术嘉
·
2024-02-05 16:38
Hadoop
HDFS
balancer
hdfs
java
hadoop调优-
HDFS
集群数据不均衡处理
hdfs
balancer
查看当前的数据分布情况:
hdfs
dfsadmin-report现象一:集群上经常会增添新的DataNode节点,或者人为干预将数据的副本数降低或者增加。
不会吐丝的蜘蛛侠。
·
2024-02-05 16:08
Hadoop
hadoop
hdfs
big
data
大数据技术应用场景
大数据技术产品大数据技术产品大数据技术分类:存储,计算,资源管理1.存储:(1)最基本的存储技术是
HDFS
:比如在企业应用中,会把通过各种渠道得到的数据,比如关系数据库的数据、日志数据、应用程序埋点采集的数据
大数据基础入门教程
·
2024-02-05 16:08
大数据
大数据应用场景
所有
HDFS
磁盘数据存储不均情况的终极处理方案
一、多节点存储不均1、现有多节点存储不均:1、先设置带宽
hdfs
dfs-setBalancerBandwith字节数2、然后执行脚本start-balancer.sh-thresholdn或者
hdfs
balancer-thresholdn
二百四十九先森
·
2024-02-05 16:08
Hadoop核心技术
磁盘
存储
不均
wordcount
单词计数
HDFS
BALANCER
介绍Hadoop的
HDFS
集群非常容易出现机器与机器之间磁盘利用率不平衡的情况,比如集群中添加新的数据节点。
风筝Lee
·
2024-02-05 16:07
hadoop
hdfs
balancer
Hadoop-
HDFS
的DataNode介绍及原理
DataNodeDataNode工作机制1、一个数据块在DataNode上以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是元数据包括数据块的长度,块数据的校验和,以及时间戳。2、DataNode启动后向NameNode注册,通过后,周期性(1小时)的向NameNode上报所有的块信息。3、心跳是每3秒一次,心跳返回结果带有NameNode给该DataNode的命令如复制块数据到另一台机
魔笛Love
·
2024-02-05 16:07
hadoop
大数据
HDFS
DataNode高密度存储机型的探索尝试
这里就涉及到了数据存储能力的问题,需要存储的数据越多,其实意味着我们需要更多的机器来扩增
HDFS
集群存储的总capacity。但是机器数量的变多另外一方面带来的则是机器费用成本的巨大开销。
Android路上的人
·
2024-02-05 16:05
Hadoop
HDFS
hadoop
big
data
hdfs
CDH使用Disk Balancer平衡磁盘
HDFS
数据
文章目录前言启用磁盘平衡器生成磁盘平衡器任务执行磁盘平衡任务查询磁盘平衡任务是否完成参考来源前言当集群磁盘空间不足时,需要增加新硬盘到机器,此时新加入的磁盘空间基本为空,而旧磁盘则已占用很多。网上则是通过增减副本的方式达到磁盘平衡方式,但如果磁盘空间大小本身不一致,通过该方法平衡后,磁盘空间不平衡情况依然存在。从CDH5.8.2开始,ClouderaManager提供了一个全面的存储容量管理解决方
Alderaan
·
2024-02-05 16:05
Cloudera
CDH
cloudera
hdfs
disk
balancer
绝对完美解决
hdfs
datanode数据和磁盘数据分布不均调整(
hdfs
balancer )——经验总结
Hadoop集群Datanode数据倾斜,个别节点
hdfs
空间使用率达到95%以上,于是新增加了三个Datenode节点,由于任务还在跑,数据在不断增加中,这几个节点现有的200GB空间估计最多能撑20
ZhaoYingChao88
·
2024-02-05 16:05
Hadoop
hdfs
Hudi学习6:安装和基本操作
目录1编译Hudi1.1第一步、Maven安装1.2第二步、下载源码包1.3第三步、添加Maven镜像1.4第四步、执行编译命令1.5第五步、HudiCLI测试2环境准备2.1安装
HDFS
2.2安装Spark3
hzp666
·
2024-02-05 14:59
Hudi
学习
hudi
Hudi学习1:概述
Hudi概念Hudi跟hive很像,不存储数据,只是管理
hdfs
数据。
hzp666
·
2024-02-05 14:59
Hudi
学习
hudi
数据湖
湖仓一体
Hudi学习 6:Hudi使用
准备工作:1.安装
hdfs
https://mp.csdn.net/mp_blog/creation/editor/1096891432.安装sparkspark学习4:spark安装_hzp666的博客
hzp666
·
2024-02-05 14:58
Hudi
hudi
数据湖
湖仓一体
湖仓融合
实时数仓
计算机毕业设计hadoop+spark+hive小说数据分析可视化大屏 小说推荐系统 小说爬虫 小说大数据 机器学习 知识图谱 小说网站 大数据毕业设计
流程1.爬取17k的小说数据约5-10万,存入mysql数据库;2.使用mapreduce对mysql中的小说数据集进行数据清洗,转为.csv文件上传至
hdfs
文件系统;3.根据.csv文件结构,使用hive
计算机毕业设计大神
·
2024-02-05 14:48
6.Linux虚拟机下的Hadoop
集群搭建
之完全分布式配置
Hadoop及相关组件搭建指导WeChat:h19396218469hadoop-3.1.3jdk-8u162-linux-x64本案例软件包:链接:https://pan.baidu.com/s/1ighxbTNAWqobGpsX0qkD8w提取码:lkjh(若链接失效在下面评论,我会及时更新)一、配置Hadoop集群主节点1.进入目标文件夹。cd/usr/local/hadoop/etc/ha
学习BigData
·
2024-02-05 13:01
关于Hadoop的学习笔记
hadoop
分布式
linux
4.Linux虚拟机下的Hadoop
集群搭建
之Xshell及Xftp的使用和SSH服务配置
Hadoop及相关组件搭建指导WeChat:h19396218469本案例软件包:链接:https://pan.baidu.com/s/1ighxbTNAWqobGpsX0qkD8w提取码:lkjh(若链接失效在下面评论,我会及时更新)一、Xshell和Xftp的使用在这里我们首先要了解两个软件,一个是Xshell另一个是Xftp。1.Xshell是一个强大的安全终端模拟软件,它支持SSH1,SS
学习BigData
·
2024-02-05 13:31
关于Hadoop的学习笔记
linux
hadoop
ssh
[Hadoop]万字长文Hadoop相关优化和问题排查总结
namenode优化namenode内存生产配置NameNode心跳并发配置开启回收站配置datanode的优化
hdfs
调优hadoop的优化YARN的优化
HDFS
调优的基本原则
HDFS
调优的常用参数排查哪个任务的
王一1995
·
2024-02-05 10:55
hadoop
jvm
java
2024-02-04(hive)
分区其实就是
HDFS
上的不同文件夹。分区表可以极大的提高特定场景下Hive的操作性能。
陈xr
·
2024-02-05 10:54
随记日志
hadoop
微服务入门篇:Nacos注册中心(Nacos安装,快速入门,多级存储,负载均衡,环境隔离,配置管理,热更新,
集群搭建
,nginx反向代理)
目录1.Nacos安装1.官网下载2.解压到本地3.启动nacos2.Nacos快速入门1.在父工程中导入nacos依赖2.给子项目添加客户端依赖3.修改对应服务的配置文件4.启动服务,查看nacos发现情况3.Nacos服务多级存储模型4.NacosRule负载均衡5.服务实例的权重设置6.环境隔离(namespace)7.Nacos和Eureka的对比1.临时实例和非临时实例2.Nacos与e
JungleiRim
·
2024-02-05 10:39
微服务学习
微服务
负载均衡
架构
降本增效利器!趣头条Spark Remote Shuffle Service最佳实践
多个业务线依赖于大数据平台展开业务,大数据系统的高效和稳定成了公司业务发展的基石,在大数据的架构上我们使用了业界成熟的方案,存储构建在
HDFS
上、计算资源调度依赖Yarn、表元数据使用Hiv
阿里云技术
·
2024-02-05 09:29
大数据
spark
CDH添加新节点小记
免密,jdk,防火墙及时间同步安装配置CM子节点,创建parcels,后续安装的软件都会分发到该文件夹下启动当前节点的CM,转到CDH管理界面,可以看到节点已添加到主机列表中选择该节点,添加角色:例如:
hdfs
sx_1706
·
2024-02-05 09:59
大数据
大数据
kafka高可用
集群搭建
kafka高可用
集群搭建
说明这篇博文主要是为了后面的elk做准备,我们这里搭建一个kafka集群,使用2个节点,还是前面的节点。主要是为了后面做数据缓冲。
憧憬blog
·
2024-02-05 09:40
分布式
kafka
java
zookeeper
linux
大数据 - Spark系列《三》- 加载各种数据源创建RDD
中的一些常用配置-CSDN博客目录3.1加载文件(本地)1.加载本地文件路径使用textFile加载本地txt文件使用textFile加载本地json文件使用sequenceFile加载本地二进制文件
HDFS
王哪跑nn
·
2024-02-05 09:28
spark
大数据
spark
分布式
impala与kudu进行集成
概要Impala是一个开源的高效率的SQL查询引擎,用于查询存储在Hadoop分布式文件系统(
HDFS
)中的大规模数据集。它提供了一个类似于传统关系型数据库的SQL接口,允许用户使用SQL语言
shandongwill
·
2024-02-05 07:44
大数据
impala
kudu
impala与kudu集成
1.0 Hadoop 教程
其核心部件包括分布式文件系统(HadoopDFS,
HDFS
)和Ma
二当家的素材网
·
2024-02-05 06:38
Hadoop
教程
hadoop
大数据
分布式
3.0 Hadoop 概念
Hadoop主要包含
HDFS
和MapReduce两大组件,
HDFS
负责分布储存数据,MapRed
二当家的素材网
·
2024-02-05 06:38
Hadoop
教程
hadoop
大数据
分布式
大数据框架(分区,分桶,分片)
建议收藏目录Hive分区与分桶ES分片Kafka分区HBase分区Kudu分区HiveHive分区是按照数据表的某列或者某些列分为多区,在hive存储上是
hdfs
文件,也就是文件夹形式。
坨坨的大数据
·
2024-02-05 06:29
Nacos 集群
Nacos
集群搭建
1.集群结构图官方给出的Nacos集群图:其中包含3个nacos节点,然后一个负载均衡器代理3个Nacos。这里负载均衡器可以使用nginx。
漠丶小翁
·
2024-02-05 04:12
CDH5.X中使用Sqoop导数据报Cannot run program “mysqldump“: error=2, No such file or director
一、背景CHD5.16环境中,使用sqoop从MySQL中进行ETL导数据到
hdfs
过程中,报了如下错误:20/12/2213:58:48INFOmapreduce.Job:TaskId:attempt
江畔独步
·
2024-02-05 01:49
hadoop
【读红宝书(一)】背景知识
相反,MapReduce市场已经转变为
HDFS
市场,并且似乎准备成为关系型SQL市场。最近,
HDFS
领域出现了另一个值得讨论的重点,即“数据湖”。
三半俊秀
·
2024-02-04 23:41
Flink1.18.0集成Yarn-session模式部署
上次部署了Hadoop集群Hadoop3.3.6(
HDFS
、YARN、MapReduce)完全分布式集群安装搭建这次集成下flinkYARN上部署的过程是:客户端把Flink应用提交给Yarn的ResourceManager
china-zhz
·
2024-02-04 21:34
flink
yarn
hadoop
大数据
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他