E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs集群搭建
hive之DDl数据定义
1.Hive在
HDFS
上的默认存储路径Hive的数据都是存储在
HDFS
上的,默认有一个根目录,在hive-site.xml中,由参数hive.metastore.warehouse.dir指定。
嚄825
·
2024-02-07 19:32
hive
hadoop
大数据
【hadoop】
集群搭建
之部署mysql并远程访问(连接)
目录一、前言介绍二、什么是mysql集群三、如何进行mysql的
集群搭建
部署?步骤?
db_lcz_2014
·
2024-02-07 18:32
hadoop
mysql
大数据
HDFS
之 数据管理(namespace 和 slaves)
1、namespaceNamespace在
HDFS
中是一个非常重要的概念,也是有效管理数据的方法。Namespace有很多优点:可伸缩性。使
HDFS
集群存储能力可以轻松进行水平拓展;系统性能。
Studying!!!
·
2024-02-07 17:57
中间件
hdfs
hadoop
大数据
HDFS
架构 之 服务视图
1、简介为实现以上特性,
HDFS
包含的各个服务模块都是经过精心设计的,
HDFS
的服务视图如图。
HDFS
的服务视图包含三大部分:核心服务、公共服务和拓展服务。2、核心服务1)Namenode。
Studying!!!
·
2024-02-07 17:27
中间件
hdfs
hadoop
大数据
HDFS
架构 之 元数据架构解析
1.1namenode启动流程1.1.1启动流程1、加载fsimage文件FsImage是一种持久化到磁盘上的文件,里面包含了集群大部分的meta数据,持久化的目的主要是为了防止meta数据丢失,也就是在
HDFS
Studying!!!
·
2024-02-07 17:23
中间件
hdfs
架构
hadoop
Mysql
集群搭建
学习01 2018-08-29
准备centos安装1.在Hyper-V上新建虚拟机1.1创建虚拟机Hyper-V.png1.2虚拟机向导前几步直接跟着导航下一步即可开始之前.png指定名称和位置.png可使用默认值指定代数.png据说第一代是支持32位和64位。第二代是支持64位的更多高级功能分配内存根据自己电脑内存情况和所需大小进行配置配置网络后期可以设置,这里设置更方便连接虚拟硬盘安装选项选择自己的镜像文件。可后期选,此处
夏_未至
·
2024-02-07 15:54
DataX概述
1.概述DataX是阿里开源的的一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、
HDFS
、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能
大数据开发工程师-宋权
·
2024-02-07 14:01
DataX
hadoop
阿里云datax工具使用详解
datax介绍特征安装前准备工作-系统需求快速开始补充datax介绍DataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括MySQL、SQLServer、Oracle、PostgreSQL、
HDFS
王春星
·
2024-02-07 14:01
数据高效导入工具
大数据数据迁移工具选择
快速导数据工具
异构数据源导入工具
大数据工具
datax安装与使用详解
一、dataX概览1.1DataXDataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括MySQL、SQLServer、Oracle、PostgreSQL、
HDFS
、Hive、HBase
jhchengxuyuan
·
2024-02-07 14:00
hadoop
大数据
datax
大数据
hadoop
集群搭建
踩坑实录
由于不可控以及不可知的原因我搭建的hadoop集群突然显示虚拟机出现了问题导致某一个DataNode数据丢失并且无法通过Xshell远程访问其他的DataNode主机和虚拟机无法互相ping通网上能找的解决办法基本都找了依然无法解决因此我能想到的是只能删除虚拟机重新克隆一台机器然而还是无法通过远程连接无奈之下我重启电脑发现又可以通过Xshell远程访问了具体原因尚不知晓克隆成功后发现集群先格式化集
温文尔雅的流氓
·
2024-02-07 10:39
Hadoop
Hadoop分布式计算实验踩坑实录及小结
目录Hadoop分布式计算实验踩坑实录及小结踩坑实录Hadoop学习Hadoop简介
HDFS
SomeconceptsMapReduce主要配置文件
集群搭建
来源与引用Hadoop分布式计算实验踩坑实录及小结踩坑实录单机
小童同学_
·
2024-02-07 10:08
HIT
hadoop
分布式
ubuntu
java
大数据命令,一文在手,全部都有(送纯净版文档)
比如linux,kafka命令就比较多,
hdfs
操作也多。但是对于HBase.....这类框架命令比较少,就不再本篇展示。望周知。其中内容包含以下,具体命令会一一介绍。
大数据左右手
·
2024-02-07 09:35
大数据
大数据
zookeeper
hadoop
flink
linux
Elasticsearch三节点
集群搭建
Elasticsearch三节点
集群搭建
1、Elasticsearch简介Elasticsearch是一款近实时的分布式搜索、分析引擎,可以动态横向扩展以应对数据的增长。
TSLONG_TSL
·
2024-02-07 09:18
Elasticsearch
elasticsearch
原来还可以使用 DataX 进行数据同步
DataX实现了包括MySQL、Oracle、SqlServer、Postgre、
HDFS
、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、Hologres
lytao123
·
2024-02-07 06:16
➤
数据库
big
data
hive
java
DataX
Clickhouse
Clickhouse到HBase(Phoenix)数据导入 DataX
DataXDataX是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、
HDFS
、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。
布尔科技技术团队
·
2024-02-07 06:44
hbase
oracle
postgresql
数据仓库
【实验2】在Hadoop平台上部署WordCount程序
文章目录实验内容一、实验环境:二、实验内容与步骤(过程及数据记录):5.分布式文件系统
HDFS
上的操作5.1利用Shell命令与
HDFS
进行交互5.2利用Web界面管理
HDFS
6.分布式文件系统
HDFS
-借我杀死庸碌的情怀-
·
2024-02-07 05:27
hadoop
npm
大数据
centos
分布式
如何将日志文件和二进制文件快速导入
HDFS
?
日志数据在应用程序中一直很常见,Hadoop能够处理生产系统生成的大量日志数据,比如网络设备、操作系统、Web服务器和应用程序的日志数据。这些日志文件提供了对系统和应用程序运行以及使用的见解,统一日志文件的原因是它们往往采用文本形式和面向行的方式,因此易于处理。在《Hadoop从入门到精通》大型专题的上一章节中,我们介绍了可用于将数据复制到Hadoop的低级方法。本节不使用这些方法构建数据移动工具
weixin_34159110
·
2024-02-07 05:36
大数据
数据库
python
3.0 Zookeeper linux 服务端
集群搭建
步骤
本章节将示范三台zookeeper服务端
集群搭建
步骤。
二当家的素材网
·
2024-02-07 03:27
运维
Zookeeper
教程
zookeeper
linux
分布式
数据仓库-Hive基础(二)Hive 的基本概念
其本质是将SQL转换为MapReduce的任务进行运算,底层由
HDFS
来提供数据的存储,说白了hive可以理解为一个将SQL转换为MapReduce的任务的工具,甚至更进一步可以说hive就是一个MapReduce
做个合格的大厂程序员
·
2024-02-07 03:42
2024-02-06(Sqoop)
Hadoop生态包括:
HDFS
,Hive,Hbase等。RDBMS体系包括:Mysql,Oracle,DB2等。Sq
陈xr
·
2024-02-06 23:29
随记日志
sqoop
大数据
分布式文件系统
HDFS
的组成架构,及相关知识点归纳。
1.每存一个文件,需要消耗150字节,不管你是1kb,还是128m,2.分布式文件系统
HDFS
的组成架构namenode——4个功能1-管理
hdfs
的名称空间2-配置副本策略3-管理数据块映射信息4-处理客户端的读写请求
小米的南瓜洲
·
2024-02-06 23:37
K8S
集群搭建
1.28.x
1、Kubernetes集群规划主机名IP地址说明master192.168.33.201主节点node1192.168.33.202从节点noide2192.168.33.202从节点2、准备环境1、关闭防火墙systemctlstopfirewalldsystemctldisablefirewalld2、关闭selinuxsed-i's/enforcing/disabled/'/etc/sel
程丶的摆烂日常
·
2024-02-06 18:26
k8s
kubernetes
云原生
redis
集群搭建
(基于redis5.0+)
一、前戏1.1下载软件去官网下载软件:https://redis.io/download,笔者使用的是5.0.12,理由就是本人公司使用的也是这个版本。1.2物理机配置本人搭建的是3主3从。使用3台虚拟机,保证主从分配不在一台机器上,避免某台机器挂掉而影响整个集群的运行。物理配置:1.192.168.37.133:63702.192.168.37.133:63803.192.168.37.130:
She_lock
·
2024-02-06 12:51
redis
redis5.0集群
redis集群常见错误
redis启动脚本
redis集群最简配置
RabbitMQ
集群搭建
rabbitMQ的两种重要特性,异步化提高系统抗峰值能力和系统及功能解耦,这两个特点决定了rabbitMQ在我们的系统中占据了重要的地位,所以为了让RabbitMQ高可用,我们今天就来讲解下RabbitMQ的集群环境搭建应用常识一般情况下,一个单机版的rabbitMQ能承受大运1000/s的消息量(跟网络和消息的大小有关,数值存在波动),但是如果是集群环境中,就可以将访问的压力分摊到集群中的其他节
AmosZhu
·
2024-02-06 10:12
热数据存储在
HDFS
,冷备数据存储于对象存储中
1.场景分析生产环境均为腾讯云服务器,日志数据计划存储于
HDFS
中,由于日志数据较大(压缩后1T/天),不断扩充云盘成本消耗大。鉴于对象存储的存储成本较为低廉,但是日常频繁使用会产生流量费用。
tuoluzhe8521
·
2024-02-06 10:11
云原生
hdfs
hadoop
大数据
cos
对象存储
加速
hdfs
balance速度
hdfs
默认配置指定DataNode用于balancer的带宽为10Mdfs.datanode.balance.bandwidthPerSec1048576su
hdfs
hdfs
dfsadmin-setBalancerBandwidth104857600
迷茫_小青年
·
2024-02-06 09:05
minio
集群搭建
(纠删码模式)
搭一个4个节点,16块硬盘的minio集群。1.先做一些准备工作,新建了4个centos7的虚拟机,各新添加4块硬盘我用的虚拟机软件是VirtualBox,先搭建4个虚拟机,即4个节点,建虚拟机就不讲了用VirtualBox添加硬盘,这几台虚拟机硬盘我都添加过了,我用一个其他node35这个机器介绍硬盘添加添加磁盘这块我也不是特别懂,但是在搭建minio集群的过程中我是这么做的,而且成功了下一步,
hahaha 1hhh
·
2024-02-06 09:52
minio
centos
Kafka 使用手册
2.kafka基础架构3.kafka
集群搭建
4.kafka命令行操作主题命令行【topic】生产者命令行【producer】消费者命令行【consumer】5.kafka生产者生产者消息发送流程Producer
@lihewei
·
2024-02-06 08:01
kafka
分布式
ELFK日志采 - QuickStart
文章目录架构选型ELKEFLKElasticsearchES
集群搭建
常用命令Filebeat功能介绍安装步骤Filebeat配置详解filebeat常用命令Logstash功能介绍安装步骤Input插件
@lihewei
·
2024-02-06 07:25
elk
Redis(三)主从架构、Redis哨兵架构、Redis集群方案对比、Redis高可用
集群搭建
、Redis高可用集群之水平扩展
转自极客时间Redis主从架构redis主从架构搭建,配置从节点步骤:1、复制一份redis.conf文件2、将相关配置修改为如下值:port6380pidfile/var/run/redis_6380.pid#把pid进程号写入pidfile配置的文件logfile"6380.log"dir/usr/local/redis-5.0.3/data/6380#指定数据存放目录#需要注释掉bind#b
_蓝天IT_
·
2024-02-06 07:37
分布式
redis
架构
java
MongoDB分片
集群搭建
----前言mongodb分片一般用得比较少,需要较多的服务器,还有三种的角色一般把mongodb的副本集应用得好就足够用了,可搭建多套mongodb复本集mongodb分片技术mongodb副本集可以解决数据备份、读性能的问题,但由于mongodb副本集是每份数据都一模一样的,无法解决数据量过大问题mongodb分片技术能够把数据分成两份存储,假如shijiange.myuser里面有1亿条数据
ZzzkiYoumi
·
2024-02-06 06:21
MongoDB
mongodb
数据库
dba
HDFS
入门基础
HDFS
总结在现代的企业环境中,海量数据超过单台物理计算机的存储能力,分布式文件系统应运而生,对数据分区存储于若干物理主机,管理网络中跨多台计算机存储的文件系统。
nucty
·
2024-02-06 05:33
大数据
hdfs
hadoop
大数据
Apache Hadoop
ApacheHadoop_狭义上说,Hadoop指Apache一款java语言开发的开源框架,它的核心组件有:
HDFS
(分布式文件系统):解决海量数据存储YARN(作业调度和集群资源管理的框架):解决资源任务调度
VincentLeon
·
2024-02-06 05:28
2.RocketMQ
集群搭建
与消息发送样例
1.RocketMQ
集群搭建
1.1各角色介绍mqGroup.png角色NameServer:Broker的管理者。Broker自己去上报NameServer自己的存在Broker:消息的存储者。
lambdaCC
·
2024-02-06 00:58
Hadoop Start(1) ——Google与Hadoop的前世今生
参考文档:《Hadoop权威指南(第4版)》网址:http://hadoop.apache.org/[1]
HDFS
:HadoopDistributionFileSystemHadoop分布式文件系统[2
bclz
·
2024-02-05 18:41
Kafka2.13
集群搭建
并配置hosts172.17.0.2 node0172.17.0.3 node1172.17.0.4 node2在其中一台服务器中搭建Zookeeper(单机或集群都可以)Zookeeper
集群搭建
参考链接下载
咩哥无敌
·
2024-02-05 17:57
kafka
kafka
zookeeper
分布式
HDFS
的 DataNode 工作机制
1DataNode工作机制1)一个数据块在DataNode上以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是元数据包括数据块的长度,块数据的校验和,以及时间戳。2)DataNode启动后向NameNode注册,通过后,周期性(1小时)的向NameNode上报所有的块信息。3)心跳是每3秒一次,心跳返回结果带有NameNode给该DataNode的命令如复制块数据到另一台机器,或删除某个
求学旅途
·
2024-02-05 16:41
Java大数据
hdfs
datanode
hadoop
大数据
java
【
HDFS
实战】
HDFS
上的数据均衡
HDFS
上的数据均衡简介文章目录
HDFS
上的数据均衡简介重新平衡多DN之间的数据相关命令重新平衡单DN内磁盘间的数据相关命令PlanExecuteQueryCancelReport相关配置调试
HDFS
上的
顧棟
·
2024-02-05 16:09
hdfs
hadoop
大数据
如何对
HDFS
进行节点内(磁盘间)数据平衡
1.文档编写目的当
HDFS
的DataNode节点挂载多个磁盘时,往往会出现两种数据不均衡的情况:1.不同DataNode节点间数据不均衡;2.挂载数据盘的磁盘间数据不均衡。
格格巫 MMQ!!
·
2024-02-05 16:39
hadoop
hdfs
hdfs
hadoop
大数据
HDFS
源码解析---Balancer
概述在输入启动命令的那台机器上会启动一个进程,为了避免给namenode带来过大的负担,整个balance过程由balanceserver而不是namenode来控制。Balancer的最终结果是namenode上记录的一个block的一个副本从一个datanode转移到另一个datanode上。PS:副本放置策略第2个副本存放于不同于第1个副本所在的机架第3个副本存放于第2个副本所在的机架,但是
请叫我算术嘉
·
2024-02-05 16:38
Hadoop
HDFS
balancer
hdfs
java
hadoop调优-
HDFS
集群数据不均衡处理
hdfs
balancer
查看当前的数据分布情况:
hdfs
dfsadmin-report现象一:集群上经常会增添新的DataNode节点,或者人为干预将数据的副本数降低或者增加。
不会吐丝的蜘蛛侠。
·
2024-02-05 16:08
Hadoop
hadoop
hdfs
big
data
大数据技术应用场景
大数据技术产品大数据技术产品大数据技术分类:存储,计算,资源管理1.存储:(1)最基本的存储技术是
HDFS
:比如在企业应用中,会把通过各种渠道得到的数据,比如关系数据库的数据、日志数据、应用程序埋点采集的数据
大数据基础入门教程
·
2024-02-05 16:08
大数据
大数据应用场景
所有
HDFS
磁盘数据存储不均情况的终极处理方案
一、多节点存储不均1、现有多节点存储不均:1、先设置带宽
hdfs
dfs-setBalancerBandwith字节数2、然后执行脚本start-balancer.sh-thresholdn或者
hdfs
balancer-thresholdn
二百四十九先森
·
2024-02-05 16:08
Hadoop核心技术
磁盘
存储
不均
wordcount
单词计数
HDFS
BALANCER
介绍Hadoop的
HDFS
集群非常容易出现机器与机器之间磁盘利用率不平衡的情况,比如集群中添加新的数据节点。
风筝Lee
·
2024-02-05 16:07
hadoop
hdfs
balancer
Hadoop-
HDFS
的DataNode介绍及原理
DataNodeDataNode工作机制1、一个数据块在DataNode上以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是元数据包括数据块的长度,块数据的校验和,以及时间戳。2、DataNode启动后向NameNode注册,通过后,周期性(1小时)的向NameNode上报所有的块信息。3、心跳是每3秒一次,心跳返回结果带有NameNode给该DataNode的命令如复制块数据到另一台机
魔笛Love
·
2024-02-05 16:07
hadoop
大数据
HDFS
DataNode高密度存储机型的探索尝试
这里就涉及到了数据存储能力的问题,需要存储的数据越多,其实意味着我们需要更多的机器来扩增
HDFS
集群存储的总capacity。但是机器数量的变多另外一方面带来的则是机器费用成本的巨大开销。
Android路上的人
·
2024-02-05 16:05
Hadoop
HDFS
hadoop
big
data
hdfs
CDH使用Disk Balancer平衡磁盘
HDFS
数据
文章目录前言启用磁盘平衡器生成磁盘平衡器任务执行磁盘平衡任务查询磁盘平衡任务是否完成参考来源前言当集群磁盘空间不足时,需要增加新硬盘到机器,此时新加入的磁盘空间基本为空,而旧磁盘则已占用很多。网上则是通过增减副本的方式达到磁盘平衡方式,但如果磁盘空间大小本身不一致,通过该方法平衡后,磁盘空间不平衡情况依然存在。从CDH5.8.2开始,ClouderaManager提供了一个全面的存储容量管理解决方
Alderaan
·
2024-02-05 16:05
Cloudera
CDH
cloudera
hdfs
disk
balancer
绝对完美解决
hdfs
datanode数据和磁盘数据分布不均调整(
hdfs
balancer )——经验总结
Hadoop集群Datanode数据倾斜,个别节点
hdfs
空间使用率达到95%以上,于是新增加了三个Datenode节点,由于任务还在跑,数据在不断增加中,这几个节点现有的200GB空间估计最多能撑20
ZhaoYingChao88
·
2024-02-05 16:05
Hadoop
hdfs
Hudi学习6:安装和基本操作
目录1编译Hudi1.1第一步、Maven安装1.2第二步、下载源码包1.3第三步、添加Maven镜像1.4第四步、执行编译命令1.5第五步、HudiCLI测试2环境准备2.1安装
HDFS
2.2安装Spark3
hzp666
·
2024-02-05 14:59
Hudi
学习
hudi
Hudi学习1:概述
Hudi概念Hudi跟hive很像,不存储数据,只是管理
hdfs
数据。
hzp666
·
2024-02-05 14:59
Hudi
学习
hudi
数据湖
湖仓一体
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他