E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs高级特性
Hadoop-
HDFS
写流程(从命令行到完成)
一、简单回顾下
HDFS
的架构如果不了解
HDFS
的可以看下我写的一篇博客,这里先贴下官网架构图:二、源码分析源码中写的肯定是最真实的,下面是hadoop官方源码下载地址,我下载的是hadoop-3.2.4
隔着天花板看星星
·
2024-01-25 09:23
hadoop
hdfs
大数据
Hadoop-
HDFS
高可用
一、说明在我的博客中已经包含了
HDFS
高可用的搭建,这里描述下它的原理。
隔着天花板看星星
·
2024-01-25 09:52
hadoop
hdfs
大数据
Hadoop-
HDFS
读流程(从输入命令到回显)
一、简单回顾下
HDFS
的架构如果不了解
HDFS
的可以看下我写的一篇博客,这里先贴下官网架构图:二、静静的思考一会儿爱因斯坦说过:想象力比知识更重要。想象力推动世界,是知识进化的源泉。
隔着天花板看星星
·
2024-01-25 09:52
hadoop
hdfs
大数据
HBase学习五:运维排障之备份与恢复
HBase的所有文件都存储在
HDFS
上,因此只要使用Hadoop提供的文件复制工具distcp将HBASE目录复制到同一
HDFS
或者其他
HDFS
的另一个目录中,就可以完成对源HBase集群的备份工作copyTable
Studying!!!
·
2024-01-25 09:49
中间件
hbase
学习
运维
大数据平台组件日常运维操作说明(Hadoop/Zookeeper/Kafa/ES/Mysql/Spark/Flume/Logstash/Tomcat)
Hadoop日常运维操作说明
hdfs
生产环境hadoop为30台服务器组成的集群,统一安装配置,版本号为2.7.7部署路径:/opt/hadoop启动用户:hadoop配置文件:/opt/hadoop/
love6a6
·
2024-01-25 07:12
大数据
java-zookeeper
运维
Hadoop
HDFS
实现原理图文详解
一、
HDFS
体系结构1.1
HDFS
简介Hadoop分布式文件系统(
HDFS
)是运行在通用硬件(commodityhardware)上的分布式文件系统(DistributedFileSystem)。
禅与计算机程序设计艺术
·
2024-01-25 07:49
Lua 中的
高级特性
:模块的使用、字符串模式匹配、高阶函数和表的元方法
###1.模块的使用在Lua中,模块是一种封装代码的方式,使得代码可以被重用。下面是一个简单的模块定义和使用的示例:```lua--定义一个名为mymodule的模块mymodule={}functionmymodule.sayHello()print("Hellofrommymodule!")endreturnmymodule```然后,在另一个Lua文件中,你可以这样使用这个模块:```lua
薛定谔的zhu
·
2024-01-24 21:16
Lua
大数据小白初探
HDFS
架构原理:带你揭秘背后的真相(一)
目录1.前言2.
HDFS
架构2.1架构定义2.2揭秘架构2.3
HDFS
核心结构3.
HDFS
的优缺点3.1
HDFS
的优点3.2
HDFS
的缺点4.
HDFS
的应用场景5.总结1.前言前面的文章写了一篇,大数据方面的基础知识
程序员阿奇
·
2024-01-24 19:38
Hadoop
大数据
hdfs
架构原理
EditLog
checkpoint
FsImage
小白初探架构模式—常用的设计模式
2.4主从架构的示例3.主从架构设计的延伸3.1主备模式3.2主从复制3.3集群分片3.4异地多活4.总结1.前言作为一个架构设计小白,我们通常用了很多种工具,比如Mysql、Redis、Kafka、
Hdfs
程序员阿奇
·
2024-01-24 19:03
Hadoop
java
主从架构
设计模式
集群分片
主从复制
【Kafka】
高级特性
:生产者
目录消息发送消息生产流程ProducerRecord序列化器分区器拦截器生产者原理剖析主线程消息累加器发送线程生产者参数消息发送消息生产流程整个流程如下:Producer创建时,会创建一个Sender线程并设置为守护线程。生产消息时,内部其实是异步流程;生产的消息先经过拦截器->序列化器->分区器,然后将消息缓存在缓冲区(该缓冲区也是在Producer创建时创建)。批次发送的条件为:缓冲区数据大小
Ethan-running
·
2024-01-24 14:03
#
kafka
kafka
消息中间件
分布式
部署Hadoop集群
在node1节点执行,以root身份1:在VMware虚拟机集群上部署
HDFS
集群1)准备好hadoop安装包;目前最新3.3.4;了解:2)上传解压hadoop①:上传hadoop到node1节点;②
%HelloWorld%
·
2024-01-24 13:27
java
开发语言
Redis 常规操作
其提供了丰富的数据结构支持,如字符串、列表、集合、哈希表以及有序集合等,并具有事务处理、持久化及发布/订阅等多种
高级特性
。
月与篝火
·
2024-01-24 10:11
redis
数据库
缓存
重温《深入理解Java虚拟机:JVM
高级特性
与最佳实践(第二版)》 –– 学习笔记(一)
第一部分:走近Java第1章:走近Java1.1Java的技术体系SUN官方所定义的Java技术体系包括:Java程序设计语言、Java虚拟机、Class文件格式、JavaAPI类库、第三方(商业机构和开源社区)Java类库。其中,「Java程序设计语言」、「Java虚拟机」、「JavaAPI类」这三个被称为JDK(JavaDeploymentKit),即Java程序开发的最小环境。而JRE(Ja
cab5
·
2024-01-24 10:29
JVM
Java
java
jvm
Hive 优化总结
Hive优化本质:
HDFS
+MapReduce问题原因:倾斜:分区:有的分区没有数据,有的分区数据堆积。(若按天分区,每一天数据差别大就叫倾斜。)
Byyyi耀
·
2024-01-24 10:25
hive
hadoop
数据仓库
Hive优化
IDEA报错:No hostname could be resolved for the IP address 127.0.0.1, using IP address as host name.
NohostnamecouldberesolvedfortheIPaddress127.0.0.1,usingIPaddressashostname.Localinputsplitassignment(suchasfor
HDFS
files
唯一2333
·
2024-01-24 09:09
flink
kafka
idea
Sass语法规则及使用方法
Sass特点:对css完全兼容语言扩展,例如变量、嵌套、mixins拥有大量函数,可以用来操作颜色及其他属性值
高级特性
如controldirectives可以自定义格式化输出sass有两种语法格式,分别以
_亦影
·
2024-01-24 09:30
前端开发
css
sass
scss
css扩展
hbase 总结
HBase什么是HBasehbase是一个基于java、开源、NoSql、非关系型、面向列的、构建与hadoop分布式文件系统(
HDFS
)上的、仿照谷歌的BigTable的论文开发的分布式数据库。
l靠近一点点l
·
2024-01-24 08:24
大数据
hbase
Hbase原理、基本概念、基本架构
概述HBase是一个构建在
HDFS
上的分布式列存储系统;HBase是基于GoogleBigTable模型开发的,典型的key/value系统;HBase是ApacheHadoop生态系统中的重要一员,主要用于海量结构化数据存储
wyl9527
·
2024-01-24 08:24
Hbase
hbase
存储系统
Hadoop集群(第12期)_HBase简介及安装
可以直接使用本地文件系统也可使用Hadoop的
HDFS
文件存储系统。为了提高数据
weixin_30451709
·
2024-01-24 08:23
大数据
数据库
人工智能
HBase学习
可以直接使用本地文件系统也可使用Hadoop的
HDFS
文件存储系统。为了提高数据
mm_bit
·
2024-01-24 08:20
HBase
大数据
数据库
HBase简易安装和简介
可以直接使用本地文件系统也可使用Hadoop的
HDFS
文件存储系统。为了提高数据
滑过的板砖
·
2024-01-24 08:49
Hbase
HBase学习五:运维排障之宕机恢复
RegionServer主要负责用户的读写服务,进程中包含很多缓存组件以及与
HDFS
交互的组件,实际生产线上往往会有非常大的压力,进而造成的软件层面故障会比较多。
Studying!!!
·
2024-01-24 07:27
中间件
hbase
学习
运维
记一次Flink通过Kafka写入MySQL的过程
->sink,即从source获取相应的数据来源,然后进行数据转换,将数据从比较乱的格式,转换成我们需要的格式,转换处理后,然后进行sink功能,也就是将数据写入的相应的数据库DB中或者写入Hive的
HDFS
梦痕长情
·
2024-01-24 07:17
flink
kafka
mysql
Hadoop中HBase命令行操作
采用的底层存储为
HDFS
。使用Hbase客户端操作,执行查看Hbase版本、状态、查看帮助命令。创建表、修改表、插入数据、删除数据、查询数据,清空表、退出Hbase命令行、停止
HDFS
服务。
m0_69595107
·
2024-01-24 06:05
Hadoop
hadoop
hbase
大数据
centos
Storm和hadoop对比及storm组件
stormhadoop实时流处理批处理无状态有状态使用zk协同的主从架构无主从zk架构每秒处理数万消息
HDFS
,MR数分钟,数小时不会主动停止终于完成的时候storm优点:跨语言,可伸缩,低延迟,秒级容错核心概念
smartjiang
·
2024-01-24 02:01
深入MySQL窗口函数:原理和应用
一、什么是窗口函数窗口函数(WindowFunctions)是SQL标准中的一个
高级特性
,它允许用户在不改变查询结果集行数的情况下,对
地瓜伯伯
·
2024-01-23 17:18
DB
mysql
数据库
大数据
sql
java
python
算法
Dubbo_扩展
系列文章目录提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加Dubbo_扩展提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、Dubbo
高级特性
地址缓存超时机制服务生产端设置超时机制服务消费端设置超时机制重试机制灰度发布老版本服务提供者配置新版本服务提供者配置新版本服务消费者配置不需要区分版本配置负载均衡生产者服务消费者服务集群容错集群容错
键盘敲烂~~~
·
2024-01-23 16:17
Dubbo
dubbo
Dubbo
容错机制
服务降级
手把手教你安装vCenter Server 6.7
VMwarevSphere虚拟化架构核心的管理平台,通过VMwarevSphereClient或者WebClient工具登录到vCenterServer,可以实现VMwarevSphere虚拟化架构的所有
高级特性
IT搬砖我最拿手
·
2024-01-23 14:57
运维
服务器
云计算
Hadoop集群配置及测试
配置文件hadoop102hadoop103hadoop104
HDFS
NameNodeDataNodeDataNodeSecondaryNameNodeDataNodeYARNNod
YUuuuME_
·
2024-01-23 11:07
hadoop
大数据
分布式
RabbitMQ进阶
RabbitMQ进阶1RabbitMQ的
高级特性
1.1TTL(Time-To-Live)生存时间TTL允许设置消息的生存时间,超过指定时间仍未被消费者处理的消息将被视为过期。
C道万古如长夜,V来!
·
2024-01-23 09:17
rabbitmq
分布式
Spark解析JSON文件,写入
hdfs
一、用Sparkcontext读入文件,map逐行用Gson解析,输出转成一个caseclass类,填充各字段,输出。解析JSON这里没有什么问题。RDD覆盖写的时候碰到了一些问题:1.直接saveAsTextFile没有覆盖true参数;2.转dataframe时,还得一个一个字段显化才能转成dataframe;3.write时,一开始打算写text,说字段里不能含有long和int,换成str
gegeyanxin
·
2024-01-23 09:42
spark
json
hdfs
Gson
rdd转Dataframe
Hadoop基本介绍
1、Hadoop的整体框架Hadoop由
HDFS
、MapReduce、HBase、Hive和ZooKeeper等成员组成,其中最基础最重要元素为底层用于存储集群中所有存储节点文件的文件系统
HDFS
(HadoopDistributedFileSystem
w蕾丝
·
2024-01-23 08:53
DATAX的架构和运行原理
一.概念DATAX呢就是把各个不同构的数据库进行同步的过程,具体有
hdfs
hiveOracle等等吧。二.架构1.设计原理显而易见从强连通图到星形图,大大的简化了工作量。
加林so cool
·
2024-01-23 08:37
架构
Sqoop数据导入到Hive表的最佳实践
Sqoop是一个开源工具,用于在Hadoop生态系统中的数据存储(如
HDFS
)和关系型数据库之间传输数据。它可以帮助数据工程师和分析师轻松地
晓之以理的喵~~
·
2024-01-23 07:35
sqoop
hive
sqoop
hadoop
cdh6.3.2的hive配udf
背景大数据平台的租户要使用udf,他们用beeline连接,意味着要通过hs2,但如果有多个hs2,各个hs2之间不能共享,需要先把文件传到
hdfs
,然后手动在各hs2上createfunction。
zdkdchao
·
2024-01-23 07:02
hive
hadoop
数据仓库
flume案例
在构建数仓时,经常会用到flume接收日志数据,通常涉及到的组件为kafka,
hdfs
等。下面以一个flume接收指定topic数据,并存入
hdfs
的案例,大致了解下flume相关使用规则。
不加班程序员
·
2024-01-23 06:48
ETL
kafka
Hadoop相关
flume
大数据
etl
【技术预研】starRocks高性价比替换hbase
与
hdfs
等组件解耦,降低运维压力。starRock通过以下三个优化来提升性能:排序键相当于在存储的时候,选择某一列或者某
偏振万花筒
·
2024-01-23 03:00
hbase
数据库
大数据
starRocks
Hbase
等关系型数据库不同,它是一个NoSQL数据库(非关系型数据库)HBASE相比于其他NoSQL数据库(mongodb、redis、cassendra、hazelcast)的特点:Hbase的表数据存储在
HDFS
Cool_Pepsi
·
2024-01-23 02:12
大数据
hbase
Hadoop --
HDFS
1.什么是Hadoophadoop中有3个核心组件:分布式文件系统:
HDFS
——实现将文件分布式存储在很多的服务器上分布式运算编程框架:MAPREDUCE——实现在很多机器上分布式并行运算分布式资源调度平台
Cool_Pepsi
·
2024-01-23 02:42
大数据
hdfs
hadoop
大数据之使用Flume监听本地文件采集数据流到
HDFS
本文介绍Flume监听本地文件采集数据流到
HDFS
我还写了一篇文章是Flume监听端口采集数据流到Kafka【点击即可跳转,写的也非常详细】任务一:在Master节点使用Flume采集/data_log
十二点的泡面
·
2024-01-22 19:54
Flume
大数据
大数据
flume
hdfs
大数据之使用Flume监听端口采集数据流到Kafka
本文介绍Flume监听端口采集数据流到Kafka我还写了一篇文章是Flume监听本地文件采集数据流到
HDFS
【点击即可跳转,写的也非常详细】任务一:实时数据采集前摘:Flume是一种分布式、高可靠、高可用的数据收集系统
十二点的泡面
·
2024-01-22 19:53
Flume
大数据
flume
Impala:基于内存的MPP查询引擎
1.3、Impala与Hive1、Impala概述1.1、Impala简介Impala是Cloudera公司主导研发的高性能、低延迟的交互式SQL查询引擎,它提供SQL语义,能查询存储在Hadoop的
HDFS
对许
·
2024-01-22 17:26
Java大数据
#
Hadoop及生态圈
#
数据湖仓
大数据
Hadooop和Hbase是什么关系
HBase通过Hadoop的
HDFS
(Hadoop分布式文件系统)和MapReduce实现了水平扩展和处理分布式数据。本文将详细介绍hbase和hadoop有什么关系。
wwwyx12138
·
2024-01-22 17:50
hbase
数据库
大数据
Flink CDC 3.0 详解
一、FlinkCDC概述FlinkCDC是基于数据库日志CDC(ChangeDataCapture)技术的实时数据集成框架,支持全增量一体化、无锁读取、并行读取、表结构变更自动同步、分布式架构等
高级特性
小枫@码
·
2024-01-22 17:18
Flink
flink
大数据
大数据平台软硬件规划
一.大数据集群节点规划1.
HDFS
集群节点规划假如业务系统数据量每天增量50T,保留周期30天,那么
HDFS
存储容量为50T*30天*3副本*2倍(数据源+清洗加工)=9000T=8.79P假如每个机器的磁盘是
小枫@码
·
2024-01-22 17:17
大数据架构师
大数据
hadoop-
hdfs
-API
处理hadoop配置文件及系统环境1.将hadoop所有jar包(除了..以外)添进hadoop/lib文件夹备用。2.将linux的hadoop/bin导出覆盖windows的hadoop/bin。并将bin/hadoop.dll添入windows\system32文件夹内。需重启。3.配置windows系统环境变量HADOOP_HOME=hadoop所在包。HADOOP_USER_NAME=r
有七段变化
·
2024-01-22 15:43
Apache doris Datax DorisWriter扩展使用方法
DataX实现了包括MySQL、Oracle、SqlServer、Postgre、
HDFS
、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、Hologres
张家锋
·
2024-01-22 15:27
CentOS7下Hadoop2.9.2、Hive 2.3.6安装与实践
操作实录:1、hive中建立数据库后,会在
hdfs
中出现对象的库名.db的文件夹文章中,我们使用了
流火星空
·
2024-01-22 14:58
大数据
hive
大数据
hive
关于Hive架构原理,尚硅谷
最近学习hive时候,在做一个实操案例,具体大概是这样子的:我在dataGip里建了一个表,然后在hadoop集群创建一个文本文件里面存储了数据库表的数据信息,然后把他上传到
hdfs
后,dataGrip
大数据SQLboy
·
2024-01-22 11:41
Hive
hive
架构
hadoop
Impala
Impala概述Impala是什么Impala是一款针对
HDFS
和HBASE中的PB级别数据进行交互式实时查询工具。
奋斗的蛐蛐
·
2024-01-22 10:42
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他