E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs集群搭建
mysql 同步 工具 开源_开源数据同步工具——datax
开源数据同步工具——dataxDataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括MySQL、Oracle、SqlServer、Postgre、
HDFS
、Hive、ADS、HBase、
weixin_39942572
·
2024-01-28 12:08
mysql
同步
工具
开源
Presto源码阅读——如何获取Hive中的Metadata(HMS+
HDFS
)
Presto源码阅读——如何获取Hive中的Metadata(HMS+
HDFS
)本文的Metadata定义SQLonHadoop系统在执行一个query时所需要的Metadata主要有两部分Hive中的
stiga-huang
·
2024-01-28 12:38
Presto
Impala元数据简介
SQL-on-Hadoop的ROLAP解决方案如Presto、SparkSQL等不同的是,Impala对元数据(Metadata/Catalog)做了缓存,因此在做查询计划生成时不再依赖外部系统(如Hive、
HDFS
stiga-huang
·
2024-01-28 12:05
Impala
开源数据同步工具DataX
DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、
HDFS
、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS
快乐江小鱼
·
2024-01-28 12:34
java
开源
java
Hadoop的基础操作
Hadoop的基础操作
HDFS
是Hadoop的分布式文件框架,它的实际目标是能够在普通的硬件上运行,并且能够处理大量的数据。
陆卿之
·
2024-01-28 12:27
大数据
hadoop
大数据
hdfs
66.管理Hive外部表——Sentry
66.1演示环境介绍操作系统:CentOS6.5CM和CDH版本:5.12.1采用root用户操作集群运行正常,Kerberos/
HDFS
/Hive/Impala/Hue服务已与Sentry集成,Hive
大勇任卷舒
·
2024-01-28 11:57
HBase入门、基础原理介绍
1.2HBase架构二、HBase的读写删流程2.1HBase的写入流程2.2HBase的读流程2.3HBase的数据删除一、HBase介绍HBase是一个面向列式存储的分布式数据库,HBase底层存储基于
HDFS
幸福右手牵
·
2024-01-28 09:07
hbase
hbase
hadoop
大数据
HBase入门:运行机制
服务器工作原理用户读写数据的过程缓存的刷新StoreFile合并Store的工作原理HLog的工作原理HBase系统架构HBase的系统架构包括客户端、ZooKeeper服务器、Master主服务器、Region服务器HBase一般采用
HDFS
缘友一世
·
2024-01-28 09:07
分布式数据库Hbase探究
hbase
数据库
大数据
mac上搭建hbase伪集群
https://blog.csdn.net/a15835774652/article/details/135569456)但是为了模拟一把集群环境我们还是尝试搭建一个伪集群版2.环境准备jdk环境1.8+
hdfs
寂夜了无痕
·
2024-01-28 08:15
大数据
macos
hbase
Hive面试题
1)数据存储位置Hive存储在
HDFS
。数据库将数据保存在块设备或者本地文件系统中。2)数据更新Hive中不建议对数据的改写。
肿么肥四啊哈
·
2024-01-28 07:34
hive学习笔记
大数据面试题
hive
hive面试题
本质上是将SQL转换为MapReduce或者spark来进行计算,数据是存储在
hdfs
上,简单理解来说hive就是MapReduce的一个客户端工具。补充1:你可以说一下HQL转换为MR的任务流程吗?
韩顺平的小迷弟
·
2024-01-28 07:29
大数据面试题
hive
hadoop
数据仓库
【
HDFS
】一天一个RPC系列--updateBlockForPipeline
本文目标是:弄清updateBlockForPipeline这个RPC的作用。弄清updateBlockForPipelineRPC的使用场景,代码里的调用点。一、updateBlockForPipeline的作用其定义在ClientProtocol接口里,是Client与NameNode之间的接口。看其代码注释描述:为一个underconstruction状态下的block获取一个新的GS与ac
叹了口丶气
·
2024-01-28 06:03
HDFS全方位实战
hdfs
rpc
hadoop
【BugFix】java.lang.NoSuchMethodError: java.nio.ByteBuffer.position(I)Ljava/nio/ByteBuffer;
2022-10-2010:43:59,633ERRORorg.apache.hadoop.
hdfs
.server.namenode.FSEditLog:Error:startinglogsegment946759failedfor
叹了口丶气
·
2024-01-28 06:02
HDFS全方位实战
Java语言积累
java
nio
jvm
【
HDFS
】EC写数据时checkStreamerFailures逻辑
本文试图弄清楚以下问题:checkStreamerFailures方法主要目的是做什么的?checkStreamerFailures方法的调用点(调用时机、条件)?checkStreamerFailures及其周边函数的逻辑。RQ1:checkStreamerFailures方法主要目的是做什么的?此方法的目的是在close流或者每次写完一整个stripe时,对streamer做健康判断。因为ce
叹了口丶气
·
2024-01-28 06:02
HDFS全方位实战
hdfs
hadoop
大数据
DevOps工程师技能_容器化技术之K8s
集群搭建
K8s-
集群搭建
部署说明1、安装包下载CentOSLinux7.61810x8664iso官方原版镜像下载https://renwole.com/archives/15302、系统环境配置ipaddrvi
Coder_Boy_
·
2024-01-28 06:57
DevOps
软件工程化
devops
k8s
【
HDFS
】一天一个RPC系列--updatePipeline
建议先阅读【
HDFS
】一天一个RPC系列–updateBlockForPipeline本文目标是弄清楚以下问题:弄清updatePipeline这个RPC的作用。
叹了口丶气
·
2024-01-28 06:27
HDFS全方位实战
hdfs
rpc
hadoop
Ubuntu22.04三台虚拟机Hadoop集群安装和搭建(全面详细的过程)
Ubuntu22.04Hadoop集群安装和搭建(全面详细的过程)环境配置安装安装JDK安装Hadoop三台虚拟机设置克隆三台虚拟机设置静态IP修改虚拟机hostssh免密登录关闭防火墙Hadoop配置core-site.xml
hdfs
-site.xmlyarn-site.xmlmapred-site.xmlworkers
WuRobb
·
2024-01-28 06:41
hadoop
大数据
分布式
java
Elasticsearch8.1.0
集群搭建
(linux)
一、传统模式1.下载elasticsearchDownloadElasticsearch|Elastic最新版的elasticsearch,最好jdk选用172.linux配置es用户tar-xzvfelasticsearch-8.1.0-linux-x86_64.tar.gzgroupaddesuseraddes-gespasswdes:123456chown-Res:eselasticsear
发呀发呀哈哈
·
2024-01-28 05:53
java
linux
elasticsearch
运维
数据结构
缓存
Nginx进阶篇【五】
Nginx进阶篇【五】八、Nginx实现服务器端
集群搭建
8.1.Nginx与Tomcat部署8.1.1.环境准备(Tomcat)8.1.1.1.浏览器访问:8.1.1.2.获取动态资源的链接地址:8.1.1.3
良辰美景好时光
·
2024-01-28 03:08
nginx
nginx
ELK Stack 7.3.0构建多系统多用户安全认证日志平台(二)
Elasticsearch
集群搭建
,操作系统Linuxcentos7三台机器:192.168.137.55192.168.137.56192.168.137.571、192.168.137.55这台机器
程序员之成长路
·
2024-01-28 00:56
ClickHouse(22)ClickHouse集成
HDFS
表引擎详细解析
文章目录
HDFS
用法实施细节配置可选配置选项及其默认值的列表lib
hdfs
3支持的ClickHouse额外的配置限制Kerberos支持虚拟列资料分享系列文章clickhouse系列文章知乎系列文章
HDFS
张飞的猪大数据
·
2024-01-27 17:35
clickhouse
hdfs
大数据
hadoop
数据仓库
数据库
centos7 安装k8s集群
Kubernetes
集群搭建
(centos7)部署架构ip域名备注安装软件192.168.2.246master主节点DockerKubeadmkubeletkubectlflannel192.168.2.247node1
ricky饭团
·
2024-01-27 15:50
GBase 8a 数据迁移工具2---数据加载 “SQL 接口 LOAD DATA INFILE”
支持如下功能:支持本地文件加载支持从通用数据服务器拉取数据加载;支持FTP/HTTP/
HDFS
/SFTP等多种协议;支持多加载机对单表的并行加载,最大化加载性能;支持普通文本、gzip压缩、snappy
Linux有意思吗
·
2024-01-27 14:03
GBASE
sql
数据库
database
数据仓库
dba
搭建大数据平台常用的端口号
50070:
HDFS
webUI的端口号8485:journalnode默认的端口号9000:非高可用访问数rpc端口8020:高可用访问数据rpc8088:yarn的webUI的端口号8080:master
修勾勾L
·
2024-01-27 13:51
Linux
大数据
YARN 工作原理
1、Hadoop2新增了YARN,YARN的引入主要有两个方面的变更:其一、
HDFS
的NameNode可以以集群的方式部署,增强了NameNode的水平扩展能力和高可靠性,水平扩展能力对应
HDFS
Federation
无羡爱诗诗
·
2024-01-27 13:43
利用Docker搭建Mysql 5.7强一致性集群解决方案实战
利用Docker搭建Mysql5.7强一致性集群解决方案实战前言拓展:Mysql高可用,弱一致性
集群搭建
解决方案之:Replication主角:Mysql强一致
集群搭建
解决方案:percona-xtradb-cluster
24K不怕
·
2024-01-27 12:50
分布式
数据库
docker
mysql
Oracle 11g RAC安装运维总结
1.1高可用(HA)1.2负载均衡(LB)1.3RAC集群1.4CRS2架构2.1RAC环境组成2.1.1硬件环境2.1.2软件组成2.2CRS组成2.3单实例与RAC环境3.Oracle11gRAC
集群搭建
不 古
·
2024-01-27 11:03
oracle
Oracl
RAC
运维
数据库
深入浅出
hdfs
源码
1、hadoop基本介绍2、周边生态图3、
hdfs
读源码解析4、
hdfs
写源码解析5、
hdfs
副本机制解读6、
hdfs
常见管理源码解析7、
hdfs
高可用源码解析-ha8、
hdfs
监控源码解析-dnmetrics-nnmetrics
大数据之家
·
2024-01-27 10:39
hdfs
hadoop
大数据
2021-03-07
HDFS
=====>解决存储问题·MapReduce=====>解决计算问题·Yarn=====>资源协调者·Zookeeper=====>分布式应用程序协调服务·Flume=====>日志收集系统·Hive
残月冷无声
·
2024-01-27 10:39
深入浅出
hdfs
-hadoop基本介绍
一、Hadoop基本介绍hadoop最开始是起源于ApacheNutch项目,这个是由DougCutting开发的开源网络搜索引擎,这个项目刚开始的目标是为了更好的做搜索引擎,后来Google发表了三篇未来持续影响大数据领域的三架马车论文:GoogleFileSystem、BigTable、Mapreduce开始掀起来了大数据的浪潮,paper原文可以参考我的这篇文章CSDN。这三篇论文介绍了如何
大数据之家
·
2024-01-27 10:03
hdfs
hadoop
大数据
Hadoop三大核心组件,hadoop原理
Hadoop的三大核心组件分别是:
HDFS
(HadoopDistributeFileSystem):hadoop的数据存储工具。
你敢和我比剑吗
·
2024-01-27 09:03
hadoop
大数据
mapreduce
Hadoop2.0架构及其运行机制,HA原理
文章目录一、Hadoop2.0架构1.架构图2.HA1)NameNode主备切换2)watcher监听3)脑裂问题3.组件1.
HDFS
2.MapReduce3.Yarn1.组件2.调度流程一、Hadoop2.0
Toner_唐纳
·
2024-01-27 09:30
大数据
Hadoop 原理及架构详解
视频网址:01-课程内容大纲与学习目标_哔哩哔哩_bilibili一、基础概念1、版本架构变迁2、集群简介主要包括两个集群:
HDFS
、YARN(MapReduce是计算框架,是代码层面的)这两个集群逻辑上分离
Should·L
·
2024-01-27 09:25
大数据
hadoop
架构
大数据
Hive实战 —— 电商数据分析(全流程详解 真实数据)
目录前言需求概述数据清洗数据分析一、前期准备二、项目1.数据准备和了解2.确定数据粒度和有效列3.
HDFS
创建用于上传数据的目录4.建库数仓分层5.建表5.1近源层建表5.2.明细层建表为什么要构建时间维度表
Byyyi耀
·
2024-01-27 08:25
hive
数据分析
hadoop
03-Redis缓存高可用集群
文章目录1、Redis集群方案比较2、Redis高可用
集群搭建
redis
集群搭建
Java操作redis集群4、Redis集群原理分析槽位定位算法跳转重定位Redis集群节点间的通信机制gossip通信的
野心与梦
·
2024-01-27 08:39
redis专栏
缓存
redis
数据库
Hbase2.1
集群搭建
>Hbase在大数据的体系中扮演着DB角色,不得不说是重要的一员,在上一篇,大猪已经给大家演示了[Hadoop3.2
集群搭建
](https://www.jianshu.com/p/3182aaff918d
kikiki5
·
2024-01-27 03:24
[AIGC 大数据基础] 浅谈
hdfs
HDFS
介绍什么是
HDFS
?
HDFS
(HadoopDistributedFileSystem)是ApacheHadoop生态系统的一部分,是一个分布式文件系统。
程序员三木
·
2024-01-27 01:00
大后端
大数据
AIGC
hdfs
大数据开发必备工具——Hadoop及整体架构介绍
它由几个关键的组件组成,其中最核心的是Hadoop分布式文件系统(
HDFS
)和MapReduce计算模型。
love6a6
·
2024-01-26 21:03
大数据
hadoop
架构
HBase 2.3.2 集群部署
HBase2.3.2集群部署依赖服务系统优化查看ZooKeeper集群状态查看
HDFS
集群状态创建路径配置/etc/profile配置$HBASE_HOME/conf/hbase-env.sh配置$HBASE_HOME
JP.Hu
·
2024-01-26 19:07
HBase
hbase
数据库
大数据
Hadoop 3.1.1
HDFS
集群部署
Hadoop3.1.1
HDFS
集群部署依赖服务系统优化查看ZooKeeper集群状态创建路径配置/etc/profile配置$HADOOP_HOME/etc/hadoop/hadoop-env.sh配置
JP.Hu
·
2024-01-26 19:37
Hadoop
hadoop
hdfs
大数据
hadoop安装遇到的一些障碍
start-dfs.sh(开启不成功)原因:1.dadoop文件所属者与执行时登陆者不一致(权限不足)报错:WARNING:HADOOP_SECURE_DN_USERhasbeenreplacedby
HDFS
_DATANODE_SECURE_USER.UsingvalueofHADOOP_SECURE_DN_USER.Startingnamenodeson
GetIdea
·
2024-01-26 18:30
手把手超详细Docker部署MongoDB集群
Mongodb
集群搭建
mongodb
集群搭建
的方式有三种:主从备份(Master-Slave)模式,或者叫主从复制模式。副本集(ReplicaSet)模式。分片(Sharding)模式。
YellowKang
·
2024-01-26 18:04
搭建Hive3.x并整合MySQL8.x存储元数据
另外一点就是
HDFS
上
端碗吹水
·
2024-01-26 16:06
C语句的作用和分类,赋值表达式和赋值语句、空语句等
它们分别是:if()...else...for()...循环语句while()...do...while()continuebreakswitchreturngoto2、函数调用语句比如printf(“d
hdfs
al
qq_263_tohua
·
2024-01-26 16:04
c语言
算法
开发语言
ElasticSearch7.7.1
集群搭建
前言Elasticsearch(ES)是一个基于ApacheLucene的分布式、高扩展、近实时的搜索引擎,主要用于海量数据快速存储、实时检索、高效分析的场景。通过简单易用的RESTfulAPI,Elasticsearch隐藏了Lucene的复杂性,使得全文搜索变得简单。以下是Elasticsearch的主要特点:分布式:由于其分布式特性,Elasticsearch可以将海量数据分散到多台服务器上
卢卡上学
·
2024-01-26 16:32
Elasticsearch
服务器
Kibana
elasticsearch
Elasticsearch集群
135.如何进行离线计算-1
应用场景用户流失预警系统基于用户购买的挽回系统用户特征和规则提取系统数据分析系统用户画像系统流程数据采集数据预处理数据建模ETL数据导出工作流调度135.1数据采集Flume收集服务器日志到
hdfs
type
大勇任卷舒
·
2024-01-26 15:03
用户画像项目背景
1,用户画像项目介绍大数据平台简介数据仓库+用户画像+推荐系统(1)数据仓库:加快数据的分析和查询数据仓库分层:ODS层(映射
HDFS
的数据)—DW(数据仓库层)–APP(层)—BI(层)DW:DWD明细数据层
祈愿lucky
·
2024-01-26 13:20
大数据
spark
kafka
Linux高可用
集群搭建
1.准备两个部署好项目的服务器这里采用VM+CentOS7进行虚拟机搭建,为了避免重复搭建的繁琐,创建好第一个虚拟机并搭建好环境后,第二个使用克隆右键虚拟机-》管理-》克隆选择好安装路径确定即可完成clone克隆完成后打开两个虚拟机,可使用命名来修改主机名hostnamectlset-hostname主机名两个虚拟机分别安装keepalived,具体步骤如下安装keepalivedyuminsta
顾十方
·
2024-01-26 09:03
java
Linux
新手
大数据
linux
nginx
服务器
运维
MongoDB
集群搭建
(三节点副本集)
软件包安装0、主机规划IP地址访问端口10.0.0.2012701710.0.0.2022701810.0.0.203270191、MongoDB安装包下载下载地址:https://www.mongodb.com/try/download/community版本根据需求选择,Mongodb6.0及以上的版本没有mongo命令2、上传至服务器,并添加环境变量将下载的安装包mongodb-linux-
四火..
·
2024-01-26 09:29
mongodb
数据库
Hadoop3.x学习笔记
Hadoop概述1.1简介1.2hadoop优势1.3hadoop组成1.4大数据技术生态体系2、环境准备(重点)2.1模板机配置2.2模板创建3、本地运行模式(官方WordCount)4、Hadoop
集群搭建
魅Lemon
·
2024-01-26 09:24
大数据
hadoop
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他