E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs集群搭建
【Flink-1.17-教程】-【二】Flink
集群搭建
、Flink 部署、Flink 运行模式
【Flink-1.17-教程】-【二】Flink
集群搭建
、Flink部署、Flink运行模式1)集群角色2)Flink
集群搭建
2.1.集群启动2.2.向集群提交作业3)部署模式3.1.会话模式(SessionMode
bmyyyyyy
·
2024-01-17 12:16
Flink
flink
大数据
#flink集群搭建
#flink部署
#flink运行模式
#flink1.17
#flink1.17教程
Zookeeper
集群搭建
目录1、下载并解压zookeeper2、修改配置文件zoo.cfg3、创建myid文件4、启动zookeeper服务5、可能存在的问题1、下载并解压zookeeperhttps://www.apache.org/dyn/closer.lua/zookeeper/zookeeper-3.7.0/apache-zookeeper-3.7.0-bin.tar.gz2、修改配置文件zoo.cfg上面红色框
程序员张同学
·
2024-01-17 11:16
zookeeper
zookeeper
apache
分布式
ActiveMq由浅入深讲解+面试题50道讲解-张立坤-专题视频课程
基于队列的生产者和消费者,基于发布-订阅的生产者和消费者,消息的同步消费和异步消费,消息的数据类型,身份认证,持久化配置与实现,事务,死信队列,ACK策略,消息的丢失,重复重复消费,消息重发,springmvc集成,
集群搭建
zlkwork
·
2024-01-17 11:12
视频教程
面试题
activemq
张立坤
消息队列
消费者
大数据开发之Hadoop(
HDFS
)
第1章:
HDFS
概述1.1
HDFS
产出背景及定义1、
HDFS
产生背景随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件
Key-Key
·
2024-01-17 10:22
大数据
hadoop
hdfs
Hadoop——
HDFS
、MapReduce、Yarn期末复习版(搭配尚硅谷视频速通)
一、
HDFS
1.
HDFS
概述1.1
HDFS
定义
HDFS
(HadoopDistributedFileSystem),它是一个文件系统,用于存储文件,通过目录树来定位文件;其次,它是分布式的,由很多服务器联合起来实现其功能
革斤要加油
·
2024-01-17 06:10
专业课
hadoop
hdfs
mapreduce
yarn
【教程】
集群搭建
准备工作全流程
基于VMware创建虚拟机进行
集群搭建
,适用于hadoop/GreenPlum等集群之前已经创建了三台虚拟机hadoop102,hadoop103,hadoop104来搭建hadoop集群,因为目前学习到了
THE WHY
·
2024-01-17 04:12
大数据
大数据
分布式
运维
hadoop
学习
HDFS
机架感知配置导致数据不均衡
HDFS
机架感知介绍
HDFS
机架感知是一种逻辑上的网络架构设计,它主要是用来区分不同节点的网络拓扑情况下,保证数据是能够高性能写入和查询的一种机制,毕竟跨网络的数据读写是有网络带宽消耗的,当没有配置机架信息时
KubeData
·
2024-01-17 02:41
hdfs
hadoop
大数据
【状态管理|概述】Flink的状态管理:为什么需要state、怎么保存state、对于state过大怎么处理
文章目录一.state相关1.state种类2.State的存在形式3.state在哪产生4.state内存设置二.statebackend1.三种状态后端2.如何在
hdfs
中存储?
roman_日积跬步-终至千里
·
2024-01-17 01:13
#
flink
实战
flink
java
大数据
flume
为什么选用FlumePython爬虫数据Java后台日志数据服务器本地磁盘文件夹
HDFS
FlumeFlume最主要的作用就是,实时读取服务器本地磁盘的数据,将数据写入到
HDFS
。
添柴少年yyds
·
2024-01-17 00:55
flume
大数据
Hadoop详解
核心内容包含
hdfs
和mapreduce。hadoop2.0以后引入yarn.
hdfs
是提供数据存储的,mapreduce是方便数据计算的。
武昌库里写JAVA
·
2024-01-16 21:20
高手面试
hadoop
大数据
分布式
Linux搭建 Kubernetes(K8S)集群详情教程
当搭建Kubernetes集群时,涉及的详细步骤可能较多,以下是详细的Kubernetes单节点
集群搭建
步骤:步骤1:准备工作确保满足以下基本要求:一台运行Ubuntu18.04或更高版本的机器。
二当家的素材网
·
2024-01-16 17:17
运维
linux
kubernetes
运维
hive:创建自定义python UDF
addfile
hdfs
://home/user/py3_script/;setspark.yarn.dist.archives=
hdfs
://home/user/py3.tar.gz;setspark.shuffle.
hdfs
.enabled
青盏
·
2024-01-16 16:35
other
hive
hadoop
数据仓库
企业级大数据安全架构(四)Ranger安装
作者:楼高Ranger是支持审计功能的,安装时可以选择审计数据保存的位置,默认支持Solr和
HDFS
。
云掣YUNCHE
·
2024-01-16 16:50
企业级大数据安全架构
大数据
安全架构
安全
zookeeper
集群搭建
软件下载官网首页:ApacheZooKeeper
集群搭建
准备三台服务器服务器1192.168.206.135服务器2192.168.206.136服务器3192.168.206.137软件安装解压压缩包
喝水的鱼.
·
2024-01-16 14:58
软件安装
zookeeper
zookeeper
只知道
HDFS
和GFS?你其实并不懂分布式文件系统
一、概述分布式文件系统是分布式领域的一个基础应用,其中最著名的毫无疑问是
HDFS
/GFS。如今该领域已经趋向于成熟,但了解它的设计要点和思想,对我们将来面临类似场景/问题时,具有借鉴意义。
王知无(import_bigdata)
·
2024-01-16 13:14
分布式
大数据
hadoop
数据库
java
分布式文件系统应该从哪些方面考虑
分布式文件系统是分布式领域的一个基础应用,其中最著名的毫无疑问是
HDFS
/GFS。如今该领域已经趋向于成熟,但了解它的设计要点和思想,对我们将来面临类似场景/问题时,具有借鉴意义。
吃胖点儿
·
2024-01-16 13:44
分布式系统
DataX&数据同步(全量)
1.DataX简介1.1DataX概述 DataX是阿里巴巴开源的一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、
HDFS
、Hive、ODPS、HBase、FTP
韩顺平的小迷弟
·
2024-01-16 11:29
大数据
数据同步
Flume用法总结
可以实时读取服务器的日志写入
HDFS
。
天选之子123
·
2024-01-16 10:53
大数据
flume
大数据
HIVE总结
HIVE总结一、创建数据库CREATEDATABASEIFNOTEXISTSTEST;数据库在
HDFS
的默认位置为:/user/hive/warehouse/test.dbCREATEDATABASEIFNOTEXISTSTESTLOCATION
天选之子123
·
2024-01-16 10:52
大数据
hive
hadoop
数据仓库
【
HDFS
】
HDFS
-16348:将慢节点标记为badnode进而从pipeline中踢除并进行pipeline恢复
本文的主要内容是介绍这个PR(PullRequest):
HDFS
-16348.Markslownodeasbadnodetorecoverpipeline(#3704)通过本文可以获得如下知识:datanode
小北觅
·
2024-01-16 07:09
Hive 数据迁移
/hadoopdistcp
hdfs
://${NameNode_IP}:${NameNode_RPC_IP}/${源文件}
hdfs
://${NameNode_I
bigdata-余建新
·
2024-01-16 07:14
Hive
hive
hadoop
数据仓库
Hive知识点
基本概念:由Facebook开源,构建在Hadoop之上的数据仓库,数据计算是mapreduce,数据存储是
HDFS
目的是构建面向分析的集成的数据环境,为企业提供决策支持(面向分析的存储系统)主要特征:
꧁༺朝花夕逝༻꧂
·
2024-01-16 07:25
hive
hadoop
数据仓库
HDFS
HA
集群搭建
- 基于Quorum Journal Manager(hadoop2.7.1)
0、前置概念0.1checkpoint检查点在Hadoop分布式文件系统(
HDFS
)中,检查点(Checkpointing)是一个关键的过程,它涉及到将文件系统的命名空间状态持久化到磁盘。
Studying!!!
·
2024-01-16 06:36
中间件
hdfs
hadoop
大数据
mac上搭建 hadoop 伪集群
它主要由以下几个部分组成:
HDFS
(HadoopDistributedFileSystem):
HDFS
是Hadoop的分布式文件系统,具有较高的读写速度,很好的容错性和可伸缩性,为海量的数据提供了分布式存储
寂夜了无痕
·
2024-01-16 06:30
大数据
macos
hadoop
大数据
HDFS
和MapReduce综合实训
文章目录第1关:WordCount词频统计第2关:
HDFS
文件读写第3关:倒排索引第4关:网页排序——PageRank算法第1关:WordCount词频统计测试说明以下是测试样例:测试输入样例数据集:文本文档
柔雾
·
2024-01-16 06:24
hdfs
mapreduce
hadoop
Hive基础知识(十六):Hive-SQL分区表使用与优化
1.分区表分区表实际上就是对应一个
HDFS
文件系统上的独立的文件夹,该文件夹下是该分区所有的数据文件。Hive中的分区就是分目录,把一个大的数据集根据业务需要分割成小的数据集。
依晴无旧
·
2024-01-16 05:11
大数据
hive
hadoop
数据仓库
Clickhouse集成离线hive、实时kafka数据实操
Clickhouse集成hive一、官网介绍:1、clickhouse集成hive、kafka官网介绍:2、clickhouse支持的数据类型:二、创建对应hive的clickhouse表1、利用clickhouse的
HDFS
Engine
静听枫语
·
2024-01-16 05:11
大数据
hive
数据仓库
big
data
kafka
Hadoop 3.2.4
集群搭建
详细图文教程
一、集群简介Hadoop集群包括两个集群:
HDFS
集群、YARN集群。两个集群逻辑上分离、通常物理上在一起;两个集群都是标准的主从架构集群。
༺࿈誓言࿈༻
·
2024-01-16 05:10
hadoop
大数据
分布式
MapReduce总结
执行分布式计算和任务处理split读取数据,一个map任务处理一个分片,通常一个分片对应一个
HDFS
文件Block。
w未然
·
2024-01-16 05:51
大数据技术原理与应用 第三版 林子雨 期末复习(二) Hadoop
HDFS
HBase
大数据技术原理与应用第三版林子雨期末复习(二)Hadoop
HDFS
HBaseHadoop生态系统
HDFS
HDFS
结构块NameNode与SecondNameNode与DataNode数据冗余存储
HDFS
头发多多,肆意生长
·
2024-01-16 05:21
大数据技术
hadoop
hdfs
hbase
大数据
DR-AUTO-SYNC架构
集群搭建
及主备切换手册
作者:Liuhaoao原文来源:https://tidb.net/blog/170d6d47近期有个生产系统,计划做一套dr-autosync的集群,但是之前并没有这种类型系统的生产实施经验,就一点点的摸索,好在最后是顺利搭建成功了,把搭建过程分享出来给大家参考下。1、集群架构2、规划拓扑根据集群架构规划拓扑文件global:user:"tidb"ssh_port:22deploy_dir:"/t
TiDB 社区干货传送门
·
2024-01-16 03:09
架构
java
linux
微服务
大数据
kafka使用zookeeper完成
集群搭建
本次搭建使用的是Kafka3.6.1,zookeeper3.9.1。1、zookeeper集群安装zookeeper下载:ApacheDownloadMirrors1.1、zookeeper解压修改配置文件名#1、解压到指定目录tar-zxvfapache-zookeeper-3.9.1-bin.tar.gz-C/opt/software#2、需改配置文件名称cpzoo_sample.cfgzoo
知其_所以然
·
2024-01-16 03:04
kafka
ClickHouse - 01
1、ClickHouse与其特性在大数据处理场景中,流处理和批处理使用到的技术大致如下:大数据处理场景流程.png批处理会将源业务系统中的数据通过数据抽取工具(例如Sqoop)将数据抽取到
HDFS
中,这个过程可以使用
ArthurHC
·
2024-01-16 02:17
docker 下nacos
集群搭建
目录1、准备工作2、拉取镜像3、启动mysql4、导入sql脚本4.1、建立连接,新建数据库nacos4.2、导入脚本4.3、导入成功5、启动naco
SHIZHK
·
2024-01-16 01:10
后端
nacos
集群
任务12:使用Hadoop Streaming解压NCDC天气原始数据
任务描述知识点:NCDC原始的气象数据上传到
HDFS
MapReduce程序处理NCDC原始数据重点:熟练使用
HDFS
基础命令查看
HDFS
文件块的分布情况掌握Linux系统Shell脚本的编写熟练使用MapReduce
Dija-bl
·
2024-01-15 22:21
hadoop
npm
大数据
【安装手册】在CentOS搭建Elasticsearch集群
一、
集群搭建
3台虚拟机:192.168.59.191、192.168.59.192、192.168.59.193二、找下载链接https://www.elastic.co/cn/downloads/past-releases
衣谷PN
·
2024-01-15 21:23
数据存储
elasticsearch
大数据
【Elasticsearch】Elasticsearch
集群搭建
详细手册
一、
集群搭建
1.1.资源准备服务器192.168.X.26192.168.X.25192.168.X.24安装包elasticsearch-6.8.10.tar.gz防火墙所有服务器均开通9200,9300
以梦为馬Douglas
·
2024-01-15 21:53
组件学习文档
elasticsearch
大数据
Redis
集群搭建
1.初识Redis1.1.Redis介绍: Redis是一种基于键值对(key-value)的NoSQL数据库。 与很多键值对数据库不同的是,Redis中的值可以是由string(字符串)、hash(哈希)、list(列表)、set(集合)、zset(有序集合)等多种数据结构和算法组成,因此Redis可以满足很多的应用场景。 而且因为Redis会将所有数据都存放在内存中,所以它的读写性能非常
八分用心
·
2024-01-15 14:02
redis
redis
数据库
分布式
Hive导入数据的五种方法
在Hive中建表成功之后,就会在
HDFS
上创建一个与之对应的文件夹,且文件夹名字就是表名;文件夹父路径是由参数hive.metastore.warehouse.dir控制,默认值是/user/hive/
冬瓜的编程笔记
·
2024-01-15 12:04
大数据
hive
hadoop
数据仓库
大数据开发之Hive(基本概念、安装、数据类型、DDL数据定义、DML数据操作)
第1章:Hive基本概念1.1Hive1.1.1Hive产生背景
HDFS
来存储海量的数据、MapReduce来对海量数据进行分布式并行计算、Yarn来实现资源管理和作业调度。
Key-Key
·
2024-01-15 12:04
大数据
hive
hadoop
大数据开发之HA
HA严格来说应该分成各个组件的HA机制:
HDFS
的HA和YARN的HA。NameNode主要在以下两个方面影响
HDFS
集群NameNode机器发生意外,如宕机,集群将无法使用,直到管理员重启。
Key-Key
·
2024-01-15 12:03
大数据
hadoop
大数据开发之Hive(详细版,最后有实战训练)
第1章:Hive基本概念1.1Hive1.1.1Hive产生背景
HDFS
来存储海量的数据、MapReduce来对海量数据进行分布式并行计算、Yarn来实现资源管理和作业调度。
Key-Key
·
2024-01-15 12:29
hive
hadoop
大数据
k8s
集群搭建
(一个master,三个node)
1.准备四台CentOSLinuxrelease7.9.2009(Core)(2核2G)系统,都安装好dockerdocker的安装https://docs.docker.com/engine/install/centos/1.卸载原来安装过的docker,如果没有安装可以不需要卸载yumremovedocker\docker-client\docker-client-latest\docker-
是文倩呀
·
2024-01-15 12:26
k8s
kubernetes
docker
运维
Datax同步(高可用
HDFS
版本)
这是一个mysql同步到hive的json脚本,hive的底层使用的是
HDFS
存储,同步到hive,只能用
hdfs
writermysql->hive{"job":{"setting":{"speed":
暴走的贼宇
·
2024-01-15 12:59
hdfs
hadoop
大数据
zookeeper单机安装、
集群搭建
记录
ApacheZooKeeper官网地址:http://zookeeper.apache.org/下载地址(最新稳定版是3.6.3):https://mirrors.bfsu.edu.cn/apache/zookeeper/zookeeper-3.6.3/apache-zookeeper-3.6.3-bin.tar.gz安装之前,确保已安装好了jdk(sudoaptinstallopenjdk-11
haiyong6
·
2024-01-15 11:02
分布式计算平台 Hadoop 简介
其主要采用MapReduce分布式计算框架,包括根据GFS原理开发的分布式文件系统
HDFS
、根据BigTable原理开发的数据存储系统HBase以及资源管理系统YARN。
rookiexiong
·
2024-01-15 08:19
Hadoop学习
分布式
hadoop
大数据
本地k8s
集群搭建
保姆级教程(4)-安装k8s集群Dashboard
安装k8s集群管理UI1Dashboard安装1.1参考文档Dashboard是基于网页的Kubernetes用户界面。你可以使用Dashboard将容器应用部署到Kubernetes集群中,也可以对容器应用排错,还能管理集群资源。你可以使用Dashboard获取运行在集群中的应用的概览信息,也可以创建或者修改Kubernetes资源(如Deployment,Job,DaemonSet等等)。例如
幸福指北
·
2024-01-15 07:57
Devops
Linux/Unix
kubernetes
docker
linux
云原生
devops
java大数据hadoop2.92 Java连接操作
hadoop文件系统,需要给文件系统权限(1)需要在/usr/local/hadoop/etc/hadoop/core-site.xmlcore-site.xml文件配置具体ipfs.defaultFS
hdfs
crud-boy
·
2024-01-15 06:29
java大数据
大数据
java
hadoop
java大数据hadoop2.9.2 Java编写Hadoop分析平均成绩
org.apache.hadoophadoop-common2.9.2org.apache.hadoophadoop-client${hadoop.version}org.apache.hadoophadoop-
hdfs
crud-boy
·
2024-01-15 06:23
java大数据
大数据
hadoop
分布式
k8s实战从入门到上天系列第一篇:K8s微服务实战内容开篇介绍
第一章:开源ruoyi微服务简介基本使用第二章:k8s基本知识回顾、k3s
集群搭建
和基本使用第三章:微服务镜像构建第四章:中间件镜像构建第五章:微服务前后端部署第六章:基于SLB以及Trasfik访问第七章
岁岁种桃花儿
·
2024-01-15 05:32
#
docker和k8s
kubernetes
微服务
容器
docker
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他