hdfs集群搭建第13页

【Flink-1.17-教程】-【二】Flink 集群搭建、Flink 部署、Flink 运行模式

【Flink-1.17-教程】-【二】Flink集群搭建、Flink部署、Flink运行模式1）集群角色2）Flink集群搭建2.1.集群启动2.2.向集群提交作业3）部署模式3.1.会话模式（SessionMode

bmyyyyyy·2024-01-17 12:16

Zookeeper集群搭建

目录1、下载并解压zookeeper2、修改配置文件zoo.cfg3、创建myid文件4、启动zookeeper服务5、可能存在的问题1、下载并解压zookeeperhttps://www.apache.org/dyn/closer.lua/zookeeper/zookeeper-3.7.0/apache-zookeeper-3.7.0-bin.tar.gz2、修改配置文件zoo.cfg上面红色框

程序员张同学·2024-01-17 11:16

ActiveMq由浅入深讲解+面试题50道讲解-张立坤-专题视频课程

基于队列的生产者和消费者，基于发布-订阅的生产者和消费者，消息的同步消费和异步消费，消息的数据类型，身份认证，持久化配置与实现，事务，死信队列，ACK策略，消息的丢失，重复重复消费，消息重发，springmvc集成，集群搭建

zlkwork·2024-01-17 11:12

大数据开发之Hadoop（HDFS）

第1章：HDFS概述1.1HDFS产出背景及定义1、HDFS产生背景随着数据量越来越大，在一个操作系统存不下所有的数据，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，迫切需要一种系统来管理多台机器上的文件

Key-Key·2024-01-17 10:22

Hadoop——HDFS、MapReduce、Yarn期末复习版（搭配尚硅谷视频速通）

一、HDFS1.HDFS概述1.1HDFS定义HDFS(HadoopDistributedFileSystem),它是一个文件系统，用于存储文件，通过目录树来定位文件；其次，它是分布式的，由很多服务器联合起来实现其功能

革斤要加油·2024-01-17 06:10

【教程】集群搭建准备工作全流程

基于VMware创建虚拟机进行集群搭建，适用于hadoop/GreenPlum等集群之前已经创建了三台虚拟机hadoop102，hadoop103，hadoop104来搭建hadoop集群，因为目前学习到了

THE WHY·2024-01-17 04:12

HDFS 机架感知配置导致数据不均衡

HDFS机架感知介绍HDFS机架感知是一种逻辑上的网络架构设计，它主要是用来区分不同节点的网络拓扑情况下，保证数据是能够高性能写入和查询的一种机制，毕竟跨网络的数据读写是有网络带宽消耗的，当没有配置机架信息时

KubeData·2024-01-17 02:41

【状态管理｜概述】Flink的状态管理：为什么需要state、怎么保存state、对于state过大怎么处理

roman_日积跬步-终至千里·2024-01-17 01:13

flume

为什么选用FlumePython爬虫数据Java后台日志数据服务器本地磁盘文件夹HDFSFlumeFlume最主要的作用就是，实时读取服务器本地磁盘的数据，将数据写入到HDFS。

添柴少年yyds·2024-01-17 00:55

Hadoop详解

核心内容包含hdfs和mapreduce。hadoop2.0以后引入yarn.hdfs是提供数据存储的，mapreduce是方便数据计算的。

武昌库里写JAVA·2024-01-16 21:20

Linux搭建 Kubernetes（K8S)集群详情教程

当搭建Kubernetes集群时，涉及的详细步骤可能较多，以下是详细的Kubernetes单节点集群搭建步骤：步骤1:准备工作确保满足以下基本要求：一台运行Ubuntu18.04或更高版本的机器。

二当家的素材网·2024-01-16 17:17

hive:创建自定义python UDF

addfilehdfs://home/user/py3_script/;setspark.yarn.dist.archives=hdfs://home/user/py3.tar.gz;setspark.shuffle.hdfs.enabled

青盏·2024-01-16 16:35

企业级大数据安全架构（四）Ranger安装

作者：楼高Ranger是支持审计功能的，安装时可以选择审计数据保存的位置，默认支持Solr和HDFS。

云掣YUNCHE·2024-01-16 16:50

zookeeper集群搭建

软件下载官网首页：ApacheZooKeeper集群搭建准备三台服务器服务器1192.168.206.135服务器2192.168.206.136服务器3192.168.206.137软件安装解压压缩包

喝水的鱼.·2024-01-16 14:58

只知道HDFS和GFS？你其实并不懂分布式文件系统

一、概述分布式文件系统是分布式领域的一个基础应用，其中最著名的毫无疑问是HDFS/GFS。如今该领域已经趋向于成熟，但了解它的设计要点和思想，对我们将来面临类似场景/问题时，具有借鉴意义。

王知无(import_bigdata)·2024-01-16 13:14

分布式文件系统应该从哪些方面考虑

分布式文件系统是分布式领域的一个基础应用，其中最著名的毫无疑问是HDFS/GFS。如今该领域已经趋向于成熟，但了解它的设计要点和思想，对我们将来面临类似场景/问题时，具有借鉴意义。

吃胖点儿·2024-01-16 13:44

DataX&数据同步（全量）

1.DataX简介1.1DataX概述 DataX是阿里巴巴开源的一个异构数据源离线同步工具，致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP

韩顺平的小迷弟·2024-01-16 11:29

Flume用法总结

可以实时读取服务器的日志写入HDFS。

天选之子123·2024-01-16 10:53

HIVE总结

HIVE总结一、创建数据库CREATEDATABASEIFNOTEXISTSTEST;数据库在HDFS的默认位置为：/user/hive/warehouse/test.dbCREATEDATABASEIFNOTEXISTSTESTLOCATION

天选之子123·2024-01-16 10:52

【HDFS】HDFS-16348：将慢节点标记为badnode进而从pipeline中踢除并进行pipeline恢复

本文的主要内容是介绍这个PR（PullRequest）：HDFS-16348.Markslownodeasbadnodetorecoverpipeline(#3704)通过本文可以获得如下知识：datanode

小北觅·2024-01-16 07:09

Hive 数据迁移

/hadoopdistcphdfs://${NameNode_IP}:${NameNode_RPC_IP}/${源文件}hdfs://${NameNode_I

bigdata-余建新·2024-01-16 07:14

Hive知识点

基本概念：由Facebook开源，构建在Hadoop之上的数据仓库，数据计算是mapreduce，数据存储是HDFS目的是构建面向分析的集成的数据环境，为企业提供决策支持（面向分析的存储系统）主要特征：

꧁༺朝花夕逝༻꧂·2024-01-16 07:25

HDFS HA 集群搭建 - 基于Quorum Journal Manager（hadoop2.7.1）

0、前置概念0.1checkpoint检查点在Hadoop分布式文件系统（HDFS）中，检查点（Checkpointing）是一个关键的过程，它涉及到将文件系统的命名空间状态持久化到磁盘。

Studying！！！·2024-01-16 06:36

mac上搭建 hadoop 伪集群

它主要由以下几个部分组成：HDFS(HadoopDistributedFileSystem)：HDFS是Hadoop的分布式文件系统，具有较高的读写速度，很好的容错性和可伸缩性，为海量的数据提供了分布式存储

寂夜了无痕·2024-01-16 06:30

HDFS和MapReduce综合实训

文章目录第1关：WordCount词频统计第2关：HDFS文件读写第3关：倒排索引第4关：网页排序——PageRank算法第1关：WordCount词频统计测试说明以下是测试样例：测试输入样例数据集：文本文档

柔雾·2024-01-16 06:24

Hive基础知识（十六）：Hive-SQL分区表使用与优化

1.分区表分区表实际上就是对应一个HDFS文件系统上的独立的文件夹，该文件夹下是该分区所有的数据文件。Hive中的分区就是分目录，把一个大的数据集根据业务需要分割成小的数据集。

依晴无旧·2024-01-16 05:11

Clickhouse集成离线hive、实时kafka数据实操

Clickhouse集成hive一、官网介绍：1、clickhouse集成hive、kafka官网介绍：2、clickhouse支持的数据类型：二、创建对应hive的clickhouse表1、利用clickhouse的HDFSEngine

静听枫语·2024-01-16 05:11

Hadoop 3.2.4 集群搭建详细图文教程

一、集群简介Hadoop集群包括两个集群：HDFS集群、YARN集群。两个集群逻辑上分离、通常物理上在一起；两个集群都是标准的主从架构集群。

༺࿈誓言࿈༻·2024-01-16 05:10

MapReduce总结

执行分布式计算和任务处理split读取数据，一个map任务处理一个分片，通常一个分片对应一个HDFS文件Block。

w未然·2024-01-16 05:51

大数据技术原理与应用第三版林子雨期末复习（二） Hadoop HDFS HBase

大数据技术原理与应用第三版林子雨期末复习（二）HadoopHDFSHBaseHadoop生态系统HDFSHDFS结构块NameNode与SecondNameNode与DataNode数据冗余存储HDFS

头发多多，肆意生长·2024-01-16 05:21

DR-AUTO-SYNC架构集群搭建及主备切换手册

作者：Liuhaoao原文来源：https://tidb.net/blog/170d6d47近期有个生产系统，计划做一套dr-autosync的集群，但是之前并没有这种类型系统的生产实施经验，就一点点的摸索，好在最后是顺利搭建成功了，把搭建过程分享出来给大家参考下。1、集群架构2、规划拓扑根据集群架构规划拓扑文件global:user:"tidb"ssh_port:22deploy_dir:"/t

TiDB 社区干货传送门·2024-01-16 03:09

kafka使用zookeeper完成集群搭建

本次搭建使用的是Kafka3.6.1，zookeeper3.9.1。1、zookeeper集群安装zookeeper下载：ApacheDownloadMirrors1.1、zookeeper解压修改配置文件名#1、解压到指定目录tar-zxvfapache-zookeeper-3.9.1-bin.tar.gz-C/opt/software#2、需改配置文件名称cpzoo_sample.cfgzoo

知其_所以然·2024-01-16 03:04

ClickHouse - 01

1、ClickHouse与其特性在大数据处理场景中，流处理和批处理使用到的技术大致如下：大数据处理场景流程.png批处理会将源业务系统中的数据通过数据抽取工具（例如Sqoop）将数据抽取到HDFS中，这个过程可以使用

ArthurHC·2024-01-16 02:17

docker 下nacos集群搭建

目录1、准备工作2、拉取镜像3、启动mysql4、导入sql脚本4.1、建立连接，新建数据库nacos4.2、导入脚本4.3、导入成功5、启动naco

SHIZHK·2024-01-16 01:10

任务12：使用Hadoop Streaming解压NCDC天气原始数据

任务描述知识点：NCDC原始的气象数据上传到HDFSMapReduce程序处理NCDC原始数据重点：熟练使用HDFS基础命令查看HDFS文件块的分布情况掌握Linux系统Shell脚本的编写熟练使用MapReduce

Dija-bl·2024-01-15 22:21

【安装手册】在CentOS搭建Elasticsearch集群

一、集群搭建3台虚拟机：192.168.59.191、192.168.59.192、192.168.59.193二、找下载链接https://www.elastic.co/cn/downloads/past-releases

衣谷PN·2024-01-15 21:23

【Elasticsearch】Elasticsearch集群搭建详细手册

一、集群搭建1.1.资源准备服务器192.168.X.26192.168.X.25192.168.X.24安装包elasticsearch-6.8.10.tar.gz防火墙所有服务器均开通9200,9300

以梦为馬Douglas·2024-01-15 21:53

Redis集群搭建

1.初识Redis1.1.Redis介绍： Redis是一种基于键值对（key-value）的NoSQL数据库。与很多键值对数据库不同的是，Redis中的值可以是由string（字符串）、hash（哈希）、list（列表）、set（集合）、zset（有序集合）等多种数据结构和算法组成，因此Redis可以满足很多的应用场景。而且因为Redis会将所有数据都存放在内存中，所以它的读写性能非常

八分用心·2024-01-15 14:02

Hive导入数据的五种方法

在Hive中建表成功之后，就会在HDFS上创建一个与之对应的文件夹，且文件夹名字就是表名；文件夹父路径是由参数hive.metastore.warehouse.dir控制，默认值是/user/hive/

冬瓜的编程笔记·2024-01-15 12:04

大数据开发之Hive(基本概念、安装、数据类型、DDL数据定义、DML数据操作)

第1章：Hive基本概念1.1Hive1.1.1Hive产生背景HDFS来存储海量的数据、MapReduce来对海量数据进行分布式并行计算、Yarn来实现资源管理和作业调度。

Key-Key·2024-01-15 12:04

大数据开发之HA

HA严格来说应该分成各个组件的HA机制：HDFS的HA和YARN的HA。NameNode主要在以下两个方面影响HDFS集群NameNode机器发生意外，如宕机，集群将无法使用，直到管理员重启。

Key-Key·2024-01-15 12:03

大数据开发之Hive（详细版，最后有实战训练）

第1章：Hive基本概念1.1Hive1.1.1Hive产生背景HDFS来存储海量的数据、MapReduce来对海量数据进行分布式并行计算、Yarn来实现资源管理和作业调度。

Key-Key·2024-01-15 12:29

k8s集群搭建（一个master，三个node）

1.准备四台CentOSLinuxrelease7.9.2009(Core)（2核2G）系统，都安装好dockerdocker的安装https://docs.docker.com/engine/install/centos/1.卸载原来安装过的docker，如果没有安装可以不需要卸载yumremovedocker\docker-client\docker-client-latest\docker-

是文倩呀·2024-01-15 12:26

Datax同步（高可用HDFS版本）

这是一个mysql同步到hive的json脚本，hive的底层使用的是HDFS存储，同步到hive，只能用hdfswritermysql->hive{"job":{"setting":{"speed":

暴走的贼宇·2024-01-15 12:59

zookeeper单机安装、集群搭建记录

ApacheZooKeeper官网地址：http://zookeeper.apache.org/下载地址（最新稳定版是3.6.3）：https://mirrors.bfsu.edu.cn/apache/zookeeper/zookeeper-3.6.3/apache-zookeeper-3.6.3-bin.tar.gz安装之前，确保已安装好了jdk(sudoaptinstallopenjdk-11

haiyong6·2024-01-15 11:02

分布式计算平台 Hadoop 简介

其主要采用MapReduce分布式计算框架，包括根据GFS原理开发的分布式文件系统HDFS、根据BigTable原理开发的数据存储系统HBase以及资源管理系统YARN。

rookiexiong·2024-01-15 08:19

本地k8s集群搭建保姆级教程(4)-安装k8s集群Dashboard

安装k8s集群管理UI1Dashboard安装1.1参考文档Dashboard是基于网页的Kubernetes用户界面。你可以使用Dashboard将容器应用部署到Kubernetes集群中，也可以对容器应用排错，还能管理集群资源。你可以使用Dashboard获取运行在集群中的应用的概览信息，也可以创建或者修改Kubernetes资源（如Deployment，Job，DaemonSet等等）。例如

幸福指北·2024-01-15 07:57

java大数据hadoop2.92 Java连接操作

hadoop文件系统，需要给文件系统权限（1）需要在/usr/local/hadoop/etc/hadoop/core-site.xmlcore-site.xml文件配置具体ipfs.defaultFShdfs

crud-boy·2024-01-15 06:29

java大数据hadoop2.9.2 Java编写Hadoop分析平均成绩

org.apache.hadoophadoop-common2.9.2org.apache.hadoophadoop-client${hadoop.version}org.apache.hadoophadoop-hdfs

crud-boy·2024-01-15 06:23

k8s实战从入门到上天系列第一篇：K8s微服务实战内容开篇介绍

第一章：开源ruoyi微服务简介基本使用第二章：k8s基本知识回顾、k3s集群搭建和基本使用第三章：微服务镜像构建第四章：中间件镜像构建第五章：微服务前后端部署第六章：基于SLB以及Trasfik访问第七章

岁岁种桃花儿·2024-01-15 05:32

推荐频道

hdfs集群搭建