hadoop大数据平台第19页

一站式大数据平台XSailboat简介--Hadoop、Hive、Flink、DataStudio、数据服务、API网关、认证中心、数据可视化、离线分析、实时计算、应用引擎等

1.引言从2021年年底开始，笔者带领一个微型团队开始开发我们的大数据平台XSailboat，目前已经初步具备实用化条件，产品将持续性地开发、完善、迭代升级。

OkGogooXSailboat·2024-01-19 06:26

Jackson标签的高阶使用样例--多继承/子类、对象id、JsonIdentityInfo、JsonTypeInfo、JsonSubTypes

1.背景最近笔者在开发大数据平台XSailboat的数据资产目录模块。它的其中一个功能是能定义并查看资产数据。我们支持的资产类型不仅有关系数据库表，也支持Kafka主题，hdfs上的文件等。

OkGogooXSailboat·2024-01-19 06:19

大数据开发之Hadoop（MapReduce）

第1章：MapReduce概述1.1MapReduce定义MapReduce是一个分布式运算程序的编程框架，是用户开发“基于Hadoop的数据分析应用”的核心框架。

Key-Key·2024-01-19 06:40

大数据开发之Hadoop（Yarn）

第1章：Yarn资源调度器思考：1、如何管理集群资源？2、如何给任务合理分配资源？Yarn是一个资源调度平台，负责为运算程序提供服务器运算资源，相当于一个分布式的操作系统平台，而MapReduce等运算程序则相当于运行于操作系统之上的应用程序。1.1Yarn基础架构YARN主要由ResourceManager、NodeManager、ApplicationMaster和Container等组件构成

Key-Key·2024-01-19 06:09

linux安装hadoop详细步骤

以下是在Linux系统上安装Hadoop的详细步骤：下载Hadoop文件在Hadoop官方网站上下载最新的稳定版本的Hadoop文件。

酷爱码·2024-01-19 06:08

hadoop下载，安装

下载：https://mirrors.tuna.tsinghua.edu.cn/从清华源下载找到apache找到hadoop找到对应的版本使用64位版本上传到linux的/usr/local目录下使用tar-zxvf

三木一立·2024-01-19 06:33

spark读取hive的数据

/dev/make-distribution.sh--tgz--namewith-hive-Pyarn-Phadoop-2.7-Dhadoop.version=2.7.7-Phive-Phive

IT烧麦·2024-01-19 04:17

HBase第一章：集群搭建

：集群搭建文章目录系列文章目录前言一、环境准备二、上传HBase三、上传HBase四、配置参数五、分发测试六、高可用总结前言Hive的内容基本算是学完了，太深入的东西，现在没有必要死磕，接下来我们学习hadoop

超哥--·2024-01-19 00:57

HBase学习总结(1)：HBase的下载与安装

(HBase是一种数据库：Hadoop数据库，它是一种NoSQL存储系统，专门设计用来快速随机读写大规模数据。本文介绍HBase的下载与安装的整个过程。)

蝶Wu天涯·2024-01-19 00:25

hbase学习笔记-hbase集群安装部署

上传安装包到服务器4、解压安装包到指定的规划目录tar-zxvfhbase-2.0.0-bin.tar.gz-C/opt/bigdata5、重命名解压目录mvhbase-2.0.0hbase6、修改配置文件1、需要把hadoop

陈同学：·2024-01-19 00:22

HBase集群部署

前提条件安装hbse的前提条件是jdk已经搭建完成，虚拟机具有Hadoop伪分布式或完全分布式的集群搭建，以及zookeeper环境搭建完成。

Golden life·2024-01-19 00:21

【大数据】HBase集群安装部署

一、前提条件服务器配置好，搭建大数据集群服务器看这篇：搭建学习使用的大数据集群环境：windows使用vmware安装三台虚拟机，配置好网络环境安装好对应版本的hadoop集群，并启动安装好对应版本的zookeeper

橙子园·2024-01-19 00:51

Hbase高可用集群部署

Zookeeper集群的正常部署并启动Hadoop集群的正常部署并启动配置环境变量vi/etc/profile#Hbase-HAexportHBASE_HOME=/home/xyp9x/hbase-2.0.5

衡超越爱学习~·2024-01-19 00:21

HBase学习三：集群部署

集群启停顺序：启动Hadoop—>启动HBase—>关闭HBase—>关闭Hadoop1环境准备1.0环境前期准备参考基础环境配置1.1机器准备hostnameipvm1ip1vm2ip2vm3ip31.2

Studying！！！·2024-01-19 00:50

Hadoop的心脏：中央异步调度器AsyncDispatcher代码和设计解析

以Yarn、HDFS和MapReduce为主要组成的Hadoop，涉及到大量复杂的、交互的事件处理、状态转换，同时，这些事件调度和状态转换又对实时性和效率提出了极高的要求。

麦兜和小可的舅舅·2024-01-18 22:56

Hadoop RPC Server基于Reactor模式和Java NIO 的架构和原理

文章目录前言JavaNIO简介Reactor设计模式详解1.Reactor设计模式概览2.RPC总服务启动3.Listener4.Reader5.Handler6.Responder结束前言HadoopRPC

麦兜和小可的舅舅·2024-01-18 22:26

HDFS WebHDFS 读写文件分析及HTTP Chunk Transfer Encoding相关问题探究

文章目录前言需要回答的首要问题DataNode端基于Netty的WebHDFSService的实现基于重定向的文件写入流程写入一个大文件时WebHDFS和HadoopNative的块分布差异基于重定向的数据读取流程尝试读取一个小文件尝试读取一个大文件读写过程中的

麦兜和小可的舅舅·2024-01-18 22:52

Hive入门

介绍Hive是一个基于Hadoop的数据仓库工具，它可以将结构化数据文件映射成一张表，然后通过类似SQL的查询语句来执行查询。

kongxx·2024-01-18 17:11

MacBook Linux安装zookeeper

MacBookLinux安装zookeeperZooKeeper是一个分布式的，开放源码的分布式应用程序协调服务，是Google的Chubby一个开源的实现，是Hadoop和Hbase的重要组件。

beyond阿亮·2024-01-18 17:12

虚拟机中配置hadoop

一、可以先在windows系统下下载好需要安装的hadoop版本比如：hadoop-3.1.3.tar.gz。

※海绵※的笑~·2024-01-18 14:40

Linux常用命令大全

1.查看端口号占用lsof-i:端口号lsof-i:8060sudonetstat-nlp|grep80602.查看CPU、核数、磁盘信息[hadoop@master1~]$cat/etc/redhat-releaseCentOSLinuxrelease7.9.2009

tuoluzhe8521·2024-01-18 13:52

构建高效数据生态：数据库、数据仓库、数据湖、大数据平台与数据中台解析_光点科技

本文将深入探讨数据库、数据仓库、数据湖、大数据平台以及数据中台的功能和价值，帮助您构建一个符合自身业务需求的高效数据生态系统。

光点数据治理·2024-01-18 12:24

情报研判分析系统开发，可视化大数据研判平台建设

情报研判分析系统功能：1、大数据多维度预测分析：通过大数据平台和算法对历史数据

d13823153201·2024-01-18 12:08

公安情报大数据分析研判平台建设解决方案，情报信息平台建设

公安情报大数据分析研判平台建设解决方案，情报信息平台建设公安情报大数据分析研判平台建设解决方案，通过构建汇聚公安内部各警种部门和公安外部单位各类社会数据的大数据平台，以公安数据业务为基础、情报需求为主导

d13823153201·2024-01-18 12:37

书签留存文档

用plsql连接oracle-郑文亮-博客园IDEA中创建mavenweb项目的详细部署kettle连接hbase-CSDN博客PI服务器及各客户端安装配置-豆丁网Oracle客户端使用-CSDN博客hadoop

Liang.Wang·2024-01-18 09:13

作为刚入职的小白，怎么才能学好大数据？

大数据学习方向一、大数据运维之Linux基础打好Linux基础，以便更好地学习Hadoop，hbase,NoSQL，Spark，Storm，docker,openstack等。

铁拳虎·2024-01-18 09:40

HBASE学习一：原理架构详解

HBase的存储是基于HDFS的，HDFS有着高容错性的特点，被设计用来部署在低廉的硬件上，基于Hadoop意味着HBase与生俱来的超强的扩展性和吞吐量。HBase采用的时ke

Studying！！！·2024-01-18 08:34

ClickHouse vs StarRocks 全场景MPP数据库选型对比

ClickHousevsStarRocks选型对比面向列存的DBMS新的选择Hadoop从诞生已经十三年了，Hadoop的供应商争先恐后的为Hadoop贡献各种开源插件，发明各种的解决方案技术栈，一方面确实帮助很多用户解决了问题

涛子丶白了你一眼·2024-01-18 08:12

ClickHouse vs StarRocks 选型对比

ClickHousevsStarRocks选型对比面向列存的DBMS新的选择Hadoop从诞生已经十三年了，Hadoop的供应商争先恐后的为Hadoop贡献各种开源插件，发明各种的解决方案技术栈，一方面确实帮助很多用户解决了问题

dan20211·2024-01-18 08:40

Clickhouse VS StarRocks

ClickHousevsStarRocks选型对比面向列存的DBMS新的选择Hadoop从诞生已经十三年了，Hadoop的供应商争先恐后的为Hadoop贡献各种开源插件，发明各种的解决方案技术栈，一方面确实帮助很多用户解决了问题

chixushuchu·2024-01-18 08:10

dubbo入门案例！！！

Zookeeper是ApacaheHadoop的子项目，可以为分布式应用程序协调服务，适合作为Dubbo服务的注册中心，负责服务地址的注册与查找，相当于目录服务，服务提供者和消费者只在启动时与注册中心交互

明天更新·2024-01-18 07:51

Dinky创建Flink实例报错

Dinky版本：0.7.3Flink版本：1.13.0问题描述问题1：已有实例不显示在Dinky的【注册中心】—【Flink实例管理】中：hadoop集群以及zookeeper重启后，之前创建的一个yarn-session

THE WHY·2024-01-18 07:48

数仓项目6.0配置大全（hadoop/Flume/zk/kafka/mysql配置）

配置背景我使用的root用户，懒得加sudo所有文件夹在/opt/module所有安装包在/opt/software所有脚本文件在/root/bin三台虚拟机：hadoop102-103-104分发脚本

Int mian[]·2024-01-18 06:57

hadoop YARN详解

YARN概念YARN是一个资源管理、任务调度的框架，主要包含三大模块：ResourceManager（RM）、NodeManager（NM）、ApplicationMaster（AM）。其中，ResourceManager负责所有资源的监控、分配和管理；ApplicationMaster负责每一个具体应用程序的调度和协调；NodeManager负责每一个节点的维护。对于所有的application

武昌库里写JAVA·2024-01-18 06:25

Hadoop之mapreduce参数大全-7

Inter-ProcessCommunication）连接在发生超时时的最大重试次数yarn.app.mapreduce.client-am.ipc.max-retries-on-timeouts是ApacheHadoopYARN

OnePandas·2024-01-18 06:54

Hadoop之mapreduce参数大全-8

176.指定JobHistoryServer在缓存中存储的日期字符串的最大数量mapreduce.jobhistory.datestring.cache.size是ApacheHadoopMapReduce

OnePandas·2024-01-18 06:54

SeaTunnel 、DataX 、Sqoop、Flume、Flink CDC 对比

对比对比项ApacheSeaTunnelDataXApacheSqoopApacheFlumeFlinkCDC部署难度容易容易中等，依赖于Hadoop生态系统容易中等，依赖于Hadoop生态系统运行模式分布式

贾斯汀玛尔斯·2024-01-18 06:01

阿里云大数据ACA及ACP复习题（21~40)

21.Hadoop的主要功能中，能完成对海量数据分布式运算的是哪个组件?

周周的奇妙编程·2024-01-18 03:08

HDFS 系统架构

HDFSArchitectureIntroductionHadoopDistributedFileSystem(HDFS)是设计可以运行于普通商业硬件上的分布式文件系统。

偷油考拉·2024-01-18 03:52

基于JavaWeb+BS架构+SpringBoot+Vue+Hadoop的物品租赁系统的设计与实现

基于JavaWeb+BS架构+SpringBoot+Vue+Hadoop的物品租赁系统的设计与实现文末获取源码Lun文目录前言主要技术系统设计功能截图订阅经典源码专栏Java项目精品实战案例《500套》

FREE技术·2024-01-18 00:17

Note08：Hive-1.2.2安装配置

安装包下载安装地址：http://archive.apache.org/dist/hive/把安装包上传到/opt/software目录解压[kevin@hadoop112software]$tar-zxvfapache-hive

K__3f8b·2024-01-18 00:22

【若泽大数据第二天】--MySQL二进制部署

1、通过winscp上传MySQL5.6安装文件2、判断一下服务器是否安装了MySQL3、解压MySQL安装文件并进行重命名[root@hadoop001~]#tar-zxvfmysql-5.6.23-

naroutofan·2024-01-17 21:52

[CDH5] Oozie web console is disabled 问题解决

Ooziewebconsoleisdisabled.问题解决：下载ExtJS2.2:下载地址：http://archive.cloudera.com/gplextras/misc/ext-2.2.zip上传到服务器并解压[root@hadoop1libext

尼小摩·2024-01-17 19:12

IDEA插件安装ZooKeeper

zookeeper介绍Zookeeper是ApacaheHadoop的子项目，可以为分布式应用程序协调服务，适合作为Dubbo服务的注册中心，负责服务地址的注册与查找，相当于目录服务，服务提供者和消费者只在启动时与注册中心交互

冰冰很社恐·2024-01-17 19:07

Flink的ListState在小规模场景下的缓存提速和接口优化丰富的实践

1.背景笔者的大数据平台XSailboat中包含以DAG方式可视化的离线分析和实时计算的开发、运维功能。

OkGogooXSailboat·2024-01-17 18:36

Aviator表达式扩展--数组、列表负向序号索引以及自己的JSON库支持方括号([])赋值

1.背景笔者开发的大数据大数据平台XSailboat中的DataStudio模块包含基于DAG图的实时计算可视化开发功能，实现了Flink计算任务的可视化开发（想要了解更多，可以查看《Flink的DAG

OkGogooXSailboat·2024-01-17 18:36

关于Flink在一条计算管道中配置流和数据流通过广播方式合流的情形下，无保存点和检查点重跑时，让配置流先行，数据流等延迟几秒再进入合流节点的思考

1.背景笔者带领的团队在自研的大数据平台XSailboat上进行专家策略规则的计算管道开发时，遇到这样一种情形：计算管道中存在一条配置流和数据流通过广播方式合流的情形。

OkGogooXSailboat·2024-01-17 18:36

本地运行Flink退出时java.nio.file.DirectoryNotEmptyException、目录没有正常删除解决方法

1.背景在开发大数据平台XSailboat中的查看Flink任务的状态数据工具时，用StateProcessAPI解析保存点数据，将其从HDFS上读取出来再将其解析过后下沉到HDFS以CSV格式保存，然后由其它接口提供对这个文件的分页加载功能

OkGogooXSailboat·2024-01-17 18:05

Flink的Reduce算子，Name-Position形式的Row数据在使用保存点/检查点重新启动的时候，变成了Position-Based形式的Row解决

1.背景大数据平台XSailboat提供了基于ApacheFlink的实时计算管道开发功能。DataStudio的实时计算管道开发功能中提供了分区规约节点(keyBy+reduce)。

OkGogooXSailboat·2024-01-17 18:05

数据标签设计 -- 大数据平台(XSailboat)的数据标签模块

原先就有在大数据平台XSailboat中增加“数据标签”模块的设想，现在有这样的需求，正好趁此机会将其实现。

OkGogooXSailboat·2024-01-17 18:35

推荐频道

hadoop大数据平台

一站式大数据平台XSailboat简介--Hadoop、Hive、Flink、DataStudio、数据服务、API网关、认证中心、数据可视化、离线分析、实时计算、应用引擎等

Jackson标签的高阶使用样例--多继承/子类、对象id、JsonIdentityInfo、JsonTypeInfo、JsonSubTypes

大数据开发之Hadoop（MapReduce）

大数据开发之Hadoop（Yarn）

linux安装hadoop详细步骤

hadoop下载，安装

spark读取hive的数据

HBase第一章：集群搭建

HBase学习总结(1)：HBase的下载与安装

hbase学习笔记-hbase集群安装部署

HBase集群部署

【大数据】HBase集群安装部署

Hbase高可用集群部署

HBase学习三：集群部署

Hadoop的心脏：中央异步调度器AsyncDispatcher代码和设计解析

Hadoop RPC Server基于Reactor模式和Java NIO 的架构和原理

HDFS WebHDFS 读写文件分析及HTTP Chunk Transfer Encoding相关问题探究

Hive入门

MacBook Linux安装zookeeper

虚拟机中配置hadoop

Linux常用命令大全

构建高效数据生态：数据库、数据仓库、数据湖、大数据平台与数据中台解析_光点科技

情报研判分析系统开发，可视化大数据研判平台建设

公安情报大数据分析研判平台建设解决方案，情报信息平台建设

书签留存文档

作为刚入职的小白，怎么才能学好大数据 ？

HBASE学习一：原理架构详解

ClickHouse vs StarRocks 全场景MPP数据库选型对比

ClickHouse vs StarRocks 选型对比

Clickhouse VS StarRocks

dubbo入门案例！！！

Dinky创建Flink实例报错

数仓项目6.0配置大全（hadoop/Flume/zk/kafka/mysql配置）

hadoop YARN详解

Hadoop之mapreduce参数大全-7

Hadoop之mapreduce参数大全-8

SeaTunnel 、DataX 、Sqoop、Flume、Flink CDC 对比

阿里云大数据ACA及ACP复习题（21~40)

HDFS 系统架构

基于JavaWeb+BS架构+SpringBoot+Vue+Hadoop的物品租赁系统的设计与实现

Note08：Hive-1.2.2安装配置

【若泽大数据第二天】--MySQL二进制部署

[CDH5] Oozie web console is disabled 问题解决

IDEA插件安装ZooKeeper

Flink的ListState在小规模场景下的缓存提速和接口优化丰富的实践

Aviator表达式扩展--数组、列表负向序号索引以及自己的JSON库支持方括号([])赋值

关于Flink在一条计算管道中配置流和数据流通过广播方式合流的情形下，无保存点和检查点重跑时，让配置流先行，数据流等延迟几秒再进入合流节点的思考

本地运行Flink退出时java.nio.file.DirectoryNotEmptyException、目录没有正常删除解决方法

Flink的Reduce算子，Name-Position形式的Row数据在使用保存点/检查点重新启动的时候，变成了Position-Based形式的Row解决

数据标签设计 -- 大数据平台(XSailboat)的数据标签模块

作为刚入职的小白，怎么才能学好大数据？