E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop大数据平台
一站式
大数据平台
XSailboat简介--
Hadoop
、Hive、Flink、DataStudio、数据服务、API网关、认证中心、数据可视化、离线分析、实时计算、应用引擎等
1.引言从2021年年底开始,笔者带领一个微型团队开始开发我们的
大数据平台
XSailboat,目前已经初步具备实用化条件,产品将持续性地开发、完善、迭代升级。
OkGogooXSailboat
·
2024-01-19 06:26
大数据平台开发技术
大数据
Jackson标签的高阶使用样例--多继承/子类、对象id、JsonIdentityInfo、JsonTypeInfo、JsonSubTypes
1.背景最近笔者在开发
大数据平台
XSailboat的数据资产目录模块。它的其中一个功能是能定义并查看资产数据。我们支持的资产类型不仅有关系数据库表,也支持Kafka主题,hdfs上的文件等。
OkGogooXSailboat
·
2024-01-19 06:19
java
json
大数据开发之
Hadoop
(MapReduce)
第1章:MapReduce概述1.1MapReduce定义MapReduce是一个分布式运算程序的编程框架,是用户开发“基于
Hadoop
的数据分析应用”的核心框架。
Key-Key
·
2024-01-19 06:40
大数据
hadoop
mapreduce
大数据开发之
Hadoop
(Yarn)
第1章:Yarn资源调度器思考:1、如何管理集群资源?2、如何给任务合理分配资源?Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而MapReduce等运算程序则相当于运行于操作系统之上的应用程序。1.1Yarn基础架构YARN主要由ResourceManager、NodeManager、ApplicationMaster和Container等组件构成
Key-Key
·
2024-01-19 06:09
大数据
hadoop
分布式
linux安装
hadoop
详细步骤
以下是在Linux系统上安装
Hadoop
的详细步骤:下载
Hadoop
文件在
Hadoop
官方网站上下载最新的稳定版本的
Hadoop
文件。
酷爱码
·
2024-01-19 06:08
大数据基础教程
linux
hadoop
运维
hadoop
下载,安装
下载:https://mirrors.tuna.tsinghua.edu.cn/从清华源下载找到apache找到
hadoop
找到对应的版本使用64位版本上传到linux的/usr/local目录下使用tar-zxvf
三木一立
·
2024-01-19 06:33
大数据
hadoop
大数据
分布式
spark读取hive的数据
/dev/make-distribution.sh--tgz--namewith-hive-Pyarn-P
hadoop
-2.7-D
hadoop
.version=2.7.7-Phive-Phive
IT烧麦
·
2024-01-19 04:17
HBase第一章:集群搭建
:集群搭建文章目录系列文章目录前言一、环境准备二、上传HBase三、上传HBase四、配置参数五、分发测试六、高可用总结前言Hive的内容基本算是学完了,太深入的东西,现在没有必要死磕,接下来我们学习
hadoop
超哥--
·
2024-01-19 00:57
HBase
hbase
hadoop
大数据
HBase学习总结(1):HBase的下载与安装
(HBase是一种数据库:
Hadoop
数据库,它是一种NoSQL存储系统,专门设计用来快速随机读写大规模数据。本文介绍HBase的下载与安装的整个过程。)
蝶Wu天涯
·
2024-01-19 00:25
HBase
HBase
hbase学习笔记-hbase集群安装部署
上传安装包到服务器4、解压安装包到指定的规划目录tar-zxvfhbase-2.0.0-bin.tar.gz-C/opt/bigdata5、重命名解压目录mvhbase-2.0.0hbase6、修改配置文件1、需要把
hadoop
陈同学:
·
2024-01-19 00:22
hbase
hbase
zookeeper
HBase集群部署
前提条件安装hbse的前提条件是jdk已经搭建完成,虚拟机具有
Hadoop
伪分布式或完全分布式的集群搭建,以及zookeeper环境搭建完成。
Golden life
·
2024-01-19 00:21
hbase
数据库
大数据
【大数据】HBase集群安装部署
一、前提条件服务器配置好,搭建大数据集群服务器看这篇:搭建学习使用的大数据集群环境:windows使用vmware安装三台虚拟机,配置好网络环境安装好对应版本的
hadoop
集群,并启动安装好对应版本的zookeeper
橙子园
·
2024-01-19 00:51
大数据工程师成神之路
hbase
big
data
hadoop
安装部署
Hbase高可用集群部署
Zookeeper集群的正常部署并启动
Hadoop
集群的正常部署并启动配置环境变量vi/etc/profile#Hbase-HAexportHBASE_HOME=/home/xyp9x/hbase-2.0.5
衡超越爱学习~
·
2024-01-19 00:21
Hbase
hbase
hadoop
big
data
HBase学习三:集群部署
集群启停顺序:启动
Hadoop
—>启动HBase—>关闭HBase—>关闭
Hadoop
1环境准备1.0环境前期准备参考基础环境配置1.1机器准备hostnameipvm1ip1vm2ip2vm3ip31.2
Studying!!!
·
2024-01-19 00:50
中间件
HBase
Hadoop
的心脏:中央异步调度器AsyncDispatcher代码和设计解析
以Yarn、HDFS和MapReduce为主要组成的
Hadoop
,涉及到大量复杂的、交互的事件处理、状态转换,同时,这些事件调度和状态转换又对实时性和效率提出了极高的要求。
麦兜和小可的舅舅
·
2024-01-18 22:56
yarn
hadoop
hadoop
yarn
dispatcher
异步调度器
Hadoop
RPC Server基于Reactor模式和Java NIO 的架构和原理
文章目录前言JavaNIO简介Reactor设计模式详解1.Reactor设计模式概览2.RPC总服务启动3.Listener4.Reader5.Handler6.Responder结束前言
Hadoop
RPC
麦兜和小可的舅舅
·
2024-01-18 22:26
hadoop
yarn
open-source
hadoop
reactor
yarn
nio
RPC
HDFS WebHDFS 读写文件分析及HTTP Chunk Transfer Encoding相关问题探究
文章目录前言需要回答的首要问题DataNode端基于Netty的WebHDFSService的实现基于重定向的文件写入流程写入一个大文件时WebHDFS和
Hadoop
Native的块分布差异基于重定向的数据读取流程尝试读取一个小文件尝试读取一个大文件读写过程中的
麦兜和小可的舅舅
·
2024-01-18 22:52
大数据架构
实现
hadoop
open-source
hdfs
http
hadoop
Hive入门
介绍Hive是一个基于
Hadoop
的数据仓库工具,它可以将结构化数据文件映射成一张表,然后通过类似SQL的查询语句来执行查询。
kongxx
·
2024-01-18 17:11
MacBook Linux安装zookeeper
MacBookLinux安装zookeeperZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是
Hadoop
和Hbase的重要组件。
beyond阿亮
·
2024-01-18 17:12
zookeeper
macbook
linux
虚拟机中配置
hadoop
一、可以先在windows系统下下载好需要安装的
hadoop
版本比如:
hadoop
-3.1.3.tar.gz。
※海绵※的笑~
·
2024-01-18 14:40
linux
hadoop
hadoop
大数据
hdfs
Linux常用命令大全
1.查看端口号占用lsof-i:端口号lsof-i:8060sudonetstat-nlp|grep80602.查看CPU、核数、磁盘信息[
hadoop
@master1~]$cat/etc/redhat-releaseCentOSLinuxrelease7.9.2009
tuoluzhe8521
·
2024-01-18 13:52
Linux
linux
运维
服务器
构建高效数据生态:数据库、数据仓库、数据湖、
大数据平台
与数据中台解析_光点科技
本文将深入探讨数据库、数据仓库、数据湖、
大数据平台
以及数据中台的功能和价值,帮助您构建一个符合自身业务需求的高效数据生态系统。
光点数据治理
·
2024-01-18 12:24
数据库
数据仓库
大数据
情报研判分析系统开发,可视化大数据研判平台建设
情报研判分析系统功能:1、大数据多维度预测分析:通过
大数据平台
和算法对历史数据
d13823153201
·
2024-01-18 12:08
情报研判系统开发
大数据
数据分析
数据挖掘
公安情报大数据分析研判平台建设解决方案,情报信息平台建设
公安情报大数据分析研判平台建设解决方案,情报信息平台建设公安情报大数据分析研判平台建设解决方案,通过构建汇聚公安内部各警种部门和公安外部单位各类社会数据的
大数据平台
,以公安数据业务为基础、情报需求为主导
d13823153201
·
2024-01-18 12:37
情报研判系统开发
可视化
大数据
人工智能
数据分析
书签留存文档
用plsql连接oracle-郑文亮-博客园IDEA中创建mavenweb项目的详细部署kettle连接hbase-CSDN博客PI服务器及各客户端安装配置-豆丁网Oracle客户端使用-CSDN博客
hadoop
Liang.Wang
·
2024-01-18 09:13
eclipse
java
tomcat
作为刚入职的小白,怎么才能学好大数据 ?
大数据学习方向一、大数据运维之Linux基础打好Linux基础,以便更好地学习
Hadoop
,hbase,NoSQL,Spark,Storm,docker,openstack等。
铁拳虎
·
2024-01-18 09:40
大数据学习
大数据开发
大数据入门
数据分析
Hadoop
Kafka
大数据
大数据技术
人工智能
spark
Linux
大数据
大数据学习
大数据开发
HBASE学习一:原理架构详解
HBase的存储是基于HDFS的,HDFS有着高容错性的特点,被设计用来部署在低廉的硬件上,基于
Hadoop
意味着HBase与生俱来的超强的扩展性和吞吐量。HBase采用的时ke
Studying!!!
·
2024-01-18 08:34
中间件
hbase
学习
架构
ClickHouse vs StarRocks 全场景MPP数据库选型对比
ClickHousevsStarRocks选型对比面向列存的DBMS新的选择
Hadoop
从诞生已经十三年了,
Hadoop
的供应商争先恐后的为
Hadoop
贡献各种开源插件,发明各种的解决方案技术栈,一方面确实帮助很多用户解决了问题
涛子丶白了你一眼
·
2024-01-18 08:12
大数据技术
数据库
hadoop
大数据
ClickHouse vs StarRocks 选型对比
ClickHousevsStarRocks选型对比面向列存的DBMS新的选择
Hadoop
从诞生已经十三年了,
Hadoop
的供应商争先恐后的为
Hadoop
贡献各种开源插件,发明各种的解决方案技术栈,一方面确实帮助很多用户解决了问题
dan20211
·
2024-01-18 08:40
big
data
数据库
hadoop
Clickhouse VS StarRocks
ClickHousevsStarRocks选型对比面向列存的DBMS新的选择
Hadoop
从诞生已经十三年了,
Hadoop
的供应商争先恐后的为
Hadoop
贡献各种开源插件,发明各种的解决方案技术栈,一方面确实帮助很多用户解决了问题
chixushuchu
·
2024-01-18 08:10
数据库
clickhouse
starrocks
dubbo入门案例!!!
Zookeeper是Apacahe
Hadoop
的子项目,可以为分布式应用程序协调服务,适合作为Dubbo服务的注册中心,负责服务地址的注册与查找,相当于目录服务,服务提供者和消费者只在启动时与注册中心交互
明天更新
·
2024-01-18 07:51
dubbo
Dinky创建Flink实例报错
Dinky版本:0.7.3Flink版本:1.13.0问题描述问题1:已有实例不显示在Dinky的【注册中心】—【Flink实例管理】中:
hadoop
集群以及zookeeper重启后,之前创建的一个yarn-session
THE WHY
·
2024-01-18 07:48
大数据相关问题汇总
Dinky
Flink
flink
大数据
数据库
数仓项目6.0配置大全(
hadoop
/Flume/zk/kafka/mysql配置)
配置背景我使用的root用户,懒得加sudo所有文件夹在/opt/module所有安装包在/opt/software所有脚本文件在/root/bin三台虚拟机:
hadoop
102-103-104分发脚本
Int mian[]
·
2024-01-18 06:57
hadoop
flume
kafka
hadoop
YARN详解
YARN概念YARN是一个资源管理、任务调度的框架,主要包含三大模块:ResourceManager(RM)、NodeManager(NM)、ApplicationMaster(AM)。其中,ResourceManager负责所有资源的监控、分配和管理;ApplicationMaster负责每一个具体应用程序的调度和协调;NodeManager负责每一个节点的维护。对于所有的application
武昌库里写JAVA
·
2024-01-18 06:25
高手面试
hadoop
大数据
linux
Hadoop
之mapreduce参数大全-7
Inter-ProcessCommunication)连接在发生超时时的最大重试次数yarn.app.mapreduce.client-am.ipc.max-retries-on-timeouts是Apache
Hadoop
YARN
OnePandas
·
2024-01-18 06:54
Hadoop
hadoop
mapreduce
大数据
Hadoop
之mapreduce参数大全-8
176.指定JobHistoryServer在缓存中存储的日期字符串的最大数量mapreduce.jobhistory.datestring.cache.size是Apache
Hadoop
MapReduce
OnePandas
·
2024-01-18 06:54
Hadoop
hadoop
mapreduce
大数据
SeaTunnel 、DataX 、Sqoop、Flume、Flink CDC 对比
对比对比项ApacheSeaTunnelDataXApacheSqoopApacheFlumeFlinkCDC部署难度容易容易中等,依赖于
Hadoop
生态系统容易中等,依赖于
Hadoop
生态系统运行模式分布式
贾斯汀玛尔斯
·
2024-01-18 06:01
数据湖
大数据生态
sqoop
flume
flink
阿里云大数据ACA及ACP复习题(21~40)
21.
Hadoop
的主要功能中,能完成对海量数据分布式运算的是哪个组件?
周周的奇妙编程
·
2024-01-18 03:08
阿里云
大数据
云计算
HDFS 系统架构
HDFSArchitectureIntroduction
Hadoop
DistributedFileSystem(HDFS)是设计可以运行于普通商业硬件上的分布式文件系统。
偷油考拉
·
2024-01-18 03:52
基于JavaWeb+BS架构+SpringBoot+Vue+
Hadoop
的物品租赁系统的设计与实现
基于JavaWeb+BS架构+SpringBoot+Vue+
Hadoop
的物品租赁系统的设计与实现文末获取源码Lun文目录前言主要技术系统设计功能截图订阅经典源码专栏Java项目精品实战案例《500套》
FREE技术
·
2024-01-18 00:17
计算机专业毕业设计
spring
boot
Note08:Hive-1.2.2安装配置
安装包下载安装地址:http://archive.apache.org/dist/hive/把安装包上传到/opt/software目录解压[kevin@
hadoop
112software]$tar-zxvfapache-hive
K__3f8b
·
2024-01-18 00:22
【若泽大数据第二天】--MySQL二进制部署
1、通过winscp上传MySQL5.6安装文件2、判断一下服务器是否安装了MySQL3、解压MySQL安装文件并进行重命名[root@
hadoop
001~]#tar-zxvfmysql-5.6.23-
naroutofan
·
2024-01-17 21:52
[CDH5] Oozie web console is disabled 问题解决
Ooziewebconsoleisdisabled.问题解决:下载ExtJS2.2:下载地址:http://archive.cloudera.com/gplextras/misc/ext-2.2.zip上传到服务器并解压[root@
hadoop
1libext
尼小摩
·
2024-01-17 19:12
IDEA插件安装ZooKeeper
zookeeper介绍Zookeeper是Apacahe
Hadoop
的子项目,可以为分布式应用程序协调服务,适合作为Dubbo服务的注册中心,负责服务地址的注册与查找,相当于目录服务,服务提供者和消费者只在启动时与注册中心交互
冰冰很社恐
·
2024-01-17 19:07
java-zookeeper
intellij-idea
zookeeper
Flink的ListState在小规模场景下的缓存提速和接口优化丰富的实践
1.背景笔者的
大数据平台
XSailboat中包含以DAG方式可视化的离线分析和实时计算的开发、运维功能。
OkGogooXSailboat
·
2024-01-17 18:36
大数据平台开发技术
flink
缓存
spring
Aviator表达式扩展--数组、列表负向序号索引以及自己的JSON库支持方括号([])赋值
1.背景笔者开发的大数据
大数据平台
XSailboat中的DataStudio模块包含基于DAG图的实时计算可视化开发功能,实现了Flink计算任务的可视化开发(想要了解更多,可以查看《Flink的DAG
OkGogooXSailboat
·
2024-01-17 18:36
大数据平台开发技术
json
java
关于Flink在一条计算管道中配置流和数据流通过广播方式合流的情形下,无保存点和检查点重跑时,让配置流先行,数据流等延迟几秒再进入合流节点的思考
1.背景笔者带领的团队在自研的
大数据平台
XSailboat上进行专家策略规则的计算管道开发时,遇到这样一种情形:计算管道中存在一条配置流和数据流通过广播方式合流的情形。
OkGogooXSailboat
·
2024-01-17 18:36
flink
linq
大数据
本地运行Flink退出时java.nio.file.DirectoryNotEmptyException、目录没有正常删除解决方法
1.背景在开发
大数据平台
XSailboat中的查看Flink任务的状态数据工具时,用StateProcessAPI解析保存点数据,将其从HDFS上读取出来再将其解析过后下沉到HDFS以CSV格式保存,然后由其它接口提供对这个文件的分页加载功能
OkGogooXSailboat
·
2024-01-17 18:05
大数据平台开发问题解决笔记
flink
java
nio
Flink的Reduce算子,Name-Position形式的Row数据在使用保存点/检查点重新启动的时候,变成了Position-Based形式的Row解决
1.背景
大数据平台
XSailboat提供了基于ApacheFlink的实时计算管道开发功能。DataStudio的实时计算管道开发功能中提供了分区规约节点(keyBy+reduce)。
OkGogooXSailboat
·
2024-01-17 18:05
flink
python
大数据
数据标签设计 --
大数据平台
(XSailboat)的数据标签模块
原先就有在
大数据平台
XSailboat中增加“数据标签”模块的设想,现在有这样的需求,正好趁此机会将其实现。
OkGogooXSailboat
·
2024-01-17 18:35
大数据平台开发技术
大数据
上一页
15
16
17
18
19
20
21
22
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他