E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Kafka;Hadoop
Hbase的简单使用示例
HBase是基于
Hadoop
HDFS构建的分布式、列式存储的NoSQL数据库,适用于存储和检索超大规模的非结构化数据。它支持随机读写,并且能够处理PB级数据。
傲雪凌霜,松柏长青
·
2024-09-09 11:40
后端
大数据
hbase
数据库
大数据
Kafka
是如何实现高性能的
将写磁盘的过程变为顺序写
Kafka
的整个设计中,Partition相当于一个非常长的数组,而Broker接收到的所有消息顺序写入这个大数组中。
明斯克开源
·
2024-09-09 04:19
Java
经验分享
架构
java
Spring常用中间件
(2)
Kafka
:分布式流处理平台,适合处理大规模数
贺仙姑
·
2024-09-08 23:15
spring
中间件
java
Hbase、hive以及ClickHouse的介绍和区别?
一、Hbase介绍:HBase是一个分布式的、面向列的开源数据库,由ApacheSoftwareFoundation开发,是
Hadoop
生态系统中的一个重要组件。
damokelisijian866
·
2024-09-08 23:43
hbase
hive
clickhouse
Flink - CEP
Hadoop
3.2集群新版本的搭建详细讲解过程,从下面第一张官方的图来看,最新版是3.2,所以大猪将使用3.2的版本来演示,过程中遇到的坑留给自己,把路留给你们,IT之路还有大猪。
kikiki1
·
2024-09-08 21:46
chapter01 Java语言概述 知识点Note
JavaSEJavaEEJavaME大数据Java基础常用技术栈mysqlJDBCSSMspring+springmvc+mybatisLinuxnacos
Hadoop
FlinkJAVAEE消息队列rabbitMQdocker
月下绯烟
·
2024-09-08 18:42
Java
java
开发语言
Hive和Hbase的区别
Hive和HBase都是
Hadoop
生态系统中的重要组件,它们都能处理大规模数据,但各自有不同的适用场景和设计理念。
傲雪凌霜,松柏长青
·
2024-09-08 17:37
大数据
后端
hive
hbase
hadoop
HBase
ApacheHBase是一个基于
Hadoop
分布式文件系统(HDFS)构建的分布式、面向列的NoSQL数据库,主要用于处理大规模、稀疏的表结构数据。
傲雪凌霜,松柏长青
·
2024-09-08 17:07
大数据
后端
hbase
数据库
大数据
Hive的优势与使用场景
Hive的优势Hive作为一个构建在
Hadoop
上的数据仓库工具,具有许多优势,特别是在处理大规模数据分析任务时。
傲雪凌霜,松柏长青
·
2024-09-08 17:07
后端
大数据
hive
hadoop
数据仓库
大数据技术之
Hadoop
(一)
Hadoop
概述1.1
Hadoop
是什么
Hadoop
是什么1)
Hadoop
是一个由Apache基金会所开发的分布式系统基础架构。2)主要解决,海量数据的存储和海量数据的分析计算问题。
pauls
·
2024-09-08 16:30
【Python系列】中位数计算
推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,
kafka
,Spring,微服务等常用开发工具系列:常用的开发工具
Kwan的解忧杂货铺@新空间代码工作室
·
2024-09-08 15:24
s2
Python
python
开发语言
大数据面试题:说下为什么要使用Hive?Hive的优缺点?Hive的作用是什么?
Hive是
Hadoop
生态系统中比不可少的一个工具,它提供了一种SQL(结构化查询语言)方言,可以查询存储在
Hadoop
分布式文件系统(HDFS)中的数据或其他和
Hadoop
集成的文件系统,如MapR-FS
蓦然_
·
2024-09-08 15:50
大数据面试题
hive
大数据开发面试题
大数据面试
ERROR:master启动报错: Attempting to operate on hdfs namenode as root
[root@master
hadoop
]#sbin/start-all.shStartingnamenodeson[master]ERROR:AttemptingtooperateonhdfsnamenodeasrootERROR
CourageLee
·
2024-09-08 07:55
Docker
hadoop
linux
Kafka
、RabbitMQ、RocketMQ 之间的区别是什么
Kafka
、RabbitMQ、RocketMQ之间的区别是什么?
m0_67394230
·
2024-09-08 07:54
面试
学习路线
阿里巴巴
android
前端
后端
Kafka
高性能揭秘 —— sequence IO、PageCache、SendFile的应用详解
大家都知道
Kafka
是将数据存储于磁盘的,而磁盘读写性能往往很差,但
Kafka
官方测试其数据读写速率能达到600M/s,那么为什么
Kafka
性能会这么高呢?
大数据学习与分享
·
2024-09-08 05:12
Kafka
kafka
大数据
java
pyspark
kafka
mysql_数据平台实践①——Flume+
Kafka
+SparkStreaming(pyspark)
蜻蜓点水Flume——数据采集如果说,爬虫是采集外部数据的常用手段的话,那么,Flume就是采集内部数据的常用手段之一(logstash也是这方面的佼佼者)。下面介绍一下Flume的基本构造。Agent:包含Source、Channel和Sink的主体,它是这3个组件的载体,是组成Flume的数据节点。Event:Flume数据传输的基本单元。Source:用来接收Event,并将Event批量传
weixin_39793638
·
2024-09-08 04:34
pyspark
kafka
mysql
Spring Boot 2.x实战94 - 事件驱动3 -
Kafka
与
Kafka
Streams
3.
Kafka
Apache
Kafka
以Topic为导向,提供消息中间件的功能。一个类型的数据称之为一个Topic。3.1安装
Kafka
使用dockercompose安装Apache
Kafka
。
汪云飞记录本
·
2024-09-08 02:50
Spring
Boot2.x实战全集
spring
boot
kafka
kafka
streams
KafkaListener
基于
Kafka
实现分布式事件驱动
事件驱动是一种灵活的系统设计方法,在事件驱动的系统中,当数据发生变化时系统会产生、发布一个对应的事件,其它对这个事件感兴趣的部分会接收到通知,并进行相应的处理。事件驱动设计最大的好处在我看来有两点:一是它为系统提供了很好的扩展能力,比如我们可以对某类事件增加一个订阅者来对系统进行扩展,最主要的是我们并不需要修改任何已有的代码,它完全符合开闭原则;二是它实现了模块间的低偶合,系统间各个部分不是强依赖
weixin_33785972
·
2024-09-08 02:48
大数据
java
数据库
Python大数据:深入探索
Hadoop
库的使用
在大数据的世界中,Python和
Hadoop
结合使用,为处理庞大数据集提供了强大的工具。本文将详细探讨如何在Python中使用
Hadoop
,特别是通过实例来展示这一过程。
t0_54coder
·
2024-09-07 17:22
Python基础入门教程
大数据
python
hadoop
Python 操作大数据使用
Hadoop
参考:https://blog.csdn.net/wuShiJingZuo/article/details/135620018fromhdfsimportInsecureClienthdfs_client=InsecureClient("http://localhost:9000",user="xiaokkk")#测试连接print(hdfs_client.status("/")){'access
静听山水
·
2024-09-07 17:47
Hadoop
hadoop
flink 问题记录
文章目录1.Causedby:java.lang.UnsatisfiedLinkError:org.apache.
hadoop
.util.NativeCrc32.nativeComputeChunkedSums
Jhon_yh
·
2024-09-07 15:34
flink
flink
hadoop
大数据
pyflink 滚动窗口实例
写在前头:更多大数据相关精彩内容请进我的知识星球,每周定期更新正篇技术路线:模拟
kafka
生产者发送数据——>flink对
kafka
数据实时计算处理——>处理后的数据发送到
kafka
1、模拟客流数据的生产者
菜鸟社长
·
2024-09-07 15:31
菜鸟的大数据进阶之路
大数据进阶之路
kafka
big
data
python
flink
【Flink】Flink 写入到 CSV BucketingSink 的使用方法
1.概述【File】CSV文件写入追加写入CsvWriter的使用有一个需求是这样的,flink读取
kafka
数据,然后写入到csv,但是写入的时候,要求写入一个文件,然后在监听到配置文件变化的时候,将写入到另外一个文件
九师兄
·
2024-09-07 15:00
大数据-flink
flink
BucketingSink
csv
第五章
Kafka
构建TB级异步消息系统
第五章
Kafka
构建TB级异步消息系统1、阻塞队列模拟阻塞队列publicclassBlockingQueueTest{publicstaticvoidmain(String[]args){//容量为10
跟风。
·
2024-09-07 13:48
仿牛客社区论坛
kafka
java
分布式
kubernetes集群下部署
kafka
+zookeeper单机部署方案
背景:注:在kubernetes集群上部署单机版的zookeeper+
kafka
服务,是采用了kubernetes中的deploment组件+service组件+pvc存储组件1、部署zookeeper
jiang0615csdn
·
2024-09-07 12:17
消息队列服务
kubernetes
kafka
zookeeper
Kafka
,构建TB级异步消息系统
:使用数据的线程实现类ArrayBlockingQueueLinkedBlockingQueuePriorityBlockingQueue、SynchronousQueue、DelayQueue等2.
Kafka
Fern977
·
2024-09-07 12:15
牛客论坛学习笔记
kafka
java
分布式
仿论坛项目--
Kafka
,构建TB级异步消息系统
Kafka
入门•
Kafka
简介
Kafka
是一个分布式的流媒体平台。
HUT_Tyne265
·
2024-09-07 12:14
kafka
分布式
大数据系列 |
Kafka
架构分析及应用
大数据系列|
Kafka
架构分析及应用1.消息系统介绍2.
Kafka
原理分析3.
Kafka
架构分析4.
Kafka
的安装与配置4.1.Zookeeper集群安装配置4.2.安装
Kafka
集群4.3.配置
kafka
降世神童
·
2024-09-07 07:42
大数据技术专栏
大数据
kafka
架构
Spark概念知识笔记
最近总结了个人的各项能力,发现在大数据这方面几乎没有涉及,因此想补充这方面的知识,丰富自己的知识体系,大数据生态主要包含:
Hadoop
和Spark两个部分,Spark作用相当于MapReduceMapReduce
kuntoria
·
2024-09-07 05:21
【
Hadoop
】- MapReduce & YARN 初体验[9]
目录提交MapReduce程序至YARN运行1、提交wordcount示例程序1.1、先准备words.txt文件上传到hdfs,文件内容如下:1.2、在hdfs中创建两个文件夹,分别为/input、/output1.3、将创建好的words.txt文件上传到hdfs中/input1.4、提交MapReduce程序至YARN1.5、可通过node1:8088查看1.6、返回我们的服务器,检查输出文
星星法术嗲人
·
2024-09-07 04:21
hadoop
hadoop
mapreduce
Apache Storm:入门了解
前言Storm是一个开源的分布式实时计算系统,它能够处理无边界的数据流,类似于
Hadoop
对于批量数据处理的作用,但是Storm更侧重于实时数据流的处理。
布说在见
·
2024-09-07 03:43
apache
storm
大数据
SpringBoot+
Kafka
+ELK 完成海量日志收集(超详细)
SpringBoot项目准备引入log4j2替换SpringBoot默认log,demo项目结构如下:pomIndexController测试Controller,用以打印日志进行调试InputMDC用以获取log中的[%X{hostName}]、[%X{ip}]、[%X{applicationName}]三个字段值NetUtil启动项目,访问/index和/ero接口,可以看到项目中生成了app
2401_83703797
·
2024-09-07 00:25
程序员
spring
boot
kafka
elk
Kafka
Broker处于高负载状态(例如消息处理量大或系统资源不足),无法及时响应消费者的请求
Causedby:org.apache.
kafka
.common.errors.TimeoutException:Timeoutof60000msexpiredbeforethepositionforpartitionactivity
战族狼魂
·
2024-09-06 22:42
消息队列
java
kafka
分布式
Kafka
常用的传输和序列化数据方式
Kafka
常用的传输和序列化数据方式。不同的方式有不同的优缺点,选择哪种方式通常取决于具体的应用场景、性能要求、数据兼容性需求等。
傲雪凌霜,松柏长青
·
2024-09-06 21:38
后端
大数据
kafka
分布式
kafka
3.7.1 单节点 KRaft部署&测试发送和接收消息
一、环境准备
kafka
3.7.1包下载地址:https://mirrors.nju.edu.cn/apache/
kafka
/3.7.1/
kafka
_2.13-3.7.1.tgzopenjdk11.0.2
运维小弟| srebro.cn
·
2024-09-06 19:51
openeuler
kafka
运维
运维
云原生
如何做大数据测试
2、测试工具:大数据测试需要使用专门的测试工具和框架,如
Hadoop
Unit、ApacheBigTop、JMeter、LoadRunner等,而普通测试则可以使用通用的测试工具和框架,如JUnit、TestNG
测试界潇潇
·
2024-09-06 18:47
软件测试
软件测试
功能测试
自动化测试
程序人生
职场和发展
基于
Hadoop
的学习行为数据云存储平台的设计与实现
基于
Hadoop
的学习行为数据云存储平台的设计与实现DesignandImplementationofa
Hadoop
-BasedLearningBehavioralDataCloudStoragePlatform
usp1994
·
2024-09-06 16:03
hadoop
学习
大数据
Kafka
如何保证消息不丢失
1、生产者1.1丢失原因:
kafka
生产端异步发送消息后,不管broker是否响应,立即返回,伪代码producer.send(msg),由于网络抖动,导致消息压根就没有发送到broker端;
kafka
阳光倾洒
·
2024-09-06 15:55
Kafka
kafka
分布式
java
学习
开发语言
Kafka
如何保证数据不丢失?不重复
1.高可用型配置:acks=all,retries>0retry.backoff.ms=100(毫秒)(并根据实际情况设置retry可能恢复的间隔时间)优点:这样保证了producer端每发送一条消息都要成功,如果不成功并将消息缓存起来,等异常恢复后再次发送。缺点:这样保证了高可用,但是这会导致集群的吞吐量不是很高,因为数据发送到broker之后,leader要将数据同步到fllower上,如果网
优秀后端工程师
·
2024-09-06 15:23
Java程序员
kafka
linq
分布式
【
Kafka
专栏 11】深入理解
Kafka
的网络线程模型:是谁在幕后“操纵”数据流?
作者名称:夏之以寒作者简介:专注于Java和大数据领域,致力于探索技术的边界,分享前沿的实践和洞见文章专栏:夏之以寒-
kafka
专栏专栏介绍:本专栏旨在以浅显易懂的方式介绍
Kafka
的基本概念、核心组件和使用场景
夏之以寒
·
2024-09-06 14:16
夏之以寒-kafka专栏
kafka
网络
分布式
网络模型
如何查看当前的gruop_id 的
kafka
消费情况 这个可以查看到是否存在消费阻塞问题
如何查看当前的gruop_id的
kafka
消费情况这个可以查看到是否存在消费阻塞问题命令如下:/
kafka
/bin/
kafka
-consumer-groups.sh--bootstrap-server127.0.0.1
树下水月
·
2024-09-06 08:02
kafka
分布式
kafka
单机安装
kafka
单机安装下载地址官网:https://
kafka
.apache.org/最新版本下载页面:https://
kafka
.apache.org/downloads说明版本选择:3.0.0,
kafka
shuair
·
2024-09-06 08:02
kafka
kafka
分布式
Kafka
-设计原理
ControllerLeader-PartitionRebalance消息发布机制HW与LEO日志分段Controller
Kafka
核心总控制器Controller:在
Kafka
集群中会有一个或者多个broker
姜希成
·
2024-09-06 07:59
Kafka
kafka
Spark与
Kafka
进行连接
在Java中使用Spark与
Kafka
进行连接,你可以使用SparkStreaming来处理实时流数据。以下是一个简单的示例,展示了如何使用SparkStreaming从
Kafka
读取数据并进行处理。
傲雪凌霜,松柏长青
·
2024-09-06 07:27
后端
大数据
spark
kafka
Kafka
Kafka
是一个高性能的分布式消息队列系统,最初由LinkedIn开发,后来成为Apache软件基金会的一部分。
Kafka
设计用于处理大规模的数据流,提供高吞吐量、低延迟的消息传递机制。
傲雪凌霜,松柏长青
·
2024-09-06 07:57
后端
中间件
kafka
分布式
Python 全栈系列266
Kafka
服务的Docker搭建
测试也接近了
kafka
官方标称的性能。考虑到网络、消息的大小等因素,可以简单认为
kafka
的速度是10万/秒级的。
yukai08008
·
2024-09-06 06:26
全栈
python
kafka
docker
DAG (directed acyclic graph) 作为大数据执行引擎的优点
DR-ConceptuallyDAGmodelisastrictgeneralizationofMapReducemodel.DAG-basedsystemslikeSparkandTezthatareawareofthewholeDAGofoperationscandobetterglobaloptimizationsthansystemslike
Hadoop
MapReducewhicha
joeywen
·
2024-09-06 04:43
分布式计算
Storm
Spark
Storm
杂谈
Storm
spark
DAG
hadoop
-hdfs系统构成
2019独角兽企业重金招聘Python工程师标准>>>HDFS组成1)NameNode元数据2)DataNode存储文件内容block3)SecondaryNameNode合并NameNode与editsHDFS缺点1)不能低延迟访问2)小文件存取占用大量NameNode内存空间寻道时间超过读取时间3)并发写入,文件随机修改一个文件只能有一个写着仅支持appendHDFS存储数据单元1)文件被切分
weixin_33701564
·
2024-09-06 00:46
大数据
python
操作系统
python windows路径正则表达式,Python 正则表达式从Windows路径中获取文件夹
推荐文章一,要使用正则表达式相关的方法,首先得搞清楚正则表达式的基本用法,摘自百度百科:元字符描述将下一个字符标记为一个特殊字符推荐文章学习
Hadoop
Common模块,当然应该是从最简单,最基础的模块学习最好
弓长丶艮
·
2024-09-06 00:16
python
windows路径正则表达式
Canal同时监控两个mysql的binlog并同步至一个topic中
准备:安装canal(博主canal版本1.1.5)安装
kafka
,做接收binlog日志数据用(博主
kafka
版本2.11)安装两个msyql,相当于两个mysql数据库(博主mysql版本5.1.0
梦见伊兮伊不觉
·
2024-09-06 00:45
大数据
mysql
kafka
上一页
13
14
15
16
17
18
19
20
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他