E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Kafka原理解析
通过Spark向
Kafka
写入数据
1、·将
Kafka
Producer利用lazyval的方式进行包装packagecn.com.m.utilimportjava.util.concurrent.Futureimportorg.apache.
kafka
.clients.producer
不加班程序员
·
2024-01-23 06:24
Hadoop相关
kafka
spark
kafka
spark
flume案例
在构建数仓时,经常会用到flume接收日志数据,通常涉及到的组件为
kafka
,hdfs等。下面以一个flume接收指定topic数据,并存入hdfs的案例,大致了解下flume相关使用规则。
不加班程序员
·
2024-01-23 06:48
ETL
kafka
Hadoop相关
flume
大数据
etl
【分布式技术】消息队列
Kafka
目录一、
Kafka
概述二、消息队列
Kafka
的好处三、消息队列
Kafka
的两种模式四、
Kafka
1、
Kafka
定义2、
Kafka
简介3、
Kafka
的特性五、
Kafka
的系统架构六、实操部署
Kafka
集群步骤一
liu_xueyin
·
2024-01-23 04:01
分布式
kafka
数据库
ceph
zabbix
mysql
全国快递物流 API 实现快递单号自动识别的
原理解析
概述全国快递物流API是一种提供快递物流单号查询的接口,涵盖了包括申通、顺丰、圆通、韵达、中通、汇通等600+快递公司的数据。该API的目标是为快递公司、电商、物流平台等提供便捷、快速、准确的快递物流信息查询服务。数据采集和处理全国快递物流API的数据采集和处理过程主要包括爬虫、数据清洗和数据标准化三个步骤。下载.png数据采集和处理的技术难点下载(2).png快递单号识别的原理单号识别是指通过一
API小百科_APISpace
·
2024-01-23 03:40
Hadoop -- ZooKeeper
ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Hadoop、Hbase、
kafka
、dubbo等重要组件。
Cool_Pepsi
·
2024-01-23 02:42
大数据
zookeeper
钓鱼邮件的
原理解析
二
过了一年了,这个钓鱼的
原理解析
做了个补充解释。
一个在高校打杂的
·
2024-01-23 00:02
前端
linux
github
spring boot
kafka
发送消息 完整的例子工程
以下是一个简单的SpringBoot
Kafka
发送消息的完整例子:首先,添加SpringBoot
Kafka
的依赖到你的pom.xml文件:xmlorg.springframework.bootspring-boot-starter-
kafka
欧亨利式结局
·
2024-01-23 00:47
spring
boot
kafka
后端
【算法Hot100系列】跳跃游戏
推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,
kafka
,Spring,微服务,Netty等常用开发工具系列
檀越剑指大厂
·
2024-01-22 21:04
s6
算法与数据结构
算法
游戏
kafka
基础入门
Apache
Kafka
是一个事件流平台,其结合了三个关键的功能,使你可以完成端到端的事件流解决方案。发布(写)和订阅(读)事件流,包括从其他系统连续导入/导出数据。事件流存储具有持久性和可靠性。
从大数据到人工智能
·
2024-01-22 19:08
【算法Hot100系列】字母异位词分组
推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,
kafka
,Spring,微服务,Netty等常用开发工具系列
檀越剑指大厂
·
2024-01-22 19:59
s6
算法与数据结构
算法
大数据之使用Flume监听本地文件采集数据流到HDFS
本文介绍Flume监听本地文件采集数据流到HDFS我还写了一篇文章是Flume监听端口采集数据流到
Kafka
【点击即可跳转,写的也非常详细】任务一:在Master节点使用Flume采集/data_log
十二点的泡面
·
2024-01-22 19:54
Flume
大数据
大数据
flume
hdfs
大数据之使用Flume监听端口采集数据流到
Kafka
本文介绍Flume监听端口采集数据流到
Kafka
我还写了一篇文章是Flume监听本地文件采集数据流到HDFS【点击即可跳转,写的也非常详细】任务一:实时数据采集前摘:Flume是一种分布式、高可靠、高可用的数据收集系统
十二点的泡面
·
2024-01-22 19:53
Flume
大数据
flume
【Xiao.Lei】- 网络爬虫基本
原理解析
:深入探讨数据采集的奥秘
引言在信息时代,数据被认为是最宝贵的资源之一。为了获取并利用这些数据,网络爬虫(WebCrawler)应运而生。本文将深入介绍网络爬虫的基本原理,从HTTP协议、HTML解析、爬虫框架到数据存储等多个层面,帮助读者全面理解网络爬虫的工作机制。1.HTTP协议基础1.1HTTP概述HTTP(HypertextTransferProtocol)是一种用于在计算机之间传输超文本的协议。网络爬虫的第一步就
Xiao.Lei
·
2024-01-22 18:50
爬虫
开发语言
爬虫
开发语言
Prometheus插件安装
kafka
_exporter
下载地址https://github.com/danielqsj/
kafka
_exporter/releases解压tar-zxvf
kafka
_exporter-1.7.0.linux-amd64.tar.gzmv
kafka
_exporter
weixin_43169720
·
2024-01-22 18:41
运维
linux
prometheus
kafka
分布式
Spark消费
Kafka
的两种方式
目录介绍Receiver方式code原理如何保证数据不丢失但是会导致数据重复问题优点缺点Direct(NoReceiver)方式code特点优点缺点介绍
kafka
版本,
kafka
0.8支持Receiver
这个程序猿可太秀了
·
2024-01-22 17:57
#
spark
#
kafka
spark内核
kafka
spark
Kafka
Connect: Debezium MySQL Connector 的 Partition 和 Replication 配置
使用
Kafka
Connect的DebeziumMySQLConnector将MySQL数据库中的CDC数据写入
Kafka
时,在
Kafka
默认允许自动创建Topic的情况下,
Kafka
Connect自动创建的
Laurence
·
2024-01-22 17:56
大数据专题
kafka
connect
debezium
mysql
connector
partition
replication
如何本地安装Python Flask并结合内网穿透实现远程开发
推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,
kafka
,Spring,微服务,Netty等常用开发工具系列
檀越剑指大厂
·
2024-01-22 17:36
s20
cpolar
python
flask
开发语言
在windows初装
kafka
1.下载
kafka
:http://
kafka
.apache.org/downloadsimage.png2.解压image.png3.运行CMD到这里:image.png1).启动zookeeper.
小狼在IT
·
2024-01-22 17:37
分布式系统中为什么需要使用消息队列
当今市面上有很多主流的消息中间件,如老牌的ActiveMQ、RabbitMQ,炙手可热的
Kafka
,阿里巴巴自主开发的Notify、MetaQ、RocketMQ等。
码农小旋风
·
2024-01-22 12:44
后端
【Flink-1.17-教程】-【四】Flink DataStream API(1)源算子(Source)
创建执行环境1.2.执行模式(ExecutionMode)1.3.触发程序执行2)源算子(Source)2.1.准备工作2.2.从集合中读取数据2.3.从文件读取数据2.4.从Socket读取数据2.5.从
Kafka
bmyyyyyy
·
2024-01-22 11:34
Flink
flink
#flink-api
#flink-source
#flink原算子
【后端目录贴】
【大数据】
kafka
8.【JAVA】目录贴9.【linux】目录贴10.【后端】深入浅出Node.js
骑鱼过海的猫123
·
2024-01-22 11:39
前端
笔记
数据库
java
ide
Android学习之路(22) ARouter
原理解析
1.ARouter认知首先我们从命名来看:ARouter翻译过来就是一个路由器。官方定义:一个用于帮助AndroidApp进行组件化改造的框架——支持模块间的路由、通信、解耦那么什么是路由呢?简单理解就是:一个公共平台转发系统工作方式:1.注册服务:将我们需要对外暴露的页面或者服务注册到ARouter公共平台中2.调用服务:调用ARouter的接口,传入地址和参数,ARouter解析传入的地址和参
星如雨グッ!(๑•̀ㅂ•́)و✧
·
2024-01-22 10:51
安卓
android
学习
某马头条——day06
kafka
概述
kafka
环境搭建dockerpullzookeeper:3.4.14dockerrun-d--namezookeeper-p2181:2181zookeeper:3.4.14安装
kafka
dockerpullwurstmeister
北岭山脚鼠鼠
·
2024-01-22 09:55
微服务
java
数据库
微服务
Flink on yarn 实时日志收集到
kafka
打造日志检索系统
点击上方"JasonLee实时计算",选择"设为星标"再也不用担心错过重要文章后台回复"监控",获取grafana监控Flink最新的模板背景在Flinkonyarn的模式下,程序运行的日志会分散的存储在不同的DN上,当Flink任务发生异常的时候,我们需要查看日志来定位问题,一般我们会选择通过FlinkUI上面的logs来查看日志,或者登录到对应的服务器上去查看,但是在任务日志量非常大的情况下,
JasonLee实时计算
·
2024-01-22 08:33
log4j
java
kafka
hadoop
大数据
ELK日志分析
Logstash(1)定义(2)插件①input②filter③output(三)可以添加的其它组件1.Filebeat(1)定义(2)filebeat结合logstash带来好处2.缓存/消息队列(redis、
kafka
江南字子川
·
2024-01-22 08:55
elk
JVM系列-3.类的生命周期
作者简介:大家好,我是爱吃芝士的土豆倪,24届校招生Java选手,很高兴认识大家系列专栏:Spring原理、JUC原理、
Kafka
原理、分布式技术原理、数据库技术、JVM原理如果感觉博主的文章还不错的话
爱吃芝士的土豆倪
·
2024-01-22 08:16
JVM
jvm
java
JVM系列-1.初识JVM
作者简介:大家好,我是爱吃芝士的土豆倪,24届校招生Java选手,很高兴认识大家系列专栏:Spring原理、JUC原理、
Kafka
原理、分布式技术原理、数据库技术、JVM原理如果感觉博主的文章还不错的话
爱吃芝士的土豆倪
·
2024-01-22 08:16
JVM
jvm
java
JVM系列-2.字节码文件详解
作者简介:大家好,我是爱吃芝士的土豆倪,24届校招生Java选手,很高兴认识大家系列专栏:Spring原理、JUC原理、
Kafka
原理、分布式技术原理、数据库技术、JVM原理如果感觉博主的文章还不错的话
爱吃芝士的土豆倪
·
2024-01-22 08:07
JVM
jvm
java
Kafka
(八)使用
Kafka
构建数据管道
目录1使用场景2构建数据管道时需要考虑的问题2.1及时性2.2可靠性高可用可靠性数据传递2.3高吞吐量2.4数据格式2.5转换ETLELT2.6安全性2.7故障处理2.8耦合性和灵活性临时数据管道元数据丢失末端处理3使用ConnectAPI3.1Connect的数据处理流程sourcesinkconnectorsTasksWorkersTransformerConverters偏移量管理3.2运行
yunyun1886358
·
2024-01-22 07:35
Kafka
kafka
分布式
kafka
入门(十):副本数据同步
Kafka
通过多副本机制实现故障自动转移,在
Kafka
集群中某个broker节点失效的情况下仍然保证服务可用。
乐之者v
·
2024-01-22 07:04
A1--kafka
kafka
Spark写入
kafka
(批数据和流式)
Spark写入(批数据和流式处理)Spark写入
kafka
批处理写入
kafka
基础#spark写入数据到
kafka
frompyspark.sqlimportSparkSession,functionsasFss
中长跑路上crush
·
2024-01-22 07:02
Spark阶段
spark
kafka
linq
大数据开发之电商数仓(hadoop、flume、hive、hdfs、zookeeper、
kafka
)
第1章:数据仓库1.1数据仓库概述1.1.1数据仓库概念1、数据仓库概念:为企业制定决策,提供数据支持的集合。通过对数据仓库中数据的分析,可以帮助企业,改进业务流程、控制成本,提高产品质量。数据仓库并不是数据的最终目的地,而是为数据最终的目的地做好准备,这些准备包括对数据的:清洗、转义、分类、重组、合并、拆分、统计等。2、数据仓库的数据通常包括:业务数据、用户行为数据和爬虫数据等3、业务系统数据库
Key-Key
·
2024-01-22 07:29
大数据
hadoop
flume
kafka
hive
hdfs
Kafka
常见指令及监控程序介绍
kafka
在流数据、IO削峰上非常有用,以下对于这款程序,做一些常见指令介绍。
necessary653
·
2024-01-22 07:49
kafka
linq
分布式
Kafka
生产者投递内存池源码刨铣
大体逻辑是这样的。。初始化BufferPool的时候会指定BufferPool的大小以及内存块(poolableSize)的大小。在申请内存的时候如果申请的内存大小大于指定的内存块大小就会抛出异常,无法申请。如果是等于poolableSize的话,就会判断free中是否有,有的话就直接从free中取出,没有的话再去申请(这个free可以里面为一个缓存,每次归还的时候会归还到free中(前提free
老耿
·
2024-01-22 06:02
java
kafka
内存池
源码解析
Map实现类
LinkedHashMapLRU、LFU算法实现参考https://www.jianshu.com/p/8f4f58b4b8ab跳表
原理解析
ConcurrentSkipListMap此外对于并发性相对较低的并行程序可以使用
chenxuezhou
·
2024-01-22 04:15
多线程
深入剖析:
Kafka
流数据处理引擎的核心面试问题解析75问(5.7万字参考答案)
Kafka
是一款开源的分布式流处理平台,被广泛应用于构建实时数据管道、日志聚合、事件驱动的架构等场景。本文将深入探究
Kafka
的基本原理、特点以及其在实际应用中的价值和作用。
danci_
·
2024-01-22 00:08
JAVA后端-刷题
java
kafka
中间件
面试
职场发展
程序人生
学习笔记
intellij idea 编译
kafka
源码
以下是针对
kafka
1.1.1版本编译流程及在idea中启动的步骤从GitHub网站,gitclone
kafka
源码下载安装好gradle,scala进入
kafka
项目目录,执行gradleidea如果出现如下
专职掏大粪
·
2024-01-21 20:52
Kafka
事务分析
Kafka
幂等性
Kafka
幂等性含义幂等性起初是在HTTP协议中定义,是指一次和多次请求同一个资源对资源本身应当具有同样的效果。
WestC
·
2024-01-21 17:26
Flink容错机制(二)
状态一致性10.2.1一致性的概念和级别10.2.2端到端的状态一致性10.3端到端精确一次(end-to-endexactly-once)10.3.1输入端保证10.3.2输出端保证10.3.3Flink和
Kafka
大数据阿嘉
·
2024-01-21 17:12
flink
大数据
Kafka
为什么在消息积压时不能直接通过消费者水平扩容来提升消费速度?
我们知道当消息生产者生产的速度快于消费者的消费速度时,会产生大量的消息积压,大多数人的想法是增加消费者的数量来提升消费速度,这个想法在RocketMQ中是可行的,但是在
Kafka
中不一定可行。
coffee_babe
·
2024-01-21 16:36
消息中间件
kafka
分布式
Kafka
消息不能正常消费问题排查
订单宽表数据不同步事情的起因是专员在zeapp上查不到订单了,而订单数据是从mysql的order_search_info查询的,order_search_info表的数据是从oracel的BZ_ORDER_INFO表同步过来的,查不到说明同步有问题首先重启,同步数据,问题解决,然后查找原因。首先看日志,有如下两种情况有的容器消费消息的日志正常打印有的容器很长时间没有消费消息的日志(看着像是消息丢
Java识堂
·
2024-01-21 16:05
Kafka
kafka
分布式
消息中间件之
Kafka
(二)
1.
Kafka
线上常见问题1.1为什么要对topic下数据进行分区存储?
coffee_babe
·
2024-01-21 16:04
消息中间件
kafka
分布式
领航分布式消息系统:一起探索Apache
Kafka
的核心术语及其应用场景
本文是
Kafka
系列文章的第一篇,将带你了解
Kafka
的核心术语及其应用场景,后续会逐步探索其各方面的原理及应用场景。
超越不平凡
·
2024-01-21 15:27
分布式
kafka
kafka核心概念
kafka
同步、异步发送
kafka
producer默认是异步发送:在初始化producer实例时,会创建一个sender线程负责批量发送消息producer将消息暂存在缓冲区,消息根据topic-partition分类缓存消息达到
陆阳226
·
2024-01-21 13:59
kafka
(一)——简介
简介
Kafka
是一种分布式、支持分区、多副本的消息中间件,支持发布-订阅模式,多用于实时处理大量数据缓存的场景,类似于一个“缓存池”。
却道天凉_好个秋
·
2024-01-21 07:21
kafka
kafka
分布式
大数据开发之
kafka
(完整版)
第1章:
Kafka
概述1.1定义
Kafka
是一个分布式的基于发布/订阅模式的消息队列,主要应用于大数据实时处理领域。
Key-Key
·
2024-01-21 07:19
大数据
kafka
分布式
kafka
入门(九):
kafka
分区分配策略
kafka
分区分配策略参数:
Kafka
提供了消费者客户端参数partition.assignment.strategy来设置消费者与订阅主题之间的分区分配策略。
乐之者v
·
2024-01-21 07:19
A1--kafka
kafka
大数据开发之
Kafka
(broker、消费者、eagle监控、kraft模式)
第4章:
Kafka
Broker4.1
Kafka
Broker工作流程4.1.1Zookeeper存储的
Kafka
的信息1、查看zookeeper中的
kafka
节点所存储的信息启动Zookeeper客户端[
Key-Key
·
2024-01-21 07:18
大数据
kafka
linq
11、
Kafka
------
Kafka
核心API 及 生产者API 讲解
目录
Kafka
核心API及生产者API讲解★
Kafka
的核心API
Kafka
包含如下5类核心API:★生产者API
Kafka
的API文档★使用生产者API发送消息
Kafka
核心API及生产者API讲解官方文档
_L_J_H_
·
2024-01-21 07:48
Kafka
系列
kafka
分布式
ELK 日志分析系统
日志管理方案二、完整日志系统基本特征三、ELK简介ELK组件:1、ElasticSearch2、Logstash3、Kibana可以添加的其它组件:1、Filebeat2、缓存/消息队列(redis、
kafka
luochiying
·
2024-01-21 07:04
elk
上一页
15
16
17
18
19
20
21
22
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他