老邋遢

Kafka Session

文章目录

Kafka Session
- 1. What's Kafka
- 2. Why Kafka
- 3. Tech Points
- - 3.1 说一说什么是Kafka中的 ISR、OSR？
  - 3.2 说一说什么是Kafka中的LSO、LEO、HW？
  - 3.3 Kafka Producer的常见参数
  - 3.4 有没有对Kafka Producer参数进行过调优？
- 4. Landing Implementation
- 5. Issues
- - 5.1 无限消费失败消息
- References

本文源于笔者一次集成外部Kafka实例的总结，

所以侧重点会放到landing上面，

比如一些关键的知识点和踩到的坑。

基础知识点会一笔带过，有兴趣可以参考文末引用部分的书籍和博客自行取阅。

1. What’s Kafka

Apache Kafka® 是一个分布式流处理平台.

上面是Kafka官方对其自身的一个简练概括，

分布式（distributed）和平台（platform）不用过多解释，

对于初次接触Kafka的人来说，流处理（streaming）是比较难以理解的。

引用知乎中的一段话（本文所有引用都可以在文末找到原文链接，后面不再赘述）：

流数据是指由数千个数据源持续生成的数据，通常也同时以数据记录的形式发送，规模较小（约几千字节）。流数据包括多种数据，例如客户使用您的移动或 Web 应用程序生成的日志文件、网购数据、游戏内玩家活动、社交网站信息、金融交易大厅或地理空间服务，以及来自数据中心内所连接设备或仪器的遥测数据。

总结一下，所谓流数据就是持续生成的数据。

所有的流处理平台都具备一下三种特性， Kafka亦复如是：

可以让你发布和订阅流式的记录。这一方面与消息队列或者企业消息系统类似。
可以储存流式的记录，并且有较好的容错性。
可以在流式记录产生时就进行处理。

2. Why Kafka

在此之前，我们可以将现在主流的消息队列方案予以对比（一些冷门的MQ如ZeroMQ不在此列）

特性	ActiveMQ	RabbitMQ	Kafka	RocketMQ
PRODUCER-COMSUMER	支持	支持	支持	支持
PUBLISH-SUBSCRIBE	支持	支持	支持	支持
REQUEST-REPLY	支持	支持	-	支持
API完备性	高	高	高	低（静态配置）
多语言支持	支持，JAVA优先	语言无关	支持，JAVA优先	支持
单机呑吐量	万级	万级	十万级	单机万级
消息延迟	-	微秒级	毫秒级	-
可用性	高（主从）	高（主从）	非常高（分布式）	高
消息丢失	-	低	理论上不会丢失	-
消息重复	-	可控制	理论上会有重复	-
文档的完备性	高	高	高	中
提供快速入门	有	有	有	无
首次部署难度	-	低	中	高

可见Kafka在可用性和吞吐量上占有绝对的优势。

其优势决定了Kafka很适合在高负载下提供稳定的服务，比如日志的采集、大数据中间件等。

Kafka适用场景

构造实时流数据管道，它可以在系统或应用之间可靠地获取数据。 (相当于message queue)
构建实时流式应用程序，对这些流数据进行转换或者影响。 (就是流处理，通过kafka stream topic和topic之间内部进行变化)

3. Tech Points

3.1 说一说什么是Kafka中的 ISR、OSR？

分区中的所有副本统称为AR（Assigned Replicas）。所有与leader副本保持一定程度同步的副本（包括leader副本在内）组成ISR（In-Sync Replicas），ISR集合是AR集合中的一个子集。消息会先发送到leader副本，然后follower副本才能从leader副本中拉取消息进行同步，同步期间内follower副本相对于leader副本而言会有一定程度的滞后。前面所说的“一定程度的同步”是指可忍受的滞后范围，这个范围可以通过参数进行配置。与leader副本同步滞后过多的副本（不包括leader副本）组成OSR（Out-of-Sync Replicas），由此可见，AR=ISR+OSR。在正常情况下，所有的 follower 副本都应该与 leader 副本保持一定程度的同步，即AR=ISR，OSR集合为空。

leader副本负责维护和跟踪ISR集合中所有follower副本的滞后状态，当follower副本落后太多或失效时，leader副本会把它从ISR集合中剔除。如果OSR集合中有follower副本“追上”了leader副本，那么leader副本会把它从OSR集合转移至ISR集合。默认情况下，当leader副本发生故障时，只有在ISR集合中的副本才有资格被选举为新的leader，而在OSR集合中的副本则没有任何机会（不过这个原则也可以通过修改相应的参数配置来改变）。

3.2 说一说什么是Kafka中的LSO、LEO、HW？

ISR与HW和LEO也有紧密的关系。HW是High Watermark的缩写，俗称高水位，它标识了一个特定的消息偏移量（offset），消费者只能拉取到这个offset之前的消息。

如图所示，它代表一个日志文件，这个日志文件中有 9 条消息，第一条消息的 offset（LogStartOffset）为0，最后一条消息的offset为8，offset为9的消息用虚线框表示，代表下一条待写入的消息。日志文件的HW为6，表示消费者只能拉取到offset在0至5之间的消息，而offset为6的消息对消费者而言是不可见的。

LEO是Log End Offset的缩写，它标识当前日志文件中下一条待写入消息的offset，图1-4中offset为9的位置即为当前日志文件的LEO，LEO的大小相当于当前日志分区中最后一条消息的offset值加1。分区ISR集合中的每个副本都会维护自身的LEO，而ISR集合中最小的LEO即为分区的HW，对消费者而言只能消费HW之前的消息

3.3 Kafka Producer的常见参数

有点多，罗列一个常见且重要的，剩下的在文末书籍第二章有很多：

acks

这个参数用来指定分区中必须要有多少个副本收到这条消息，之后生产者才会认为这条消息是成功写入的。acks 是生产者客户端中一个非常重要的参数，它涉及消息的可靠性和吞吐量之间的权衡。

acks=1。默认值即为1。生产者发送消息之后，只要分区的leader副本成功写入消息，那么它就会收到来自服务端的成功响应。如果消息无法写入leader副本，比如在leader 副本崩溃、重新选举新的 leader 副本的过程中，那么生产者就会收到一个错误的响应，为了避免消息丢失，生产者可以选择重发消息。如果消息写入leader副本并返回成功响应给生产者，且在被其他follower副本拉取之前leader副本崩溃，那么此时消息还是会丢失，因为新选举的leader副本中并没有这条对应的消息。acks设置为1，是消息可靠性和吞吐量之间的折中方案。

acks=0。生产者发送消息之后不需要等待任何服务端的响应。如果在消息从发送到写入Kafka的过程中出现某些异常，导致Kafka并没有收到这条消息，那么生产者也无从得知，消息也就丢失了。在其他配置环境相同的情况下，acks 设置为 0 可以达到最大的吞吐量。

acks=-1或acks=all。生产者在消息发送之后，需要等待ISR中的所有副本都成功写入消息之后才能够收到来自服务端的成功响应。在其他配置环境相同的情况下，acks 设置为-1（all）可以达到最强的可靠性。但这并不意味着消息就一定可靠，因为ISR中可能只有leader副本，这样就退化成了acks=1的情况。要获得更高的消息可靠性需要配合 min.insync.replicas 等参数的联动

3.4 有没有对Kafka Producer参数进行过调优？

首先这个问题是有坑的，因为如果你不足够了解Kafka的话，很有可能忽略一些联动参数而导致错误。

以下是一些常见的生产者联动参数：

acks=-1或acks=all。虽然这个配置可以达到最高的消息可靠性，但是ISR中如果只有leader副本的情况下会退化为acks=1，需要配合min.insync.replicas 等参数的联动。

max.request.size。这个参数用来限制生产者发送消息的最大值，默认为1M，但是不能单纯加大这个参数的设置，需要配合broker端的message.max.bytes参数联动。

retries。这个参数是生产者重试次数，默认为0即发生异常不重试。如果要动这个参数，一般需要联动retry.backoff.ms，即重试间隔时间。

compression.type。指定压缩的类型，默认不压缩，如果对延时要求较高不建议动这个参数。

receive.buffer.bytes。Socket接收缓冲区大小，默认32KB，如果Producer与Kafka处于不同的机房，则可以适地调大这个参数值。

所以没有系统的学习或者生产上的验证干脆就说没有调优过就可以了。

4. Landing Implementation

这是本文重点，先说一下我们的需求

requirement

我们的系统需要整合一个外部系统来获取单一可信的数据，

集成方式为监听外部系统部署于AWS MSK（Managed Stream for Kafka）的队列。

为了安全起见，我们使用的是AWS提供的IAM认证。

1. 创建新工程

这一步没有什么特别需要注意的地方，

依旧是使用Spring Initializer初始化一个SpringBoot项目，

然后引入所有工程都有的一些公共组件。

我们用的构建工具是Gradle。

2. 封装连接到MSK的公共starter

因为后续还会有一些工程需要用监听AWS消息队列的方式集成，

所以将顶层逻辑提取出来，抽一个starter是很有必要的。

首先梳理出我们的一些核心starter功能：

因为starter中需要对Kafka有一些默认的配置设置，所以需要将这些配置封装进我们自定义的Bean
尽量将Listener上程序可以推导的参数用反射注入进去，提升易用性
让消息监听方法支持链路追踪
做到使用者无感（这个已有方案，最终因为effort原因没有落地）

有了核心功能的需求，

我们就可以着手开发kafka-starter了。

创建一个resources/META-INF/spring.factories文件

org.springframework.boot.autoconfigure.EnableAutoConfiguration=com.daimler.otr.message.configuration.KafkaDatasourceConfiguration

创建KafkaDatasourceConfiguration配置类

    @Bean
    public ConcurrentKafkaListenerContainerFactory<String, String> kafkaListenerContainerFactory() {
        Assert.notNull(applicationName, "This application does not have a valid application name.");
        initKafkaCommonProperties();
        ConcurrentKafkaListenerContainerFactory<String, String> factory
                = new ConcurrentKafkaListenerContainerFactory<>();
        factory.setConsumerFactory(consumerFactory());
        factory.setBatchListener(isBatchListener);
        factory.setBatchErrorHandler((e, consumerRecords) ->
                log.error("error when consuming: {}, records are: {}", e.getMessage(), consumerRecords, e));
        return factory;
    }


    private void initKafkaCommonProperties() {
        if (isKafkaBootstrapServersNone()) {
            throw new IllegalArgumentException("required spring.kafka.bootstrap-servers not configured.");
        }
        Map<String, String> properties = kafkaProperties.getProperties();
        properties.put(CommonClientConfigs.SECURITY_PROTOCOL_CONFIG, SASL_SSL);
        properties.put(SaslConfigs.SASL_MECHANISM, AWS_MSK_IAM);
        properties.put(SaslConfigs.SASL_JAAS_CONFIG, IAM_LOGIN_MODULE);
        properties.put(SaslConfigs.SASL_CLIENT_CALLBACK_HANDLER_CLASS, IAM_CLIENT_CALLBACK_HANDLER);
    }

    private boolean isKafkaBootstrapServersNone() {
        return CollectionUtils.isEmpty(kafkaProperties.getBootstrapServers());
    }

    @Bean
    public ConsumerFactory<String, String> consumerFactory() {
        KafkaProperties.Consumer consumer = kafkaProperties.getConsumer();
        consumer.setMaxPollRecords(maxPollRecords);
        consumer.setFetchMaxWait(Duration.ofSeconds(fetchMaxWait));
        consumer.setKeyDeserializer(StringDeserializer.class);
        consumer.setValueDeserializer(JsonDeserializer.class);
        consumer.setGroupId(StringUtils.isEmpty(groupId) ? applicationName : groupId);
        consumer.setAutoOffsetReset(autoOffsetReset);
        consumer.getProperties().put(TRUSTED_PACKAGES, trustedPackages);
        consumer.getProperties().put(USE_TYPE_INFO_HEADERS, AWS_JSON_TYPE_HEADERS);
        return new DefaultKafkaConsumerFactory<>(kafkaProperties.buildConsumerProperties());
    }

这里主要是创建出我们自己的两个工厂Bean（ConcurrentKafkaListenerContainerFactory、ConsumerFactory），

然后设置一些通用的参数，

其中AWS_JSON_TYPE_HEADERS常量对应的值为spring.json.use.type.headers=false，

这是为了在json反序列化的时候忽略请求头中携带的对象信息。

若携带了对象信息例如package.xxx.xxx.A，那么反序列化的时候就会去找对应包下的对应对象，

显然这个对象在本地的目录结构不一定和远端一致，所以我们需要移除反序列化时远端带过来的type header。

上述问题除了移除type header外，我们还需要设置对应的本地type，形如：

spring.json.value.default.type=package.xxx.xxx.A

这样就能正常的反序列化了，其实这么设置等价于以下的代码：

@KafkaListener(topics = "topic",properties = {
    "spring.json.use.type.headers=false",
    "spring.json.value.default.type=package.xxx.xxx.A"
})
public void listen(List<A> messages) {
    //TODO 可以将消息写入数据库, 或者做其他处理
}

而统一设置后，使用我们starter的小伙伴只需要这么编码即可

@KafkaListener(topics = "topic")
public void listen(List messages) {
    //TODO 可以将消息写入数据库, 或者做其他处理
}

但是这样做会存在一个问题：我们"spring.json.value.default.type=package.xxx.xxx.A"后面的对象是根据监听队列的变化而变化的

所以我们需要动态的去获取参数列表中的对象ClassName，然后拼接好了给注解反射设置进去。

最开始笔者想用切面实现，但是最后发现实现不了，看源码可以发现spring-kafka是通过Processor实现的

下图为部分源码

并且这个processor的优先级为最低，所以我们可以在spring-kafka操作KafkaListener这个注解之前把

"spring.json.value.default.type=package.xxx.xxx.A"设置进去

以下是我实现的BeanPostProcessor

@Slf4j
@Component
@SuppressWarnings("PMD.AssignmentInOperand")
public class KafkaJsonTypeBeanProcessor implements BeanPostProcessor, Ordered {

    private static final String JSON_DEFAULT_TYPE_PREFIX = "spring.json.value.default.type=";

    @Override
    public Object postProcessAfterInitialization(final Object bean, final String beanName){
        Class<?> targetClass = AopUtils.getTargetClass(bean);
        Map<Method, Set<KafkaListener>> annotatedMethods = MethodIntrospector.selectMethods(targetClass,
                (MethodIntrospector.MetadataLookup<Set<KafkaListener>>) method -> {
                    Set<KafkaListener> listenerMethods = findListenerAnnotations(method);
                    return listenerMethods.isEmpty() ? null : listenerMethods;
                });
        annotatedMethods.forEach(this::processKafkaListener);
        return bean;
    }

    private void processKafkaListener(Method method, Set<KafkaListener> v) {
        v.parallelStream().forEach(listener -> {
            String[] properties = listener.properties();
            String[] appendedArray = appendJsonDefaultTypeToStringArray(properties, method);
            try {
                InvocationHandler invocationHandler = Proxy.getInvocationHandler(listener);
                Field declaredField = invocationHandler.getClass().getDeclaredField("memberValues");
                declaredField.setAccessible(true);
                Map memberValues = (Map) declaredField.get(invocationHandler);
                memberValues.put("properties", appendedArray);
            } catch (NoSuchFieldException e) {
                log.error("no such field error", e);
            } catch (IllegalAccessException e) {
                log.error("illegal access error", e);
            }
        });
    }

    private String[] appendJsonDefaultTypeToStringArray(String[] properties, Method method) {
        List<String> list = Lists.newArrayList(properties);
        if (isJsonDefaultTypeExists(list)) {
            return properties;
        }
        Type arg = method.getGenericParameterTypes()[0];
        Type[] p;
        if (arg instanceof ParameterizedType && (p = ((ParameterizedType) arg).getActualTypeArguments()).length > 0) {
            list.add(JSON_DEFAULT_TYPE_PREFIX + p[0].getTypeName());
        } else {
            list.add(JSON_DEFAULT_TYPE_PREFIX + arg.getTypeName());
        }
        return list.toArray(String[]::new);
    }

    private boolean isJsonDefaultTypeExists(List<String> list) {
        return list.stream().anyMatch(item -> item.contains(JSON_DEFAULT_TYPE_PREFIX));
    }

    private Set<KafkaListener> findListenerAnnotations(Method method) {
        Set<KafkaListener> listeners = new HashSet<>();
        KafkaListener ann = AnnotatedElementUtils.findMergedAnnotation(method, KafkaListener.class);
        if (ann != null) {
            listeners.add(ann);
        }
        KafkaListeners anns = AnnotationUtils.findAnnotation(method, KafkaListeners.class);
        if (anns != null) {
            listeners.addAll(Arrays.asList(anns.value()));
        }
        return listeners;
    }

    @Override
    public int getOrder() {
        return Ordered.LOWEST_PRECEDENCE - 10;
    }
}

整个Processor就干了一件事，找出所有打了KafkaListener注解的方法，然后把

形如"spring.json.value.default.type=package.xxx.xxx.A"这个property给注解设置进去。

这里注意不能直接拿KafkaListener对象给其设值，因为Spring给每个注解生成了一个代理对象，

我们需要去拿这个代理对其设值（参考上面的processKafkaListener()方法）

最后加个切面，给每次消费消息加个request-id用于链路追踪即可

@Aspect
@Component
public class MdcAspect {

    public static final String REQUEST_ID = "X-SERVICE-REQUEST-ID";

    @Pointcut("@annotation(org.springframework.kafka.annotation.KafkaListener)")
    public void kafkaListenerAspect() {
    }

    @Before("kafkaListenerAspect()")
    public void after() {
        MDC.put(REQUEST_ID, UUID.randomUUID().toString());
    }

}

3. 新工程引入starter后进行测试

这一步可以通过让外部系统的Dev介入联调，

来验证我们的starter以及代码逻辑是否正确（不得不说联调是最费时费力的一步哈哈）。

5. Issues

5.1 无限消费失败消息

在联调过程中发现有一个offset怎么也消费不过去，一直在重试。

最终发现是因为我们使用的是batch消费的模式，但是没有配置BatchErrorHandler

在ConcurrentKafkaListenerContainerFactory的Bean里加上即可

    @Bean
    public ConcurrentKafkaListenerContainerFactory<String, String> kafkaListenerContainerFactory() {
        Assert.notNull(applicationName, "This application does not have a valid application name.");
        initKafkaCommonProperties();
        ConcurrentKafkaListenerContainerFactory<String, String> factory
                = new ConcurrentKafkaListenerContainerFactory<>();
        factory.setConsumerFactory(consumerFactory());
        factory.setBatchListener(isBatchListener);
        //这里
        factory.setBatchErrorHandler((e, consumerRecords) ->
                log.error("error when consuming: {}, records are: {}", e.getMessage(), consumerRecords, e));
        return factory;
    }

References

《深入理解Kafka：核心设计与实践原理》朱忠华电子工业出版社 2019 第一版
Apache Kafka 中文文档
知乎-什么是流数据
常用消息队列介绍和对比
MQ的四种应用场景

JavaScript基础-DOM的一些基本常用语法 Southern Wind JavaScript javascript
总结了一下JS一直到DOM中所用的单词的用法输入方式：window.prompt('请输入数据');输出方式：1、window.alert('HelloJavaScript');2、console.log输出到控制台3、输出数据到页面document.write('hello')JavaScript数据类型1、基本类型string：字符型number：数值型boolean：布尔型2、特殊类型und
通过浏览器扩展获取本机 MAC 地址云水木石 macos
在Web技术主导的B/S架构项目中，获取终端设备硬件信息（如MAC地址）的需求经常会碰到。尽管Electron/CEF等混合应用框架可通过系统级API轻松实现，但纯浏览器环境下的硬件信息获取则不那么容易。因为现代浏览器基于沙箱机制和隐私保护策略，严格禁止网页直接访问底层硬件资源。但用户的需求不能不考虑，特别是在做商业项目时，这时就不得不给出方案，总结下来有如下三种方案：扩展JSAPI：比如以前在做
CopyOnWriteArrayList详解重生之我在成电转码 java 开发语言集合
1️⃣什么是CopyOnWriteArrayList？java.util.concurrent包下的线程安全的List读多写少场景下的性能优选核心思想：写时复制（Copy-On-Write）2️⃣底层原理内部维护一个volatileObject[]array读操作：直接读取数组，不加锁，性能极高写操作（增删改）：加ReentrantLock互斥锁把原数组复制一份新数组在新数组上操作操作完成后，替换
【读点论文】Chain Replication for Supporting High Throughput and Availability 寻雾&启示分布式系统论文阅读
在分布式系统中，强一致性往往和高可用、高吞吐是矛盾的。比如传统的关系型数据库，其保证了强一致性，但往往牺牲了可用性和吞吐量。而像NoSQL数据库，虽然其吞吐量、和扩展性很高，但往往只支持最终一致性，无法保证强一致性。由此ChainReplicationforSupportingHighThroughputandAvailability提出了链式复制协议，旨在保证高吞吐、高可用的同时，支持数据的强一
vLLM - 查看模型是否支持云客Coder 人工智能
支持的模型：https://docs.vllm.ai/en/latest/models/supported_models.html要确定是否支持给定模型，您可以检查HF存储库中的config.json文件。如果"architectures"字段包含下面列出的模型架构，那么理论上应该支持它。查看模型架构查看模型的config.json中的architecturescat~/.cache/huggin
QEMU与KVM架构三境界虚拟化架构开发语言
完整架构图，来自QEMU官网QEMU与KVM架构总体上分为3部分。VMXroot模式的应用层（左上）VMXroot模式的内核层（左下）虚拟机的运行（右上）VMXroot相对于VMXnon-root模式，CPU引入了硬件虚拟化指令后有了这些概念，VMXroot可以理解为宿主机模式，VMXnon-root可以理解为虚拟机模式虚拟机运行在VMXnon-root模式下VMXroot模式与未引入VT-x之前
JavaScript基础-删除事件（解绑事件）難釋懷 javascript 前端开发语言
在现代Web开发中，动态地添加和移除事件处理器是构建交互式网页的关键技能之一。虽然添加事件处理器相对直观，但了解如何有效地移除或“解绑”这些处理器同样重要。这不仅有助于优化性能，还能防止潜在的内存泄漏问题。本文将介绍几种方法来删除JavaScript中的事件处理器，并探讨它们的应用场景及最佳实践。一、为什么需要删除事件？随着页面复杂度的增加，不恰当地管理事件处理器可能会导致性能下降或出现意外行为。
Android Jetpack 应用架构指南小李子学编程 Android 开发文档指南 android android jetpack 学习
AndroidJetpack应用架构指南本指南涵盖Android应用开发的最佳实践和推荐架构，助力开发者构建健壮高效的应用程序。。前置要求本文假设您已具备Android框架基础知识。若需系统学习Android开发，建议先完成《Android基础知识》目录新架构设计背景移动应用交互特性核心架构原则分离关注点数据模型驱动界面单一数据源单向数据流分层架构设计界面层数据层领域层依赖管理方案工程实践指南参考
【自建分布式数据库详细指南】（五）使用：常见API及使用问题大板牙花生分布式
延续前几篇文章，下面着重从一些基本的API讲讲从入门到习惯的常用方法，后续更新。USAGE1节点管理设置主节点，又成为协调节点SELECTcitus_set_coordinator_host('coord.example.com',5432);step1.创建节点select*frommaster_add_node('new-node',12345);step2.删除节点step3.新增节点后重新
fastjosn注册自定义序列化器林发和开发语言 java
自定义序列化器： importcom.alibaba.fastjson.serializer.JSONSerializer; importcom.alibaba.fastjson.serializer.ObjectSerializer; importorg.springframework.boot.actuate.health.Status; importjava.io.IOExcepti
没想到枚举Enum类还能实现接口！教你玩转Java枚举Enum 林发和 Java 干货分享 java
枚举是什么？枚举是一种特殊的数据类型，预先定义一组常量（对象），并且必须为其赋值。Java枚举类型的基本想法非常简单：这些类通过共有的静态final域为每个枚举常量导出一个实例。枚举类型没有可以访问的构造器，所以它是真的final类。客户端不能创建枚举类型的实例，也不能对它进行扩展，因此不存实例，而只存在声明过程的枚举常量。也就是枚举类型是实例受控的。它们是单例（Singleton）的范型化，本质
SpringBoot 整合security 实现自定义Token和clientId登录及退出(二) .猫的树 spring boot spring java
接上一篇6.认证相关处理创建登录成功DemoAuthenticationSuccessHandler.java/***用户身份验证通过处理*/@Component@SuppressWarnings("all")publicclassDemoAuthenticationSuccessHandlerimplementsAuthenticationSuccessHandler{@Autowiredpri
Flink sql-clinet 查询报错 lhfmqc sql-clinet 运行问题查询报错 flink
Flinksql-clinet查询报错运行后进行select'helloworld’报以下错误，couldnotexecutesqlstatementjava.net.NoRouteToHostException:Noroutetohost在关闭防火墙之后仍无法解决这个时候你需要进入flinkconf配置中查看flink-conf.yaml文件，查看jobmanager.rpc.address该地
【架构实战营】模块四 3.存储架构模式 - 分片架构和分区架构 qxlxi #架构实战训练营架构系统架构微服务
教学目标掌握分片架构的设计和本质掌握分区架构的设计和本质目录分片架构分区架构分片架构分片架构的本质分片架构设计核心分片架构设计核心-分片规则分片架构设计核心-路由规则
178.HarmonyOS NEXT系列教程之列表交换组件错误处理机制 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之列表交换组件错误处理机制效果演示1.错误处理架构1.1错误类型定义//错误类型枚举enumErrorType{DATA_ERROR,//数据错误OPERATION_ERROR,//操作错误NETWORK_ERROR,//网络错
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
Linux脚本实践1 一点多余. linux 运维服务器脚本
前言日常在Liunx中用到多个版本的java修改很麻烦，一个脚本搞定。1.准备两个jdk(如下图所示)2.准备脚本文件viswitch_jdk.sh#!/bin/bash#提示用户输入JDK路径read-p"请输入JDK的绝对路径（例如/usr/local/jdk/jdk-11.0.21）："jdk_path#检查输入的路径是否存在if[!-d"$jdk_path"];thenecho"错误：路径
Spring Bean 的生命周期：从创建到销毁的完整解析一点多余. java 开发语言
引言：为什么需要了解SpringBean的生命周期？在Spring框架中，Bean是应用程序的核心构建块，理解其生命周期对于开发高效、稳定的应用至关重要。根据2023年JetBrains开发者调查报告，超过75%的Java开发者使用Spring框架，而Bean的生命周期管理是Spring的核心特性之一。以下数据展示了Bean生命周期的重要性：90%的Spring性能问题与Bean的初始化或销毁不当
181.HarmonyOS NEXT系列教程之列表交换组件整体架构详解 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之列表交换组件整体架构详解效果演示1.组件概述1.1功能介绍ListExchangeViewComponent是一个支持列表项交换和删除的自定义组件，主要用于实现如扣款列表等场景。主要功能包括：列表项拖拽排序滑动删除自定义列表项
六十天前端强化训练之第二十九天之深入解析：从零构建企业级Vue项目的完整指南编程星辰海 #前端前端 Vue项目
=====欢迎来到编程星辰海的博客讲解======看完可以给一个免费的三连吗，谢谢大佬！目录一、Vite核心原理与开发优势二、项目创建深度解析三、配置体系深度剖析四、企业级项目架构设计五、性能优化实战六、开发提效技巧七、质量保障体系八、扩展阅读推荐一、Vite核心原理与开发优势1.1为什么选择Vite？Vite采用现代浏览器原生ES模块系统（NativeESM）作为开发服务器，颠覆了传统打包工具的
【软考论文】论软件系统架构评估罗小爬EX 软考（系统架构师）软考系统架构师论文
目录一、题目二、论文2.1摘要2.2正文三、扩展3.1基础知识3.2评估方式综合对比3.3SAAM基于场景的架构分析方法3.4ATAM架构权衡分析方法3.5质量属性一、题目对于软件系统，尤其是大规模的复杂软件系统来说，软件的系统架构对于确保最终系统的质量具有十分重要的意义，不恰当的系统架构将给项目带来高昂的代价和难以避免的灾难。对一个系统架构进行评估，是为了：分析现有架构存在的风险，检验设计中提出
今日BUG— java.lang.NumberFormatException 水晶果冻1125 其它 bug int范围
今日照例巡检系统，打开系统的汇聚首页，发现数据都消失了，于是查看其他服务器上部署的版本也出现了同样的问题，而其他功能并未受影响，排除后台服务挂掉的可能，内心生出疑问一直运行稳定的程序怎么突然都查不出来内容了呢？赶紧查看系统运行日志，果然看见了报错信息java.lang.NumberFormatException:Forinputstring:"2315841207"于是赶紧确认了下int数据类型的
NLP高频面试题（十）——目前常见的几种大模型架构是啥样的 Chaos_Wang_ NLP常见面试题自然语言处理架构人工智能
深入浅出：目前常见的几种大模型架构解析随着Transformer模型的提出与发展，语言大模型迅速崛起，已经成为人工智能领域最为关注的热点之一。本文将为大家详细解析几种目前常见的大模型架构，帮助读者理解其核心差异及适用场景。1.什么是LLM（大语言模型）？LLM通常指参数量巨大、能够捕捉丰富语义信息的Transformer模型，它们通过海量的文本数据训练而成，能够实现高度逼真的文本生成、复杂的语言理
基于AWS Endpoint Security（EPS）的自动化安全基线部署 weixin_30777913 云计算 aws python 安全架构
设计AWS云架构方案实现基于AWSEndpointSecurity(EPS)的自动化安全基线部署，AMSAdvanced（AWS托管服务）环境会为所有新部署的资源自动安装EPS监控客户端，无需人工干预即可建立统一的安全基线。这种自动化机制特别适用于动态扩缩的云环境，确保新启动的EC2实例、容器等终端设备从初始状态即受保护，以及具体实现的详细步骤和关键代码。以下是基于AWSEndpointSecur
架构师必知必会系列：数据架构与数据管理 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.背景介绍数据架构与数据管理介绍数据架构是指用来定义企业数据的逻辑结构、物理存储结构和数据的流转过程。它由数据中心和IT平台、数据库、文件系统、网络、安全、计算资源等构成。其目的是为了满足业务需求、提升组织效率和降低成本。数据架构包括数据字典、元数据、数据模型、数据流、数据仓库、数据管道、数据服务等。在应用中，将数据按照其自身特性进行划分、分类、归档、清洗和加工，才能
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
Java24的新特性 hello_ejb3 redis 数据库 java
Java语言特性系列Java5的新特性Java6的新特性Java7的新特性Java8的新特性Java9的新特性Java10的新特性Java11的新特性Java12的新特性Java13的新特性Java14的新特性Java15的新特性Java16的新特性Java17的新特性Java18的新特性Java19的新特性Java20的新特性Java21的新特性Java22的新特性Java23的新特性Java2
JavaScript 性能优化实战：优化循环结构提升效率 deying0865423 javascript 开发语言
目录一、理解循环的性能损耗二、减少循环迭代次数（一）缓存数组长度（二）提前终止循环三、优化循环内部操作（一）避免在循环内执行复杂计算（二）减少DOM操作四、选择合适的循环类型（一）for循环与while循环的选择（二）for...in与for...of的使用场景在JavaScript编程中，循环结构是实现重复执行任务的基础工具。然而，不当的循环使用常常会导致性能瓶颈，特别是在处理大量数据时，循环的
《今日AI-人工智能-编程日报》-源自2025年3月20日小亦编辑部每日AI-人工智能-编程日报人工智能大数据
一、AI行业动态英伟达新一代AI芯片Rubin发布计划英伟达宣布其新一代AI芯片Rubin将于2026年下半年推出，下下一代AI芯片架构命名为Feynman，计划于2028年登场。同时，英伟达还推出了RTXPRO6000系列Blackwell专业卡，拥有24064核心、96GB显存和最高600W功耗。OpenAI星际之门数据中心建设进展OpenAI的首个数据中心“星际之门”预计于2026年中在德克
员工管理(3)-删除员工-修改员工-全局异常处理器-员工信息统计汐栊 java 数据库开发语言
目录员工管理:删除员工：Controller层：Service层：Mapper接口：接受参数的两种方式：修改员工：查询回显：Controller层：Service层：Mapper接口：修改数据：Controller层：Service层：Mapper接口：程序优化：员工信息统计：职位统计开发Controller层：Service层：Mapper接口：性别统计：员工管理:删除员工：明确三层架构职责：C
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

Kafka Session

Kafka Session

文章目录

1. What’s Kafka

2. Why Kafka

3. Tech Points

3.1 说一说什么是Kafka中的 ISR、OSR？

3.2 说一说什么是Kafka中的LSO、LEO、HW？

3.3 Kafka Producer的常见参数

3.4 有没有对Kafka Producer参数进行过调优？

4. Landing Implementation

5. Issues

5.1 无限消费失败消息

References

你可能感兴趣的:(架构私房菜,kafka,分布式,java)