wl6965307

Kafka设计解析（五）- Kafka性能测试方法及Benchmark报告

摘要

　　本文主要介绍了如何利用Kafka自带的性能测试脚本及Kafka Manager测试Kafka的性能，以及如何使用Kafka Manager监控Kafka的工作状态，最后给出了Kafka的性能测试报告。

性能测试及集群监控工具

　　Kafka提供了非常多有用的工具，如Kafka设计解析（三）- Kafka High Availability （下）中提到的运维类工具——Partition Reassign Tool，Preferred Replica Leader Election Tool，Replica Verification Tool，State Change Log Merge Tool。本文将介绍Kafka提供的性能测试工具，Metrics报告工具及Yahoo开源的Kafka Manager。

Kafka性能测试脚本

$KAFKA_HOME/bin/kafka-producer-perf-test.sh 该脚本被设计用于测试Kafka Producer的性能，主要输出4项指标，总共发送消息量（以MB为单位），每秒发送消息量（MB/second），发送消息总数，每秒发送消息数（records/second）。除了将测试结果输出到标准输出外，该脚本还提供CSV Reporter，即将结果以CSV文件的形式存储，便于在其它分析工具中使用该测试结果
$KAFKA_HOME/bin/kafka-consumer-perf-test.sh 该脚本用于测试Kafka Consumer的性能，测试指标与Producer性能测试脚本一样

Kafka Metrics

　　Kafka使用Yammer Metrics来报告服务端和客户端的Metric信息。Yammer Metrics 3.1.0提供6种形式的Metrics收集——Meters，Gauges，Counters，Histograms，Timers，Health Checks。与此同时，Yammer Metrics将Metric的收集与报告（或者说发布）分离，可以根据需要自由组合。目前它支持的Reporter有Console Reporter，JMX Reporter，HTTP Reporter，CSV Reporter，SLF4J Reporter，Ganglia Reporter，Graphite Reporter。因此，Kafka也支持通过以上几种Reporter输出其Metrics信息。

使用JConsole查看单服务器Metrics

　　使用JConsole通过JMX，是在不安装其它工具（既然已经安装了Kafka，就肯定安装了Java，而JConsole是Java自带的工具）的情况下查看Kafka服务器Metrics的最简单最方便的方法之一。
　　首先必须通过为环境变量JMX_PORT设置有效值来启用Kafka的JMX Reporter。如export JMX_PORT=19797。然后即可使用JConsole通过上面设置的端口来访问某一台Kafka服务器来查看其Metrics信息，如下图所示。

　　使用JConsole的一个好处是不用安装额外的工具，缺点很明显，数据展示不够直观，数据组织形式不友好，更重要的是不能同时监控整个集群的Metrics。在上图中，在kafka.cluster->Partition->UnderReplicated->topic4下，只有2和5两个节点，这并非因为topic4只有这两个Partition的数据是处于复制状态的。事实上，topic4在该Broker上只有这2个Partition，其它Partition在其它Broker上，所以通过该服务器的JMX Reporter只看到了这两个Partition。

通过Kafka Manager查看整个集群的Metrics

　　Kafka Manager是Yahoo开源的Kafka管理工具。它支持如下功能

管理多个集群
方便查看集群状态
执行preferred replica election
批量为多个Topic生成并执行Partition分配方案
创建Topic
删除Topic（只支持0.8.2及以上版本，同时要求在Broker中将delete.topic.enable设置为true）
为已有Topic添加Partition
更新Topic配置
在Broker JMX Reporter开启的前提下，轮询Broker级别和Topic级别的Metrics
监控Consumer Group及其消费状态
支持添加和查看LogKafka

　　安装好Kafka Manager后，添加Cluster非常方便，只需指明该Cluster所使用的Zookeeper列表并指明Kafka版本即可，如下图所示。

　　这里要注意，此处添加Cluster是指添加一个已有的Kafka集群进入监控列表，而非通过Kafka Manager部署一个新的Kafka Cluster，这一点与Cloudera Manager不同。

Kafka Benchmark

　　Kafka的一个核心特性是高吞吐率，因此本文的测试重点是Kafka的吞吐率。
　　本文的测试共使用6台安装Red Hat 6.6的虚拟机，3台作为Broker，另外3台作为Producer或者Consumer。每台虚拟机配置如下

CPU：8 vCPU， Intel(R) Xeon(R) CPU E5-2680 v2 @ 2.80GHz，2 Sockets，4 Cores per socket，1 Thread per core
内存：16 GB
磁盘：500 GB

　　开启Kafka JMX Reporter并使用19797端口，利用Kafka-Manager的JMX polling功能监控性能测试过程中的吞吐率。

　　本文主要测试如下四种场景，测试的指标主要是每秒多少兆字节数据，每秒多少条消息。

Producer Only

　　这组测试不使用任何Consumer，只启动Broker和Producer。

Producer Number VS. Throughput

　　实验条件：3个Broker，1个Topic，6个Partition，无Replication，异步模式，消息Payload为100字节
　　测试项目：分别测试1，2，3个Producer时的吞吐量
　　测试目标：如Kafka设计解析（一）- Kafka背景及架构介绍所介绍，多个Producer可同时向同一个Topic发送数据，在Broker负载饱和前，理论上Producer数量越多，集群每秒收到的消息量越大，并且呈线性增涨。本实验主要验证该特性。同时作为性能测试，本实验还将监控测试过程中单个Broker的CPU和内存使用情况
　　测试结果：使用不同个数Producer时的总吞吐率如下图所示

　　由上图可看出，单个Producer每秒可成功发送约128万条Payload为100字节的消息，并且随着Producer个数的提升，每秒总共发送的消息量线性提升，符合之前的分析。

　　性能测试过程中，Broker的CPU和内存使用情况如下图所示。

　　由上图可知，在每秒接收约117万条消息（3个Producer总共每秒发送350万条消息，平均每个Broker每秒接收约117万条）的情况下，一个Broker的CPU使用量约为248%，内存使用量为601 MB。

Message Size VS. Throughput

　　实验条件：3个Broker，1个Topic，6个Partition，无Replication，异步模式，3个Producer
　　测试项目：分别测试消息长度为10，20，40，60，80，100，150，200，400，800，1000，2000，5000，10000字节时的集群总吞吐量
　　测试结果：不同消息长度时的集群总吞吐率如下图所示

　　由上图可知，消息越长，每秒所能发送的消息数越少，而每秒所能发送的消息的量（MB）越大。另外，每条消息除了Payload外，还包含其它Metadata，所以每秒所发送的消息量比每秒发送的消息数乘以100字节大，而Payload越大，这些Metadata占比越小，同时发送时的批量发送的消息体积越大，越容易得到更高的每秒消息量（MB/s）。其它测试中使用的Payload为100字节，之所以使用这种短消息（相对短）只是为了测试相对比较差的情况下的Kafka吞吐率。

Partition Number VS. Throughput

　　实验条件：3个Broker，1个Topic，无Replication，异步模式，3个Producer，消息Payload为100字节
　　测试项目：分别测试1到9个Partition时的吞吐量
　　测试结果：不同Partition数量时的集群总吞吐率如下图所示

　　由上图可知，当Partition数量小于Broker个数（3个）时，Partition数量越大，吞吐率越高，且呈线性提升。本文所有实验中，只启动3个Broker，而一个Partition只能存在于1个Broker上（不考虑Replication。即使有Replication，也只有其Leader接受读写请求），故当某个Topic只包含1个Partition时，实际只有1个Broker在为该Topic工作。如之前文章所讲，Kafka会将所有Partition均匀分布到所有Broker上，所以当只有2个Partition时，会有2个Broker为该Topic服务。3个Partition时同理会有3个Broker为该Topic服务。换言之，Partition数量小于等于3个时，越多的Partition代表越多的Broker为该Topic服务。如前几篇文章所述，不同Broker上的数据并行插入，这就解释了当Partition数量小于等于3个时，吞吐率随Partition数量的增加线性提升。
　　当Partition数量多于Broker个数时，总吞吐量并未有所提升，甚至还有所下降。可能的原因是，当Partition数量为4和5时，不同Broker上的Partition数量不同，而Producer会将数据均匀发送到各Partition上，这就造成各Broker的负载不同，不能最大化集群吞吐量。而上图中当Partition数量为Broker数量整数倍时吞吐量明显比其它情况高，也证实了这一点。

Replica Number VS. Throughput

　　实验条件：3个Broker，1个Topic，6个Partition，异步模式，3个Producer，消息Payload为100字节
　　测试项目：分别测试1到3个Replica时的吞吐率
　　测试结果：如下图所示

　　由上图可知，随着Replica数量的增加，吞吐率随之下降。但吞吐率的下降并非线性下降，因为多个Follower的数据复制是并行进行的，而非串行进行。

　　

Consumer Only

　　实验条件：3个Broker，1个Topic，6个Partition，无Replication，异步模式，消息Payload为100字节
　　测试项目：分别测试1到3个Consumer时的集群总吞吐率
　　测试结果：在集群中已有大量消息的情况下，使用1到3个Consumer时的集群总吞吐量如下图所示

　　由上图可知，单个Consumer每秒可消费306万条消息，该数量远大于单个Producer每秒可消费的消息数量，这保证了在合理的配置下，消息可被及时处理。并且随着Consumer数量的增加，集群总吞吐量线性增加。
　　根据Kafka设计解析（四）- Kafka Consumer设计解析所述，多Consumer消费消息时以Partition为分配单位，当只有1个Consumer时，该Consumer需要同时从6个Partition拉取消息，该Consumer所在机器的I/O成为整个消费过程的瓶颈，而当Consumer个数增加至2个至3个时，多个Consumer同时从集群拉取消息，充分利用了集群的吞吐率。

Producer Consumer pair

　　实验条件：3个Broker，1个Topic，6个Partition，无Replication，异步模式，消息Payload为100字节
　　测试项目：测试1个Producer和1个Consumer同时工作时Consumer所能消费到的消息量
　　测试结果：1,215,613 records/second

你可能感兴趣的:(Kafka设计解析（五）- Kafka性能测试方法及Benchmark报告)

《前端开发者必看：IndexedDB海量数据查询提速秘籍》程序猿阿伟数据库 oracle 前端
IndexedDB作为强大的客户端存储方案，虽提供了大容量存储能力，然而当面对海量数据时，查询速度的优化成为亟待解决的难题，这不仅关乎应用性能，更直接影响用户体验。IndexedDB采用异步操作，以事务为核心，通过对象存储空间（ObjectStore）存储数据。其查询依赖于索引机制，索引类似书籍目录，能快速定位数据位置。例如，在一个包含大量用户信息的数据库中，若要查找特定用户，通过为用户ID建立索
C++系列（二）：告别低效循环！选择、循环、跳转原理与优化实战全解析
引言闯过C++基础“新手村”（注释、变量、数据类型…），是否已摩拳擦掌，渴望指挥程序执行更复杂的任务？流程控制，就是赋予程序逻辑与生命的核心技能！本指南作为《彻底吃透C++基础核心》的进阶篇章，将带你深度解锁“选择结构”(if/三目/switch)、“循环结构”(while/do-while/for/嵌套)与“跳转语句”(break/continue/goto)三大核心武器库。告别代码的平铺直叙，
基于Python的智能语音识别系统设计 MATLAB算法工程师Y python 语音识别开发语言
引言语言是人类最原始直接的一种交流方式，通俗易懂、便于理解。随着科技的发展，语言交流不再只存在于人与人之间，如何让机器“听懂”人类的语言并做出反应成为人工智能的重要课题，语音智能交互技术应运而生。作为其中重要一环的语音识别技术近年来不断发展，走出了实验室，随着人工智能进入人们的日常生活中。当今市场上语音识别技术相关的软件、商品涉及人类生活的方方面面，语音识别的实用性已经得到充分的印证。如今语音识别
Python漂浮的爱心 Want595 python
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
爬虫第三篇（网络通信之获取响应）
响应状态码HTTP响应状态码是服务器与客户端之间通信的重要机制，用于指示请求的处理结果。状态码分为五个类别：1xx：信息性状态码，用于临时响应。2xx：成功状态码，表示请求已成功处理。3xx：重定向状态码，表示客户端需要进一步操作。4xx：客户端错误状态码，表示客户端请求有误。5xx：服务器错误状态码，表示服务器处理请求时出错。响应头响应头信息的定义与组成1.响应头信息的定义HTTP响应头（Res
PyCharm如何调用DeepSeek实现AI编程？手把手教你打造智能开发环境！[特殊字符]_pycharm调用deepseek AI大模型-海文 pycharm AI编程 ide 人工智能开发语言深度学习 github
前言DeepSeek作为国产顶尖AI大模型，凭借其强大的代码生成、逻辑推理能力，已成为开发者提升效率的利器。本文将详细讲解如何将DeepSeek无缝接入PyCharm，实现代码自动补全、智能问答、单元测试生成等功能，助你解锁AI编程新体验！（文末附完整代码配置及常见问题解决，建议收藏！）一、准备工作：获取DeepSeekAPIKey1.注册DeepSeek账号访问DeepSeek官网，点击右上角“
柠檬笔记APP：打造个性化记事空间，记录生活点滴东风西巷笔记生活软件需求 android 智能手机
在快节奏的现代生活中，我们常常需要记录各种信息，无论是工作中的重要事项、学习中的知识点，还是生活中的灵感与感悟。柠檬笔记APP正是这样一款匠心制作的笔记记录应用，它不仅满足了日常笔记的基本需求，更通过个性化的设计和贴心的功能，为用户打造了一个专属的记事空间。软件介绍柠檬笔记官方版以用户为中心设计，界面简洁直观，功能强大且实用。在繁忙的日程中，您可以快速创建、编辑和分享各类笔记，无论是会议纪要、读书
新华妙笔：AI智能写作助手，让高效写作触手可及东风西巷 AI写作 android 软件需求智能手机
在当今快节奏的时代，无论是职场人士、学生还是创作者，都面临着大量的写作任务。从工作总结、调研报告到公文写作、商业文案，高效且高质量的写作能力成为了提升个人竞争力的关键。然而，写作不仅需要丰富的知识储备和扎实的文字功底，还需要大量的时间和精力去打磨。为了帮助用户更高效地完成写作任务，新华妙笔APP应运而生。它是一款功能强大的AI智能写作助手，依托自然语言处理（NLP）和大数据分析技术，能够快速生成各
Python蓝色飘雪 Want595 python
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Redis 数据持久化方式详解 zru_9602 数据库 redis 数据库缓存
Redis数据持久化方式详解1.引言Redis是一个高性能的键值存储系统，广泛应用于缓存、消息队列、实时分析等领域。默认情况下，Redis使用内存来存储数据，这使得它能够提供极低的延迟和高吞吐量。然而，由于数据是驻留在内存中的，一旦服务器发生故障（如断电或崩溃），所有的数据都将丢失。为了应对这种情况，Redis提供了多种数据持久化方式，确保数据能够在系统故障时得到保存，并在重启后恢复。本教程将详细
怎么看GPU好坏，有哪些关键指标，显卡性能参数全解析芥子沫 GPU 显卡 GPU-Z
电脑显卡性能如何评估？本文推荐使用gpu-z软件，它能全面展现显卡各项参数，帮助您判断显卡优劣。一、显卡核心参数解析1）在GPU-Z主界面顶端，会显示显卡的具体型号（Name）如“NVIDIAGeForceRTX4090”。型号不仅代表身份，还暗示定位：数字越大通常越高端，例如RTX4090就强于RTX4070。而“架构”则是显卡的“底层设计蓝图”。以英伟达为例，RTX40系列采用AdaLovel
破局并发困境：Python 协程 async/await 深度解析与实战指南清水白石008 python Python题库 python 开发语言
破局并发困境：Python协程async/await深度解析与实战指南一、写在前面：为什么我们仍在为并发编程头疼？在构建高性能的网络服务、实时数据处理系统、自动化调度工具时，你可能遇到过这些困境：多线程写起来麻烦，线程之间切换的开销不容忽视；多进程占用大量内存，IPC（进程间通信）复杂又笨重；I/O密集型任务跑得慢，CPU明明闲着却像在等月亮升起。正因为如此，Python在3.5之后正式引入了as
设计模式之外观模式缘来是庄设计模式外观模式 java
目录定义结构适用场景使用示例定义外观模式（FacadePattern）‌是一种结构型设计模式，它提供了一个统一的接口，用来访问子系统中的一组接口。外观模式定义了一个高层接口，这个接口使得子系统更容易使用。结构适用场景1）为复杂的子系统提供简单入口2）统一管理系统中存在的多个复杂的子系统3）解耦客户端与多个子系统之间的依赖关系4）分层系统中，作为层与层之间的通信接口5）为遗留系统提供新的简化接口使用
深入理解Python协程：async def、async for、await、yield详解
前言在现代编程中，异步编程已成为提高程序效率和性能的重要方式。Python作为一种流行的编程语言，自然也提供了强大的异步编程支持。本文将详细介绍Python中的协程，以及asyncdef、asyncfor、await和yield等关键字的使用。协程简介协程是一种比传统函数更高级的控制结构。它们在一个过程中暂停，然后在另一个地方恢复执行。协程可以在程序的多个点之间切换，从而实现并发执行，而无需多线程
Redis精通之路：起源、应用、高级特性一网打尽！奔跑吧邓邓子项目实战 redis 数据库缓存
目录一、Redis简介1、Redis起源与发展（1）Redis的起源（2）Redis的发展（3）Redis的优势2、Redis特点（1）支持多种数据结构（2）高性能（3）持久化机制（4）高可用性（5）灵活的过期策略（6）支持事务管理（7）支持管道技术（8）监控和故障排查3、Redis应用场景（1）缓存（2）消息队列（3）排行榜（4）社交网络（5）实时分析（6）地理信息存储（7）分布式锁二、Redi
锁查询及处理瀚高PG实验室数据库 postgresql 瀚高数据库
文章目录环境症状问题原因解决方案环境系统平台：N/A版本：6.0症状数据库锁表后，对锁住的表无法进行改动，严重时会影响业务正常运转。问题原因多个会话在同一时间段对相同的数据做了改动，且第一个会话没有立即释放。解决方案1、创建测试表highgo=#select*fromhgjob_test033;id|name|timestart|count----+-------+----------------
如何实现强磁环境下小井斜段的高精度测量？ ericco123 科技制造 MEMS 陀螺仪惯性技术
在套管井、强磁地层等复杂工况中，普通测井工具因磁干扰导致方位角测量失灵。针对此技术局限，采用基于地球自转角速度感应的陀螺定向方案成为必然选择。新一代MEMS定向短节通过融合三轴MEMS陀螺仪与三轴MEMS加速度计捷联惯性测量技术，在随机振动工况下实现方位角、井斜角及工具面角的动态跟踪测量，为随钻测量场景提供关键技术支撑。1.小井斜方位测量优化•在1°-5°井斜段维持方位角与工具面角的高精度输出能力
python+django/flask+springboot的招聘求职系统 QQ1963288475 python django flask spring boot node.js php
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
Linux集群管理实战：5个必知的核心技术与工具操作系统内核探秘操作系统内核揭秘 OS linux 网络运维 ai
Linux集群管理实战：5个必知的核心技术与工具关键词：Linux集群、负载均衡、高可用性、分布式计算、集群监控、自动化部署、资源调度摘要：本文将深入探讨Linux集群管理的5个核心技术领域，包括负载均衡、高可用性、分布式计算、集群监控和自动化部署。通过实际案例和代码示例，我们将一步步解析这些技术的原理、实现方式以及在实际生产环境中的应用场景，帮助读者掌握构建和管理高效Linux集群的关键技能。背
操作系统一致性模型全解析：强一致性 vs 最终一致性操作系统内核探秘网络 ai
操作系统一致性模型全解析：强一致性vs最终一致性关键词：操作系统、一致性模型、强一致性、最终一致性、数据同步摘要：本文深入探讨了操作系统中的一致性模型，重点解析了强一致性和最终一致性这两种常见的模型。通过生动形象的比喻和实际案例，详细介绍了这两种一致性模型的概念、原理、适用场景以及它们之间的区别。同时，还给出了相关的代码示例，帮助读者更好地理解和应用这两种一致性模型。希望读者通过本文能够对操作系统
操作系统日志最佳实践：从收集到分析的完整解决方案操作系统内核探秘操作系统内核揭秘 OS 网络 unity 游戏引擎 ai
操作系统日志最佳实践：从收集到分析的完整解决方案关键词：操作系统日志、日志收集、日志分析、ELKStack、Syslog、日志管理、安全审计摘要：本文将深入探讨操作系统日志管理的完整生命周期，从日志收集、传输、存储到分析和可视化。我们将介绍现代日志管理的最佳实践，包括工具选择、架构设计和性能优化策略，帮助读者构建高效可靠的日志管理系统。背景介绍目的和范围本文旨在为系统管理员、DevOps工程师和安
Windows 11 vs Windows 10：全面对比与升级建议操作系统内核探秘操作系统内核揭秘 windows ai
Windows11vsWindows10：全面对比与升级建议关键词：Windows11、Windows10、系统对比、升级建议、性能优化、兼容性、用户体验摘要：本文从用户界面、性能表现、核心功能、兼容性、安全性、硬件要求等维度对Windows11与Windows10进行深度对比，结合技术原理与实际应用场景分析差异点，为个人用户、游戏玩家、企业用户提供针对性升级建议。通过系统架构解析、功能模块对比和
鸿蒙分布式文件系统开发完全指南操作系统内核探秘操作系统内核揭秘 OS harmonyos 华为 ai
鸿蒙分布式文件系统开发完全指南关键词：鸿蒙系统、分布式文件系统、HarmonyOS、跨设备文件共享、文件管理、开发指南、系统架构摘要：本文将全面介绍鸿蒙分布式文件系统的核心概念、架构设计、开发方法和实际应用。我们将从基础概念入手，逐步深入探讨其技术原理，并通过实际代码示例展示如何开发基于鸿蒙分布式文件系统的应用。无论您是初学者还是有经验的开发者，都能从本文中获得实用的开发知识和技巧。背景介绍目的和
设计模式之代理模式缘来是庄设计模式代理模式 java
目录定义结构适用场景使用实例定义代理对象作为客户端和真实对象之间的中介，替代真实对象处理请求，实现对访问的控制和功能增强。客户端通过代理间接操作真实对象，二者通常实现相同接口。结构适用场景1）远程代理为一个对象在不同的地址空间提供局部代表2）虚拟代理根据需要创建开销很大的对象3）安全代理控制对原始对象的访问4）日志代理记录操作行为使用实例这里以日志代理为例，说明java中代理的几种方式。1、静态代
.NET Core配置系统详解：JSON、环境变量与多源配置
目录一、配置系统架构全景1.1配置系统核心组件1.2配置源加载顺序对比二、JSON配置深度解析2.1多环境JSON配置实战2.2JSON配置结构最佳实践三、环境变量配置策略3.1环境变量命名规范3.2环境变量与JSON对比四、多配置源融合技术4.1配置提供程序组合示例4.2自定义配置提供程序五、配置数据消费模式5.1配置绑定技术对比5.2选项模式最佳实践六、高级配置场景6.1动态配置更新6.2多租
方配.Core网站服务器：.NET Core开发者的利器兰森环游世界
本文还有配套的精品资源，点击获取简介：方配.Core网站服务器是一款专为.NETCore开发的轻量级Web服务器，简化了.NETCore应用程序的部署和运行过程。提供一键安装、快速启动和友好的网站管理功能。基于.NETCore构建，兼容多操作系统，具有高性能和稳定性。利用C#的特性如异步编程实现高效服务器运行和管理。核心功能包括一键安装、快速启动、网站管理、错误日志、安全特性及性能监控，旨在提升.
架构师面试题木鱼时刻软件开发架构
说明难度分级：L1：低难度，适合初级开发者，基础概念和原理L2：中难度，适合中级开发者，实际问题解决和系统设计L3：高难度，适合高级开发者，复杂系统架构和深度技术挑战问题结构：每个问题按「类别-序号-具体问题」格式组织使用Markdown链接连接到对应答案每个问题前标注难度等级答案结构：每个答案按「类别-序号」格式组织，与问题对应使用Markdown标题和代码块格式化答案内容采用结构化的要点列表呈
GNN多任务预测模型实现（二）：将EXCEL数据转换为图数据走的远一些神经网络知识分享知识备份人工智能深度学习
目录一.引言二.加载和检查数据三.提取特征和标签四.标准化特征五.构建节点索引六.构建边及其特征七.总结八.结语一.引言在图神经网络（GraphNeuralNetworks,GNNs）的多任务学习场景中，数据预处理是至关重要的一步。尤其是当我们的数据存储在表格格式（如Excel文件）中时，如何有效地将其转换为图数据格式，是搭建GNN模型的基础。二.加载和检查数据第一步是加载数据并检查其格式。我们通
JVM 中的完整 GC 流程一叶飘零_sweeeet java jvm java 开发语言
一、引言在Java应用程序的运行过程中，垃圾回收是一个至关重要的环节。它负责自动管理内存，回收不再被使用的对象，以确保应用程序的稳定运行。了解JVM中一次完整的GC流程对于优化Java应用的性能、减少内存占用以及避免内存泄漏至关重要。本文将深入探讨JVM中的GC流程。二、JVM内存结构概述（一）堆内存新生代（YoungGeneration）Eden区：新创建的对象首先分配在Eden区。Surviv
.NET 环境配置工具 (dotnet-env) 教程诸余煦
.NET环境配置工具(dotnet-env)教程dotnet-envA.NETlibrarytoloadenvironmentvariablesfrom.envfiles项目地址:https://gitcode.com/gh_mirrors/do/dotnet-env1.项目目录结构及介绍dotnet-env/├──src#源代码主目录│├──DotNetEnv#主项目库，包含了环境变量处理的核心
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他