cuizhu6079

李亚坤：Hadoop YARN在字节跳动的实践

【IT168 专稿】本文根据李亚坤老师在2018年10月17日【第十届中国系统架构师大会】现场演讲内容整理而成。

讲师简介：

李亚坤，哈工大硕士，目前从事分布式计算资源调度系统YARN的研发支持工作，支撑了包括今日头条、抖音短视频、火山小视频、西瓜视频等一系列产品的离线、流式计算任务。

摘要：

字节跳动公司的今日头条、抖音短视频、火山小视频、西瓜视频等一系列产品，在最近几年内数据量一直呈现出爆炸性增长趋势，数据基础架构部门在离线计算、流式计算等多个方向上遭遇到了一系列前所未有的挑战。本次演讲主要介绍从0到4万+计算结点的YARN集群管理，以及在调度优化、流式作业支持等多个方面的经验分享。

分享大纲：

1、IntroductiontoYARN

2、YARN@ByteDance Overview

3、Customization@ByteDance

4、Future Works

正文：

1、IntroductiontoYARN

首先，我们将Hadoop生态圈分为三层，从底向上依次是物理层、分布式系统层和用户层。物理层由一系列标准X86服务器组成，这些服务器上跑着开源Linux或者Windows系统。中间是分布式系统层，分别由HDFS服务管理的分布式存储、Yarn管理的分布式计算资源，以及其上的一些计算框架，比如MapReduce、Storm和Flink等组成，这些都是为了方便用户使用并编写分布式应用。最上面是应用层，主要存放日报、进行数据分析，还有推荐模型等训练。本文将重点介绍Yarn所在的分布式计算资源管理层。

上图为Yarn架构图，Yarn中有两大概念需要普及：一是Resource Manager，这是Yarn的调度大脑。二是NodeManager，由很多Manager组成，是最基本的Yarn计算节点服务，负责执行并监控用户作业。无论是Spark、MapReduce还是Flink，都必须按照Yarn对作业的抽象进行编程，这样才能跑在Yarn之上。

2、YARN@ByteDance Overview

接下来，我将从不同视角向大家介绍Yarn在字节跳动的概览情况。从物理资源来看，所有计算节点全部由基础架构团队管理，目前的流式作业资源占比不到30%，但增长速度很快。今年9月份与去年3月份对比，集群总规模大概涨了15倍。从集群视角出发，我们现在有400左右队列，100左右Label，十个集群大概分布在五个数据中心。从作业视角出发，我们每天大概要完成34万作业，其中，MapReduce大概30万，Spark大概4万，Streaming作业大概2000个。从用户视角出发，我们目前日活用户2000左右(公司内部)，月活用户3000左右(公司内部)。我们的用户可从两个维度看，从横向业务维度看，所有对外APP基本都在使用该服务，也有部分公司内部自研且仅为内部提供的基础工具软件。如果从职责上看，上层的推荐、广告和分析，下层的系统运维包括机房网络管理等，都在使用Yarn服务做运算。

3、Customization@ByteDance

接下来，我将介绍定制化方面的事情。首先，我们在使用的Yarn基于社区2.6.0源码，我们大概用了三年多时间，这之中也发现了很多问题，比如在单机群5000台机器时，一个简单的切主就可能导致集群挂掉，比如Yarn原生抢占机制在该版本下有bug。在使用过程中，由于我们的规模较大，因此对稳定性要求更高。同时，由于用户较多，我们在易用性上也做了改进。

首先，我们来看在调度层面做的定制化。为了提高节点资源利用率而做的优化叫Delay scheduling for Dominant Resource Fairness，这是一个延迟调度。为了主资源的公平性，延迟调度与社区提到的Delay scheduling是完全不同的概念，社区提到的Delay scheduling是根据node的locality进行Delay，如果分配不满足locality就要等待，而我们则是为了节点资源等待。一台机器的计算资源其实有很多维度，CPU和内存是最常见的两个，还有网络IO、磁盘IO和GPU等。以CPU和内存为例，假设现在有一个container，需要申请两个CPU和1G内存，因为Yarn是一个心跳分配机制，如果在11:01时来了一个节点node1，现在闲置了两个CPU和8G内存，理论上是可以分配的，因为我只需要两个CPU和1G内存。如果分配，这台node1的机器就会完全用完CPU，而内存还剩下87%，这部分内存基本就不会有人使用了，这其实是一个非常严重的资源碎片。如果跳过node1，在一段时间之后，node2来了，node2需要1个CPU，2G内存，这也是可以匹配的，并且将资源分配到node2之后，CPU和内存都会有一些剩余，而这些剩余其实可以被用来调度其他作业，资源利用就会得到很大提升，碎片化会降低很多。这套机制也让我们的集群在高峰时段的资源碎片化小于10%，基本维持在5%左右。

但是，这类优化会带来一个问题，就是需要等待一段时间再进行调度。因为Yarn是一个非常重吞吐的调度引擎，等待就代表着牺牲了吞吐，这其实对Yarn来说是不可接受的，因此我们在吞吐上也做了一些优化。简单来说，我们将原生Yarn调度器的单线程改成了多线程版本。

我们把调度器拆分成了读锁和写锁，对要做的作业包括节点进行了合理分区。然后，我们启动了多个线程，让每个线程负责一部分node和作业，这样就可以达到多线程的效果。在测试环境中，我们的测试结果是在物理资源充裕的情况下，容器的吞吐效率比原来有大概一百倍的提升。

接下来，我将介绍抢占方面做的优化。Yarn的优势是更好的利用资源，比如当资源分配完成，A队列的资源没有用，而B队列需要的比较多，B队列就会把A的资源挪过去用。如果A在此时提交作业，就会发现队列已经没有资源了，而B作业没有运行完，也不会释放给A，这就需要强调抢占机制，比如把B作业的部分容器杀死从而释放资源给A。

Yarn 2.6.0本身自带抢占功能，但这基本不可用。举例说明，如果我要申请一个容器，而该容器需要两个核才能跑起来，但是Yarn自带的抢占机制可能会为我在两台机器上各抢占一个核，这基本上是不可用的，这在社区的2.8.0版本中做了重构。我们参考了社区2.8.0版本的代码，在实现重构的基础上做了一些优化，并降低了抢占成本，比如Yarn抢占要么全开，要么不开。抢占一定会杀死容器，杀死容器肯定会带来集群的不稳定，我们定制了一些优化策略，比如不针对AM，不杀运行时间过长的容器，一个作业只杀死一定比例以下的容器，一台机器只杀死一定比例以下的容器，以此来减少抢占带来的影响。

除此之外，社区版本的Yarn在节点达到5000台时，如果发生一次切主，这个集群很可能就会挂掉。对此，我们主要做了两件事情，一是设置安全模式，保证其在稳定之后再进行调度;二是分析找到所有不必要事件并直接切掉，这让我们的事件总量下降了800倍左右。以上措施让集群可以轻松应对万台机器。

在实际生产环境中，我们很多地方都需要考虑高稳定性。对此，我们做得第一件事是动态 Reservation for Fair Scheduler ，因为一个突然之间需要特别大资源的应用很可能会把整个集群卡住，导致其他应用没有资源可用。我们的解决方案是能够Reservation一个上限，并与应用存活时间进行绑定，这可以有效避免整个集群资源被某一个应用全部用掉，而导致其他应用程序没有资源可用。

此处，我们同样进行了优化，我们将label信息存储到了 ZKRMStateStore 中。ZKRMStateStore是原生Yarn用来存放application信息的地方。在Yarn切主时，ZKRMStateStore会把application读出来，但是原生Yarn会把label放到HDFS之上，这就会让Yarn对HDFS产生强依赖，当HDFS服务不可用，Yarn一定会挂掉。为了解除强依赖，我们把label信息存放到ZKRMStateStore 中。当切主时，load应用信息的同时会把label信息也load得出来，降低切主时间总长度。并彻底摆脱对HDFS的强依赖，即便HDFS服务挂了，也不会影响Yarn框架的使用。另外，我们修改了容器log的部分策略，比如上传策略，主要目的是增强功能稳定性，同时降低对HDFS服务的压力。

当集群规模较大时，用户上传的作业、容器log等信息会把HDFS目录打满，因为HDFS目录有默认的存储上限。针对该情况，我们做了一个哈希希望可以分得更均匀。此外，我们会根据Resource Manager里的压力负载将NodeManager心跳设置为动态，如果Resource Manager负载较大，它会自动地把Node Manager的心跳时间设置得更大一些，这样可以减少一些事件，并减少对Resource Manager的影响。当集群规模较大时，经常会出现Yarn集群与HDFS集群不匹配的情况，比如Yarn集群是ABCD，HDFS集群是BCDE。当按照本地性策略申请资源时，由于没有版本的计算结点，会等待直到超时退出，我们提前把这些信息保存下来，如果申请的资源在集群内一开始就不存在，我们直接降级成any任何节点都可以。

接下来，我将介绍资源隔离相关操作。更好得资源隔离可以提高在一台机器上同时运行多个作业的效率，我们使用了一种叫NUMA awareness 的技术来做节点内的资源隔离。传统的资源隔离主要通过Cgroup限制使用率。当多个作业同时运行在一台机器上时，虽然作业跑在不同的CPU和内存上，但要共用系统总线带宽和CPU缓存，作业交替运行刷缓存，导致CPU缓存基本就是不可用的状态。

NUMA是一种感知架构，对CPU和内存进行绑定，他们之间有独立的带宽，如果一个CPU访问自己的内存，速度会很快，反之访问其他CPU的内存，速度会很慢。Node Manager起作业时，会直接对作业的CPU和内存进行绑定，这样会有更好的隔离性。最终，我们的生产环境在实测中实现了部分场景15%的效率提升。

接下来，我将介绍对流式作业的支持。因为Yarn起初设计是为了批处理作业，为了更高的吞吐而设计的，虽然后期也可以支持流式作业，但是Yarn天生并不适合跑流式作业。前文提到，我们公司目前有30%的机器在运行流式作业，因此，我们在这方面做了很多努力，我主要分享两个事情：一是端口危机，因为流式作业经常与在线服务交互，期间会频繁建立或断开连接。受限于TCP连接断开机制，如果发生意外中断，系统会等待一段时间才彻底把端口释放，这样可以保证它的完备性，比如经常在Node Manager里重启时会发现端口被占用，经验证又发现端口未被占用。要想解决该问题，一开始就需要考虑特定服务的端口需提前做好预留。因为流式作业需要长时间运行，因此对外部运行时环境依赖是很苛刻的，比如Yarn的Linux container Executor等脚本运行时都需要依赖外部文件，一旦这些文件出问题，就会导致Manager不正常，甚至其上的所有流式容器全部挂掉。

我们还做了容器log的实时查看功能。在Yarn的设计里，日志聚合在作业结束后才开始，但流式作业可以认为是不结束的，因此就永远不会记录容器log，这也导致用户查看log不是很方便，我们让用户在作业运行过程中通过配置实时把日志打到Kafka，再到ES进行索引，索引完之后，用户可以实时在Kibana页面对作业进行检索。

接下来，我将介绍我们针对多区域、多数据中心和多集群场景做的事情。首先，我们设计了统一UI，包含用户所有集群的Job、label和队列，同时还进行了一些队列管理，换句话说，所有集群队列都可以在UI进行管理。其次，我们做了统一hadoop client，这与社区的区别是什么呢?用户可以在配置中写一个简单的conf，指明集群的名字，这个作业就会被提交到特定集群。

在Yarn的使用过程中，用户申请资源是一个很头疼的问题，一般用户都会提的比较大，这会造成很多资源浪费，这些资源并没有被真实使用。我们针对这个问题做了两方面努力。首先，我们使用了Dtop，Dtop会实时收集所有容器的物理资源使用情况。

当然，物理资源不仅局限于CPU和内存，还有磁盘IO、网络IO等。统计完之后，我们会有一个流式作业把这些信息实时聚合。之后，用户可以在web界面上看到自己应用的资源使用情况，也可以查看单个容器的资源情况，或者整个队列的资源情况。

在数据的基础上，我们做了更进一步的实现——动态容器资源调整。首先，我们在Yarn上做了一些开发，因为社区最新版其实已经支持容器动态调整，也就是运行时。我们对这部分功能进行了改进，做了一个比较简单实用的版本。我们通过Dtop对数据进行实时处理，通过Resource预估器对所有应用信息进行实时聚合。如果用户提交一个作业，重启时，Resource预估器可以表明现在需要申请的资源数。在作业运行过程中，它也可以调整流式作业在不同时段，比如高峰期的资源分配。

在易用性层面，我们做了三件事情。首先，我们做了default队列，用户可以配置默认队列，之后提交作业时默认到该队列。其次，我们做了异常情况通知，当用户作业或者运行时出现问题，我们都可以通过内部通讯软件实时把信息反馈给用户。我们重新设计了Yarn UI，聚合了全球所有集群label、job等信息，用户可以非常方便的通过一个入口查看所有信息。最后，Troubleshooting支持在易用性里也是一个非常重要的点。由于每天的作业量很大，作业运行失败的情况时有发生，我们需要快速定位并解决问题。

首先，我介绍一下Btrace工具。该工具主要为了应用源追踪。比如，我在K8S里起一个在线服务，这在特定场景下会提交一个Hive的SQL语句，该语句又会被翻译成MapReduce的job提交到Yarn之上，Yarn上的MapReduce的job又会访问HDFS服务，访问HDFS服务很可能会把离线带宽打满，此时，通过Btrace工具，我们可以在HDFS中快速定位访问用户的信息。

接下来是WebShell 工具，该工具主要是为了快速进入容器运行时环境。在原生Yarn容器界面，我们加了一个按钮叫WebShell，用户点击该按钮就会打开一个浏览器页面，该页面显示容器的本地运行环境。这样，用户就可以快速在该环境中检查本地文件信息状态是否正常。

关于Troubleshooting，还有两件事情，其一是Reservation可视化，可以让队列非常清楚是否因为Reservation而导致资源不足;其二是History Server ，因为Yarn原生History Server 受限于ZK中Znode的大小，一般可存最近的一万个作业，这对于我们集群而言是远远不够的。为了解决该问题，我们把作业信息实时拉到外部存储，我们能够为用户提供七天的历史作业查看情况。

除此之外，我们还开发了一些非常有意思的工具，比如Truman。Truman的目标是使用真实的RM，在其它机器上虚构出NM和应用，并且这些NM跟应用表现的与真实环境一样，只是资源使用非常少，甚至基本不占用资源。这样，我们就可以较低成本测试RM的性能。另一个工具是ClusterManager，可中心化服务管理节点上声明的计算资源和label信息，该功能在社区有实现，但会把权力下放给Node Manager。

另一个是LogIndexService，可以实时抓取用户作业的容器log，并传递到Kafka和ES，最后通过Kibana页面展示。我们的运维平台工具叫YAOP，这是一个全球多机房统一运维管理平台，负责管理所有用户的job、队列、label和节点信息。

4、Future Works

未来，我们需要做两件事情。一是Federation机制，我们需要通过该机制对多个同一IDC 集群进行联合，为用户提供统一视图，并提高跨集群资源利用率;二是Docker on yarn ，为了更好地实现一台物理机之内的资源隔离。

来自 “ ITPUB博客 ” ，链接：http://blog.itpub.net/31545816/viewspace-2221199/，如需转载，请注明出处，否则将追究法律责任。

转载于:http://blog.itpub.net/31545816/viewspace-2221199/

guava loadingCache代码示例 IM 胡鹏飞 Java 工具类介绍
publicclassTest2{publicstaticvoidmain(String[]args)throwsException{LoadingCachecache=CacheBuilder.newBuilder()//设置并发级别为8，并发级别是指可以同时写缓存的线程数.concurrencyLevel(8)//设置缓存容器的初始容量为10.initialCapacity(10)//设置缓存
系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
什么是证书吊销列表？CRL 解释 WoTrusSSL ssl https
数字证书是安全在线互动的支柱，用于验证身份和确保加密通信。但是，当这些证书被盗用或滥用时，必须立即撤销它们以维持信任。这就是证书撤销列表(CRL)的作用所在。CRL由证书颁发机构(CA)维护，对于识别和撤销已撤销的证书，防止其造成危害至关重要。在本指南中，我们将探讨什么是CRL、它们如何运作以及为什么它们对网络安全至关重要。什么是证书吊销列表(CRL)？证书吊销列表(CRL)是证书颁发机构(CA)
有必要获得WHQL测试认证吗，有什么好处？
什么是WHQL认证？WHQL是MicrosoftWindowsHardwareQualityLab的缩写，中文意思是Windows硬件设备质量实验室，主要是对Windows操作系统的兼容性测试，检验硬件产品和驱动程序在windows系统下的兼容性和稳定性。当某一硬件或软件通过WHQL测试时，制造商可以在其产品包装和广告上使用“DesignedforWindows”标志。该标志可以证明硬件或软件已经
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
驱动程序为什么要做 WHQL 认证? GDCA SSL证书网络协议网络
驱动程序进行WHQL（WindowsHardwareQualityLabs）认证的核心价值在于解决兼容性、安全性和市场准入三大关键问题，具体必要性如下：️‌一、规避系统拦截，保障驱动可用性‌消除安装警告‌未认证的驱动在安装时会触发Windows的‌红色安全警告‌（如“无法验证发布者”），甚至被系统强制拦截。通过WHQL认证的驱动获得微软数字签名，用户可无阻安装‌。满足系统强制要求‌Windows1
求是网：“内卷式”竞争的突出表现和主要危害有哪些？加百力财经研究科技知识人工智能大数据
"内卷式"竞争主要表现为：企业层面的低价竞争、同质化竞争和营销"逐底竞争"；地方政府层面的违规优惠政策、盲目重复建设和设置市场壁垒。危害体现在三个层面：微观上导致"劣币驱逐良币"，损害消费者利益；中观上破坏行业生态，挤压产业链利润空间；宏观上扭曲资源配置，抑制创新活力。什么是“内卷式”竞争？概括其一般特征，是指经济主体为了维持市场地位或争夺有限市场，不断投入大量精力和资源，却没有带来整体收益增长的
WHQL签名怎么申请 GDCA SSL证书 windows
WHQL（WindowsHardwareQualityLabs）签名是微软对硬件和驱动程序进行认证的一种方式，以确保它们与Windows操作系统的兼容性和稳定性。以下是申请WHQL签名的基本步骤，供您参考：1.准备阶段准备硬件设备和驱动程序：确保您的硬件设备已经准备好，并且对应的驱动程序已经经过充分的测试，能够在各种配置和环境下正常工作。获取EV代码签名证书：根据微软的要求，驱动程序进行WHQL认
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
发票合并工具小朋的软件园前端 javascript java html 服务器
"发票合并工具"是一款专为高效整理票据设计的实用工具，支持将来自不同渠道的发票文件（如PDF文档、各类图片格式）快速整合为排版规范的PDF文件，尤其适用于财务报销场景下的批量票据处理需求。核心功能亮点多格式兼容：无缝导入PDF文件及常见图片格式（.png/.jpg/.jpeg/.bmp），适配多来源发票整合需求。智能布局配置：提供灵活的页面布局选项（每页2/3/4张发票），其中"2合1"模式针对报
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
k8s:安装 Helm 私有仓库ChartMuseum、helm-push插件并上传、安装Zookeeper 云游 docker helm helm-push
ChartMuseum是Kubernetes生态中用于存储、管理和发布HelmCharts的开源系统，主要用于扩展Helm包管理器的功能核心功能‌集中存储‌：提供中央化仓库存储Charts，支持版本管理和权限控制。‌‌跨集群部署‌：支持多集群环境下共享Charts，简化部署流程。‌‌离线部署‌：适配无网络环境，可将Charts存储在本地或局域网内。‌‌HTTP接口‌：通过HTTP协议提供服务，用户
上位机知识篇---SD卡&U盘镜像
常用的镜像烧录软件balenaEtcherbalenaEtcher是一个开源的、跨平台的工具，用于将操作系统镜像文件（如ISO和IMG文件）烧录到SD卡和USB驱动器中。以下是其使用方法、使用场景和使用注意事项的介绍：使用方法下载安装：根据自己的操作系统，从官方网站下载对应的安装包。Windows系统下载.exe文件后双击安装；Linux系统若下载的是.deb文件，可在终端执行“sudodpkg-
【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
LeetCode 148. 排序链表：归并排序的细节解析进击的小白菜 2025 Top100 详解 leetcode 链表算法
文章目录题目描述一、方法思路：归并排序的核心步骤二、关键实现细节：快慢指针分割链表1.快慢指针的初始化问题2.为什么选择`fast=head.next`？示例1：链表长度为偶数（`1->2->3->4`）三、完整代码实现四、复杂度分析五、总结题目描述LeetCode148题要求对链表进行排序，时间复杂度需为O(nlogn)，且空间复杂度为O(logn)。由于链表的特殊结构（无法随机访问），归并排序
前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&

李亚坤：Hadoop YARN在字节跳动的实践

你可能感兴趣的:(李亚坤：Hadoop YARN在字节跳动的实践)