student_lp

yarn详解

1. Yarn简介

1.1. Yarn的由来

对于业界的大数据存储及分布式处理系统来说，hadoop是耳熟能详的卓越开源分布式存储及处理框架，在hadoop原MapReduce架构如下：

从上图我们可以清楚的看出原MapReduce程序的流程以及设计思路：

首先用户程序（JobClinet）提交一个job，job的信息会发送到jobTracker中，JobTracker是Map-Reduce框架的中心，他需要与集群中的机器定时通讯（hearbeat），需要管理那些程序应该跑在那些机器上，需要管理所有job失败、重启等操作。
TaskTracker是Map-Reduce集群中每台机器都有的一个部分，他做的事情主要是监视自己所在机器的资源情况。
TaskTracker同时监控当前机器的tasks运行情况。TaskTracker需要把这些信息通过hearbeat发送给JobTracker，JobTracker会搜集这些信息已给新提交的job分配运行在那些机器上。

可以看出原来的MapReduce架构是简单明了的，在最初推出的几年，也得到了众多的成功案例，或的业界广泛的支持和肯定，但是随着分布式系统集群的规模和其他工作负荷的增长，原框架的问题逐渐浮出水面，主要的问题集中如下：

JobTracker是Map-Reduce的集中处理点，存在单点故障。
JobTracker完成了太多的任务（资源调度、任务分配跟踪、异常处理），造成了过多的额资源消耗，当Map-Reduce job非常多的时候，会造成很大的内存开销，潜在来说，也增加了jobTracker fail的风险，这也是业界普遍总结出老hadoop的Map-Reduce只能支持4000节点主机的上限。
在taskTracker端，以Map/reduce task的数据作为资源的表示过于简单，没有考虑到CPU/MEM的占用情况，如果两个大内存消耗的task被调度到了一块，很容易出现OOM。
在TaskTracker端，把资源强制划分为map task slot和reduce task slot，如果当系统中只有map task或者只有reduce task的时候，会变成资源的浪费，也就是前面提过的集群资源利用的问题。
源代码层面分析的时候，会发现代码非常的困难，常常因为一个class做了太多的事情，代码量达到3000多行，造成class的任务不清晰，增加bug修复和版本维护的难度。
从操作的角度来看，现在的hadoop MapReduce框架在有任何重要的或者不重要的变化（例如bug修复，性能提升和特性化）时，都会强制进行系统级别的升级更新。更糟糕的是，他不管用户的喜好，强制让分布式集群系统的每个用户端同时更新。这些更新会让用户为了验证他们之前的应用程序是不是适合新的hadoop版本而浪费大量时间。

1.2. Yarn框架原理及运作机制

从业界使用分布式系统的变化趋势和hadoop框架的长远发展来看，MapReduce的jobTracker/TaskTracker机制需要大规模的调整来修复它在扩展性，内存消耗，线程模型，可靠性和性能上的缺陷。在过去的几年中，hadoop开发团队做了一些bug的修复，但是最近这些修复的成本越来越高，这表明对原框架作出改变的难度越来越大。

为从根本上解决旧MapReduce框架的性能瓶颈，促进Hadoop框架的更长远发展，从0.23.0版本开始，Hadoop的MapReduce框架完全重构，发生了根本的变化。新的Hadoop MapReduce框架命名为MapReduce V2或者叫Yarn，其框架如下图所示：

重构根本的思想是将JobTracker两个主要的功能分离成单独的组件，这两个功能是资源管理和任务调度/监控。新的资源管理器全局管理所有应用程序计算资源的分配，每一个应用的ApplicationMaster负责相应的调度和协调。一个应用程序无非是一个单独的传统的MapReduce任务或者是一个DAG（有向无环图）任务。ResourceManager和每一台机器的节点管理服务器都能够管理用户在那台机器上的进程并对计算进行组织。

事实上，每一个应用的ApplicationMaster是一个详细的框架库，它结合从ResourceManager获得的资源和NodeManager协同工作来运行和监控任务。

上图中ResourceManager支持分层级的应用队列，这些队列分享有集群一定比例的资源。从某种意义上讲他就是一个纯粹的调度器，他在执行过程中不对应用进行监控和状态跟踪。同样，他也不能重启因应用失败或者硬件错误而运行失败的任务。

ResourceManager是基于应用程序对资源的需求进行调度的；每一个应用程序需要不同类型的资源，因此就需要不同的容器。资源包括：MEM、CPU、disk、网络等等。可以看出，这同现MapReduce固定类型的资源使用模型有显著的却别，他给集群的使用带来负面的影响。资源管理器提供一个调度策略的插件，他负责将集群资源分配给多个队列和应用程序。调度插件key8i基于现有的能力调度和公平调度模型。

上图中NodeManager是每一台机器框架的代理，是执行应用程序的容器，监控应用程序的资源使用情况（CPU、MEM、DISK、网络）并向调度器汇报。

每一个应用的ApplicationMaster的职责有：向调度器索要适当的资源容器，运行任务，跟踪应用程序的状态和监控他们的进程，处理任务的失败原因。

1.3. 新旧Hadoop MapReduce框架对比

让我们来对新旧MapReduce框架做详细的分析和对比，可以看到有以下几个显著变化：

首先客户端不变，其调用API及接口大部分保持兼容，这也是为了对开发者透明化，使其不必对原有代码做大的改变，但是原框架中核心的JobTracker和TaskTracker不见了，取而代之的是ResourceManager、ApplicationMaster与NodeManager三部分。

我们来详细解释这三部分，首先ResourceManager是一个中心的服务，它做的事情是调度、启动每一个Job所属的ApplicationMaster、另外监控ApplicationMaster的存在情况。Job里面所在的task的监控、启动等等内容不见了。这就是AppMst存在的原因。ResourceManager负责作业与资源的调度。接收JobSubmitter提交的作业，按照作业的上下文信息，以及从NodeManager收集来的状态信息，启动调度过程，分配一个Container作为App Mstr。

NodeManager功能比较专一，就是负责Container状态的维护，并向RM保持心跳。

ApplicationMaster负责一个Job生命周期内的所有工作，类似老的框架中jobTracker。但注意每一个Job都有一个ApplicationMaster，他可以运行在ResourceManager以外的机器上。

Yarn框架相对于老的MapReduce框架生命优势呢？我们可以看到：

这个设计大大减少了JobTracker的资源消耗，并且让检测每一个Job子任务状态的程序分布式化了，更安全、更优美。
在新的Yarn中，ApplicationMaster是一个可变的部分，用户可以对不同的变成模型写自己的AppMst，让更多类型的编程模型能够跑在Hadoop集群中，可以参考Hadoop Yarn官方配置模板中的mapred-site.xml配置。
对于资源的表示以内存为单位（在目前版本的yarn中，没有考虑cpu的占用），比之前所剩余slot数据更合理。
老的框架中，jobTracker一个很大的负担就是监控job下的tasks的运行状况，现在这个部分就扔给applicationMaster做了，而ResourceManager中有一个模板叫做ApplicationsMasters(注意不是ApplicationMaster)，它是检测ApplicationMaster的运行状况，如果出问题，会将其在其他机器上启动。
Container是yarn为了将来作资源隔离而提出的一个框架。这一点应该借鉴了mesos的工作，目前是一个框架，仅仅提供java虚拟机内存的隔离，Hadoop团队的设计思路应该后续能支持更多的资源调度和控制，既然资源表示成内存量，那就没有了之前的map slot/reduce slot分开造成集群资源闲置的尴尬情况。

2. Yarn组成详解

2.1. ResourceManager（RM）

RM是一个全局的资源管理器，负责整个系统的资源管理和分配。它主要有两个组件构成：调度器（Scheduler）和应用程序管理器（Applications Manager，ASM）。

1、调度器（Scheduler）

调度器根据容量、队列等限制条件（如每个队列分配一定的资源，最多执行一定数量的作业等），将系统中的资源分配给各个正在运行的应用程序。需要注意的是，该调度器是一个“纯调度器”，它不再从事任何与具体应用程序相关的工作，比如不负责监控或者跟踪应用的执行状态等，也不负责重新启动因应用执行失败或者硬件故障而产生的失败任务，这些均交由应用程序相关的ApplicationMaster完成。调度器仅根据各个应用程序的资源需求进行资源分配，而资源分配单位用一个抽象概念“资源容器”（Resource Container，简称Container）表示，Container是一个动态资源分配单位，它将内存、cpu、磁盘、网络等资源封装在一起，从而限定每个任务使用的资源量。此外，该调度器是一个可插拔的组件，用户可根据自己的需求设计新的资源量。此外，调度器是一个可插拔的组件，用户可以根据自己的需要设计新的调度器，yarn提供了多种直接可用的调度器，比如Fair Scheduler和Capacity Scheduler等。

2、应用程序管理器（Applications Manager）

应用程序管理器负责管理整个系统中所有应用程序，包括应用程序提交、与调度器协商资源已启动ApplicationMaster、监控ApplicationMaster运行状态并在失败时重新启动它等。

2.2. ApplicationMaster（AM）

用户提交的每个应用程序均包含一个AM，主要功能包括：

与RM调度器协商以获取资源（用Container表示）；
将得到的任务进一步分配给内部的任务；
与NM通讯以启动/停止任务；
监控所有任务运行状态，并在任务运行失败的时候重新为任务申请资源以重启任务。

当前yarn自带了两个AM实现，一个用户演示AM编写方法的实例程序distributedshell，他可以申请一定数目的container以并运行一个shell命令或者shell脚本；另一个是运行MapReduce应用程序的AM—MRAppMaster。此外，一些其他的计算框架对应的AM正在开发中，比如open MPI、Spark等。

2.3. NodeManager（NM）

NM是每个节点上的资源和任务管理器，一方面，它会定时的向RM汇报本节点上的资源使用情况和各个container的运行状态；另一个方面，他接受并处理来自AM的container启动/停止各种请求。

2.4. Container

Container是yarn中的资源抽象，他封装了某个节点上的多维度资源，如内存、CPU、磁盘、网络等，当AM向RM申请资源时，RM为AM返回的资源便是Container表示的。Yarn会为每个任务分配一个Container，且该任务只能使用该Container中描述的资源。需要注意的是，Container不同与MRv1中的slot，他是一个动态资源划分单位，是根据应用程序的需求动态生成的。到目前为止，yarn仅支持CPU和内存两种资源，且使用了轻量级资源隔离机制Cgroups进行资源隔离。

3. Yarn运行流程

1、 MR JobClient向resourceManager（AsM）提交一个job；

2、 AsM向Scheduler请求一个供MR AM运行的container，然后启动它

3、MR AM启动起来后向AsM注册

4、MR JobClient向AsM获取到MR AM相关的信息，然后直接与MR AM进行通讯

5、MR AM计算splits并未所有的map构造资源请求

6、MR AM做一些必要的MR OutPutCommiter的准备工作

7、MR AM向RM(Scheduler)发起资源请求，得到一组供MAP/Reduce task运行的container，然后与NM一起对每一个container执行一些必要的任务，包括资源本地化等。

8、MR AM监视运行着的task知道完成，当task失败时，申请新的container运行失败的task

9、当每一个map/reduce task完成后，MR AM运行MR OutPutCommiter的clean up代码，也就是进行一些收尾工作。

10、当所有的map/reduce完成后，MR AM运行OutPutCommitter的必要的job commit或者abort APIs.

11、MR AM退出。

4. Yarn对资源的调度和隔离

Yarn同时支持MEM和CPU两种资源的调度（默认仅支持内存，如果想进一步调度CPU需要自己进行一些配置）。在yarn中，资源管理由ResourceManager和nodeManager共同完成，其中ResourceManager中的调度器负责资源的分配，而NodeManager负责资源的供给和隔离。ResourceManager将某个NodeManager上资源分配给任务（这就是所谓的“资源调度”）后，NodeManager需按照要求为任务提供相应的资源，甚至保证这些资源应具有独占性，为任务运行提供基础的保证，这就是资源隔离。

在正式介绍具体的资源调度和隔离之前，先品味一下内存和CPU这两种资源的特殊点，这是两种性质不同的资源。内存资源的多少会决定任务的生死，如果内存不够，任务可能会运行失败；相比之下，CPU资源则不同，他只会决定任务运行的快慢，不会对生死产生影响。

4.1. Yarn对内存资源的调度和隔离

基于以上考虑，yarn允许用户配置节点上可用的物理内存资源，注意，这里是“可用的”，因为一个节点上的内存会被若干个服务共享，比如一部分给yarn，一部分给HDFS，一部分给hbase等，yarn配置的只是自己可以使用的，配置参数如下：

1、 yarn.nodemanager.resource.memory-mb

表示该节点上yarn可使用的物理内存总量，默认是8G,注意如果你的节点内存不够8G，则需要调小这个值，而yarn不能只能的探测节点的物理内存总量；

2、 yarn.nodemanager.resource.vmem-pmem-ratio

任务每使用1MB物理内存，最多可使用虚拟内存量，默认是2.1

3、yarn.nodemanager.pmem-check-enabled

是否启动一个线程检查么个任务正在使用的物理内存量，如果任务超出分配值，则直接将其杀死，默认为true。

4、yarn.nodemanager.vmem-check-enabled

是否启动一个线程检查每个任务正使用的虚拟内存量，如果任务超出分配值，则直接将其杀死，默认为true。

5、 yarn.scheduler.minimum-allocation-mb

单个任务可申请的最小物理内存量，默认是1024M，如果一个任务申请的物理内存量少于该值，则对应的值改为这个数。

6、yarn.scheduler.maximum-allocation-mb

单个任务可申请的最多物理内存量，默认是8G。

默认情况下，yarn采用了线程监控的方法判断任务是否超量使用内存，一旦发现超量，则直接将其杀死。由于Cgroups对内存的判断缺乏灵活性（即任务任何时刻不能超过内存上限，如果超过，则直接将其杀死或者报OOM），而java进程在创建瞬间内存翻倍，之后骤降到正常值，这种情况下，采用线程监控的方式更加灵活（当发现进程树内存瞬间翻倍超过设定值时，可以认为是正常现象，不会将任务杀死），因此yarn未采用Cgroups内存隔离机制。

4.2. Yarn对CPU资源的调度和隔离

在yarn中，CPU资源的额组织方式仍然在探索中，目前只是一个初步的，非常粗粒度的实现方式，更细粒度的CPU划分方式已经提出来了，正在完善和实现中。

目前CPU被划分为虚拟CPU（CPU virtual core），这里的虚拟CPU是yarn自己引入的概念，初衷是，考虑到不同节点的CPU性能可能不同，么个CPU具有的计算能力也不是一样的，比如某个物理CPU的计算能力可能是另外一个物理CPU的2倍，这时候，你可以通过一个物理CPU多配置几个虚拟CPU弥补这种差异。用户提交作业时，可以指定每个任务所需要的CPU个数。在yarn中，CPU相关的配置参数如下：

1、yarn.nodemanager.resource.cpu-vcores

表示该节点上yarn可以使用的虚拟CPU个数，默认是8。注意，目前推荐将该值设置为物理CPU核数相同。如果你的节点CPU核数不够8个，则需要调减小这个值，而yarn不会智能探测节点的物理CPU总数。

2、yarn.scheduler.minimum-allocation-vcores

单个任务可申请的最小虚拟CPU个数，默认是1。如果一个任务申请的CPU个数少于该数值，则该对应的值改为这个数。

3、 yarn.scheduler.maximum-allocation-vcores

单个任务可申请的最多虚拟CPU个数，默认值是32。

默认情况下，yarn是不会对CPU资源进行调度的，需要你配置相应的资源调度器让你支持。默认情况下，NodeManager不会对CPU资源进行任何隔离，你可以通过启动Cgroups让你支持CPU隔离。

由于CPU资源的独特性，目前这种CPU分配方式仍然是粗粒度的。举个例子，很多任务可能是IO秘籍行的，消耗的CPU资源非常少，比如此时你为它分配一个CPU，则是一种严重浪费，你完全可以让它与其他几个任务公用一个CPU，也就是说，我们需要支持更细粒度的CPU表达方式。

5. Hadoop权限管理

5.1. 简介

Hadoop权限管理包括以下几个模块：①用户分组管理。用户按组为单位组织管理，某个用户只能向固定分组中提交作业，只能使用固定分组中配置的资源；同时可以限制每个用户提交的作业数，使用的资源量等；②作业管理。包括作业提交权限控制，作业运行状态查看权限控制等。如：可以限定提交作业的用户；可限定可查看作业运行状态的用户；可限定普通用户只能修改自作业优先级，kill自己的作业；高级用户可以控制所有作业等。

想要支持权限管理需要使用fair scheduler或者capacity scheduler（作业管理需要用到ACL(access control list)功能，启用该功能需要选择一个支持多队列管理的调度器）

5.2. 基本属于

用户（user）：hadoop使用linux用户管理，hadoop中的用户就是linux中的用户；
分组（group）：hadoop使用linux分组管理，hadoop中的分组就是linux中的分组；
池（pool）：hadoop fair scheduler中的概念，一个pool可以是一个user，一个group或者一个queue；
队列（queue）：队列是hadoop提出的概念，一个queue可以有任意几个group或者几个user组成。

5.3. Fair Scheduler

Facebook开发的适合共享环境的调度器，支持多用户分组管理，么个分组可以配置资源量，也可限制每个用户和每个分组中的并发运行作业数量；每个作业的作业有优先级，优先级越高分配的资源越多。

5.4. Capacity Scheduler

Yahoo开发的适合共享环境的调度器，支持多用户多队列管理，每个队列可以配置资源量，也可限制每个用户和每个队列的并发运行作业数量，也可限制每个作业使用的内存量；每个用户的作业有优先级，在单个队列中，作业按照先来先服务（实际上是先按照优先级，优先级相同的再按照作业提交时间）的原则进行调度。

5.5. Fair Scheduler vs Capacity Scheduler

1、相同点

均支持多用户多队列，即：适用于多用户共享集群的使用环境
单个队列均支持优先级和FIFO调度方式
均支持资源共享，即摸个queue中的资源有剩余时，可以共享给其他缺资源的queue。

2、不同点

核心调度策略不同。计算能力调度器的调度策略是，先选择资源利用率低的queue，然后在queue中同事考虑FIFO和memory constraint因素；而公平调度器仅考虑公平，而公平是通过作业缺额体现的，调度器每次选择缺额最大的job。
内存约束。计算能力调度器调度job时会考虑作业的内存限制，为了满足某些特殊job的特殊内存需求，可能会为该job分配多个slot；而公平调度器对这种特殊的job无能为力，只能杀掉这种task。

3、功能上的不同

Fair Scheduler不允许配置每个user使用的slot数上限，但允许抢占资源；而capactiy Scheduler允许配置每个user使用的slot数上限，但暂时不支持资源抢占。

网安系列【3】之深入理解内容安全策略（CSP）缘友一世网络安全网络安全 web安全
文章目录一CSP(内容安全策略)二CSP基础：如何实现内容安全策略2.1主要实现方式2.2基本指令解析三简单到复杂：CSP策略示例3.1示例1：最基本的CSP策略3.2示例2：允许特定CDN资源3.3示例3：更复杂的策略四CSP进阶概念4.1非ce与哈希值4.2报告机制五CSP案例5.1案例1：防止XSS攻击5.2案例2：第三方集成5.3案例3：渐进式采用CSP六CSP的局限性七总结一CSP(内容
特斯拉：电动汽车与能源革命的先锋 Nate Hillick
本文还有配套的精品资源，点击获取简介：特斯拉公司以其创新的电动汽车技术、自动驾驶系统和可持续能源解决方案处于全球电动汽车行业的领导地位。公司的核心技术包括高效的锂离子电池技术、先进的电动机动力系统、Autopilot自动辅助驾驶系统、独特的车辆设计、以及提供家庭储能和太阳能解决方案的Powerwall和SolarRoof。特斯拉的超级充电网络进一步提高了电动汽车的便利性和实用性。这些技术和服务的结
简要介绍redis tornadoami AI 系统运维 redis 数据库缓存开源 ai 键值 insight
redis阅读原文建议阅读原文，始终查看最新文档版本，获得最佳阅读体验：《redis》什么是redisRedis（REmoteDIctionaryServer）是一个开源的、高性能的内存键值数据库，属于NoSQL数据库类别，由C语言编写。它支持网络访问、持久化存储及多种数据结构，广泛应用于缓存、消息队列等场景。以下是其核心特点的简要介绍：⚙️核心特性高性能内存存储数据主要存储在内存中，读写速度达1
【Security】操作系统安全 KAZIMIYA 小资料安全操作系统
【Security】操作系统安全一、主体与客体访问控制关注的对象要么是主体，要么是客体客体（objects）：客体是一个被动的实体。在操作系统中，客体可以是按照一定格式存储在一定记录介质上的数据信息（通常以文件系统格式存储数据），也可以是操作系统中的进程。图书是保护对象，那么他是客体。对一个客体的访问隐含着对其包含信息的访问。文件，IPC资源等就是客体，进程也可以是客体。主体（subjects）：
【Day 13-N24】 Python 的异常捕获、多重异常捕获、try-except 语句嵌套、使用finally代码块、自定义异常类、手动引发异常 DES 仿真实践家 14天Python入门学习笔记 python 开发语言
挑战14天学会Python，第13天学习笔记！加油！1.异常处理概述在Python编程中，异常处理是保证程序健壮性的重要机制。异常(Exception)是程序运行时发生的错误事件，会中断正常的程序流程。良好的异常处理能够：防止程序意外崩溃提供友好的错误提示实现错误恢复逻辑保证资源正确释放Python使用try-except语句结构来处理异常，其基本语法如下：try:#可能引发异常的代码except
建筑设备监控与调控双管齐下，楼宇自控达成建筑环境全方位智慧化管理 ctrlworks 楼宇自控楼宇自控系统厂家 ba系统厂商建筑管理系统厂家 ibms系统厂家能耗监测系统厂家康沃思物联
在数字化与智能化技术深度渗透的当下，建筑行业正经历从传统运维向智慧管理的深刻变革。建筑设备作为维持建筑正常运行的“神经与脉络”，其管理效率直接影响建筑的能耗水平、安全性能与用户体验。传统建筑管理中，设备监控与调控常处于割裂状态，难以实现资源的最优配置。而通过将设备监控与调控有机结合、双管齐下，正成为实现建筑环境全方位智慧化管理的关键路径，为建筑的可持续发展注入新动能。一、精准监控：构筑建筑设备管理
网络基础（3） Mr_Xuhhh 网络
网络基础（3）有关进程1）进程是人在系统中的代表，只要把数据给进程，人就相当于拿到了数据2）数据传输到主机不是目的，而是手段。到达主机内部，再交给主机内的进程才是目的上网的行为只有两种：1）从远端服务器获取数据2）本地数据，上传到远端服务器**网络通信的本质：**两个不同主机的进程在进行数据交互，也就是进程间通信，让不同的进程看到同一份资源这时候就会产生一个问题：在系统中，同时会存在非常多的进程，
Orange3机器学习建模和可视化分析数据预处理、特征工程、算法训练维度软件库测试工具开源软件电脑
各位数据挖掘爱好者们！今天给你们介绍一款超厉害的开源软件——Orange3。它就像一个神奇的工具箱，你只要通过拖放组件就能完成机器学习建模和可视化分析，软件下载地址安装包它支持数据预处理、特征工程、算法训练和评估整个流程，就像一个贴心的管家，把数据挖掘的事儿全给你安排得明明白白！它还内置了箱线图、决策树这些可视化工具，能直观地把数据分布和模型结构展示出来，就像给你开了个透视眼，让数据一目了然！这软
进程的同步与互斥幻想时刻的竹子 Linux linux
1.什么是进程同步在多道批处理系统中，多个进程是可以并发执行的，但由于系统的资源有限，进程的执行不是一贯到底的，而是走走停停，以不可预知的速度向前推进，这就是进程的「异步性」。那么，「进程的异步性会带来什么问题呢」？举个例子，如果有A、B两个进程分别负责读和写数据的操作，这两个线程是相互合作、相互依赖的。那么写数据应该发生在读数据之前。而实际上，由于异步性的存在，可能会发生先读后写的情况，而此时由
详细说说线程的同步和互斥牛马baby 多线程面试资料
面试资料大全｜各种技术资料-2000GJava中线程的同步（Synchronization）和互斥（MutualExclusion）这两个核心并发概念。它们是确保多线程程序正确性、避免竞态条件（RaceCondition）和维持数据一致性的基石。核心目标：协调多个线程对共享资源（变量、对象、文件、数据库连接等）的访问，防止它们同时进行可能导致数据损坏或逻辑错误的操作。1.互斥（MutualExcl
GO 语言学习之结构体唯独不开心 golang 学习 golang 开发语言
在Go语言中，结构体（struct）是一种用户自定义的数据类型，它可以包含多种不同类型的数据组合在一起。结构体为组织和管理相关数据提供了一种有效的方式，常用于表示现实世界中的对象或概念。如果你懂C/C++，那么这个数据结构理解起来挺容易的，只是形式上略有不同。结构体定义typestruct{...}type关键字：表示定义了一个新类型。struct关键字：表示新的类型是一个结构体类型结构体可以包含
同步（Synchronization）和互斥（Mutual Exclusion）关系 LS_learner 嵌入式嵌入式硬件
同步（Synchronization）和互斥（MutualExclusion）是多线程/多进程编程中两个核心概念，它们的核心区别如下：1.定义与目标同步协调多个线程/进程的执行顺序，确保它们按预期顺序访问共享资源或协作完成任务。目标：避免竞争条件（RaceCondition），保证程序逻辑正确性。示例：线程A写入数据后，线程B才能读取。互斥保护共享资源在同一时刻仅被一个线程/进程访问，防止数据损坏
Redis底层实现原理之订阅发布机制 Armyyyyy丶 Java第三方集成框架 #Redis相关 redis 数据库 spring boot 缓存
文章目录1.通知类型2.实现原理2.1Pub/Sub2.1.1基础知识点2.1.2频道和订阅者的存储通知原理2.1.3键空间通知2.1.4客户端消费2.1.5缺陷2.1.6总结2.2RedisStream2.2.1基础知识点2.2.2基础数据结构2.2.3消费者组管理2.2.4消息和消费者持久化2.2.5消息生产和消费2.2.6消费者拉取消息2.2.7消息分配2.2.8底层结构体3.使用示例3.1
使用 Python 编写一个简单的网页爬虫小张同学的解忧笔记 python 爬虫开发语言
在数据时代，信息是金子。而网络上蕴藏着海量的数据资源，掌握一门自动化获取数据的技术就尤为重要。今天我们将通过Python来编写一个简单的网页爬虫，从一个网页中提取我们想要的数据内容。一、什么是网页爬虫？网页爬虫（WebCrawler）是一种自动访问网站并抓取其页面内容的程序。它模拟浏览器的行为，访问网站并提取页面中的结构化数据，如文本、图片、链接等。二、准备工作我们需要安装以下Python库：pi
验证码(三)快速使用滑块验证码.
滑块验证码类似于滑动验证码，通常是将一个滑块从初始位置拖动到与背景图匹配的缺口位置，以验证用户的身份。优点视觉效果好：以图形化的方式呈现，更加直观和美观，给用户带来较好的视觉体验。安全性较强：通过对滑块的位置、拖动轨迹等进行精确检测和分析，能够有效防范自动化攻击，保障系统安全。缺点对网络要求较高：如果网络环境不佳，验证码图片可能加载缓慢，影响用户验证的速度和体验。可能被绕过：虽然安全性较高，但一些
YOLOv7 技术详解（Real-Time Dynamic Label Assignment + Model Scaling）要努力啊啊啊计算机视觉 YOLO 人工智能深度学习计算机视觉目标跟踪
✅YOLOv7技术详解（Real-TimeDynamicLabelAssignment+ModelScaling）一、前言YOLOv7是AlexeyBochkovskiy团队后续维护者提出的一种高性能目标检测模型，在YOLOv5基础上引入了多项结构优化和训练策略改进：✅模型集成（ModelIntegration）✅动态标签分配（ExtendAssigner）✅支持重参数化模块（ReparamBlo
YOLO 推理部署全方案」：一文掌握部署方式与性能对比！要努力啊啊啊计算机视觉 YOLO 目标跟踪计算机视觉目标检测人工智能
YOLO的推理部署方法全景指南YOLO系列模型经过训练后，通常需要部署到线上环境中进行推理（inference）。下面是常见的YOLO推理部署方式：1️⃣PyTorch原生部署使用原始PyTorch模型.pt文件直接调用model(input)进行推理✅优点：简单、灵活、易于调试❌缺点：推理速度较慢，不适合生产环境2️⃣ONNX导出+推理将YOLO模型导出为.onnx格式使用ONNXRuntime
FPGA实现JPEG编码器的完整项目指南
本文还有配套的精品资源，点击获取简介：JPEG编码是一种广泛使用的数字图像压缩技术，通过在FPGA上实现该编码器，可以为嵌入式系统提供高效的图像处理。FPGA的可编程逻辑单元使其成为实现JPEG编码的理想平台。实现过程包括颜色空间转换、分块、离散余弦变换（DCT）、量化和熵编码等关键步骤。此外，testbench仿真用于验证设计的功能和性能，而资源优化确保了设计的高效性和低功耗。该实现过程需要深入
Java 中的锁机制详解笑衬人心。 JAVA学习笔记 java 开发语言面试
Java中的锁机制是实现多线程并发控制的核心手段，用于保证临界资源在多线程访问时的安全性。锁的设计与实现主要依赖JDK提供的synchronized和java.util.concurrent.locks包。一、锁的分类总览分类维度锁类型实现层面Java内置锁（synchronized）JUC显式锁（ReentrantLock等）可重入性可重入锁/非可重入锁公平性公平锁/非公平锁读写粒度独占锁/共享
A systems-biology model of the tumor necrosis factor (TNF) interactions with TNF receptor 1 and 2 但她还是走了深度学习
Asystems-biologymodelofthetumornecrosisfactor(TNF)interactionswithTNFreceptor1and2摘要注意:聚集使肿瘤坏死因子受体能够刺激细胞内信号传导。模拟了可溶性配体诱导的肿瘤坏死因子受体1和肿瘤坏死因子受体2的聚集行为。方法:一个结构化的、基于规则的模型实现了配体无关的配体前结合装配域(PLAD)介导的未连接和连接的肿瘤坏死因
Kubernetes 资源调度中标签（Label）和选择器（Selector）深入理解 pengdott 云原生 kubernetes java 容器
目录前言：一、什么是标签（Label）二、什么是选择器（Selector）三、标签和选择器的应用四、最佳实践五、总结前言：在Kubernetes中，标签（Label）和选择器（Selector）是资源调度中非常重要的概念。它们帮助我们组织、分类和选择集群中的资源对象。通过标签和选择器，Kubernetes可以轻松地管理和调度Pods、服务（Services）以及其他资源对象。本文将深入探讨Kube
深入解析Linux分页机制：从虚拟内存到物理地址的魔法转换 pengdott 运维监控 linux 运维服务器
目录引言：为什么需要分页机制？一、分页机制基础概念1.1虚拟地址与物理地址1.2页与页框1.3为什么是4KB？二、多级页表结构2.1为什么需要多级页表？2.2x86_64的四级页表结构2.3页表项详解三、Linux分页实现机制3.1内核中的页表管理数据结构3.2地址转换过程3.3缺页异常处理四、高级话题与优化技术4.1大页（HugePage）支持4.2反向映射（ReverseMapping）4.3
5G URLLC网络中的时间敏感通信：破解工业控制场景的确定性传输困局 LCG元物联网 5G 网络
目录一、工业控制场景三大技术痛点痛点1：运动控制时延波动导致精度崩塌痛点2：极端场景可靠性雪崩痛点3：多租户资源争抢引发确定性失效二、核心方案：双时钟域同步+动态帧抢占✅技术原理1：亚微秒级双时钟域同步✅技术原理2：物理层动态帧抢占三、端到端实施路径步骤1：环境配置（Linux实时内核优化）步骤2：O-RANCU/DU拆分配置（TS代码片段）步骤3：验证指标与压力测试四、边界场景容灾方案场景1：毫
Verilog HDL基础语法1-1 酱酱酱酱酱 Verilog与FPGA fpga开发
一、语法特点及规则①Verilog采用模块化结构，数据类型和变量、基本运算符等基本语法，语法类型和C语言很相似。②每行只写一个声明语句或说明，每个VerilogHDL源文件中只能写一个顶层模块，也不能把一个顶层模块分成几部分写在几个源文件中。③源文件名字和文件内容有关，最好与顶层文件同名，命名时，第一个字符为字母或下划线。④源文件用层层缩进的格式来写。⑤变量名的大小写应自始至终保持一致。⑥对关键步
【置顶】【GESP】C++ 认证学习资源汇总 CoderCodingNo GESP c++学习开发语言
其余详见：【置顶】【GESP】C++认证学习资源汇总|OneCoder【置顶】【GESP】C++认证学习资源汇总|OneCoder本置顶将汇总本站发布的GESP认证考试相关资源，并进行了分类整理，不定期更新。https://www.coderli.com/gesp-resource-summary/考纲解析一级（考纲）考点知识讲解考试级别（1）了解计算机的基本构成（CPU，内存，I/O设备等），了
【GESP】C++四级考试大纲知识点梳理, (6) 递推算法 CoderCodingNo c++算法开发语言
GESPC++四级官方考试大纲中，共有11条考点，本文针对第6条考点进行分析介绍。（6）掌握递推算法基本思想、递推关系式的推导以及递推问题求解。四级其他考点回顾：【GESP】C++四级考试大纲知识点梳理,(1)指针【GESP】C++四级考试大纲知识点梳理,(2)结构体和二维数组【GESP】C++四级考试大纲知识点梳理,(3)模块化和函数【GESP】C++四级考试大纲知识点梳理,(4)变量和作用域【
【AI总结】Git vs GitHub vs GitLab：深度解析三者联系与核心区别荔枝吻 Java GitLab 人工智能 git github
目录1Git：版本控制的核心引擎1.1Git的核心架构与工作原理1.2Git的工作流程与区域划分1.3Git的核心能力2GitHubvsGitLab：云端双雄的差异化定位2.1核心定位与市场策略2.2技术架构深度对比2.2.1核心功能差异2.2.2AI能力演进路线（2025-2026）2.3工作流模型对比3三位一体的技术关系网3.1技术栈中的定位3.2互补与集成实践4如何选择：从场景出发的决策指南
蚁群算法原理与应用详解
本文还有配套的精品资源，点击获取简介：蚁群算法是一种基于蚂蚁寻找食物路径行为的优化算法，它能够有效解决包括旅行商问题、网络路由和多目标优化在内的复杂问题。该算法模拟蚂蚁释放信息素来找到最短路径的过程，通过模拟蚂蚁的行为，算法逐步优化选择路径。蚁群算法具有并行性和全局优化能力，但也面临早熟收敛和参数调整的挑战。它已成功应用于物流优化、通信网络、任务调度、机器学习、图像处理和生物医学等众多领域。1.蚁
MATLAB蚁群算法完整教程与代码实现 Emmamkq~~
本文还有配套的精品资源，点击获取简介：蚁群算法是一种模拟蚂蚁寻找食物路径行为的全局优化方法，具有强大的数值优化能力。本资源详细介绍了在MATLAB中实现蚁群算法的关键步骤，包括初始化、规则迭代、信息素更新和停止条件等，并通过实例代码展示了算法的实用应用。这为工程师和科研人员提供了一个学习和应用蚁群算法的平台，特别是在解决旅行商问题、网络路由、生产调度等优化问题方面。1.蚁群算法简介蚁群算法，灵感来
《明远智睿RK3506开发板：多核异构，赋能高可靠性工业应用新型形》 riveting 人工智能嵌入式硬件智能硬件 3506 LGA封装电力能源工业机器人
在工业4.0与物联网技术飞速发展的今天，嵌入式系统作为连接物理世界与数字世界的桥梁，其性能与可靠性直接关系到各类智能设备的运行效率与稳定性。明远智睿推出的RK3506开发板，凭借其独特的多核异构架构、卓越的能效比、丰富的外设资源以及强大的图形处理能力，正逐步成为电力、工业网关、HMI（人机界面）、商用显示器等领域高可靠性、高实时性应用场景的理想选择。多核异构，高效协同RK3506开发板采用了三核A
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方