岁月的眸

彻底搞明白YARN资源分配

本篇要解决的问题是：

Container是以什么形式运行的？是单独的JVM进程吗？
YARN的vcore和本机的CPU核数关系？
每个Container能够使用的物理内存和虚拟内存是多少？
一个NodeManager可以分配多少个Container？
一个Container可以分配的最小内存是多少？最大内存内存是多少？以及最小、最大的VCore是多少？
当将Spark程序部署在YARN上， AM与Driver的关系是什么？
Spark on YARN，一个Container可以运行几个executor？executor设置的内存和container的关系是什么？

YARN资源管理简述

分布式应用在YARN中的执行流程

这张图是YARN的经典任务执行流程图。可以发现上图中有5类角色：

Client
Resource Manager
Node Manager
Application Master
Container

先简单来梳理提交任务的流程。

要将应用程序（MapReduce/Spark/Flink）程序运行在YARN集群上，先得有一个用于将任务提交到作业的客户端，也就是client。它向Resource Manager（RM）发起请求，RM会为提交的作业生成一个JOB ID。此时，JOB的状态是：NEW
客户端继续将JOB的详细信息提交给RM，RM将作业的详细信息保存。此时，JOB的状态是：SUBMIT
RM继续将作业信息提交给scheduler（调度器），调度器会检查client的权限，并检查要运行Application Master（AM）对应的queue（默认：default queue）是否有足够的资源。此时，JOB的状态是ACCEPT。
接下来RM开始为要运行AM的Container资源，并在Container上启动AM。此时，JOB的状态是RUNNING
AM启动成功后，开始与RM协调，并向RM申请要运行程序的资源，并定期检查状态。
如果JOB按照预期完成。此时，JOB的状态为FINISHED。如果运行过程中出现故障，此时，JOB的状态为FAILED。如果客户端主动kill掉作业，此时，JOB的状态为KILLED。

YARN集群资源管理

集群总计资源

要想知道YARN集群上一共有多少资源很容易，我们通过YARN的web ui就可以直接查看到。

通过查看Cluster Metrics，可以看到总共的内存为24GB、虚拟CPU核为24个。我们也可以看到每个NodeManager的资源。很明显，YARN集群中总共能使用的内存就是每个NodeManager的可用内存加载一起，VCORE也是一样。

NodeManager总计资源

NodeManager的可用内存、可用CPU分别是8G、和8Core。这个资源和Linux系统是不一致的。我们通过free -g来查看下Linux操作系统的总计内存、和CPU核。

第一个节点（总计内存是10G，空闲的是8G）

[root@node1 hadoop]# free -h total used free shared buff/cache availableMem: 9.6G 1.6G 7.6G 12M 444M 7.8GSwap: 2.0G 0B 2.0G

第二个节点（总计内存是7G，空闲是不到6G）

[root@node2 hadoop]# free -h total used free shared buff/cache availableMem: 6.6G 700M 5.6G 12M 383M 5.7GSwap: 2.0G 0B 2.0G

第三个节点（和第二个节点一样）

[root@node3 logs]# free -h total used free shared buff/cache availableMem: 6.6G 698M 5.6G 12M 386M 5.7GSwap: 2.0G 0B 2.0G

这说明了，NodeManager的可用内存和操作系统总计内存是没有直接关系的！

那NodeManager的可用内存是如何确定的呢？

在yarn-default.xml中有一项配置为：yarn.nodemanager.resource.memory-mb，它的默认值为：-1（hadoop 3.1.4）。我们来看下Hadoop官方解释：

Amount of physical memory, in MB, that can be allocated for containers. If set to -1 and yarn.nodemanager.resource.detect-hardware-capabilities is true, it is automatically calculated(in case of Windows and Linux). In other cases, the default is 8192MB.

这个配置是表示NodeManager总共能够使用的物理内存，这也是可以给container使用的物理内存。如果配置为-1，且yarn.nodemanager.resource.detect-hardware-capabilities配置为true，那么它会根据操作的物理内存自动计算。而yarn.nodemanager.resource.detect-hardware-capabilities默认为false，所以，此处默认NodeManager就是8G。这就是解释了为什么每个NM的可用内存是8G。

还有一个重要的配置：yarn.nodemanager.vmem-pmem-ratio，它的默认配置是2.1

Ratio between virtual memory to physical memory when setting memory limits for containers. Container allocations are expressed in terms of physical memory, and virtual memory usage is allowed to exceed this allocation by this ratio.

这个配置是针对NodeManager上的container，如果说某个Container的物理内存不足时，可以使用虚拟内存，能够使用的虚拟内存默认为物理内存的2.1倍。

针对虚拟CPU核数，也有一个配置yarn.nodemanager.resource.cpu-vcores配置，它的默认配置也为-1。看一下Hadoop官方的解释：

Number of vcores that can be allocated for containers. This is used by the RM scheduler when allocating resources for containers. This is not used to limit the number of CPUs used by YARN containers. If it is set to -1 and yarn.nodemanager.resource.detect-hardware-capabilities is true, it is automatically determined from the hardware in case of Windows and Linux. In other cases, number of vcores is 8 by default.

与内存类似，它也有一个默认值：就是8。

这就解释了为什么每个NodeManager的总计资源是8G和8个虚拟CPU核了。

scheduler调度资源

通过YARN的webui，点击scheduler，我们可以看到的调度策略、最小和最大资源分配。

通过web ui，我们可以看到当前YARN的调度策略为容量调度。调度资源的单位是基于MB的内存、和Vcore（虚拟CPU核）。最小的一次资源分配是：1024M（1G）和1个VCORE。最大的一次分配是：4096M（4G）和4个VCORE。注意：内存资源和VCORE都是以Container承载的。

我们来看一下yarn-default.xml的配置。

配置项	默认	说明
yarn.scheduler.minimum-allocation-mb	1024	该配置表示每个容器的最小分配。因为RM是使用scheduler来进行资源调度的，如果请求的资源小于1G，也会设置为1G。这表示，如果我们请求一个256M的container，也会分配1G。
yarn.scheduler.maximum-allocation-mb	8192	最大分配的内存，如果比这个内存高，就会抛出InvalidResourceRequestException异常。这里也就意味着，最大请求的内存不要超过8G。上述截图显示是4G，是因为我在yarn-site.xml中配置了最大分配4G。
yarn.scheduler.minimum-allocation-vcores	1	同内存的最小分配
yarn.scheduler.maximum-allocation-vcores	4	同内存的最大分配

Container总计资源

在YARN中，资源都是通过Container来进行调度的，程序也是运行在Container中。Container能够使用的最大资源，是由scheduler决定的。如果按照Hadoop默认配置，一个container最多能够申请8G的内存、4个虚拟核。例如：我们请求一个Container，内存为3G、VCORE为2，是OK的。考虑一个问题：如果当前NM机器上剩余可用内存不到3G，怎么办？此时，就会使用虚拟内存。不过，虚拟内存，最多为内存的2.1倍，如果物理内存 + 虚拟内存仍然不足3G，将会给container分配资源失败。

根据上述分析，如果我们申请的container内存为1G、1个VCORE。那么NodeManager最多可以运行8个Container。如果我们申请的container内存为4G、4个vcore，那么NodeManager最多可以运行2个Container。

Container是一个JVM进程吗

这个问题估计有很多天天在使用Hadoop的人都不一定知道。当向RM请求资源后，会在NodeManager上创建Container。问题是：Container是不是有自己独立运行的JVM进程呢？还是说，NodeManager上可以运行多个Container？Container和JVM的关系是什么？

此处，明确一下，每一个Container就是一个独立的JVM实例。（此处，咱们不讨论Uber模式）。每一个任务都是在Container中独立运行，例如：MapTask、ReduceTask。当scheduler调度时，它会根据任务运行需要来申请Container，而每个任务其实就是一个独立的JVM。

为了验证此观点，我们来跑一个MapReduce程序。然后我们在一个NodeManager上使用JPS查看一下进程：（这是我处理过的，不然太长了，我们主要是看一下内存使用量就可以了）

[root@node1 ~]# jps -v22560 YarnChild -Xmx820m 22667 YarnChild -Xmx820m[root@node2 hadoop]# jps -v10224 MRAppMaster -Xmx1024m[root@node3 logs]# jps -v10305 YarnChild -Xmx820m

我们看到了有MRAppMaster、YarnChild这样的一些Java进程。这就表示，每一个Container都是一个独立运行的JVM，它们彼此之间是独立的。

Spark on YARN资源管理

通常，生产环境中，我们是把Spark程序在YARN中执行。而Spark程序在YARN中运行有两种模式，一种是Cluster模式、一种是Client模式。这两种模式的关键区别就在于Spark的driver是运行在什么地方。如果运行模式是Cluster模式，Driver运行在Application Master里面的。如果是Client模式，Driver就运行在提交spark程序的地方。Spark Driver是需要不断与任务运行的Container交互的，所以运行Driver的client是必须在网络中可用的，知道应用程序结束。

这两幅图描述得很清楚。

留意一下Driver的位置。

通过上面的分析，我们可以明确，如果是Client模式，Driver和ApplicationMaster运行在不同的地方。ApplicationMaster运行在Container中，而Driver运行在提交任务的client所在的机器上。

因为如果是Standalone集群，整个资源管理、任务执行是由Master和Worker来完成的。而当运行在YARN的时候，就没有这两个概念了。资源管理遵循YARN的资源调度方式。之前在Standalone集群种类，一个worker上可以运行多个executor，现在对应的就是一个NodeManager上可以运行多个container，executor的数量跟container是一致的。可以直接把executor理解为container。

我们再来看看spark-submit的一些参数配置。

[root@c5836fa7593c /]# spark-submit --help
Usage: spark-submit [options] | python file | R file> [app arguments]
Usage: spark-submit --kill [submission ID] --master [spark://...]
Usage: spark-submit --status [submission ID] --master [spark://...]
Usage: spark-submit run-example [options] example-class [example args]

Options:
  --driver-memory MEM         Memory for driver (e.g. 1000M, 2G) (Default: 1024M).
  --executor-memory MEM       Memory per executor (e.g. 1000M, 2G) (Default: 1G).

 Cluster deploy mode only:
  --driver-cores NUM          Number of cores used by the driver, only in cluster mode
                              (Default: 1).

 Spark standalone and Mesos only:
  --total-executor-cores NUM  Total cores for all executors.

 Spark standalone and YARN only:
  --executor-cores NUM        Number of cores per executor. (Default: 1 in YARN mode,
                              or all available cores on the worker in standalone mode)

 YARN-only:
  --num-executors NUM         Number of executors to launch (Default: 2).
                              If dynamic allocation is enabled, the initial number of
                              executors will be at least NUM.

配置选项中，有一个是公共配置，还有一些针对spark-submit运行在不同的集群，参数是不一样的。

公共的配置：

–driver-memory、–executor-memory，这是我们可以指定spark driver以及executor运行所需的配置。executor其实就是指定container的内存，而driver如果是cluster模式，就是application master的内置，否则就是client运行的那台机器上申请的内存。

如果运行在Cluster模式，可以指定driver所需的cpu core。

如果运行在Spark Standalone，–total-executor-cores表示一共要运行多少个executor。

如果运行在Standalone集群或者YARN集群，–executor-cores表示每个executor所需的cpu core。

如果运行在yum上，–num-executors表示要启动多少个executor，其实就是要启动多少个container。

Flink on YARN资源管理

Flink在YARN上也有两种模式：一种是yarn-session、还有一个是yarn-per-job。

YARN session模式比较有意思，相当于在YARN集群中基于Container运行一套Flink集群。Container有JobManager角色、还有TaskManager角色。然后客户端可以不断地往这套运行在YARN上的Flink Cluster提交作业。

./yarn-session.sh -n 4 -s 8 -jm 3072 -tm 32768

上面这个命令表示，在YARN上分配4个Container，每个Container上运行TaskManager，每个TaskManager对应8个vcore，每个TaskManager 32个G。这就要求YARN上scheduler分配Container最大内存要很大，否则根本无法分配这么大的内存。这种模式比较适合做一些交互性地测试。

第二种模式yarn-per-job，相当于就是单个JOB提交的模式。同样，在YARN中也有JobManager和TaskManager的概念，只不过当前是针对一个JOB，启动则两个角色。JobManager运行在Application Master上，负责资源的申请。

flink run -m yarn-cluster -yn 2 -yjm 1024 -ytm 3072 -ys 3 -ynm yarn-cluster-1 -yqu root.default -c com.kn.rt.Test01 ~/jar/dw-1.0-SNAPSHOT.jar

上述命令表示，运行两个TaskManager（即2个Container），job manager所在的container是1G内存、Task Manager所在的Container是3G内存、每个TaskManager使用3个vcore。

总结

如果你认真看完了，很轻易地就能回答下面的问题：

Container是以什么形式运行的？是单独的JVM进程吗？

是的，每一个Container就是一个单独的JVM进程。

YARN的vcore和本机的CPU核数关系？

没关系。默认都是手动在yarn-default.xml中配置的，默认每个NodeManager是8个vcore，所有的NodeManager上的vcore加在一起就是整个YARN所有的vcore。

每个Container能够使用的物理内存和虚拟内存是多少？

scheduler分配给container多少内存就是最大能够使用的物理内存，但如果超出该物理内存，可以使用虚拟内存。虚拟内存默认是物理内存的2.1倍。

一个NodeManager可以分配多少个Container？

这个得看Container的内存大小和vcore数量。用NM上最大的可用Mem和Vcore相除就知道了。

一个Container可以分配的最小内存是多少？最大内存内存是多少？以及最小、最大的VCore是多少？

根据scheduler分配的最小/最大内存、最小/最大vcore来定。

当将Spark程序部署在YARN上， AM与Driver的关系是什么？

有两种模式，cluster模式，Driver就运行在AM上。如果是client模式，没关系。

Spark on YARN，一个Container可以运行几个executor？executor设置的内存和container的关系是什么？

一个container对应一个executor。executor设置的内存就是AM申请的container内存，如果container最小分配单位是1G，而executor设置的内置是512M，按照container最小单位分配。

不管开发Hive、Spark还是Flink，都必须会的YARN调度

目前，YARN调度几乎成为大数据平台资源管理的标配，不管你跑的是Hive、跑的是Spark或者是Flink，基本都会选择YARN。Hadoop默认是使用FIFO的方式，在一个Queue中进行调度，这种方式对于粗粒度的资源管控、或者是小规模用户来说可能适用，但对于规模稍微大一点的集群肯定是不可取的。大家可以去网上随便搜索YARN调度的教程，大家都在讲概念，例如：弹性资源、抢占。但能够真正带大家去测试一下的教程几乎没有。我所面试的候选人，面试10个有8个基本上这一块都是模棱两可，背概念可以，但一问生产环境的调配，基本上都说不上来。

所以，今天我手把手带大家来聊聊调度，并直接调参跑作业给大家演示两种调度器弹性扩展、资源抢占、优先级权重等。

FIFO调度
Capacity Scheduler
- 简介
- 容量调度配置文件
- root队列
- 配置更多的队列
- Queue Properties
- 应用程序优先级
- Capacity Scheduler容器抢占
- 需求及实现
FAIR Scheduler
- 简介
- 可插拔的分层队列
- 队列调度策略
- 自动分发作业到队列
- 配置使用Fair Scheduler
- 配置选项
- 需求及实现
对比两种资源调度策略

FIFO调度

FIFO（‘faifəu，不要念错啦！）代表的是First In First Out，即先进先出。Job Scheduler首先会从队列中找到最早提交的作业，不考虑优先级、以及资源的大小，按照FIFO顺序运行作业。

这种调度策略比较简单，但它有比较明显的缺点：调度大作业尚可，但如果集群中有一些小作业，响应时间会很差。另外，如果针对组织机构比较复杂的用户，这种方式对资源的控制粗狂型的，不利于更细粒度的资源管控。

基于此，我们要来聊一聊另外一种非常流行、使用广泛的Capacity Scheduler，即容量调度。

Capacity Scheduler

简介

YARN默认的调度器为 Capacity Scheduler，也就是容量调度器。可以通过yarn-default.xml中看到。

CapacityScheduler提供的主要抽象是队列。队列通常由管理员提前配置好。CapacityScheduler还支持分层队列，可以做更细粒度的资源划分。

Capacity Scheduler支持以下功能：

分层队列
- 允许在不同队列中共享计算资源
容量保证
- YARN的计算资源使用队列进行网格化，管理员可以为每个队列指定容量限制（支持软限制和硬限制）
安全访问
- 每个队列都有严格的ACL，以此来控制哪些用户可以提交应用到队列
- 可以做到不同的用户队列隔离，A用户是不能看到或者修改B用户的应用程序的
- 还可以为每个队列配置管理员
弹性扩展
- 如果某些队列超出其容量了，可以弹性地分配其他可用的资源给它们。而如果资源已经使用完了（例如：Spark程序执行完了），可以继续分配给其他容量不足的队列
多租户
- 提供完整的限制，避免某个应用程序把集群资源占满
维护方便
- 支持运行时配置：管理员可以在运行时更改队列配置（包括容量、ACL），注意，除非队列停止或者没有运行着的应用程序，否则无法在运行时删除队列
- 优雅停止调度：管理员可在运行时停止队列，可以确保当前的应用运行完毕后停止，期间不能提交新的应用程序。
- 基于资源的调度：支持资源密集型应用，应用程序可以指定比默认值更高的资源请求，适应不同资源要求的应用程序。
- 支持自定义队列映射规则：用户可以根据默认配置将作业映射到指定队列。例如：基于用户、或者基于组、或者应用程序的名称。当然，用户也可以自己来定义映射规则。
可配置优先级
- 可以以不同的优先级提交、调度作业。整数值越大，表示应用程序的优先级越高。目前，只有FIFO排序策略支持优先级。
绝对资源配置
- 可以为队列配置绝对资源，而不是配置百分比。
自动创建和管理Leaf Queue
- Queue Mapping当前支持基于用户-组Mapping Policy。

容量调度配置文件

# CapacityScheduler的配置文件为：
${HADOOP_HOME}/etc/hadoop/capacity-scheduler.xml

配置文件内容如下：



  
    yarn.scheduler.capacity.maximum-applications
    10000
    能够调度的最大应用程序数量(包含pending的running的应用)
  

  
    yarn.scheduler.capacity.maximum-am-resource-percent
    0.1
    AM最大能够使用的资源大小。为整个集群资源的百分比
  

  
    yarn.scheduler.capacity.resource-calculator
    org.apache.hadoop.yarn.util.resource.DefaultResourceCalculator
    资源计算器，DefaultResourceCalculator只基于内存进行资源计算
  

  
    yarn.scheduler.capacity.root.queues
    default
    配置root queue
  

  
    yarn.scheduler.capacity.root.default.capacity
    100
    配置Queue能够使用的容量(百分比)
  

  
    yarn.scheduler.capacity.root.default.user-limit-factor
    1
    队列的限制因子(0.0-1.0)
  

  
    yarn.scheduler.capacity.root.default.maximum-capacity
    100
    default queue的最大容量
  

  
    yarn.scheduler.capacity.root.default.state
    RUNNING
    队列的状态(要么是RUNNING、要么是STOPPED)
  

  
    yarn.scheduler.capacity.root.default.acl_submit_applications
    *
    default queue提交作业配置
  

  
    yarn.scheduler.capacity.root.default.acl_administer_queue
    *
    default queue管理员配置
  

  
    yarn.scheduler.capacity.root.default.acl_application_max_priority
    *
    提交带优先级作业配置
  

   
     yarn.scheduler.capacity.root.default.maximum-application-lifetime
     
     -1
     提交作业到queue的最大时间,-1或者0表示不启用。单位为秒，如果配置的是正数，超过这个数值JOB将会被kill掉。用户也可以在提交作业时指定lifetime。
   

   
     yarn.scheduler.capacity.root.default.default-application-lifetime
     
     -1
     默认lifetime
   

  
    yarn.scheduler.capacity.node-locality-delay
    40
    调度器会优先调度同一个机架上的资源。如果配置为-1，表示不进行延迟调度。此处配置为40，表示如果scheduler错过40次机会后尝试在其他机架上调度。
  

  
    yarn.scheduler.capacity.rack-locality-additional-delay
    -1
    机架额外的延迟调度等待。超过配置的数量，Scheduler将会尝试非统一交换机上的容器资源
  

  
    yarn.scheduler.capacity.queue-mappings
    
    队列映射，可以将某个用户提交的JOB映射到指定队列
  

  
    yarn.scheduler.capacity.queue-mappings-override.enable
    false
    如果指定了Queue Mapping，是否允许用户指定配置。
  

  
    yarn.scheduler.capacity.per-node-heartbeat.maximum-offswitch-assignments
    1
    增加该值可以提升OFF_SWICH容器的调度速度
  


  
    yarn.scheduler.capacity.application.fail-fast
    false
    如果之前应用程序的Queue不再有效，RM是否在恢复时失败

root队列

Capacity Scheduler有一个已经创建好的root队列。YARN中配置的所有队列都是root队列的子队列。

配置更多的队列

在yarn.scheduler.capacity.root.queues节点中可以配置更多的队列。


    yarn.scheduler.capacity.root.queues
    default

分层队列

Capacity Scheduler使用Queue Path来配置队列的层次结构。Queue Path是Queue层次结构的完整路径，从root开始，以.作为分隔符。例如：

yarn.scheduler.capacity..queues

看一个配置：


  yarn.scheduler.capacity.root.queues
  a,b,c



  yarn.scheduler.capacity.root.a.queues
  a1,a2



  yarn.scheduler.capacity.root.b.queues
  b1,b2,b3

注意

Leaf Queue名称必须唯一

更新Queue配置

当修改了capacity-scheduler.xml后，无需重启yarn集群，直接使用：

yarn rmadmin -refreshQueues

即可。

假设我们当前要添加以下几个Queue：

+-root
	|-default
	|-hive
		|-hive_dev
		|-hive_test
		|-hive_prod
    |-spark
        |-spark_dev
        |-spark_test
        |-spark_prod

修改capacity-scheduler.xml配置文件：


  yarn.scheduler.capacity.root.queues
  default,hive,spark



  yarn.scheduler.capacity.root.hive.queues
  hive_dev,hive_test,hive_prod



  yarn.scheduler.capacity.root.spark.queues
  spark_dev,spark_test,spark_prod

修改完配置后，执行

yarn rmadmin -refreshQueues

停止使用队列

假如某个队列已经不需要使用了，也可以删除它。但在删除队列之前，Leaf Queue中应该没有pending或者running的应用程序。然后修改以下配置：


  yarn.scheduler.capacity..state
  STOPPED

例如：我们想要删除 hive_test 和 spark_test 两个Leaf Queue。可以配置如下：


  yarn.scheduler.capacity.root.hive.hive_test.state
  STOPPED


  yarn.scheduler.capacity.root.spark.spark_test.state
  STOPPED

更新配置。

yarn rmadmin -refreshQueues

Queue Properties

Capacity Scheduler有很多的属性可以配置，默认的配置文件中也可以看到一些。但大体可以分为以下几类：

资源分配
使用绝对资源分配
运行和等待应用程序限制
Queue管理和权限控制
基于user-group、应用程序名称、用户自定义规则（UDR）方式的Queue Mapping
Queue应用程序Lifetime

资源分配

接下来，我们来试验配置下队列容量。



  yarn.scheduler.capacity.root.default.capacity
  20



  yarn.scheduler.capacity.root.default.maximum-capacity
  20



  yarn.scheduler.capacity.root.hive.capacity
  40



  yarn.scheduler.capacity.root.spark.capacity
  40





  yarn.scheduler.capacity.root.hive.hive_dev.capacity
  20



  yarn.scheduler.capacity.root.hive.hive_prod.capacity
  80



  yarn.scheduler.capacity.root.spark.spark_dev.capacity
  20



  yarn.scheduler.capacity.root.spark.spark_dev.maximum-allocation-mb
  8192



  yarn.scheduler.capacity.root.spark.spark_prod.capacity
  80



  yarn.scheduler.capacity.root.spark.spark_prod.maximum-allocation-mb
  8192

刷新YARN队列。

yarn rmadmin -refreshQueues

绝对资源分配


    yarn.scheduler.capacity..capacity
    memory = 10240,vcores = 12

    

    yarn.scheduler.capacity..max-capacity
    memory = 102400,vcores = 60

运行和等待应用程序限制

以下参数可以控制运行和等待的应用程序。

配置最大AM的资源占比为0.3：


 yarn.scheduler.capacity.maximum-am-resource-percent
 0.3




 yarn.scheduler.capacity.maximum-applications
 50000

注意

最大RUNNING和PENDING的应用数量也会按照队列容量占比划分，例如：
- 最大应用数量整体配置为1W
- default容量占比20%，那么default队列最大能够提交2000个应用
- spark和hive队列各占40%，那么最大能够提交4000个应用
- spark_dev和spark_prod各占20%和80%，所以dev队列能够提交800个，prod队列能够提交3200个

Queue管理和权限控制

配置ACL可以参考以下：

[user={name} group={name} max_priority={priority} default_priority={priority}]

如果配置为*，表示所有人都具备权限，配置为空格，表示所有人都无权限。

要配置YARN的资源管理，首先需要开启YARN的ACL，默认该配置是禁用的。


    yarn.acl.enable
    true





    yarn.scheduler.capacity.root.acl_submit_applications
     



    yarn.scheduler.capacity.root.acl_administer_queue
     




    yarn.scheduler.capacity.root.hive.acl_submit_applications
    *



    yarn.scheduler.capacity.root.hive.acl_administer_queue
    user=yarn,user=hive




    yarn.scheduler.capacity.root.spark.acl_submit_applications
    *



    yarn.scheduler.capacity.root.spark.acl_administer_queue
    user=yarn,user=spark

上述配置，配置了：

1. 所有人都提交提交hive、spark作业
2. hive queue由yarn、hive用户管理
3. spark queue由yarn、spark用户管理

注意

配置ACL时，如果value中配置为空格，表示任何人都不能往队列中提交应用
ACL是具备有继承性的

测试提交作业到指定queue

在提交作业时，可以指定Queue的名字。

-Dmapred.job.queue.name=hive_dev

执行下测试：

cd /opt/hadoop-3.2.1/share/hadoop/mapreduce; \
yarn jar hadoop-mapreduce-examples-3.2.1.jar pi -Dmapred.job.queue.name=hive_dev 3 1

尝试用spark用户去kill hdfs用户提交的mr作业，将会报错如下：

yarn app -kill application_1613715844272_0005

Caused by: java.security.AccessControlException: User spark cannot perform operation MODIFY_APP on application_1613715844272_0005

Queue Mapping

前面，我们在执行YARN提交作业时，通过-Dmapred.job.queue.name=hive_dev指定将作业提交到指定队列。但每次提交都手动指定很麻烦，而通过Queue Mapping可以实现根据用户、组、应用程序名称自动映射到Queue上，用户还可以自己来定义映射规则。

配置以下映射：

配置以下参数：



    yarn.scheduler.capacity.queue-mappings
    u:hive:hive_dev,u:spark:spark_dev,u:yarn:hive_dev,u:%user:default

重新提交作业：

cd /opt/hadoop-3.2.1/share/hadoop/mapreduce; \
yarn jar hadoop-mapreduce-examples-3.2.1.jar pi 3 1

Queue应用程序Life time

应用程序优先级

当前YARN的应用程序优先级仅支持FIFO。提交的应用程序默认为cluster级别和queue级别。

Cluster优先级

一个应用如果提交的优先级如果高于Cluster的最大优先级会被自动设置为最大优先级。通过yarn-site.xml可以指定集群应用的最大优先级。


    yarn.cluster.max-application-priority
    0

Queue优先级

管理员可以给Leaf Queue指定默认优先级。这样，提交到该队列的应用都会被指定一个优先级。可以通过capacity-scheduler.xml来配置优先级：


    yarn.scheduler.capacity.root..default-application-priority
    -10

检查FifoOrderingPolicy实现

FifoOrderingPolicy实现代码：

public FifoOrderingPolicy() {
    List> comparators =
        new ArrayList>();
    // 优先级比较器
    comparators.add(new PriorityComparator());
    // 按进入到Queue的向后顺序比较
    comparators.add(new FifoComparator());
    this.comparator = new CompoundComparator(comparators);
    this.schedulableEntities = new ConcurrentSkipListSet(comparator);
  }

优先级比较器实现：

@Override public int compare(SchedulableEntity se1, SchedulableEntity se2) { Priority p1 = se1.getPriority(); Priority p2 = se2.getPriority(); if (p1 == null && p2 == null) { return 0; } else if (p1 == null) { return -1; } else if (p2 == null) { return 1; } return p1.compareTo(p2); } }

Fifo比较器实现：

@Override public int compareInputOrderTo(SchedulableEntity other) { if (other instanceof SchedulerApplicationAttempt) { return getApplicationId().compareTo( ((SchedulerApplicationAttempt)other).getApplicationId()); } return 1;//let other types go before this, if any }

可以看到，Fifo是直接按照Application ID进行比较。

也就是说，当分配资源时，先分配优先级高的，如果优先级一样，看谁先进入到Queue中。

Capacity Scheduler容器抢占

CapacityScheduler支持从Queue中抢占容器，开启抢占后，优先级高的应用程序会抢占优先级低的应用程序。Capacity Scheduler会杀掉其他队列优先级低的container以释放资源。以下是可以在yarn-site.xml中配置的，关于抢占容器的配置：

以下为针对容量调度器的监视器策略配置：

以下为控制提交到Queue中的应用抢占容器，配置添加在capacity-scheduler.xml：

需求及实现

需求

考虑当前使用YARN集群资源有三个部门，分别是A、B、C。

A部门是经常跑ETL的部门，我们最多提交的是T+1的跑批任务，而且需要消耗大量资源。但白天的时候，这部门资源使用是比较少的。

B部门是经常跑AdHoc的部门1，它们集中在白天使用，会有大量用户往YARN集群中提交大量作业，包含了大作业、以及小作业。白天的时候需要保证B部门的资源使用。

C部门与B部门类似，是AdHoc的部门2。

需求分析

因为不同部门会有不同的资源需求，我们需要为不同的部门建立不同的队列。

A部门跑批的数据是AdHoc的基础，所以在凌晨执行ETL任务时，必须要保证其资源的使用。所以该队列的优先级是高的。A部门的作业数量比较多，且大作业数量也比较多。所以，我们希望当A部门在夜间跑批时，能够抢占到集群的所有资源使用。

B、C部门在白天提交AdHoc作业，所以，我们希望B、C部门能够抢占到更多的A部门的资源。

规划

A部门最大的资源使用为100%，也就是A部门对应的Queue最大能够使用整个集群的资源。而且A部门对应资源的优先级比较高，可以配置为20，支持抢占。

B、C部门最大的资源使用为80%，它们的优先级都是一样的，但要比A部门资源要低，可以设置为10。支持抢占。

其他部门提交的作业统统放在default queue中，不支持抢占，优先级也是最低的，配置为1。

配置

yarn.scheduler.capacity.maximum-applications 20000 yarn.scheduler.capacity.maximum-am-resource-percent 0.5 yarn.scheduler.capacity.resource-calculator org.apache.hadoop.yarn.util.resource.DefaultResourceCalculator yarn.scheduler.capacity.root.queues default,a,b,c yarn.scheduler.capacity.root.default.state RUNNING yarn.scheduler.capacity.root.a.state RUNNING yarn.scheduler.capacity.root.b.state RUNNING yarn.scheduler.capacity.root.c.state RUNNING yarn.scheduler.capacity.root.default.capacity 10 yarn.scheduler.capacity.root.a.capacity 50 yarn.scheduler.capacity.root.b.capacity 20 yarn.scheduler.capacity.root.c.capacity 20 yarn.scheduler.capacity.root.default.maximum-capacity 20 yarn.scheduler.capacity.root.a.maximum-capacity 100 yarn.scheduler.capacity.root.b.maximum-capacity 80 yarn.scheduler.capacity.root.c.maximum-capacity 80 yarn.scheduler.capacity.root.a.user-limit-factor 5 yarn.scheduler.capacity.root.b.user-limit-factor 5 yarn.scheduler.capacity.root.c.user-limit-factor 5 yarn.scheduler.capacity.root.default.default-application-priority 1 yarn.scheduler.capacity.root.a.default-application-priority 20 yarn.scheduler.capacity.root.b.default-application-priority 10 yarn.scheduler.capacity.root.c.default-application-priority 10 yarn.resourcemanager.scheduler.monitor.enable true yarn.resourcemanager.monitor.capacity.preemption.total_preemption_per_round 0.3 yarn.nodemanager.resource.cpu-vcores 16 yarn.nodemanager.resource.memory-mb 16384

部署

# 分发配置 scp /opt/hadoop/etc/hadoop/capacity-scheduler.xml ha-node2:/opt/hadoop/etc/hadoop/ ;\ scp /opt/hadoop/etc/hadoop/capacity-scheduler.xml ha-node3:/opt/hadoop/etc/hadoop/ ;\ scp /opt/hadoop/etc/hadoop/yarn-site.xml ha-node2:/opt/hadoop/etc/hadoop/ ;\ scp /opt/hadoop/etc/hadoop/yarn-site.xml ha-node3:/opt/hadoop/etc/hadoop/ # 刷新队列 yarn rmadmin -refreshQueues # 重启yarn集群 stop-yarn.sh start-yarn.sh

测试使用over capacity

# 运行作业测试 cd /opt/hadoop/share/hadoop/mapreduce; \ yarn jar hadoop-mapreduce-examples-3.2.1.jar pi -Dmapred.job.queue.name=b 5 1 cd /opt/hadoop/share/hadoop/mapreduce; \ yarn jar hadoop-mapreduce-examples-3.2.1.jar pi -Dmapred.job.queue.name=b 5 1 cd /opt/hadoop/share/hadoop/mapreduce; \ yarn jar hadoop-mapreduce-examples-3.2.1.jar pi -Dmapred.job.queue.name=b 5 1 cd /opt/hadoop/share/hadoop/mapreduce; \ yarn jar hadoop-mapreduce-examples-3.2.1.jar pi -Dmapred.job.queue.name=b 5 1 cd /opt/hadoop/share/hadoop/mapreduce; \ yarn jar hadoop-mapreduce-examples-3.2.1.jar pi -Dmapred.job.queue.name=b 5 1

测试抢占

# 先往b队列中提作业，把集群资源打满 cd /opt/hadoop/share/hadoop/mapreduce; \ yarn jar hadoop-mapreduce-examples-3.2.1.jar pi -Dmapred.job.queue.name=b 30 20 cd /opt/hadoop/share/hadoop/mapreduce; \ yarn jar hadoop-mapreduce-examples-3.2.1.jar pi -Dmapred.job.queue.name=b 30 20 cd /opt/hadoop/share/hadoop/mapreduce; \ yarn jar hadoop-mapreduce-examples-3.2.1.jar pi -Dmapred.job.queue.name=b 30 20 cd /opt/hadoop/share/hadoop/mapreduce; \ yarn jar hadoop-mapreduce-examples-3.2.1.jar pi -Dmapred.job.queue.name=b 30 20 # 再往a队列中提交1个作业，检查抢占情况 cd /opt/hadoop/share/hadoop/mapreduce; \ yarn jar hadoop-mapreduce-examples-3.2.1.jar pi -Dmapred.job.queue.name=a 50 20

FAIR Scheduler

简介

FAIR Scheduler可以让所有运行在YARN上的应用程序，在一段时间内获取到相同等份的资源。默认下，Fair scheduler只基于内存来进行调度。我们可以配置Fair scheduler同时调度v-core和memory。当如果YARN集群只有一个应用在运行时，这个应用将可以使用整个YARN集群的资源。当其他应用程序提交时，释放出来的资源会分配给新的应用程序，最终每个应用程序最终能够获得大致相同的资源。

Fair Scheduler与默认的Hadoop调度策略不一样，它允许短作业可以在合理的时间内完成，这样就不至于因为长作业而导致短作业无法被执行。例如：一个Spark应用配置了动态资源分配，因为要跑一个比较大的JOB，所以一次申请了100个exectuor，直接把YARN集群的资源占满了。此时，我们再提交新的JOB时，就会发现JOB会处于pending状态。而当这个Spark应用的JOB执行完一部分后，会释放出来已经运行完成的executor。那么此时，又可以将新的JOB提交到YARN集群了。Fair Scheduler可以和优先级一起使用，通过优先级可以指定应用程序总共能够获取到的资源权重。

Fair Scheduler也是将应用组织到队列中，并可以在队列之间公平地共享资源。默认情况下，所有的应用都会提交到“default”队列中。而如果在请求container时指定了queue，那么就会将请求指定queue的资源。和CapactityScheduler类似，也可以根据用户名来进行映射。在每个队列中，可以指定调度策略来让应用程序共享资源。默认配置为：基于内存的公平调度。当然，也可以配置FIFO、和多资源、抢占资源调度。类似于Capacity Scheduler，Fair Scheduler也可以配置为层次结构的队列，并且配置权重。

Fair Scheduler可以给队列设置最小保留资源，这样可以确保某些用户、组始终能够获取到资源。但队列不需要保留资源，则共享队列的所有资源。Fair Scheduler默认允许所有程序运行，我们也可以控制每个用户、每个队列能够同时运行的应用数量。限制应用程序的数量不会导致后续提交的应用程序失败，而是让它们处于等待状态，直到队列中的某些应用完成为止。

可插拔的分层队列

和Capacity Scheduler一样，Fair scheduler也支持分层队列，也都是从 root 开始的。只不过，Fair Scheduler是以公平调度的方式来进行资源分配的。

队列调度策略

用户可以通过扩展org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.SchedulingPolicy来构建自定义策略。FifoPolicy、FairSharePolicy（默认）和DominantResourceFairnessPolicy是内置的调度策略。

自动分发作业到队列

和Capacity Scheduler一样，Fair Scheduler也可以让管理员配置映射策略，自动将符合某个规则的应用提交到对应的队列中。

配置使用Fair Scheduler

yarn.resourcemanager.scheduler.class org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler

默认的Scheduler为Capacity Scheduler，如下：

yarn.resourcemanager.scheduler.class org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler

配置选项

一般Fair Scheduler涉及到两个配置文件的修改。

配置yarn-site.xml——对整个FairScheduler配置

为Fair Scheduler创建独立的配置文件，配置队列、以及各自的权重和容量。这个配置文件每10秒重新加载一起，随时可更改。

yarn-site.xml

allocation file

Allocation file以XML格式组织。包含了多种不同类型的XML节点组成。

Queue节点

Queue节点为为Fair Scheduler配置队列的地方。可以为Queue节点配置不同的属性，我们可以为一个queue设置一个type属性，当type属性配置为parent时，表示当前配置的是一个父级队列。

上面的配置文件，就表示配置了一个Queue，它的类型为parent，是一个父级队列。

我们还可以为队列配置其他属性。包括：

minResources：配置队列被分配的最小资源。如果当前不满足队列的最小资源配置，则会在父队列下的其他队列中为它提供可用资源。

maxResources：配置队列被分配的最大资源。如果队列的资源超过该阈值，则不会再分配容器给该队列。

maxContainerAllocation：队列能够为单个容器分配的最大资源。如果该属性未设置，将会从父队列继承。默认值为：yarn.scheduler.maximum-allocation-mb和yarn.scheduler.maximum-allocation-vcores。它不能高于maxResources。

maxChildResources：子队列的最大资源。如果子队列超过该阈值，则不会分配资源。

maxRunningApps：队列中同时能够执行的应用程序数量

maxAMShare：队列中能够用于AM Container的资源占比。默认为：0.5f。如果设置为1.0f，则表示最多可以占用100%的内存和CPU。-1.0f表示禁用该功能，不做检查。

weight：分配不同队列的权重。默认为权重为1，如果配置权重为2，则表示队列所接收的资源大约是权重为默认队列的2倍。

schedulingPolicy：调度策略。可以配置为fifo、fair、或者drf。或者自己实现org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.SchedulingPolicy。默认为fair，如果设置为fifo，那么优先为较早提交的应用分配容器，如果分配完后仍然有空间，则继续进行下一轮分配。

aclSubmitApps：配置哪些用户、或者哪些用户组能够提交应用到队列。

aclAdministerApps：配置哪些用户、哪些组可以管理应用。目前，就是kill应用的权限。

minSharePreemptionTimeout：队列可用资源低于minResources，Fair Scheduler将会从其他队列中抢占容器的超时等待时间。超过该时间，则开始抢占。如果未设置，则从父队列继承。默认为：Long.MAX_VALUE，表示不从其他队列抢占容器。

fairSharePreemptionTimeout：队列可用资源低于Fair share阈值，Fair Scheduler将会从其他队列中抢占容器的超时等待时间。超过该时间，则开始抢占，如果未设置，从父队列继承。默认为：Long.MAX_VALUE，表示不从其他队列抢占容器。

fairSharePreemptionThreshold：队列的Fair share阈值，如果Fair Scheduler等待一段时间后，确实没有等到fairSharePreemptionThreshold * fair share，那么可以从其他队列中抢占容器获取资源。如果未设置，从父队列继承。默认为：0.5f。

allowPreemptionFrom：是否允许Fair scheduler从队列中抢占资源。默认为true。如果设置为false，则所有子队列的资源都是不允许被抢占的。

reservation：向资源保留系统配置为用户预留资源，如果未配置，表示不为预留资源。

示例：

10000 mb,0vcores 90000 mb,0vcores 50 0.1 2.0 fair charlie 5000 mb,0vcores

User节点

user节点可以控制独立一个用户的资源。User节点可以包含相关属性。例如：maxRunningApps，这个用户最多能够提交的应用。

userMaxAppsDefault

用户最多默认能够提交的应用数量。

defaultFairSharePreemptionTimeout

为该用户设置root队列 Fair share 的抢占超时等待时间。默认为：Long.MAX_VALUE。

defaultMinSharePreemptionTimeout

为该用户设置root队列 Min Share的抢占超时等待时间。默认为：Long.MAX_VALUE。

defaultFairSharePreemptionThreshold

为该用户设置root队列 Fair Share的抢占阈值。一旦没有拿到 Fair Share * 阈值，则开始抢占。

queueMaxAppsDefault

为该用户设置最大能够提交到Queue的数量。

queueMaxAMShareDefault

设置Queue默认的最大AM能够占用的百分比

defaultQueueSchedulingPolicy

设置Queue的默认调度策略。

reservation-agent

设置ReservationAgent的实现，这个实现类是要将用户的预留请求放到计划中。默认值为：org.apache.hadoop.yarn.server.resourcemanager.reservation.planning.AlignedPlannerWithGreedy。

reservation-policy

设置SharingPolicy（共享策略），这个实现是用来验证资源保留是否会和其他配置冲突。默认值为：org.apache.hadoop.yarn.server.resourcemanager.reservation.CapacityOverTimePolicy。

reservation-planner

设置Planner的实现类，如果发现Plan的容量如果小于用户保留资源，则会调用它。默认为：org.apache.hadoop.yarn.server.resourcemanager.reservation.planning.SimpleCapacityReplanner，它会扫描plan，并按照LIFO删除保留资源，直到保留的资源在计划容量内。

queuePlacementPolicy

包含一系列的规则节点列表，这些规则可以决定应该如何将应用请求放在哪个队列中，规则是以在配置中出现的顺序应用。每一个规则都有一个create参数，默认为true。如果设置为false，表示应用程序会被放入到allocation file中未配置的队列中。以下是关于rule（规则）的说明：

specified：应用程序会放入到指定的队列中。如果应用程序没有指定队列，则会放入到“default”队列中。如果队列名称是以「.q1」或者「q1.」开头或者结尾，会被拒绝。

user：将对应用户名的应用提交到队列中，如果用户名中包含了「.」，会被替换为「dot」，例如：用户first.last会被替换为first_dot_last。

primaryGroup：以某个primary group的用户会放入到该队列中。和用户名一样，如果组名中包含了点号，也会被替换为_dot_。

secondaryGroupExistingQueue：以某个secondary group的用户会放入到该队列中。和用户名一样，如果组名中包含了点号，也会被替换为_dot_。

nestedUserQueue：与user策略类似，但user规则只能在根队列下创建用户队列，而nestedUserQueue可以在任何父队列下创建用户队列。注意，nestedUserQueue只能配置为type为parent的队列。

default：设置用户提交应用的默认队列。如果没有指定queue，会放置在root.default队列中。

reject：该应用会被拒绝

示例：

0.5 40000 mb,0vcores 30 5

参考配置文件：

10000 mb,0vcores 90000 mb,0vcores 50 0.1 2.0 fair charlie 5000 mb,0vcores 0.5 40000 mb,0vcores 3.0 4096 mb,4vcores 30 5

需求及实现

需求

考虑当前使用YARN集群资源有三个部门，分别是A、B、C。

A部门是经常跑ETL的部门，我们最多提交的是T+1的跑批任务，而且需要消耗大量资源。但白天的时候，这部门资源使用是比较少的。

B部门是经常跑AdHoc的部门1，它们集中在白天使用，会有大量用户往YARN集群中提交大量作业，包含了大作业、以及小作业。白天的时候需要保证B部门的资源使用。

C部门与B部门类似，是AdHoc的部门2。

需求分析

因为不同部门会有不同的资源需求，我们需要为不同的部门建立不同的队列。

A部门跑批的数据是AdHoc的基础，所以在凌晨执行ETL任务时，必须要保证其资源的使用。所以该队列的优先级是高的。A部门的作业数量比较多，且大作业数量也比较多。所以，我们希望当A部门在夜间跑批时，能够抢占到集群的所有资源使用。

B、C部门在白天提交AdHoc作业，所以，我们希望B、C部门能够抢占到更多的A部门的资源。

规划

配置三个Fair队列，分别是a、b、c、default，a设置的weight为6，b和c的weight为3、default的weight为1。

为了方便在队列中大家共享资源，所以需要使用fair调度。

需要开启抢占资源。

配置

yarn.resourcemanager.scheduler.class org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler yarn.scheduler.fair.preemption true yarn.resource-types.memory-mb.increment-allocation 256

注意：配置Fair scheduler需要删除掉Capcity相关配置（例如：Capacity Scheduler的抢占配置）

10% 20% 1.0 50% 100% 6.0 20% 80% 20000 3.0 20% 80% 3.0 10000 20000 0.5f fair

部署

# 分发配置 scp /opt/hadoop/etc/hadoop/fair-scheduler.xml ha-node2:/opt/hadoop/etc/hadoop/ ;\ scp /opt/hadoop/etc/hadoop/fair-scheduler.xml ha-node3:/opt/hadoop/etc/hadoop/ ;\ scp /opt/hadoop/etc/hadoop/yarn-site.xml ha-node2:/opt/hadoop/etc/hadoop/ ;\ scp /opt/hadoop/etc/hadoop/yarn-site.xml ha-node3:/opt/hadoop/etc/hadoop/ # 重启yarn集群 stop-yarn.sh start-yarn.sh # 刷新队列 yarn rmadmin -refreshQueues

测试Fair Share

cd /opt/hadoop/share/hadoop/mapreduce; \ yarn jar hadoop-mapreduce-examples-3.2.1.jar pi -Dmapred.job.queue.name=b 30 20 cd /opt/hadoop/share/hadoop/mapreduce; \ yarn jar hadoop-mapreduce-examples-3.2.1.jar pi -Dmapred.job.queue.name=b 30 20

可以看到，两个应用占用的资源是差不太多的，这就实现了Fair Share。

测试不同weight权重的Fair Share

cd /opt/hadoop/share/hadoop/mapreduce; \ yarn jar hadoop-mapreduce-examples-3.2.1.jar pi -Dmapred.job.queue.name=a 50 30 cd /opt/hadoop/share/hadoop/mapreduce; \ yarn jar hadoop-mapreduce-examples-3.2.1.jar pi -Dmapred.job.queue.name=b 50 20

可以看到，root.a这个queue能够拿到的资源大约是root.b queue的两倍左右。

测试资源抢占

# 提交4个JOB，把root.b queue的资源打满 cd /opt/hadoop/share/hadoop/mapreduce; \ yarn jar hadoop-mapreduce-examples-3.2.1.jar pi -Dmapred.job.queue.name=b 50 20 # 提交1个JOB到root.a，检查抢占情况 cd /opt/hadoop/share/hadoop/mapreduce; \ yarn jar hadoop-mapreduce-examples-3.2.1.jar pi -Dmapred.job.queue.name=a 50 20

我们可以看到随着时间推移，root.a开始抢占root.b的资源。

对比两种资源调度策略

Fair Scheduler的核心是尽可能地共享整个集群的资源，让多个用户可以共享使用整个集群。Capacity Scheduler旨在共享大型集群资源，并且为每个组织/部门提供最小的容量保证，它的核心是让YARN集群中的可用资源在多个组织/部门之间共享，Capacity Scheduler也可以共享空闲的容量。

其实它们两现在很多功能上都是有重叠的，例如，都支持Queue、都支持抢占、弹性资源扩展。而Capacity Scheduler比较适合超大规模的、多组织机构、严格的资源管理。而Fair Scheduler比较适合中小规模、组织机构不是特别复杂，而且对资源共享有较高需求的集群。

原文：

https://zhuanlan.zhihu.com/p/335881182

Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
springboot+vue项目实战一-创建SpringBoot简单项目苹果酱0567 面试题汇总与解析 spring boot 后端 java 中间件开发语言
这段时间抽空给女朋友搭建一个个人博客，想着记录一下建站的过程，就当做笔记吧。虽然复制zjblog只要一个小时就可以搞定一个网站，或者用cms系统，三四个小时就可以做出一个前后台都有的网站，而且想做成啥样也都行。但是就是要从新做，自己做的意义不一样，更何况，俺就是专门干这个的，嘿嘿嘿要做一个网站，而且从零开始，首先呢就是技术选型了，经过一番思量决定选择-SpringBoot做后端，前端使用Vue做一
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
JavaScript `Map` 和 `WeakMap`详细解释跳房子的前端 JavaScript 原生方法 javascript 前端开发语言
在JavaScript中，Map和WeakMap都是用于存储键值对的数据结构，但它们有一些关键的不同之处。MapMap是一种可以存储任意类型的键值对的集合。它保持了键值对的插入顺序，并且可以通过键快速查找对应的值。Map提供了一些非常有用的方法和属性来操作这些数据对：set(key,value):将一个键值对添加到Map中。如果键已经存在，则更新其对应的值。get(key):获取指定键的值。如果键
最简单将静态网页挂载到服务器上(不用nginx) 全能全知者服务器 nginx 运维前端 html 笔记
最简单将静态网页挂载到服务器上(不用nginx)如果随便弄个静态网页挂在服务器都要用nignx就太麻烦了，所以直接使用Apache来搭建一些简单前端静态网页会相对方便很多检查Web服务器服务状态：sudosystemctlstatushttpd#ApacheWeb服务器如果发现没有安装web服务器：安装Apache：sudoyuminstallhttpd启动Apache：sudosystemctl
补充元象二面 Redstone Monstrosity 前端面试
1.请尽可能详细地说明，防抖和节流的区别，应用场景？你的回答中不要写出示例代码。防抖（Debounce）和节流（Throttle）是两种常用的前端性能优化技术，它们的主要区别在于如何处理高频事件的触发。以下是防抖和节流的区别和应用场景的详细说明：防抖和节流的定义防抖：在一段时间内，多次执行变为只执行最后一次。防抖的原理是，当事件被触发后，设置一个延迟定时器。如果在这个延迟时间内事件再次被触发，则重
微信小程序开发注意事项 jun778895 微信小程序小程序
微信小程序开发是一个融合了前端开发、用户体验设计、后端服务（可选）以及微信小程序平台特性的综合性项目。这里，我将详细介绍一个典型的小程序开发项目的全过程，包括项目规划、设计、开发、测试及部署上线等各个环节，并尽量使内容达到或超过2000字的要求。一、项目规划1.1项目背景与目标假设我们要开发一个名为“智慧校园助手”的微信小程序，旨在为学生提供一站式校园生活服务，包括课程表查询、图书馆座位预约、食堂
切换淘宝最新npm镜像源是 hai40587 npm 前端 node.js
切换淘宝最新npm镜像源是一个相对简单的过程，但首先需要明确当前淘宝npm镜像源的状态和最新的镜像地址。由于网络环境和服务更新，镜像源的具体地址可能会发生变化，因此，我将基于当前可获取的信息，提供一个通用的切换步骤，并附上最新的镜像地址（截至回答时）。一、了解npm镜像源npm（NodePackageManager）是JavaScript的包管理器，用于安装、更新和管理项目依赖。由于npm官方仓库
字节二面 Redstone Monstrosity 前端面试
1.假设你是正在面试前端开发工程师的候选人，面试官让你详细说出你上一段实习过程的收获和感悟。在上一段实习过程中，我获得了宝贵的实践经验和深刻的行业洞察，以下是我的主要收获和感悟：一、专业技能提升框架应用熟练度：通过实际项目，我深入掌握了React、Vue等前端框架的使用，不仅提升了编码效率，还学会了如何根据项目需求选择合适的框架。问题解决能力：在实习期间，我遇到了许多预料之外的技术难题。通过查阅文
前端代码上传文件余生逆风飞翔前端 javascript 开发语言
点击上传文件import{ElNotification}from'element-plus'import{API_CONFIG}from'../config/index.js'import{UploadFilled}from'@element-plus/icons-vue'import{reactive}from'vue'import{BASE_URL}from'../config/index'i
uniapp实现动态标记效果详细步骤【前端开发】 2401_85123349 uni-app
第二个点在于实现将已经被用户标记的内容在下一次获取后刷新它的状态为已标记。这是什么意思呢？比如说上面gif图中的这些人物对象，有一些已被该用户添加为关心，那么当用户下一次进入该页面时，这些已经被添加关心的对象需要以“红心”状态显现出来。这个点的难度还不算大，只需要在每一次获取后端的内容后对标记对象进行状态更新即可。II.动态标记效果实现思路和步骤首先，整体的思路是利用动态类名对不同的元素进行选择。
高性能javascript--算法和流程控制海淀萌狗
-for,while和do-while性能相当-避免使用for-in循环，==除非遍历一个属性量未知的对象==es5:for-in遍历的对象便不局限于数组，还可以遍历对象。原因：for-in每次迭代操作会同时搜索实例或者原型属性，for-in循环的每次迭代都会产生更多开销，因此要比其他循环类型慢，一般速度为其他类型循环的1/7。因此，除非明确需要迭代一个属性数量未知的对象，否则应避免使用for-i
360前端星计划-动画可以这么玩马小蜗
动画的基本原理定时器改变对象的属性根据新的属性重新渲染动画functionupdate(context){//更新属性}constticker=newTicker();ticker.tick(update,context);动画的种类1、JavaScript动画操作DOMCanvas2、CSS动画transitionanimation3、SVG动画SMILJS动画的优缺点优点：灵活度、可控性、性能
Vue + Express实现一个表单提交九旬大爷的梦
最近在折腾一个cms系统，用的vue+express，但是就一个表单提交就弄了好久，记录一下。环境：Node10+前端：Vue服务端：Express依赖包：vueexpressaxiosexpress-formidableelement-ui（可选）前言：axiosget请求参数是：paramsaxiospost请求参数是：dataexpressget接受参数是req.queryexpresspo
JavaScript中秋快乐！ Q_w7742 javascript 开发语言 ecmascript
我们来实现一个简单的祝福网页~主要的难度在于使用canvas绘图当点击canvas时候，跳出“中秋节快乐”字样，需要注册鼠标单击事件和计时器。首先定义主要函数：初始化当点击canvas之后转到onCanvasClick函数，绘图生成灯笼。functiononCanvasClick(){//事件处理函数context.clearRect(0,0,canvas1.width,canvas1.heigh
Nginx从入门到实践(三) 听你讲故事啊
动静分离动静分离是将网站静态资源（JavaScript，CSS，img等文件）与后台应用分开部署，提高用户访问静态代码的速度，降低对后台应用访问。动静分离的一种做法是将静态资源部署在nginx上，后台项目部署到应用服务器上，根据一定规则静态资源的请求全部请求nginx服务器，达到动静分离的目标。rewrite规则Rewrite规则常见正则表达式Rewrite主要的功能就是实现URL的重写，Ngin
Nginx的使用场景：构建高效、可扩展的Web架构张某布响丸辣 nginx 前端架构
Nginx，作为当今最流行的Web服务器和反向代理软件之一，凭借其高性能、稳定性和灵活性，在众多Web项目中扮演着核心角色。无论是个人博客、中小型网站，还是大型企业级应用，Nginx都能提供强大的支持。本文将探讨Nginx的几个主要使用场景，帮助读者理解如何在实际项目中充分利用Nginx的优势。1.静态文件服务对于包含大量静态文件（如HTML、CSS、JavaScript、图片等）的网站，Ngin
前端知识点 ZhangTao_zata 前端 javascript css
下面是一个最基本的html代码body{font-family:Arial,sans-serif;margin:20px;}//JavaScriptfunctionthatdisplaysanalertwhencalledfunctionshowMessage(){alert("Hello!Youclickedthebutton.");}MyFirstHTMLPageWelcometoMyPage
第三十一节:Vue路由:前端路由vs后端路由的了解曹老师
1.认识前端路由和后端路由前端路由相对于后端路由而言的,在理解前端路由之前先对于路由有一个基本的了解路由:简而言之,就是把信息从原地址传输到目的地的活动对于我们来说路由就是:根据不同的url地址展示不同的页面内容1.1后端路由以前咱们接触比较多的后端路由,当改变url地址时,浏览器会向服务器发送请求,服务器根据这个url,返回不同的资源内容后端路由的特点就是前端每次跳转到不同url地址,都会重新访
华雁智科前端面试题因为奋斗超太帅啦前端笔试面试问题整理 javascript 开发语言 ecmascript
1.var变量的提升题目：vara=1functionfun(){console.log(b)varb=2}fun()console.log(a)正确输出结果：undefined、1答错了，给一个大嘴巴子，错误答案输出结果为：2,1此题主要考察var定义的变量，作用域提升的问题，相当于varaa=1functionfun(){varbconsole.log(b)b=2}fun()console.l
如何建设数据中台（五）——数据汇集—打破企业数据孤岛 weixin_47088026 学习记录和总结中台数据中台程序人生经验分享
数据汇集——打破企业数据孤岛要构建企业级数据中台，第一步就是将企业内部各个业务系统的数据实现互通互联，打破数据孤岛，主要通过数据汇聚和交换来实现。企业采集的数据可以是线上采集、线下数据采集、互联网数据采集、内部数据采集等。线上数据采集主要载体分为互联网和移动互联网两种，对应有系统平台、网页、H5、小程序、App等，可以采用前端或后端埋点方式采集数据。线下数据采集主要是通过硬件来采集，例如：WiFi
分布式锁和spring事务管理暴躁的鱼锁及事务分布式 spring java
最近开发一个小程序遇到一个需求需要实现分布式事务管理业务需求用户在使用小程序的过程中可以查看景点，对景点地区或者城市标记是否想去，那么需要统计一个地点被标记的人数，以及记录某个用户对某个地点是否标记为想去，用两个表存储数据，一个地点表记录改地点被标记的次数，一个用户意向表记录某个用户对某个地点是否标记为想去。由于可能有多个用户同时标记一个地点，每个用户在前端点击想去按钮之后，后台接收到请求，从数据
前端CSS面试常见题剑亦未配妥前端面试前端 css 面试
边界塌陷盒模型有两种：W3C盒模型和IE盒模型，区别在于宽度是否包含边框定义：同时给兄弟/父子盒模型设置上下边距，理论上边距值是两者之和，实际上不是注意：浮动和定位不会产生边界塌陷；只有块级元素垂直方向才会产生margin合并margin计算方案margin同为正负：取绝对值大的值一正一负：求和父子元素边界塌陷解决父元素可以通过调整padding处理；设置overflowhidden，触发BFC子
【JS】前端文件读取FileReader操作总结程序员-张师傅前端前端 javascript 开发语言
前端文件读取FileReader操作总结FileReader是JavaScript中的一个WebAPI，它允许web应用程序异步读取用户计算机上的文件（或原始数据缓冲区）的内容，例如读取文件以获取其内容，并在不将文件发送到服务器的情况下在客户端使用它。这对于处理图片、文本文件等非常有用，尤其是当你想要在用户界面中即时显示文件内容或进行文件预览时。创建FileReader对象首先，你需要创建一个Fi
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

彻底搞明白YARN资源分配

彻底搞明白YARN资源分配

本篇要解决的问题是：

YARN资源管理简述

分布式应用在YARN中的执行流程

YARN集群资源管理

集群总计资源

NodeManager总计资源

scheduler调度资源

Container总计资源

Container是一个JVM进程吗

Spark on YARN资源管理

Flink on YARN资源管理

总结

不管开发Hive、Spark还是Flink，都必须会的YARN调度

FIFO调度

Capacity Scheduler

简介

容量调度配置文件

root队列

配置更多的队列

分层队列

更新Queue配置

停止使用队列

Queue Properties

资源分配

绝对资源分配

运行和等待应用程序限制

Queue管理和权限控制

测试提交作业到指定queue

Queue Mapping

Queue应用程序Life time

应用程序优先级

Cluster优先级

Queue优先级

检查FifoOrderingPolicy实现

Capacity Scheduler容器抢占

需求及实现

需求

需求分析

规划

配置

部署

测试使用over capacity

测试抢占

FAIR Scheduler

简介

可插拔的分层队列

队列调度策略

自动分发作业到队列

配置使用Fair Scheduler

配置选项

yarn-site.xml

allocation file

Queue节点

User节点

userMaxAppsDefault

defaultFairSharePreemptionTimeout

defaultMinSharePreemptionTimeout

defaultFairSharePreemptionThreshold

queueMaxAppsDefault

queueMaxAMShareDefault

defaultQueueSchedulingPolicy

reservation-agent

reservation-policy

reservation-planner

queuePlacementPolicy

需求及实现

需求

需求分析

规划

配置

部署

测试Fair Share

测试不同weight权重的Fair Share

测试资源抢占

对比两种资源调度策略

你可能感兴趣的:(前端,javascript,开发语言)