讲文明的喜羊羊拒绝pua

大数据高级开发工程师——Hadoop学习笔记（7）

文章目录

Hadoop进阶篇
- YARN：Hadoop资源调度系统
- - 什么是YARN
  - YARN架构剖析
  - - 1. ResourceManager
    - 2. NodeManager
    - 3. Container
    - 4. ApplicationMaster
    - 5. JobHistoryServer
    - 6. TimelineServer
  - YARN应用运行原理
  - - 1. YARN应用提交过程
    - 2. MapReduce on YARN
    - - 提交作业
      - 初始化作业
      - Task 任务分配
      - Task 任务执行
      - 作业任务进度与状态更新
      - 完成作业
    - 3. YARN应用生命周期
  - YARN调度器
  - - 1. 资源调度器的职能
    - 2. 三种调度器的介绍
    - - 先进先出调度器(FIFO)
      - 容量调度器(Capacity Scheduler)
      - 公平调度器(Fair Scheduler)
    - 3. 自定义队列，实现任务提交不同队列
    - - 查看默认提交方案
      - 第一步：node01编辑yarn-site.xml
      - 第二步：node01添加fair-scheduler.xml配置文件
      - 第三步：将修改后的配置文件拷贝到其它机器
      - 第四步：重启yarn集群
      - 第五步：修改任务提交的队列
  - YARN基本使用
  - - 1. 配置文件
    - 2. YARN启动停止
    - 3. YARN 常用命令

Hadoop进阶篇

YARN：Hadoop资源调度系统

什么是YARN

Apache Hadoop YARN(Yet Another Resource Negotiator)是Hadoop的子项目，为分离Hadoop2.0资源管理和计算组件而引入。
YARN 具有足够的通用性，客户支持其它分布式计算模式。

YARN架构剖析

类似于 HDFS，YARN 也是经典的主从（Master/Slave）架构。
YARN 服务有一个 ResourceManager（RM）和多个 NodeManager（NM）构成。
ResourceManager 为主节点(master)、NodeManager 为从节点(slave)

1. ResourceManager

ResourceManager（简称 RM）是 YARN 中主的角色，是一个全局的资源管理器，集群只有一个 active 的对外提供服务。
- 负责整个系统的资源管理和分配；
- 处理客户端请求；
- 启动/监控 ApplicationMaster；
- 监控 NodeManager、资源的分配与调度。
它主要由两个组件构成：
- 调度器（Scheduler）；
- 应用程序管理器（Applications Manager，简称 ASM）。
调度器 Scheduler：根据队列、容量等限制条件（如每个队列分配一定的资源，最多执行一定数量的作业等），将系统中的资源分配给各个正在运行的应用程序。需要注意的是，该调度器是一个“纯调度器”
- 它不从事任何与具体应用程序相关的工作，比如：不负责监控或者跟踪应用的执行状态等；
- 不负责重新启动因应用执行失败或者硬件故障而产生的失败任务，这些均交由应用程序相关的 ApplicationMaster 完成；
- 调度器根据各个应用程序的资源需求进行资源分配，而资源分配单位用一个抽象概念“资源容器”（Resource Container，简称Container）表示，Container 是一个动态资源分配单位，它将内存、CPU、磁盘、网络等资源封装在一起，从而限定每个任务使用的资源量。
应用程序管理器Applications Manager：主要负责管理整个系统中所有应用程序，接收 Job 的提交请求，为应用分配第一个 Container 来运行 ApplicationMaster
- 包括应用程序提交；
- 与调度器 Scheduler 协商资源以启动 ApplicationMaster；
- 监控 ApplicationMaster 运行状态并在失败时重新启动它等。

2. NodeManager

NodeManager 是YARN中的 slave角色：
- 当一个节点启动时，它会向 ResourceManager 进行注册并告知 ResourceManager 自己有多少资源可用；
- 每个计算节点，运行一个NodeManager进程，通过心跳（每秒 yarn.resourcemanager.nodemanagers.heartbeat-interval-ms ）上报节点的资源状态(磁盘，内存，cpu等使用信息)
功能：
- 接收及处理来自 ResourceManager 的命令请求，分配 Container 给应用的某个任务；
- NodeManager 监控本节点上的资源使用情况和各个 Container 的运行状态（cpu和内存等资源）；
- 负责监控并报告 Container 使用信息给 ResourceManager；
- 定时地向RM汇报以确保整个集群平稳运行，RM 通过收集每个 NodeManager 的报告信息来追踪整个集群健康状态的，而 NodeManager 负责监控自身的健康状态；
- 处理来自 ApplicationMaster 的请求；
- 管理着所在节点每个 Container 的生命周期。
管理每个节点上的日志：
- 在运行期，通过 NodeManager 和 ResourceManager 协同工作，这些信息会不断被更新并保障整个集群发挥出最佳状态；
- NodeManager 只负责管理自身的 Container，它并不知道运行在它上面应用的信息，负责管理应用信息的组件是 ApplicationMaster。

3. Container

Container 是 YARN 中的资源抽象，YARN以Container为单位分配资源。它封装了某个节点上的多维度资源，如内存、CPU、磁盘、网络等。当 AM 向 RM 申请资源时，RM 为 AM 返回的资源便是用 Container 表示的。
YARN 会为每个任务分配一个 Container，且该任务只能使用该 Container 中指定数量的资源。
Container 和集群NodeManager节点的关系是：
- 一个 NodeManager 节点可运行多个 Container，但一个 Container 不会跨节点；
- 任何一个 Job 或 Application 必须运行在一个或多个 Container 中；
- 在 Yarn 框架中，ResourceManager 只负责告诉 ApplicationMaster 哪些 Containers 可以用；ApplicationMaster 还需要去找 NodeManager 请求分配具体的 Container。
需要注意的是：
- Container 是一个动态资源划分单位，是根据应用程序的需求动态生成的；
- 目前为止，YARN 仅支持 CPU 和内存两种资源，且使用了轻量级资源隔离机制 Cgroups 进行资源隔离。
功能：
- 对 task 环境的抽象；
- 描述一系列信息；
- 任务运行资源的集合（cpu、内存、io等）；
- 任务运行环境。

4. ApplicationMaster

功能：
- 获得分片数据；
- 为应用程序申请资源并进一步分配给内部任务；
- 任务监控与容错；
- 负载协调来自 ResourceManager 的资源，并通过 NodeManager 监控容器的执行和资源使用情况。
ApplicationMaster 与 ResourceManager 之间的通信：
- 是整个 Yarn 应用从提交到运行的最核心部分，是 Yarn 对整个集群进行动态资源管理的根本步骤；
- application master周期性的向resourcemanager发送心跳，让rm确认appmaster的健康；
- Yarn 的动态性，就是来源于多个Application 的 ApplicationMaster 动态地和 ResourceManager 进行沟通，不断地申请、释放、再申请、再释放资源的过程。

5. JobHistoryServer

作业历史服务：记录在 yarn 中调度的作业历史运行情况，可以通过历史任务日志服务器来查看 hadoop 历史任务，出现错误都应该第一时间来查看日志。

配置开启历史服务 JobHistoryServer

第一步：修改mapred-site.xml 增加如下内容

<property>
    <name>mapreduce.jobhistory.addressname>
    <value>node01:10020value>
property>

<property>
    <name>mapreduce.jobhistory.webapp.addressname>
    <value>node01:19888value>
property>

第二步：修改yarn-site.xml 增加如下内容


<property>
    <name>yarn.log-aggregation-enablename>
    <value>truevalue>
property>

<property>
    <name>yarn.log-aggregation.retain-secondsname>
    <value>2592000value>
property>


<property>
    <name>yarn.nodemanager.log-aggregation.compression-typename>
    <value>gzvalue>
property>

<property>
    <name>yarn.nodemanager.local-dirsname>
    <value>/bigdata/install/hadoop-3.1.4/hadoopDatas/yarn/localvalue>
property>

<property>
    <name>yarn.resourcemanager.max-completed-applicationsname>
    <value>1000value>
property>
<property>
    <name>yarn.log.server.urlname>
    <value>http://master:19888/jobhistory/logsvalue>
property>

第三步：将修改后的文件同步到其它机器上去：

cd /bigdata/install/hadoop-3.1.4/etc/hadoop

第四步：重启 yarn 及 jobhistory 服务

cd /bigdata/install/hadoop-3.1.4/
sbin/stop-yarn.sh
sbin/start-yarn.sh
mapred --daemon stop historyserver
mapred --daemon start historyserver

提交 MR 程序，并查看应用日志：

hadoop jar hadoop-demo-1.0.jar com.yw.hadoop.mr.p13_map_join.MapJoinMain /order.txt /map_join_out

点击 history 查看：

6. TimelineServer

用来写日志服务数据，一般来写与第三方结合的日志服务数据(比如spark等)。
它是对jobhistoryserver功能的有效补充，jobhistoryserver只能对mapreduce类型的作业信息进行记录。
它记录除了jobhistoryserver能够对作业运行过程中信息进行记录之外，还记录更细粒度的信息，比如任务在哪个队列中运行，运行任务时设置的用户是哪个用户。
timelineserver功能更强大，但不是替代jobhistory两者是功能间的互补关系。
官网教程

YARN应用运行原理

1. YARN应用提交过程

Application在Yarn中的执行过程，整个执行过程可以总结为三步：
- 应用程序提交；
- 启动应用的ApplicationMaster实例；
- ApplicationMaster 实例管理应用程序的执行
具体提交过程如下：

客户端程序向 ResourceManager 提交应用，并请求一个 ApplicationMaster 实例；
ResourceManager 找到一个可以运行一个 Container 的 NodeManager，并在这个 Container 中启动 ApplicationMaster 实例；
ApplicationMaster 向 ResourceManager 进行注册，注册之后客户端就可以查询 ResourceManager 获得自己 ApplicationMaster 的详细信息，以后就可以和自己的 ApplicationMaster 直接交互了（这个时候，客户端主动和 ApplicationMaster 交流，应用先向 ApplicationMaster 发送一个满足自己需求的资源请求）；
ApplicationMaster 根据 resource-request协议向 ResourceManager 发送 resource-request请求；
当 Container 被成功分配后，ApplicationMaster 通过向 NodeManager 发送 container-launch-specification信息来启动Container，container-launch-specification信息包含了能够让Container 和 ApplicationMaster 交流所需要的资料；
应用程序的代码以 task 形式在启动的 Container 中运行，并把运行的进度、状态等信息通过 application-specific协议发送给ApplicationMaster；
在应用程序运行期间，提交应用的客户端主动和 ApplicationMaster 交流获得应用的运行状态、进度更新等信息，交流协议也是 application-specific协议；
应用程序执行完成并且所有相关工作也已经完成，ApplicationMaster 向 ResourceManager取消注册然后关闭，用到所有的 Container 也归还给系统。
简略概括：
- 1、用户将应用程序提交到 ResourceManager 上；
- 2、ResourceManager 为应用程序 ApplicationMaster 申请资源，并与某个 NodeManager 通信启动第一个 Container，用于启动 ApplicationMaster；
- 3、ApplicationMaster 与 ResourceManager 注册进行通信，为内部要执行的任务申请资源，一旦得到资源后，将于 NodeManager 通信，已启动对应的 Task；
- 4、所有任务运行完成后，ApplicationMaster 向 ResourceManager 注销，整个应用程序运行结束。

2. MapReduce on YARN

流程图：

提交作业

① 程序打成jar包，在客户端运行hadoop jar命令，提交job到集群运行：
- job.waitForCompletion(true) 中调用Job的submit()，此方法中调用 JobSubmitter 的 submitJobInternal() 方法；
② submitClient.getNewJobID() 向 resourcemanager 请求一个 MR 作业 id：
- 检查输出目录：如果没有指定输出目录或者目录已经存在，则报错；
- 计算作业分片：若无法计算分片，也会报错；
③ 运行作业的相关资源，如作业的jar包、配置文件、输入分片，被上传到HDFS上一个以作业ID命名的目录（jar包副本默认为10，运行作业的任务，如map任务、reduce任务时，可从这10个副本读取jar包）；
④ 调用 resourcemanager 的 submitApplication() 提交作业；
客户端每秒查询一下作业的进度（map 50% reduce 0%），进度如有变化，则在控制台打印进度报告；
作业如果成功执行完成，则打印相关的计数器；
但如果失败，在控制台打印导致作业失败的原因（要学会查看日志，定位问题，分析问题，解决问题）；

初始化作业

当ResourceManager(一下简称RM)收到了submitApplication()方法的调用通知后，请求传递给RM的scheduler（调度器），调度器分配container（容器）；
⑤ RM与指定的 NodeManager 通信，通知 NodeManager 启动容器；
- NodeManager收到通知后，创建占据特定资源的container；
- 然后在container中运行 MRAppMaster 进程；
⑥ MRAppMaster需要接受任务（各map任务、reduce任务的）的进度、完成报告，所以appMaster需要创建多个簿记对象，记录这些信息；
⑦ 从 HDFS 获得 client 计算出的输入分片 split
- 每个分片 split 创建一个 map 任务；
- 通过 mapreduce.job.reduces 属性值(编程时，jog.setNumReduceTasks()指定)，知道当前MR要创建多少个reduce任务；
- 每个任务(map、reduce)有task id；

Task 任务分配

如果是小任务，appMaster会以uberized的方式运行此MR作业，appMaster会决定在它的JVM中顺序执行此MR的任务：
- 原因是，若每个任务运行在一个单独的JVM时，都需要单独启动JVM，分配资源（内存、CPU），需要时间；多个JVM中的任务再在各自的JVM中并行运行
- 若将所有任务在appMaster的JVM中顺序执行的话，更高效，那么appMaster就会这么做，任务作为uber任务运行;
- 在运行任何task之前，appMaster调用setupJob()方法，创建OutputCommitter，创建作业的最终输出目录（一般为HDFS上的目录）及任务输出的临时目录（如map任务的中间结果输出目录）；
- 小作业判断依据：小于10个map任务，只有一个reduce任务，MR输入大小小于一个HDFS块大小
- 如何开启 uber？设置属性 mapreduce.job.ubertask.enable 值为true

configuration.set("mapreduce.job.ubertask.enable", "true");

⑧ 若作业不以uber任务方式运行，那么appMaster会为作业中的每一个任务（map任务、reduce任务）向RM请求container：
- 由于reduce任务在进入排序阶段之前，所有的map任务必须执行完成，所以，为map任务申请容器要优先于为reduce任务申请容器；
- 5%的map任务执行完成后，才开始为reduce任务申请容器；
- 为map任务申请容器时，遵循数据本地化，调度器尽量将容器调度在map任务的输入分片所在的节点上（移动计算，不移动数据）；
- reduce任务能在集群任意计算节点运行；
- 默认情况下，为每个map任务、reduce任务分配1G内存、1个虚拟内核，由属性决定mapreduce.map.memory.mb、mapreduce.reduce.memory.mb、mapreduce.map.cpu.vcores、mapreduce.reduce.reduce.cpu.vcores

Task 任务执行

当调度器为当前任务分配了一个NodeManager（暂且称之为NM01）的容器，并将此信息传递给appMaster后；appMaster与NM01通信，告知NM01启动一个容器，并此容器占据特定的资源量（内存、CPU）；
NM01收到消息后，启动容器，此容器占据指定的资源量；
容器中运行YarnChild，由YarnChild运行当前任务（map、reduce）；
⑩ 在容器中运行任务之前，先将运行任务需要的资源拉取到本地，如作业的JAR文件、配置文件、分布式缓存中的文件；

作业任务进度与状态更新

作业job以及它的每个task都有状态（running、successfully completed、failed），当前任务的运行进度、作业计数器；
任务在运行期间，每隔3秒向appMaster汇报执行进度、状态（包括计数器）；
appMaster汇总目前运行的所有任务的上报的结果；
客户端每隔1秒，轮询访问appMaster获得作业执行的最新状态，若有改变，则在控制台打印出来；

完成作业

appMaster收到最后一个任务完成的报告后，将作业状态设置为成功；
客户端轮询appMaster查询进度时，发现作业执行成功，程序从waitForCompletion()退出；
作业的所有统计信息打印在控制台；
appMaster及运行任务的容器，清理中间的输出结果，释放资源；
作业信息被历史服务器保存，留待以后用户查询。

3. YARN应用生命周期

RM：ResourceManager；AM：ApplicationMaster；NM：NodeManager

① Client向RM提交应用，包括AM程序及启动AM的命令。
② RM为AM分配第一个容器，并与对应的NM通信，令其在容器上启动应用的AM。
③ AM启动时向RM注册，允许Client向RM获取AM信息然后直接和AM通信。
④ AM通过资源请求协议，为应用协商容器资源。
⑤ 如容器分配成功，AM要求NM在容器中启动应用，应用启动后可以和AM独立通信。
⑥ 应用程序在容器中执行，并向AM汇报。
⑦ 应用执行期间，Client和AM通信获取应用状态。
⑧ 应用执行完成，AM向RM注销并关闭，释放资源。
总结：申请资源 ==>> 启动appMaster ==>> 申请运行任务的container ==>> 分发Task ==>> 运行Task ==>> Task结束 ==>> 回收container。

YARN调度器

1. 资源调度器的职能

资源调度器是YARN最核心的组件之一，是一个插拔式的服务组件，负责整个集群资源的管理和分配。YARN提供了三种可用的资源调度器：FIFO、Capacity Scheduler、Fair Scheduler。

2. 三种调度器的介绍

先进先出调度器(FIFO)

FIFO Scheduler把应用按提交的顺序排成一个队列，这是一个先进先出队列
- 在进行资源分配的时候，先给队列中最头上的应用进行分配资源
- 待最头上的应用需求满足后再给下一个分配，依次类推。
FIFO Scheduler是最简单也是最容易理解的调度器，也不需要任何配置，但它并不适用于共享集群。
- 大的应用可能会占用所有集群资源，这就导致其它应用被阻塞。
- 在共享集群中，更适合采用Capacity Scheduler或Fair Scheduler，这两个调度器都允许大任务和小任务在提交的同时获得一定的系统资源。
可以看出，在FIFO 调度器中，小任务会被大任务阻塞。

容量调度器(Capacity Scheduler)

公平调度器(Fair Scheduler)

3. 自定义队列，实现任务提交不同队列

建议在集群上做一些没把握的事情前，先给集群虚拟机打个快照再说

前面我们看到了hadoop当中有各种资源调度形式，当前hadoop的任务提交，默认提交到default队列里面去了，将所有的任务都提交到default队列，我们在实际工作当中，可以通过划分队列的形式，对不同的用户，划分不同的资源，让不同的用户的任务，提交到不同的队列里面去，实现资源的隔离
资源隔离目前有2种，静态隔离和动态隔离：
- 所谓静态隔离是以服务隔离，是通过cgroups（LINUX control groups) 功能来支持的。比如HADOOP服务包含 HDFS，HBASE，YARN等等，那么我们固定的设置比例，HDFS:20%；HBASE:40%；YARN:40%。系统会帮我们根据整个集群的CPU、内存、IO数量来分割资源，先提一下，IO是无法分割的，所以只能说当遇到IO问题时根据比例由谁先拿到资源，CPU和内存是预先分配好的。
- 这种按照固定比例分割就是静态分割，仔细想想，这种做法弊端太多，假设我按照一定的比例预先分割好了，但是如果我晚上主要跑mapreduce, 白天主要是HBASE工作，这种情况怎么办？静态分割无法很好的支持，缺陷太大。
- 动态隔离只要是针对 YARN 以及impala，所谓动态只是相对静态来说，其实也不是动态。先说YARN，在HADOOP整个环境，主要服务有哪些？ mapreduce（这里再提一下，mapreduce是应用，YARN 是框架，搞清楚这个概念），HBASE、HIVE、SPARK、HDFS、IMPALA，实际上主要的大概这些，很多人估计会表示不赞同，oozie、ES、storm、kylin、flink 等等这些和 YARN 离的太远了，不依赖YARN 的资源服务，而且这些服务都是单独部署就OK，关联性不大。所以主要和 YARN 有关也就是 HIVE、SPARK、Mapreduce。这几个服务也正是目前用的最多的（HBASE用的也很多，但是和YARN没啥关系）。
根据上面的描述，大家应该能理解为什么所谓的动态隔离主要是针对YARN。好了，既然YARN占的比重这么多，那么如果能很好的对YARN 进行资源隔离，那也是不错的。如果我有 3 个部分都需要使用 HADOOP，那么我希望能根据不同部门设置资源的优先级别，实际上也是根据比例来设置，建立 3 个 queue name, 开发部们 30%，数据分析部分 50%，运营部门 20%。
设置了比例之后，再提交 JOB 的时候设置 mapreduce.queue.name，那么JOB就会进入指定的队列里面。默认提交JOB到YARN的时候，规则是 root.users.username，队列不存在，会自动以这种格式生成队列名称。队列设置好之后，再通过ACL来控制谁能提交或者KIll job。
从上面2种资源隔离来看，没有哪一种做的很好，如果非要选一种，我会选取后者，隔离YARN资源，第一种固定分割服务的方式实在支持不了现在的业务
需求：现在一个集群当中，可能有多个用户都需要使用，例如开发人员需要提交任务，测试人员需要提交任务，以及其他部门工作同事也需要提交任务到集群上面去，对于我们多个用户同时提交任务，我们可以通过配置 yarn 的多用户资源隔离来进行实现。

查看默认提交方案

第一步：node01编辑yarn-site.xml

$ pwd
/bigdata/install/hadoop-3.1.4/etc/hadoop
vim yarn-site.xml

添加如下内容：


<property>
	<name>yarn.resourcemanager.scheduler.classname>
	<value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairSchedulervalue>
property>


<property>
	<name>yarn.scheduler.fair.allocation.filename>
	<value>/bigdata/install/hadoop-3.1.4/etc/hadoop/fair-scheduler.xmlvalue>
property>


<property>
	<name>yarn.scheduler.fair.preemptionname>
	<value>truevalue>
property>

<property>
	<name>yarn.scheduler.fair.preemption.cluster-utilization-thresholdname>
	<value>0.8fvalue>
property>


<property>
	<name>yarn.scheduler.fair.user-as-default-queuename>
	<value>truevalue>
	<description>default is Truedescription>
property>


<property>
	<name>yarn.scheduler.fair.allow-undeclared-poolsname>
	<value>falsevalue>
	<description>default is Truedescription>
property>

第二步：node01添加fair-scheduler.xml配置文件

公平调度器官网文档参考

vim fair-scheduler.xml

内容如下：


<allocations>
	
	<defaultQueueSchedulingPolicy>fairdefaultQueueSchedulingPolicy>

	<user name="hadoop">
		
		<maxRunningApps>30maxRunningApps>
	user>
	
	<userMaxAppsDefault>10userMaxAppsDefault>

	
	
	<queue name="root">
		<minResources>512 mb,4 vcoresminResources>
		<maxResources>102400 mb,100 vcoresmaxResources>
		<maxRunningApps>100maxRunningApps>
		<weight>1.0weight>
		<schedulingMode>fairschedulingMode>
		<aclSubmitApps> aclSubmitApps>
		<aclAdministerApps> aclAdministerApps>

		<queue name="default">
			<minResources>512 mb,4 vcoresminResources>
			<maxResources>30720 mb,30 vcoresmaxResources>
			<maxRunningApps>100maxRunningApps>
			<schedulingMode>fairschedulingMode>
			<weight>1.0weight>
			
			<aclSubmitApps>*aclSubmitApps>
		queue>

		<queue name="hadoop">
			<minResources>512 mb,4 vcoresminResources>
			<maxResources>20480 mb,20 vcoresmaxResources>
			<maxRunningApps>100maxRunningApps>
			<schedulingMode>fairschedulingMode>
			<weight>2.0weight>
			<aclSubmitApps>hadoop hadoopaclSubmitApps>
			<aclAdministerApps>hadoop hadoopaclAdministerApps>
		queue>

		<queue name="develop">
			<minResources>512 mb,4 vcoresminResources>
			<maxResources>20480 mb,20 vcoresmaxResources>
			<maxRunningApps>100maxRunningApps>
			<schedulingMode>fairschedulingMode>
			<weight>1weight>
			<aclSubmitApps>develop developaclSubmitApps>
			<aclAdministerApps>develop developaclAdministerApps>
		queue>

		<queue name="test1">
			<minResources>512 mb,4 vcoresminResources>
			<maxResources>20480 mb,20 vcoresmaxResources>
			<maxRunningApps>100maxRunningApps>
			<schedulingMode>fairschedulingMode>
			<weight>1.5weight>
			<aclSubmitApps>test1,hadoop,develop test1aclSubmitApps>
			<aclAdministerApps>test1 group_businessC,supergroupaclAdministerApps>
		queue>
	queue>
	
	<queuePlacementPolicy>
		
		<rule name="specified" create="false"/>
		
		<rule name="primaryGroup" create="false" />
		
		<rule name="default" queue="root.default"/>
	queuePlacementPolicy>
allocations>

第三步：将修改后的配置文件拷贝到其它机器

scp yarn-site.xml fair-scheduler.xml node02:$PWD
scp yarn-site.xml fair-scheduler.xml node03:$PWD

第四步：重启yarn集群

cd /bigdata/install/hadoop-3.1.4/
sbin/stop-yarn.sh
sbin/start-yarn.sh

第五步：修改任务提交的队列

修改代码，添加我们mapreduce任务需要提交到哪一个队列里面去

Configuration configuration = new Configuration();

//情况1
//注释掉 configuration.set("mapreduce.job.queuename", "hadoop");
//匹配规则：

//情况2
configuration.set("mapreduce.job.queuename", "hadoop");
//匹配规则：

//情况3
configuration.set("mapreduce.job.queuename", "hadoopv1");
//allocation文件中，注释掉；刷新配置yarn rmadmin -refreshQueues
//匹配规则：

hive任务指定提交队列，hive-site.xml文件添加：

<property>
    <name>mapreduce.job.queuenamename>
    <value>test1value>
property>

spark任务运行指定提交的队列

1- 脚本方式
--queue hadoop

2- 代码方式
sparkConf.set("spark.yarn.queue", "develop")

YARN基本使用

1. 配置文件


<configuration>
    <property>
        <name>mapreduce.framework.namename>
        <value>yarnvalue>
    property>
configuration>


<configuration>
    <property>
        <name>yarn.nodemanager.aux-servicesname>
        <value>mapreduce_shufflevalue>
    property>
configuration>

2. YARN启动停止

启动 ResourceManager 和 NodeManager （以下分别简称RM、NM）

# 主节点运行命令
$HADOOP_HOME/sbin/start-yarn.sh

停止 RM 和 NM

#主节点运行命令
$HADOOP_HOME/sbin/stop-yarn.sh

若RM没有启动起来，可以单独启动

#若RM没有启动，在主节点运行命令
#过时$HADOOP_HOME/sbin/yarn-daemon.sh start resouremanager
yarn --daemon start resourcemanager

#相反，可单独关闭
#过时$HADOOP_HOME/sbin/yarn-daemon.sh stop resouremanager
yarn --daemon stop resourcemanager

若NM没有启动起来，可以单独启动

#若NM没有启动，在相应节点运行命令
#过时$HADOOP_HOME/sbin/yarn-daemon.sh start nodemanager
yarn --daemon start nodemanager
#相反，可单独关闭
#过时$HADOOP_HOME/sbin/yarn-daemon.sh stop nodemanager
yarn --daemon stop nodemanager

3. YARN 常用命令

查看 YARN 命令列表：

查看 yarn application 命令：

# 1.查看正在运行的任务
yarn application -list
# 2.杀掉正在运行任务
yarn application -kill application_1617095172572_0003	
# 3.查看节点列表
yarn node -list
# 4.查看节点状况；所有端口号与上图中端口号要一致（随机分配）
yarn node -status node03:38122
# 5.查看yarn依赖jar的环境变量
yarn classpath

查看 yarn logs：

# 1.查看应用的日志
yarn logs -applicationId application_1638460497520_0001

你可能感兴趣的:(大数据,hadoop,big,data,mapreduce,yarn)

python3 annotations weixin_30615767 python 开发工具
引文与描述：AddingarbitrarymetadataannotationstoPythonfunctionsandvariables说说我的体会：类似编译的作用，能够帮助你尽早地避免错误1.不支持Python2+>>>deftest_annotation_py2(a_str:str):File"",line1deftest_annotation_py2(a_str:str):^SyntaxE
YARN container cpu超核如何解决 fzip YARN 超核
在ApacheHadoopYARN中，ContainerCPU超核（即Container使用的CPU资源超过分配量）是一个常见问题，可能导致集群性能下降或不稳定。以下是解决该问题的详细步骤：1.问题诊断1.1确认超核现象查看YARNWebUI：访问http://:8088，检查Container的CPU使用率是否持续超过分配的vCore数。检查NodeManager日志：查看/var/log/ha
修改/proc/pid/limits的max open files值
如2965进程的Maxopenfiles[root@utilshkwxadmin]#cat/proc/2965/limitsLimitSoftLimitHardLimitUnitsMaxcputimeunlimitedunlimitedsecondsMaxfilesizeunlimitedunlimitedbytesMaxdatasizeunlimitedunlimitedbytesMaxstac
Angular 从框架搭建到开发上线的完整流程啃火龙果的兔子开发DEMO angular.js 前端 javascript
Angular从框架搭建到开发上线的完整流程一、环境准备与项目搭建1.环境要求Node.js(推荐LTS版本，当前16.x/18.x)npm(随Node.js安装)或yarnAngularCLI(最新稳定版)2.安装AngularCLInpminstall-g@angular/cli#或yarnglobaladd@angular/cli3.创建新项目ngnewmy-angular-app--sty
大语言模型（LLM）课程学习（Curriculum Learning）、数据课程（data curriculum）指南：从原理到实践
在人工智能的浪潮之巅，我们总会惊叹于GPT-4、Llama3.1、Qwen2.5这些顶尖大语言模型（LLM）所展现出的惊人能力。它们似乎无所不知，能写诗、能编程、能进行复杂的逻辑推理。一个自然而然的问题是：它们是如何“学”会这一切的？大多数人会回答：“用海量数据喂出来的。”这个答案只说对了一半。如果你认为只要把互联网上能找到的所有数据（比如15万亿个token）随机打乱，然后“一锅烩”地喂给模型，
Hadoop-Mapreduce入门
Hadoop-Mapreduce入门MapReduce介绍mapreduce设计MapReduce编程规范入门案例WordCountMapReduce介绍MapReduce的思想核心是“分而治之”，适用于大量复杂的任务处理场景（大规模数据处理场景）。知识。Map负责“分”，把复杂的任务分解为若干个“简单的任务”来并行处理。可以进行拆分的前提是这些小任务可以并行计算，彼此间几乎没有依赖关系。Redu
Flink ClickHouse 连接器：实现 Flink 与 ClickHouse 无缝对接 Edingbrugh.南空大数据 flink flink clickhouse 大数据
引言在大数据处理领域，ApacheFlink是一款强大的流处理和批处理框架，而ClickHouse则是一个高性能的列式数据库，专为在线分析处理（OLAP）场景设计。FlinkClickHouse连接器为这两者之间搭建了一座桥梁，使得用户能够在Flink中方便地与ClickHouse数据库进行交互，实现数据的读写操作。本文将详细介绍FlinkClickHouse连接器的相关内容，包括其特点、使用方法
Hadoop MapReduce入门且行且安~ 数据分析进阶之路 Linux命令 hadoop MapReduce入门
入门简介计算过程分为两个阶段Map和ReduceMap阶段并行处理输入数据Reduce阶段对Map结果进行汇总针对python语言来说：map函数或者reduce函数来说，输出的数据格式为元组tuple一个简单的MapReduce程序只需要指定map()reduce()input()output()剩下的由框架完成。Linux常见命令：-读取文件（文本文件，在Windows下使用记事本打开的文件）
2.线性神经网络--Softmax回归温柔济沧海深度学习神经网络回归人工智能
2.1从零实现Softmax回归#数据集导入importtorchimporttorchvisionfromtorchvisionimporttransformsimportmatplotlib.pyplotaspltfromtqdmimporttqdmfromtorch.utils.dataimportDataLoader#####################################
Hadoop MapReduce 入门
一、Hadoop3.0.4环境准备1.环境要求Java8（Hadoop3.0.4不支持Java11+）单节点或多节点Linux系统（推荐Ubuntu18.04+）至少4GB内存（建议8GB+）50GB以上磁盘空间2.安装Java#安装Java8sudoapt-getinstallopenjdk-8-jdk#验证安装java-version3.下载与安装Hadoop3.0.4#下载Hadoop3.0
fac-via-ppg 项目使用教程
fac-via-ppg项目使用教程fac-via-ppgForeignAccentConversionbySynthesizingSpeechfromPhoneticPosteriorgrams(Interspeech'19)项目地址:https://gitcode.com/gh_mirrors/fa/fac-via-ppg1.项目目录结构及介绍fac-via-ppg/├──data/│└──fi
PDF 的开发工具库: Adobe PDF Library 纸上笔下 AcroBat pdf adobe SDK API 标准签名接口
AdobePDFLibrary是Adobe公司提供的一个软件开发工具包(SDK)，它本质上是AdobeAcrobat的"无界面"版本，但功能更为强大。作为PDF处理领域的专业解决方案，它为开发者提供了创建、操作和管理PDF文档的全面能力。1many1many1manyAdobePDFLibrary+createPDF()+manipulatePDF()+extractData()+renderPD
【零基础学AI】第29讲：BERT模型实战 - 情感分析 1989 0基础学AI bert 人工智能深度学习神经网络 cnn python 自然语言处理
本节课你将学到BERT模型的核心原理与优势HuggingFaceTransformers库的BERT接口使用情感分析任务的完整实现流程模型微调(Fine-tuning)技巧开始之前环境要求Python3.8+需要安装的包：pipinstalltorchtransformersdatasetspandastqdmGPU推荐（可加速训练）前置知识第28讲Transformer基础基本PyTorch使用
小米手机录音文件位置中少奇智能手机
录音机的文件位置有两个地方，一个地方是\Android\data\com.android.soundrecorder\files另外一个地方\MIUI\sound_recorder
附上java下载excel完整实现代码
importcom.alibaba.excel.EasyExcel;importcom.alibaba.excel.ExcelWriter;importcom.alibaba.excel.write.metadata.WriteSheet;importcom.alibaba.excel.write.metadata.fill.FillConfig;importcom.qhsm.airportexp
前端上传解析Excel；前端解析excel i_am_a_div_日积月累_ yarn安装和插件前端 excel 前端上传Excel文件前端解析Excel xlsx
注意：这里是前端使用xlsx插件，将前端上传的.xls、.xlsx文件，解析得到原始列表数据我的是vue3项目文章目录1.安装依赖2.组件封装3.子组件使用1.安装依赖[email protected].组件封装src/components/MyExcelData/index.vue{{props.msg}}import{defineProps}from'vue'import{UploadFi
【前端开发】Uniapp分页器：新增输入框跳转功能
基于UniApp官方扩展组件库uni-ui中的uni-pagination分页器组件，针对大数据量场景进行优化主要优化以下内容：新增输入框跳转功能：在原有分页器基础上，新增了一个输入框区域，允许用户直接输入目标页码进行跳转双向页码绑定优化：实现了输入框与当前页码的双向绑定机制。当用户通过其他方式（如点击上一页、下一页、页码按钮）切换页面时，输入框会自动更新显示当前页码。同时，当用户在输入框中输入页
大数据技术之Flink
第1章Flink概述1.1Flink是什么1.2Flink特点1.3FlinkvsSparkStreaming表Flink和Streaming对比FlinkStreaming计算模型流计算微批处理时间语义事件时间、处理时间处理时间窗口多、灵活少、不灵活（窗口必须是批次的整数倍）状态有没有流式SQL有没有1.4Flink的应用场景1.5Flink分层API第2章Flink快速上手2.1创建项目在准备
3.二维码的类型以及等级介绍
一、码的类型一维条形码：QRCode:日常生活中最广泛应用的矩阵式二维码Datamatrix:工业上也很常用，常用于商品包装和物流管理中，因其较小的尺寸和较高的密度适合小物品的标识。二、二维码的等级说明二维码的ABCDE五个等级是对二维码质量和可读性的分级划分。这些等级主要基于激光打标技术对二维码质量参数的评估结果。一般刚打印或者喷墨生成的二维码，有客户要求必须扫码并判断等级。注意，一般需要扫码等
什么是bigkey
BigKey（大键）是Redis中的一种潜在性能问题，通常指的是占用大量内存或者元素数量过多的键。它可能导致Redis性能下降，甚至阻塞其他请求，因此在使用Redis时需要特别关注。一、什么是BigKey？在Redis中，BigKey并不是指某个特定的Redis数据类型，而是指那些在内存中占用较多空间的键。具体来说，BigKey是指以下两种情况：一个键的数据量非常大：例如，一个非常大的字符串（几M
【Python】Python 3.10 新特性月落一寸光 Python新特性 python 开发语言
文章目录前言：一、新特性1.1PEP617；带括号的上下文管理器1.2更清楚的错误消息1.3PEP634：结构化模式匹配（match）1.4PEP604：有关类型提示的新增特性1.5PEP613：类型别名二、改进的模块2.1`asyncio`2.2`argparse`2.3`base64`2.4`collections.abc`2.5`dataclasses``__slots__`2.6`trac
网络安全之注入攻击：原理、危害与防御之道
网络安全之注入攻击：原理、危害与防御之道引言在OWASPTop10安全风险榜单中，注入攻击常年占据首位。2023年Verizon数据泄露调查报告显示，67%的Web应用漏洞与注入类攻击直接相关。本文从技术视角系统解析注入攻击的核心原理、典型场景及防御体系，揭示这一"网络安全头号杀手"的攻防博弈。一、注入攻击的本质与分类1.1基本定义当应用程序将非可信数据（UntrustedData）作为代码解析时
Excel建立个人宏工作簿谷曰十鑫 Excel Excel 个人宏工作簿
什么是个人宏工作簿？有什么作用？Excel个人宏工作簿里面的宏可以宏所有工作簿通用，一次建立，永久使用，每次打开其他Excel工作簿会默认打开个人宏工作簿，个人宏工作簿默认保存路径为：C:\Users\admin\AppData\Roaming\Microsoft\Excel\XLSTART\PERSONAL.XLSB，如果不能建立个人宏工作簿，可能是受杀毒软件影响，需要将该路径设置为杀毒软件白名
JetBrains 2025 全家桶 11合1 Mac电脑 2501_92680691 intellij-idea java macos pycharm datagrip webstorm phpstorm
JetBrains2025全家桶11合1Mac电脑，11个包含：IDEA、WebStorm、DataSpell、DataGrip、Pycharm、RustRover、CLion、Rider、PhpStorm、RubyMine、GoLand。原文地址：JetBrains2025全家桶11合1含IDEA、PyCharm、DataGrip、WebStrom、GoLand、CLion、PhpStorm、D
Arduino CH552 ADC的使用 perseverance52 WCH-E8051单片机开发 CH552 ADC
ArduinoCH552ADC的使用CH552ADC简介CH552芯片提供8位的模拟数字转换器，包括电压比较器和ADC模块。该转换器具有4个模拟信号输入通道，可以分时采集，支持0到VCC模拟输入电压范围。ADC寄存器ADC控制寄存器(ADC_CTRL)ADC配置寄存器(ADC_CFG)：ADC数据寄存器(ADC_DATA)：ADC功能ADC采样模式配置步骤：(1)、设置ADC_CFG寄存器中的AD
VTK中使用梯度幅值计算边缘点PY 三维渲染服务器前端 linux
#include#includevtkSmartPointerDetectEdgesWithGradient(vtkImageData*binaryVolume){</
Spring Boot多实例环境下保障数据一致性 KiddoStone spring boot 后端 java
在SpringBoot多实例环境下保障数据一致性需要结合分布式系统设计原则，以下是针对两个场景的设计与实现方案：1.多实例ScheduleJob的数据一致性问题场景多个实例同时执行定时任务，可能导致重复处理（如重复推送消息、重复扣款）。解决方案(1)分布式锁控制//使用Redisson实现分布式锁@Scheduled(cron="0*/5***?")publicvoidsyncDataJob(){
Mysql报错微风粼粼 mysql adb android
1.权限问题MySQL认证协议不兼容问题解决方案这个错误表明您的MySQL客户端与服务器要求的认证协议不兼容，通常发生在MySQL8.0+服务器与旧版客户端之间。nestedexceptionisorg.apache.ibatis.exceptions.PersistenceException:Errorqueryingdatabase.Cause:org.springframework.jdbc
如何在YashanDB中实现多级缓存策略数据库
随着大数据时代的到来，数据存储和访问的效率要求越来越高。数据库技术在面对海量数据、高并发访问时，性能瓶颈逐渐凸显，尤其是响应时间和系统吞吐量成为开发者和DBA关注的重点。为了解决这些问题，缓存策略被引入作为一种有效的解决方案。然而，不同类型的缓存（如内存缓存、磁盘缓存等）之间需要协调工作，以达到最佳性能。在此背景下，YashanDB作为一个云原生数据库，支持多级缓存策略，为数据访问提供了灵活的加速
vue拖拽组件自定义指令，解决拖拽和点击事件冲突问题，解决拖拽组件在iframe上面延迟卡顿问题 weixin_51565477 vue.js javascript 前端
1.自定义指令directives:{drag(el,data,vnode){constoDiv=eloDiv.onmousedown=e=>{//获取ifream，解决拖拽组件在ifream上面卡顿-根据ifreampointerEventsletiframDiv=document.getElementById("screenProjection")if(iframDiv){console.lo
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟