於之

Ignite计算网格第二部分

8.负载平衡

8.1.概述

Ignite中负载平衡是通过LoadBalancingSpi实现的，它控制所有节点的负载以及确保集群中的每个节点负载水平均衡。对于同质化环境中的同质化任务，负载平衡采用的是随机或者轮询的策略。不过在很多其它场景中，特别是在一些不均匀的负载下，就需要更复杂的自适应负载平衡策略。

LoadBalancingSpi采用“前”负载技术，即在将其发送到集群之前就对作业在某个节点的执行进行了调度。

数据并置

注意，当作业还没有与数据并置或者还没有在哪个节点上执行的倾向时，负载平衡就已经触发了。如果使用了计算和数据的并置，那么数据的并置优先于负载平衡。

8.2.轮询式负载平衡

RoundRobinLoadBalancingSpi以轮询的方式在节点间迭代，然后选择下一个连续的节点。轮询式负载平衡支持两种操作模式：每任务以及全局，全局模式为默认模式。

每任务模式

如果配置成每任务模式，当任务开始执行时实现会随机地选择一个节点，然后会顺序地迭代拓扑中所有的节点，对于任务拆分的大小等同于节点的数量时，这个模式保证所有的节点都会参与任务的执行。

全局模式

如果配置成全局模式，对于所有的任务都会维护一个节点的单一连续队列然后每次都会从队列中选择一个节点。这个模式中（不像每任务模式），当多个任务并发执行时，即使任务的拆分大小等同于节点的数量，同一个任务的某些作业仍然可能被赋予同一个节点。

RoundRobinLoadBalancingSpi spi = new RoundRobinLoadBalancingSpi();

// Configure SPI to use per-task mode (this is default behavior).
spi.setPerTask(true);

IgniteConfiguration cfg = new IgniteConfiguration();

// Override default load balancing SPI.
cfg.setLoadBalancingSpi(spi);

// Start Ignite node.
Ignition.start(cfg);

8.3.随机和加权负载平衡

WeightedRandomLoadBalancingSpi会为作业的执行随机选择一个节点。也可以选择为节点赋予权值，这样有更高权重的节点最终会使将作业分配给它的机会更多。所有节点的权重默认值都是10。

WeightedRandomLoadBalancingSpi spi= new WeightedRandomLoadBalancingSpi();

// Configure SPI to used weighted random load balancing.
spi.setUseWeights(true);

// Set weight for the local node.
spi.setNodeWeight(10);

IgniteConfiguration cfg = new IgniteConfiguration();

// Override default load balancing SPI.
cfg.setLoadBalancingSpi(spi);

// Start Ignite node.
Ignition.start(cfg);

8.4.磨洋工(与节点运行效率相关的负载)

通常集群由很多计算机组成，这就可能存在配置不均衡的情况，这时开启JobStealingCollisionSpi就会有助于避免作业聚集在过载的节点，或者远离低利用率的节点。

JobStealingCollisionSpi支持作业从高负载节点到低负载节点的移动，当部分作业完成得很快，而其它的作业还在高负载节点中排队时，这个SPI就会非常有用。这种情况下，等待作业就会被移动到低负载的节点。

JobStealingCollisionSpi采用的是后负载技术，它可以在任务已经被调度在节点A执行后重新分配到节点B。

下面是配置JobStealingCollisionSpi的示例：

JobStealingCollisionSpi spi = new JobStealingCollisionSpi();

 // Configure number of waiting jobs
 // in the queue for job stealing.
 spi.setWaitJobsThreshold(10);

 // Configure message expire time (in milliseconds).
 spi.setMessageExpireTime(1000);

 // Configure stealing attempts number.
 spi.setMaximumStealingAttempts(10);

 // Configure number of active jobs that are allowed to execute
 // in parallel. This number should usually be equal to the number
 // of threads in the pool (default is 100).
 spi.setActiveJobsThreshold(50);

 // Enable stealing.
 spi.setStealingEnabled(true);

 // Set stealing attribute to steal from/to nodes that have it.
 spi.setStealingAttributes(Collections.singletonMap("node.segment", "foobar"));

 // Enable `JobStealingFailoverSpi`
 JobStealingFailoverSpi failoverSpi = new JobStealingFailoverSpi();

 IgniteConfiguration cfg = new IgniteConfiguration();

 // Override default Collision SPI.
 cfg.setCollisionSpi(spi);

 cfg.setFailoverSpi(failoverSpi);

必要的配置

注意org.apache.ignite.spi.failover.jobstealing.JobStealingFailoverSpi和IgniteConfiguration.getMetricsUpdateFrequency()都要开启，这样这个SPI才能正常工作，JobStealingCollisionSpi的其它配置参数都是可选的。

9.检查点

#9.1.概述

检查点提供了保存一个作业中间状态的能力，它有助于一个长期运行的作业保存一些中间状态以防节点故障。重启一个故障节点后，一个作业会从保存的检查点载入然后从故障处继续执行。要开启作业检查点状态，实现java.io.Serializable接口即可。

检查点功能可以通过GridTaskSession接口的如下方法启用：

ComputeTaskSession.loadCheckpoint(String)

ComputeTaskSession.removeCheckpoint(String)

ComputeTaskSession.saveCheckpoint(String, Object)

@ComputeTaskSessionFullSupport注解

注意检查点因为性能的原因默认是禁用的，要启用它需要在任务或者闭包类上加注@ComputeTaskSessionFullSupport注解。

9.2.主节点故障保护

检查点的一个重要使用场景是避免“主”节点（发起任务的节点）的故障。当主节点故障时，Ignite不知道将作业的执行结果发送给谁，这样结果就会被丢弃。

这种情况下要恢复，可以先将作业的最终执行结果保存为一个检查点然后在”主”节点故障时有一个逻辑来重新运行整个任务。这时任务的重新运行会非常快因为所有的作业都可以从已保存的检查点启动。

9.3.设置检查点

每个计算任务都可以通过调用ComputeTaskSession.saveCheckpoint(...)方法定期地保存检查点。

如果作业确实保存了检查点，那么当它开始执行时，应该检查检查点是否可用然后从最后保存的检查点处开始执行。

IgniteCompute compute = ignite.compute();

compute.run(new CheckpointsRunnable());

/**
 * Note that this class is annotated with @ComputeTaskSessionFullSupport
 * annotation to enable checkpointing.
    启用分布式任务会话
 */
@ComputeTaskSessionFullSupport
private static class CheckpointsRunnable implements IgniteCallable

setter方法	描述	默认值
`setDataSource(DataSource)`	设置用于数据库访问的数据源	无
`setCheckpointTableName(String)`	设置检查点表名	`CHECKPOINTS`
`setKeyFieldName(String)`	设置检查点键字段名	`NAME`
`setKeyFieldType(String)`	设置检查点键字段类型，字段应该有相应的SQL字符串类型（比如`VARCHAR`）	`VARCHAR(256)`
`setValueFieldName(String)`	设置检查点值字段名	`VALUE`
`setValueFieldType(String)`	设置检查点值字段类型，注意，字段需要有相应的SQL BLOB类型，默认值是BLOB，但不是所有数据库都兼容，比如，如果使用HSQL DB，那么类型应该为`longvarbinary`	`BLOB`
`setExpireDateFieldName(String)`	设置检查点过期时间字段名	`EXPIRE_DATE`
`setExpireDateFieldType(String)`	设置检查点过期时间字段类型，字段应该有相应的`DATETIME`类型	`DATETIME`
`setNumberOfRetries(int)`	任何数据库错误时的重试次数	`2`
`setUser(String)`	设置检查点数据库用户名，注意只有同时设置了用户名和密码时，认证才会执行	`无`
`setPwd(String)`	设置检查点数据库密码	`无`

setter方法	描述	默认值
`setAwsCredentials(AWSCredentials)`	设置要使用的AWS凭证来保存检查点	`无，但必须提供`
`setClientConfiguration(Client)`	设置AWS客户端配置	`无`
`setBucketNameSuffix(String)`	设置bucket名字后缀	`default-bucket`

属性	描述	可选	默认值
`uriList`	SPI扫描新任务的URI列表	是	`file://${IGNITE_HOME}/work/deployment/file`,注意如果要使用默认文件夹,`IGNITE_HOME`必须设置。
`scanners`	用于部署资源的`UriDeploymentScanner`实现的数组	是	`UriDeploymentFileScanner`和`UriDeploymentHttpScanner`
`temporaryDirectoryPath`	要扫描的GAR文件和目录要拷贝的目标临时目录路径	是	`java.io.tmpdir`系统属性值
`encodeUri`	控制URI中路径部分编码的标志	是	`true`

属性名称	类型	描述	默认值
`taskClass`	Class	自定义任务类	GridifyDefaultTask.class
`taskName`	String	要启动的自定义任务名	“”
`timeout`	long	任务执行超时时间，0为没有超时限制	0
`interceptor`	Class	过滤网格化方法的拦截器	GridifyInterceptor.class
`gridName`	String	要使用的网格名	“”

Ignite计算网格第二部分

8.负载平衡

8.1.概述

8.2.轮询式负载平衡

8.3.随机和加权负载平衡

8.4.磨洋工(与节点运行效率相关的负载)

9.检查点

#9.1.概述

9.2.主节点故障保护

9.3.设置检查点

9.5.文件系统检查点配置

9.6.缓存检查点配置

9.7.数据库检查点配置

9.8.Amazon S3 检查点配置

10.作业调度

#10.1.概述

#10.2.FIFO排序

10.3.优先级排序

11.任务部署

#11.1.DeploymentSpi

#11.2.UriDeploymentSpi

12.基于Cron的调度

12.1.概述

12.2.SchedulerFuture

12.3.语法扩展

13.持续映射

13.1.概述

13.2.运行持续的映射任务

13.3.示例

14.启用基于AOP的网格

14.1.Gridify注解

14.2.配置AOP

你可能感兴趣的:(Ignite学习)