关于大数据之批处理SpringBatch

大数据时代,数据是现代企业最宝贵的核心资产,是企业运用科学管理、决策分析的基础

企业如何通过各种技术手段,并把数据转换为信息、知识和商机已经成为提高其核心竞争力的主要手段。

而数据批处理测试达成上诉目标的一个主要技术手段,通过数据批处理,可以完成数据的加载、抽取、转换、清洗等功能,进而支撑企业的各种数据的分析。


关于SpringBatch:

SpringBatch是一个轻量级的、完善的批处理框架SpringBatch是spring的一个子项目

SpringBatch提供了大量可重用的组件,包括日志、追踪、事务、任务作业统计、任务重启、跳过、重复、资源管理等。

SpringBatch具有高性能、高可靠性、并行处理的能力,适用于金融、电信、大型制造业等使用。

SpringBatch是一个批处理框架,不是任务调度框架,但是需要和调度框架合作构建完成批处理任务,SpringBatch只关心批处理任务相关的问题,如事务、并发、监控、执行等,

并不提供相应的调度功能。


调度框架:

Quartz、JobServer、Oddjob等

SpringBatch业务适用场景:

  1. 定期提交批处理任务
  2. 并行批处理,即并行处理任务
  3. 企业消息驱动处理
  4. 大规模的并行处理
  5. 手动或定时的重启
  6. 按顺序处理依赖任务(可扩展为工作流驱动的批处理)
  7. 部分处理,如在回滚忽略记录
  8. 完整的批处理事务

你可能感兴趣的:(关于大数据之批处理SpringBatch)