一只牛博

Spring中的批处理：数据处理的瑞士军刀

前言
第一：什么是Spring批处理
- 基本概念：
- 用途：
- 优势：
第二：Spring Batch入门
第三：item读取和写入
- ItemReader（数据读取器）
- ItemWriter（数据写入器）
- 批处理Step配置
第四：数据转换和处理
第五：作业流程控制
- 条件步骤（Conditional Steps）：
- 决策器（Decider）：
- 监听器（Listeners）：
- 实现复杂的作业逻辑：
第六：容错处理
- 重试（Retry）
- 跳过（Skip）
- 处理故障和异常情况
第七：批处理监控和管理
- 使用Spring Boot Actuator
- 使用Spring Batch Admin
第八：并行处理
第九：数据验证和校验
- 使用ItemProcessor进行数据验证
- 使用Skip机制
- 自定义验证器
第十：最佳实践和性能优化
第十一：批处理案例研究

前言

每天，企业和组织产生大量的数据。这些数据可能来自各种来源，包括日志、数据库、传感器等等。处理这些海量数据通常需要高效、可靠的方法，这就是Spring批处理的用武之地。无论你是数据工程师、数据科学家还是应用程序开发者，了解Spring批处理如何工作以及如何在你的项目中应用它都是非常有价值的。在这篇博客中，我们将带你深入探讨Spring中的批处理，从基础概念到高级技巧，为你揭示数据处理的奥秘。

第一：什么是Spring批处理

Spring批处理是Spring Framework中的一个模块，用于处理大规模数据批量处理任务的框架。它提供了一种有效的方式来执行大规模数据操作，如ETL（Extract, Transform, Load）任务、数据迁移、报表生成等。下面我们来介绍Spring批处理的基本概念和用途，并讨论它的优势。

基本概念：

Job（作业）：Job是Spring批处理的顶层概念，表示一个完整的批处理任务。它可以包含多个Step，定义了批处理的执行顺序和条件。
Step（步骤）：Step是Job中的一个单独步骤，它包含了数据读取、处理和写入的逻辑。每个Step可以定义一个ItemReader、ItemProcessor和ItemWriter。
ItemReader（数据读取器）：ItemReader用于从数据源中读取数据。Spring Batch提供了多种ItemReader的实现，包括从数据库查询、文件、XML、JSON、消息队列等数据源中读取数据。你也可以自定义ItemReader以满足特定需求。
ItemProcessor（数据处理器）：ItemProcessor用于对读取的数据进行处理和转换。这是一个可选组件，通常用于数据清洗、数据转换和数据筛选等操作。
ItemWriter（数据写入器）：ItemWriter用于将处理后的数据写回到目标数据源或文件。类似于ItemReader，Spring Batch提供了多种ItemWriter的实现，也可以自定义。

用途：

Spring批处理在以下应用场景中非常有用：

数据迁移和同步：当你需要将数据从一个数据源迁移到另一个数据源，或者保持多个数据源的同步时，Spring批处理可以帮助你实现这一目标。
报表生成：定期生成报表是企业应用的一部分。Spring批处理能够从多个数据源中提取数据，并生成报表。
ETL任务：ETL（抽取、转换、加载）是将数据从一个位置提取、转换并加载到另一个位置的常见任务。Spring批处理提供了强大的工具来执行这些任务。
大规模数据处理：无论是处理大型数据集还是大规模数据导入，Spring批处理能够有效地处理大量数据。

优势：

Spring批处理的优势包括：

可伸缩性：你可以配置批处理任务以在多个线程或分布式环境中运行，以处理大规模数据。
容错性：Spring批处理支持故障恢复，任务可以在失败后自动重新启动，并且提供了事务管理以确保数据一致性。
高性能：Spring Batch经过优化，可以处理大数据集而不会占用过多内存或资源。
可管理性：提供了监控和管理工具，可以查看任务的状态、进度和日志，以便管理和维护批处理作业。

总之，Spring批处理是一个强大的工具，适用于需要处理大规模数据的应用场景，提供了可伸缩性、容错性和高性能，以简化数据处理任务的开发和管理。同时，在代码实现中，可以使用注释来说明每个步骤的具体功能和逻辑，以提高代码的可读性和可维护性。

第二：Spring Batch入门

Spring Batch的入门涉及配置和启动批处理作业，以及理解一些关键概念。下面是一个入门指南：

1. 配置Spring Batch作业：

Spring Batch作业的配置通常涉及以下步骤：

a. 添加Spring Batch依赖： 首先，在你的项目中添加Spring Batch的依赖，通常可以通过Maven或Gradle来实现。以下是一个Maven依赖的示例：

<dependency>
    <groupId>org.springframework.bootgroupId>
    <artifactId>spring-boot-starter-batchartifactId>
dependency>

b. 创建Job配置类： 创建一个Java配置类，用于定义Spring Batch的作业。这个配置类应该使用@Configuration注解，并通过@EnableBatchProcessing注解启用Spring Batch。

@Configuration
@EnableBatchProcessing
public class BatchJobConfig {
    // Define your job and steps here
}

c. 定义Job和Step： 在作业配置类中，定义一个或多个Job和它们的Step。一个Job通常包括一个或多个Step。定义Job和Step的示例：

@Bean
public Job myJob() {
    return jobBuilderFactory.get("myJob")
            .start(myStep())
            .build();
}

@Bean
public Step myStep() {
    return stepBuilderFactory.get("myStep")
            .<InputType, OutputType>chunk(10)
            .reader(itemReader)
            .processor(itemProcessor)
            .writer(itemWriter)
            .build();
}

d. 配置ItemReader、ItemProcessor、和ItemWriter： 在Step的定义中，配置ItemReader用于读取数据，ItemProcessor用于处理数据，ItemWriter用于写入数据。你可以使用Spring Batch提供的现成组件，或者自定义这些组件以满足你的需求。

e. 启动作业： 最后，你可以使用Spring的ApplicationContext来获取作业并启动它：

JobLauncher jobLauncher = context.getBean(JobLauncher.class);
Job job = context.getBean("myJob", Job.class);

JobParameters jobParameters = new JobParametersBuilder()
        .addString("jobID", String.valueOf(System.currentTimeMillis()))
        .toJobParameters();

JobExecution jobExecution = jobLauncher.run(job, jobParameters);

这将启动名为"myJob"的作业，并将其执行。

2. 关键概念的解释：

Job（作业）：表示一个完整的批处理任务，包含一个或多个Step。作业定义了批处理任务的名称、参数等信息。
Step（步骤）：表示作业中的一个单独步骤，包括数据读取、处理和写入的逻辑。每个步骤由一个或多个ItemReader、ItemProcessor和ItemWriter组成。
JobInstance（作业实例）：表示作业的一次实际运行。每次启动作业时，都会创建一个新的JobInstance。
JobExecution（作业执行）：表示作业的一次执行。每次启动作业时，都会创建一个新的JobExecution，其中包含了作业执行的详细信息，如执行状态、开始时间、结束时间等。
ItemReader（数据读取器）：用于从数据源中读取数据，如数据库、文件等。
ItemProcessor（数据处理器）：用于对读取的数据进行处理和转换。
ItemWriter（数据写入器）：用于将处理后的数据写回到目标数据源或文件。

这些概念共同构成了Spring Batch的核心，允许你定义和管理复杂的批处理作业。每个概念都有其特定的任务和角色，而Spring Batch提供了许多内置组件，使配置和管理作业变得相对容易。

第三：item读取和写入

在Spring Batch中，ItemReader用于从数据源读取数据，而ItemWriter用于将数据写入目标存储。这些组件是批处理作业中的核心部分。以下是它们的解释和示例：

ItemReader（数据读取器）

ItemReader用于从数据源中读取数据，可以是数据库、文件、消息队列或任何其他数据源。Spring Batch提供了不同的ItemReader实现，可以根据需求选择适当的实现，或者自定义一个ItemReader。

以下是一个示例，使用JdbcCursorItemReader从数据库中读取数据：

@Bean
public ItemReader<MyData> myDataReader(DataSource dataSource) {
    JdbcCursorItemReader<MyData> reader = new JdbcCursorItemReader<>();
    reader.setDataSource(dataSource);
    reader.setSql("SELECT id, name, age FROM my_table");
    reader.setRowMapper(new BeanPropertyRowMapper<>(MyData.class));
    return reader;
}

在上述示例中，我们配置了一个JdbcCursorItemReader来读取数据库中的数据，通过SQL查询获取数据，然后使用BeanPropertyRowMapper将查询结果映射到MyData对象。

ItemWriter（数据写入器）

ItemWriter用于将处理后的数据写入目标存储，这可以是数据库、文件、消息队列等。和ItemReader一样，Spring Batch提供了多种ItemWriter的实现，也支持自定义ItemWriter。

以下是一个示例，使用JdbcBatchItemWriter将数据写入数据库：

@Bean
public ItemWriter<MyData> myDataWriter(DataSource dataSource) {
    JdbcBatchItemWriter<MyData> writer = new JdbcBatchItemWriter<>();
    writer.setItemSqlParameterSourceProvider(new BeanPropertyItemSqlParameterSourceProvider<>());
    writer.setDataSource(dataSource);
    writer.setSql("INSERT INTO my_target_table (id, name, age) VALUES (:id, :name, :age)");
    return writer;
}

在上述示例中，我们配置了一个JdbcBatchItemWriter来将处理后的数据写入目标数据库表中。我们指定了SQL语句，以及如何将MyData对象的属性映射到SQL参数。

批处理Step配置

通常，ItemReader和ItemWriter会在Step中一起使用。下面是一个Step的配置示例，将ItemReader和ItemWriter组合在一起：

@Bean
public Step myStep(ItemReader<MyData> reader, ItemWriter<MyData> writer) {
    return stepBuilderFactory.get("myStep")
            .<MyData, MyData>chunk(10) // 每次处理10条数据
            .reader(reader)
            .processor(myDataProcessor) // 可选，用于数据处理
            .writer(writer)
            .build();
}

在这个示例中，我们创建了一个Step（步骤）并使用ItemReader从数据源读取数据，可以使用ItemProcessor对数据进行处理，然后使用ItemWriter将数据写入目标存储。

通过这种方式，你可以配置复杂的数据处理流程，包括读取、处理和写入，以满足各种数据处理需求。Spring Batch的优点之一是它的可扩展性和灵活性，使你能够适应不同的数据处理场景。

第四：数据转换和处理

在Spring Batch中，你可以使用ItemProcessor来对读取的数据进行转换和处理。ItemProcessor是一个中间组件，它接收从ItemReader读取的数据，执行自定义的逻辑，然后将处理后的数据传递给ItemWriter进行写入。下面是演示如何使用ItemProcessor进行数据转换和应用自定义逻辑的示例：

1. 创建自定义的ItemProcessor：

首先，你需要创建一个自定义的ItemProcessor类，实现ItemProcessor接口，其中InputType和OutputType是你要处理的数据类型。下面是一个示例的ItemProcessor，它用于将字符串转为大写：

public class MyDataProcessor implements ItemProcessor<String, String> {
    @Override
    public String process(String item) throws Exception {
        // 在这里编写自定义逻辑，这里示例将字符串转为大写
        return item.toUpperCase();
    }
}

2. 在Step中应用自定义Processor：

接下来，在Step的配置中，将自定义的ItemProcessor应用于数据处理。以下是Step的配置示例：

@Bean
public Step myStep(ItemReader<String> reader, ItemWriter<String> writer, ItemProcessor<String, String> processor) {
    return stepBuilderFactory.get("myStep")
            .<String, String>chunk(10) // 每次处理10条数据
            .reader(reader)
            .processor(processor) // 使用自定义的ItemProcessor
            .writer(writer)
            .build();
}

在这个示例中，我们将自定义的MyDataProcessor应用于Step的processor部分。这意味着在读取数据后，每个数据项都会被送到MyDataProcessor中进行处理，然后将处理后的结果传递给ItemWriter进行写入。

3. 完整示例：

这是一个完整的示例，演示了如何在Spring Batch中使用自定义的ItemProcessor来处理数据：

@Configuration
@EnableBatchProcessing
public class BatchConfig {

    @Bean
    public ItemReader<String> myDataReader() {
        // 定义ItemReader，读取数据源
    }

    @Bean
    public ItemProcessor<String, String> myDataProcessor() {
        return new MyDataProcessor(); // 使用自定义的ItemProcessor
    }

    @Bean
    public ItemWriter<String> myDataWriter() {
        // 定义ItemWriter，将数据写入目标存储
    }

    @Bean
    public Step myStep(ItemReader<String> reader, ItemWriter<String> writer, ItemProcessor<String, String> processor) {
        return stepBuilderFactory.get("myStep")
                .<String, String>chunk(10) // 每次处理10条数据
                .reader(reader)
                .processor(processor) // 使用自定义的ItemProcessor
                .writer(writer)
                .build();
    }

    @Bean
    public Job myJob(JobCompletionNotificationListener listener, Step myStep) {
        return jobBuilderFactory.get("myJob")
                .incrementer(new RunIdIncrementer())
                .listener(listener)
                .flow(myStep)
                .end()
                .build();
    }
}

在这个示例中，我们定义了一个自定义的MyDataProcessor用于数据转换和处理，然后将它应用于Step的配置中。整个作业由Job包装，用于启动和执行。

通过这种方式，你可以应用自定义逻辑来处理数据，例如数据转换、验证、计算等，以满足具体的业务需求。

第五：作业流程控制

在Spring Batch中，作业流程控制是一种强大的方式，可以根据不同的条件、决策以及在作业生命周期中的各个阶段插入监听器来实现复杂的作业逻辑。以下是关于作业流程控制的讨论，包括条件步骤、决策器和监听器。

条件步骤（Conditional Steps）：

条件步骤允许你在作业执行期间根据特定条件来决定是否执行某个步骤。你可以使用Flow和JobExecutionDecider来实现条件步骤。以下是一个简单的示例：

@Bean
public Job myJob(JobBuilderFactory jobBuilderFactory, Step step1, Step step2) {
    return jobBuilderFactory.get("myJob")
        .start(step1)
        .next(decider()) // 使用决策器来决定下一步是step2还是其他步骤
        .from(decider()).on("YES").to(step2)
        .from(decider()).on("NO").end()
        .end()
        .build();
}

@Bean
public JobExecutionDecider decider() {
    return new MyDecider();
}

在上述示例中，MyDecider是一个自定义的决策器，根据某些条件返回不同的结果（例如，“YES"或"NO”）。作业在执行时，将依据这个决策来决定是执行step2还是结束作业。

决策器（Decider）：

决策器是一个自定义的组件，实现JobExecutionDecider接口，用于根据条件来决定下一个步骤。你可以在决策器中编写任何逻辑，根据你的需求来决定下一步的执行。下面是一个简单的决策器示例：

public class MyDecider implements JobExecutionDecider {
    @Override
    public FlowExecutionStatus decide(JobExecution jobExecution, StepExecution stepExecution) {
        if (someCondition) {
            return new FlowExecutionStatus("YES");
        } else {
            return new FlowExecutionStatus("NO");
        }
    }
}

监听器（Listeners）：

Spring Batch提供了各种类型的监听器，用于在作业执行的不同阶段触发自定义逻辑。监听器包括JobExecutionListener、StepExecutionListener和ChunkListener等。你可以使用这些监听器来监控和干预作业的执行。

例如，你可以创建一个JobExecutionListener来在作业开始或结束时执行某些操作：

public class MyJobListener implements JobExecutionListener {
    @Override
    public void beforeJob(JobExecution jobExecution) {
        // 在作业开始前执行的逻辑
    }

    @Override
    public void afterJob(JobExecution jobExecution) {
        // 在作业结束后执行的逻辑
    }
}

实现复杂的作业逻辑：

通过组合条件步骤、决策器和监听器，你可以实现复杂的作业逻辑。例如，你可以创建一个作业，根据某些条件决定执行不同的步骤，同时在作业的不同阶段使用监听器来执行特定的操作。

复杂的作业逻辑可能涉及多个条件步骤，决策器可以帮助你在不同步骤之间做出决策。同时，监听器可以用于记录、通知或执行额外的逻辑。

总之，Spring Batch提供了强大的工具和灵活性，允许你在作业流程中实现复杂的逻辑。这对于需要复杂条件控制和定制行为的数据处理任务非常有用。

第六：容错处理

Spring Batch提供了强大的容错处理机制，以处理作业执行过程中的故障和异常情况。两个常见的容错处理方式包括重试和跳过，下面是关于这些机制的介绍：

重试（Retry）

重试是一种容错处理机制，允许在发生异常时重新执行某个步骤或任务。Spring Batch允许你配置在什么情况下以及如何进行重试。以下是一个示例：

@Bean
public Step myStep(ItemReader<MyData> reader, ItemWriter<MyData> writer) {
    return stepBuilderFactory.get("myStep")
            .<MyData, MyData>chunk(10)
            .reader(reader)
            .processor(myDataProcessor)
            .writer(writer)
            .faultTolerant()
            .retry(Exception.class) // 在遇到Exception时进行重试
            .retryLimit(3) // 最多重试3次
            .build();
}

在上述示例中，我们使用faultTolerant()来启用容错处理，然后配置了重试机制。这表示如果在步骤执行时抛出了Exception，将最多重试3次。你可以根据需要自定义异常类型和重试次数。

跳过（Skip）

跳过是另一种容错处理机制，它允许在遇到异常时跳过一定数量的记录，然后继续执行。你可以配置哪些异常会导致跳过以及跳过的记录数。以下是一个示例：

@Bean
public Step myStep(ItemReader<MyData> reader, ItemWriter<MyData> writer) {
    return stepBuilderFactory.get("myStep")
            .<MyData, MyData>chunk(10)
            .reader(reader)
            .processor(myDataProcessor)
            .writer(writer)
            .faultTolerant()
            .skip(Exception.class) // 在遇到Exception时跳过
            .skipLimit(10) // 最多跳过10次
            .build();
}

在上述示例中，我们使用faultTolerant()启用容错处理，并配置了跳过机制。这表示如果在步骤执行时抛出了Exception，将最多跳过10次。

处理故障和异常情况

在Spring Batch中，你还可以使用监听器来处理故障和异常情况。例如，你可以实现SkipListener，RetryListener或StepExecutionListener等监听器来记录、通知或执行特定的逻辑，以响应重试或跳过操作。

下面是一个简单的示例，如何实现SkipListener来处理跳过操作：

public class MySkipListener implements SkipListener<MyData, MyData> {
    @Override
    public void onSkipInRead(Throwable t) {
        // 在读取数据时发生跳过时执行的逻辑
    }

    @Override
    public void onSkipInWrite(MyData item, Throwable t) {
        // 在写入数据时发生跳过时执行的逻辑
    }

    @Override
    public void onSkipInProcess(MyData item, Throwable t) {
        // 在处理数据时发生跳过时执行的逻辑
    }
}

然后，你可以在步骤的配置中添加这个监听器，以处理跳过情况：

@Bean
public Step myStep(ItemReader<MyData> reader, ItemWriter<MyData> writer) {
    return stepBuilderFactory.get("myStep")
            .<MyData, MyData>chunk(10)
            .reader(reader)
            .processor(myDataProcessor)
            .writer(writer)
            .faultTolerant()
            .skip(Exception.class)
            .skipLimit(10)
            .listener(mySkipListener) // 添加跳过监听器
            .build();
}

通过配置重试、跳过以及使用监听器，你可以有效地处理作业执行期间的故障和异常情况，确保数据处理作业在出现问题时仍然能够顺利进行。这对于处理不稳定数据源或复杂数据处理逻辑非常有用。

第七：批处理监控和管理

监控和管理Spring Batch作业是确保批处理系统稳定运行的关键部分。以下是使用Spring Boot Actuator和其他工具来监控和管理批处理作业的方法：

使用Spring Boot Actuator

Spring Boot Actuator是Spring Boot的子项目，它提供了监控和管理Spring Boot应用程序的功能，包括Spring Batch作业。你可以使用Actuator来监控作业的运行状态、指标和端点。以下是如何配置Spring Boot Actuator以监控Spring Batch作业：

a. 添加Spring Boot Actuator依赖：

在pom.xml中添加Spring Boot Actuator依赖：

<dependency>
    <groupId>org.springframework.bootgroupId>
    <artifactId>spring-boot-starter-actuatorartifactId>
dependency>

b. 配置Actuator端点：

在application.properties或application.yml中，配置Actuator端点的启用和安全性。例如，你可以启用/actuator路径下的job-executions端点以监控作业执行情况：

management:
  endpoints:
    web:
      exposure:
        include: job-executions

c. 使用Actuator监控：

启动应用程序后，你可以通过访问/actuator/job-executions端点来监控作业的执行情况。这将提供有关作业执行状态、持续时间和其他相关信息的数据。

使用Spring Batch Admin

Spring Batch Admin是一个Web应用程序，用于管理和监控Spring Batch作业。它提供了图形用户界面（GUI），允许你查看作业、启动作业、监控作业执行进度和查看作业执行历史。以下是如何使用Spring Batch Admin：

a. 添加Spring Batch Admin依赖：

在pom.xml中添加Spring Batch Admin依赖：

<dependency>
    <groupId>org.springframework.batchgroupId>
    <artifactId>spring-batch-admin-resourcesartifactId>
    <version>2.0.0.BUILD-SNAPSHOTversion> 
dependency>

b. 配置Spring Batch Admin：

创建一个Spring Boot配置类，用于配置Spring Batch Admin：

@Configuration
@EnableAutoConfiguration
@ComponentScan
public class BatchAdminConfiguration {
    // 配置Spring Batch Admin
}

c. 启动Spring Batch Admin应用：

启动应用程序后，你可以访问Spring Batch Admin的Web界面，通常是http://localhost:8080/spring-batch-admin/，然后登录并使用GUI来管理和监控作业。

Spring Batch Admin提供了一种更全面的方式来管理和监控批处理作业，适合那些需要集中管理和监控大量作业的场景。

无论你选择使用Spring Boot Actuator还是Spring Batch Admin，都能帮助你更有效地监控和管理Spring Batch作业，以确保作业正常运行并及时处理问题。

第八：并行处理

在Spring Batch中，可以通过多种方式实现并行处理以加速大规模数据处理。以下是一些方法和技巧：

1. 多线程Step处理：

一种常见的并行处理方式是将作业中的步骤（Step）配置为多线程处理。通过将一个步骤拆分为多个线程，每个线程可以独立处理数据的一部分。这可以显著提高处理速度，特别是在具有多核CPU的系统上。

以下是一个示例，如何配置一个多线程Step：

@Bean
public Step myParallelStep(ItemReader<MyData> reader, ItemWriter<MyData> writer) {
    return stepBuilderFactory.get("myParallelStep")
            .<MyData, MyData>chunk(10)
            .reader(reader)
            .processor(myDataProcessor)
            .writer(writer)
            .taskExecutor(taskExecutor()) // 配置任务执行器以实现多线程处理
            .throttleLimit(4) // 设置并行处理的线程数
            .build();
}

@Bean
public TaskExecutor taskExecutor() {
    ThreadPoolTaskExecutor taskExecutor = new ThreadPoolTaskExecutor();
    taskExecutor.setCorePoolSize(4); // 设置线程池的核心线程数
    taskExecutor.setMaxPoolSize(8); // 设置线程池的最大线程数
    taskExecutor.afterPropertiesSet();
    return taskExecutor;
}

在上述示例中，我们配置了一个myParallelStep步骤，使用taskExecutor()定义的任务执行器来实现多线程处理。throttleLimit(4)指定了并行处理的线程数。

2. 分区步骤（Partitioning）：

Spring Batch还提供了分区步骤，允许将大数据集拆分成多个分区，并在不同的线程上并行处理这些分区。这对于大规模数据处理非常有用。

以下是一个示例，如何配置一个分区步骤：

@Bean
public Step myPartitionStep() {
    return stepBuilderFactory.get("myPartitionStep")
            .partitioner("workerStep", partitioner()) // 配置分区器
            .step(workerStep())
            .gridSize(4) // 设置分区的数量
            .taskExecutor(taskExecutor()) // 配置任务执行器
            .build();
}

@Bean
public Partitioner partitioner() {
    return new MyPartitioner(); // 自定义分区器
}

@Bean
public Step workerStep() {
    return stepBuilderFactory.get("workerStep")
            .<MyData, MyData>chunk(10)
            .reader(reader)
            .processor(myDataProcessor)
            .writer(writer)
            .build();
}

在上述示例中，我们配置了一个分区步骤myPartitionStep，使用自定义分区器MyPartitioner将数据集分为多个分区，并配置多线程执行。

3. 远程分区（Remote Partitioning）：

对于更复杂的并行处理需求，可以使用远程分区，将不同步骤的分区分布在不同的计算节点上执行。这对于分布式系统中的大规模数据处理非常有用。

远程分区的配置比较复杂，需要使用Spring Batch的远程分区支持以及消息中间件等技术来实现。你需要定义分区步骤、远程工作节点和通信机制等。

以上是一些在Spring Batch中实现并行处理的方法。具体的选择取决于你的应用场景和需求。无论你选择哪种方法，都可以加速大规模数据处理，并更有效地利用多核系统的性能。

第九：数据验证和校验

在Spring Batch中，你可以执行数据验证和校验以确保数据的完整性和质量。数据验证和校验通常在读取数据（ItemReader）后，但在数据写入（ItemWriter）之前进行。以下是一些方法和技巧，以实现数据验证和校验：

使用ItemProcessor进行数据验证

你可以创建一个自定义的ItemProcessor，并在其中编写数据验证和校验逻辑。ItemProcessor允许你在处理数据之前对每个数据项进行验证和转换。

以下是一个示例，如何创建一个ItemProcessor来验证数据：

public class DataValidator implements ItemProcessor<MyData, MyData> {
    @Override
    public MyData process(MyData item) throws Exception {
        // 进行数据验证和校验
        if (item.isValid()) {
            return item; // 数据有效，返回原始数据
        } else {
            return null; // 数据无效，跳过该数据
        }
    }
}

在上述示例中，我们创建了一个DataValidator，它验证MyData对象是否有效，如果无效则返回null，从而跳过该数据。

使用Skip机制

Spring Batch提供了跳过（Skip）机制，允许你在遇到无效数据时跳过它们。你可以配置哪些异常会导致跳过以及跳过的记录数。

以下是一个示例，如何配置Step来使用跳过机制：

@Bean
public Step myStep(ItemReader<MyData> reader, ItemWriter<MyData> writer) {
    return stepBuilderFactory.get("myStep")
            .<MyData, MyData>chunk(10)
            .reader(reader)
            .processor(myDataProcessor)
            .writer(writer)
            .faultTolerant()
            .skip(DataValidationException.class) // 配置要跳过的异常类型
            .skipLimit(10) // 最多跳过10次
            .build();
}

在上述示例中，我们配置了myStep步骤，使用跳过机制来跳过DataValidationException异常，最多跳过10次。

自定义验证器

除了ItemProcessor和Skip机制，你还可以创建自定义验证器来进行更复杂的数据验证。自定义验证器可以在Step的监听器中执行，例如StepExecutionListener。

以下是一个示例，如何创建自定义验证器：

public class DataValidatorListener implements StepExecutionListener {
    @Override
    public void beforeStep(StepExecution stepExecution) {
        // 在步骤开始前执行的逻辑
    }

    @Override
    public ExitStatus afterStep(StepExecution stepExecution) {
        // 在步骤结束后执行的逻辑，包括数据验证和校验
        for (MyData item : stepExecution.getReadSkipCount()) {
            if (!item.isValid()) {
                // 数据无效，执行处理逻辑，例如记录日志或通知
            }
        }
        return stepExecution.getExitStatus();
    }
}

在上述示例中，我们创建了一个DataValidatorListener，它在步骤结束后对数据进行验证和校验，并执行相应的逻辑。

通过以上方法，你可以在Spring Batch中执行数据验证和校验，确保数据的完整性和质量。这对于处理不完整或无效数据非常有用，可以帮助保持数据一致性和质量。

第十：最佳实践和性能优化

编写高效的批处理作业和性能优化是非常重要的，特别是在处理大规模数据时。以下是一些最佳实践和性能优化策略：

1. 使用适当的数据源：

选择适合你数据量和性能需求的数据源。如果数据存储在关系型数据库中，考虑使用合适的数据库引擎和索引来提高读取和写入性能。使用连接池来管理数据库连接，以减少连接开销。

2. 合理设置Chunk大小：

在Step中，合理设置chunk的大小是很重要的。chunk定义了一次处理的数据记录数，设置合适的chunk大小可以最大程度地利用系统资源，避免过多的内存占用。通常，chunk的大小应根据系统内存和数据处理需求进行调整。

3. 启用并行处理：

如前所述，在大规模数据处理中启用并行处理是一种有效的性能优化策略。你可以使用多线程Step处理、分区步骤或远程分区等方法来实现并行处理，以更充分地利用多核CPU。

4. 缓存和数据预加载：

在批处理作业开始前，考虑预加载一部分数据到内存中，以减少读取外部数据源的频率。这可以提高数据访问速度。同时，合理使用缓存来减少数据库或外部数据源的访问。

5. 数据过滤和清洗：

在批处理开始前，进行数据过滤和清洗，排除不需要处理的数据或处理无效数据。这可以减少数据处理的复杂性和资源占用。

6. 监控和日志记录：

实施有效的监控和日志记录策略，以及时发现问题并进行性能分析。Spring Batch提供了许多监控选项，也可以使用第三方监控工具。

7. 异常处理和重试：

实现适当的异常处理和重试策略，以应对可能的错误情况。在配置步骤时，使用faultTolerant()和skip等机制来处理异常和错误数据。

8. 批处理分区和分片：

将作业分成多个批处理分区或分片，每个分区独立运行。这可以提高作业的并行性和性能。

9. 使用索引和查询优化：

如果你使用关系型数据库，确保数据库表中有适当的索引以加速数据读取。同时，编写高效的SQL查询，避免不必要的查询和数据加载。

10. 定期优化数据库：

定期执行数据库维护操作，如索引重建和表优化，以保持数据库性能。

11. 增量加载和增量处理：

考虑实施增量加载和处理策略，只处理已更改的数据，而不是整个数据集。

12. 资源管理：

有效地管理系统资源，包括内存、CPU和磁盘空间。确保批处理作业不会耗尽系统资源。

13. 并行提交：

如果可能，提交多个作业并行执行，以充分利用资源。

综合使用这些最佳实践和性能优化策略，可以帮助你编写高效的批处理作业，提高数据处理性能，减少资源占用，同时确保数据质量和完整性。不同的应用场景可能需要不同的优化策略，因此根据具体需求进行调整和优化。

第十一：批处理案例研究

批处理在各种领域都有广泛的应用，以下是一些实际的批处理应用案例：

1. 日志分析： 大型网站和应用程序通常生成大量的日志文件，记录用户活动、性能指标和错误信息。批处理可以用于定期分析这些日志，提取有用的信息，如用户行为趋势、访问量、错误分析等。分析结果可以用于改进应用程序性能和用户体验。

2. 报表生成： 企业通常需要生成各种报表，如销售报表、财务报表、库存报表等。批处理可以用于从不同数据源中提取和汇总数据，然后生成定期或按需的报表。这些报表通常需要满足法规要求，因此数据质量和完整性至关重要。

3. 数据迁移： 当企业需要从一个系统迁移到另一个系统时，数据迁移是一个常见的批处理应用。这可能涉及将数据从一个数据库或文件中提取，转换为新系统的格式，然后加载到新系统中。数据迁移通常需要高度的数据质量和完整性。

4. 批量支付处理： 金融机构和支付服务提供商使用批处理来处理大量的付款和交易。这包括工资支付、账单支付、电子转账等。批量支付处理需要高度的安全性和可靠性，以确保资金的正确分配。

5. 数据清洗和标准化： 组织通常需要将从不同来源获得的数据进行清洗和标准化，以确保数据的一致性和质量。批处理可以用于去重、格式化、校验和标准化数据，以满足特定的数据标准和规范。

6. ETL（提取、转换、加载）流程： ETL过程是将数据从一个系统提取、进行转换和最后加载到另一个系统的过程。这在数据仓库、商业智能和数据分析应用中非常常见。批处理作业用于执行ETL流程，以支持数据分析和决策。

7. 批量邮件发送： 市场营销团队使用批处理来发送大量的电子邮件，如广告、营销活动、新闻简报等。这些批处理作业需要高效地处理大量的邮件，并确保邮件的投递和反馈数据的记录。

8. 订单处理： 在电子商务和供应链管理中，订单处理是一个关键的批处理应用。订单通常需要验证、处理和记录，以确保及时交付和库存管理。

这些案例只是批处理应用中的一小部分示例。批处理在各种行业和领域都有广泛的应用，帮助组织处理大量数据、自动化重复任务和确保数据质量。每个案例都有其特定的需求和挑战，因此需要根据具体情况进行定制和优化。

你可能感兴趣的:(springboot,spring,批处理)

SpringBlade dict-biz/list 接口 SQL 注入漏洞文章永久免费只为良心 oracle 数据库
SpringBladedict-biz/list接口SQL注入漏洞POC:构造请求包查看返回包你的网址/api/blade-system/dict-biz/list?updatexml(1,concat(0x7e,md5(1),0x7e),1)=1漏洞概述在SpringBlade框架中，如果dict-biz/list接口的后台处理逻辑没有正确地对用户输入进行过滤或参数化查询（PreparedSta
spring如何整合druid连接池？惜.己 spring spring junit 数据库 java idea 后端 xml
目录spring整合druid连接池1.新建maven项目2.新建mavenModule3.导入相关依赖4.配置log4j2.xml5.配置druid.xml1)xml中如何引入properties2)下面是配置文件6.准备jdbc.propertiesJDBC配置项解释7.配置druid8.测试spring整合druid连接池1.新建maven项目打开IDE（比如IntelliJIDEA,Ecl
SpringCloudAlibaba—Sentinel(限流) 菜鸟爪哇
前言：自己在学习过程的记录，借鉴别人文章，记录自己实现的步骤。借鉴文章：https://blog.csdn.net/u014494148/article/details/105484410Sentinel介绍Sentinel诞生于阿里巴巴，其主要目标是流量控制和服务熔断。Sentinel是通过限制并发线程的数量（即信号隔离）来减少不稳定资源的影响，而不是使用线程池，省去了线程切换的性能开销。当资源
springboot+vue项目实战一-创建SpringBoot简单项目苹果酱0567 面试题汇总与解析 spring boot 后端 java 中间件开发语言
这段时间抽空给女朋友搭建一个个人博客，想着记录一下建站的过程，就当做笔记吧。虽然复制zjblog只要一个小时就可以搞定一个网站，或者用cms系统，三四个小时就可以做出一个前后台都有的网站，而且想做成啥样也都行。但是就是要从新做，自己做的意义不一样，更何况，俺就是专门干这个的，嘿嘿嘿要做一个网站，而且从零开始，首先呢就是技术选型了，经过一番思量决定选择-SpringBoot做后端，前端使用Vue做一
Spring MVC 全面指南：从入门到精通的详细解析一杯梅子酱技术栈学习 spring mvc java
引言：SpringMVC，作为Spring框架的一个重要模块，为构建Web应用提供了强大的功能和灵活性。无论是初学者还是有一定经验的开发者，掌握SpringMVC都将显著提升你的Web开发技能。本文旨在为初学者提供一个全面且易于理解的学习路径，通过详细的知识点分析和实际案例，帮助你快速上手SpringMVC，让学习过程既深刻又高效。一、SpringMVC简介1.1什么是SpringMVC？Spri
Spring Boot中实现跨域请求 BABA8891 spring boot 后端 java
在SpringBoot中实现跨域请求（CORS，Cross-OriginResourceSharing）可以通过多种方式，以下是几种常见的方法：1.使用@CrossOrigin注解在SpringBoot中，你可以在控制器或者具体的请求处理方法上使用@CrossOrigin注解来允许跨域请求。在控制器上应用：importorg.springframework.web.bind.annotation.
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
RabbitMQ生产者重复机制与确认机制 java炒饭小能手 java-rabbitmq rabbitmq java
重复机制生产者发送消息时，出现了网络故障，导致与MQ的连接中断。为了解决这个问题，SpringAMQP提供的消息发送时的重试机制。即：当RabbitTemplate与MQ连接超时后，多次重试。需要修该发送端模块的application.yaml文件，添加下面的内容：spring:rabbitmq:connection-timeout:1s#设置MQ的连接超时时间template:retry:ena
【Java】已解决：org.springframework.jdbc.datasource.lookup.DataSourceLookupFailureException 屿小夏 java 开发语言
文章目录一、分析问题背景问题背景描述出现问题的场景二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项已解决：org.springframework.jdbc.datasource.lookup.DataSourceLookupFailureException在使用Spring框架进行开发时，数据源的配置和使用是非常关键的一环。然而，有时候我们可能会遇到org.springframewo
SpringBoot和SpringMVC是什么关系?SpringBoot替代SpringMVC了吗? 瑞金彭于晏 spring boot 后端 java MVC spring 数据库
SpringBoot和SpringMVC都是SpringFramework生态系统中的一部分，但它们各自扮演着不同的角色和提供不同的功能集。理解它们之间的关系，首先需要了解SpringFramework本身。SpringFrameworkSpringFramework是一个全面的、开源的应用程序开发框架，它提供了广泛的功能来支持企业应用开发的几乎所有方面。SpringFramework的核心特性之
bat+ffmpeg批处理图片，图片批量转码张雨zy 音视频 ffmpeg
直接在cmd中输入//批量转码文件for%ain("*.png")doffmpeg-i"%a"-fs1024k"%~na.webp"//删除所有pngdel*.png@echooff表示执行了这条命令后关闭所有命令(包括本身这条命令)的回显。而echooff命令则表示关闭其他所有命令(不包括本身这条命令)的回显，@的作用就是关闭紧跟其后的一条命令的回显脚本完整代码写入脚本中后，需要多加一个%，例如
spring mvc @RequestBody String类型参数 zoyation spring-mvc spring mvc
通过如下配置：text/html;charset=UTF-8application/json;charset=UTF-8在springmvc的Controller层使用@RequestBody接收Content-Type为application/json的数据时，默认支持Map方式和对象方式参数@RequestMapping(value="/{code}/saveUser",method=Requ
Java -jar 如何在后台运行项目 vincent_hahaha
撸了今年阿里、头条和美团的面试，我有一个重要发现.......>>>说到运行jar包通常我们都会以下面的方式运行:java-jarspringboot-0.0.1-SNAPSHOT.jar这样运行的话会有一个问题，就是我们一关闭当前窗口就会停止运行项目，要想解决这个问题，就需要在后台运行。nohupjava-jarbabyshark-0.0.1-SNAPSHOT.jar >log.file 2>&
spring security中几大组件的作用和执行顺序阿信在这里 java spring
springsecurity中几大组件的作用和执行顺序在SpringSecurity中，AuthenticationProvider、GroupPermissionEvaluator、PermissionEvaluator、AbstractAuthenticationProcessingFilter、DefaultMethodSecurityExpressionHandler和ManageSecu
探索Zebra4J：构建高效企业级Web应用的微服务框架叶准鑫Natalie
探索Zebra4J：构建高效企业级Web应用的微服务框架ZebraZebra4J/Zebra4Js基于SpringBoot的JavaWeb/Nodejs框架项目地址:https://gitcode.com/gh_mirrors/zebra/Zebra项目介绍在当今快速发展的技术环境中，构建高效、可扩展的企业级Web应用是每个开发团队的追求。Zebra4J作为一款基于SpringBoot的全新微服务
基于JavaWeb开发的Java+SpringMvc+vue+element实现上海汽车博物馆平台网顺技术团队成品程序项目 java vue.js 汽车课程设计 spring boot
基于JavaWeb开发的Java+SpringMvc+vue+element实现上海汽车博物馆平台作者主页网顺技术团队欢迎点赞收藏⭐留言文末获取源码联系方式查看下方微信号获取联系方式承接各种定制系统精彩系列推荐精彩专栏推荐订阅不然下次找不到哟Java毕设项目精品实战案例《1000套》感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人文章目录基
分布式锁和spring事务管理暴躁的鱼锁及事务分布式 spring java
最近开发一个小程序遇到一个需求需要实现分布式事务管理业务需求用户在使用小程序的过程中可以查看景点，对景点地区或者城市标记是否想去，那么需要统计一个地点被标记的人数，以及记录某个用户对某个地点是否标记为想去，用两个表存储数据，一个地点表记录改地点被标记的次数，一个用户意向表记录某个用户对某个地点是否标记为想去。由于可能有多个用户同时标记一个地点，每个用户在前端点击想去按钮之后，后台接收到请求，从数据
Java面试笔记记录6 今天背八股了吗 java 面试笔记
1.Spring是什么？特性？有哪些模块？Spring是一个轻量级、非入侵式的控制反转Ioc和面向切面AOP的框架。特性：1.Ioc和DISpring的核心就是一个大的工厂容器，可以维护所有对象的创建和依赖关系，Spring工厂用于生成Bean，并且管理Bean的生命周期，实现高内聚低耦合的设计理念。2.AOP编程Spring提供面向切面编程，可以方便实现对程序进行权限拦截、运行监控等切面功能。3
Sentinel 眼泪落在琴弦 springcloud java java
Sentinel（服务熔断降级限流）1.引入spring-cloud-starter-alibaba-sentinel2.下载sentinel服务器3.配置application地址信息4.在控制台调整参数【默认所以流控设置保存在内存中，重启失效】5.想实时监控需每个微服务导入actuator，并配置application暴露所有端口6.自定义sentinel流控返回数据7.配置sentinel类
Spring @Async 深度解读：默认线程池执行器的配置与优化小码快撩 spring java 前端
在Spring中，@Async注解用于异步执行方法。默认情况下，@Async注解的任务是由一个线程池执行的。然而，这个默认的线程池是如何初始化的呢？本文将深入探讨这一过程，帮助你理解Spring异步任务背后的线程池执行器的初始化原理。1.@Async的基本使用首先，让我们快速回顾一下@Async的基本用法。@Async通常用于标注在需要异步执行的方法上，比如：@Servicepublicclass
Sentinel实时监控不展示问题朱杰jjj sentinel sentinel
问题官方插件Endpoint支持，可以实时统计出SpringBoot的健康状况和请求的调用信息在使用Endpoint特性之前需要在Maven中添加spring-boot-starter-actuator依赖，并在配置中允许Endpoints的访问。SpringBoot1.x中添加配置management.security.enabled=false。暴露的endpoint路径为/sentinelS
36. MyBatis如何支持多数据库操作？如何配置不同的数据源？这孩子叫逆 Mybatis笔记 mybatis 数据库
在许多企业级应用中，可能需要访问多个数据库。MyBatis可以通过配置多个数据源和动态切换数据源来支持多数据库操作。下面介绍如何在MyBatis中配置和使用多个数据源。1.多数据源的基本配置1.1配置多个数据源要支持多个数据源，首先需要在Spring或SpringBoot中配置不同的数据源。假设我们要连接两个数据库db1和db2，可以通过以下步骤进行配置。SpringBoot示例：applicat
SpringBoot整合ES搜索引擎实现网站热搜词及热度计算码踏云端 springboot Elasticsearch spring boot elasticsearch 后端热搜词热度计算 java
博主简介：历代文学网（PC端可以访问：https://literature.sinhy.com/#/literature?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于
Spring Security静态资源过滤（11）小黑屋说YYDS spring
在一个实际项目中，并非所有的请求都需要经过SpringSecurity过滤器，有一些特殊的请求，例如静态资源等，一般来说并不需要经过SpringSecurity过滤器链，用户如果访问这些静态资源，直接返回对应的资源即可。回顾关于WebSecurity的讲解，提到它里边维护了一个ignoredRequests变量,该变量，记录的就是所有需要被忽略的请求，这些被忽略的请求将不再经过SpringSecu
MyBatis批量插入大量数据小黑屋说YYDS MyBatis java
1.思路分析批量插入这个问题，我们用JDBC操作，其实就是两种思路吧：用一个for循环，把数据一条一条的插入（这种需要开启批处理）。生成一条插入sql，类似这种insertintouser(username,address)values(‘aa’,‘bb’),(‘cc’,‘dd’)…。到底哪种快呢？我们从两方面来考虑这个问题：插入SQL本身执行的效率。网络I/O。先说第一种方案，就是用for循环循
Spring Security定义多个过滤器链（10）小黑屋说YYDS spring
在SpringSecurity中可以同时存在多个过滤器链，一个WebSecurityConfigurerAdapter的实例就可以配置一条过滤器链。我们来看如下一个案例：@ConfigurationpublicclassSecurityConfig{@BeanUserDetailsServiceus(){InMemoryUserDetailsManagerusers=newInMemoryUser
java 技术架构相关文档圣心 java 架构开发语言
在Java中，有许多不同的技术和架构，这里我将列举一些常见的Java技术和架构，并提供一些相关的文档资源。SpringFrameworkSpring是一个开源的Java/JavaEE全功能框架，以Apache许可证形式发布，提供了一种实现企业级应用的方法。官方文档：SpringFrameworkSpringBootSpringBoot是Spring的一个子项目，旨在简化创建生产级的Spring应用
SpringSecurity初学总结 weixin_66442229 spring
springSecurity安全框架基于Java的安全框架主要有:SpringSecurity和Shiro介绍基础概念安全框架是对用户访问权限的控制,保证应用的安全性。其主要的工作是用户认证和用户授权|鉴权主要应用于Spring的企业应用系统,提供声明式的安全访问控制解决方案。它提供了一组可以在Spring应用上下文中配置的Bean能很好的结合Spring的DI依赖注入和AOP面向切面编程功能应用
java获取applicationcontext,SpringBoot获取ApplicationContext的3种方式花儿街参考
ApplicationContext是什么？简单来说就是Spring中的容器，可以用来获取容器中的各种bean组件，注册监听事件，加载资源文件等功能。ApplicationContext获取的几种方式1直接使用Autowired注入@ComponentpublicclassBook1{@AutowiredprivateApplicationContextapplicationContext;pub
SpringBoot 设置传入参数非必要 loveLifeLoveCoding springboot spring boot java spring
查看RequestParam源码packageorg.springframework.web.bind.annotation;importjava.lang.annotation.Documented;importjava.lang.annotation.ElementType;importjava.lang.annotation.Retention;importjava.lang.annotat
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache

Spring中的批处理：数据处理的瑞士军刀

Spring中的批处理：数据处理的瑞士军刀

前言

第一：什么是Spring批处理

基本概念：

用途：

优势：

第二：Spring Batch入门

第三：item读取和写入

ItemReader（数据读取器）

ItemWriter（数据写入器）

批处理Step配置

第四：数据转换和处理

第五：作业流程控制

条件步骤（Conditional Steps）：

决策器（Decider）：

监听器（Listeners）：

实现复杂的作业逻辑：

第六：容错处理

重试（Retry）

跳过（Skip）

处理故障和异常情况

第七：批处理监控和管理

使用Spring Boot Actuator

使用Spring Batch Admin

第八：并行处理

第九：数据验证和校验

使用ItemProcessor进行数据验证

使用Skip机制

自定义验证器

第十： 最佳实践和性能优化

第十一：批处理案例研究

你可能感兴趣的:(springboot,spring,批处理)

第十：最佳实践和性能优化