枫叶梨花

Hadoop基本信息

概念

Hadoop是Apache旗下的一个用Java语言实现开源软件框架，是一个存储和计算大规模数据的软件平台。

框架内容

狭义解释

核心组件

HDFS 分布式文件系统 - 解决海量数据存储
MAPREDUCE 分布式运算编程框架 - 解决海量数据计算
YARN 作业调度和集群资源管理的框架 - 解决资源任务调度

广义解释

Hadoop的生态圈

HUE - 运营和开发Hadoop应用的图形化用户界面。
Kafka - 大数据消息队列。
Oozie - 用于 Hadoop 平台的开源的工作流调度引擎。是用来管理Hadoop作业。
Spark - 大规模数据处理的统一分析引擎。实时数据或者离线数据的分析。
Flink - 实时数据流分析。
Sqoop - 数据迁移工作，充当ETL工具。
Hive - 数据仓库，可用作离线数据分析。
Zeppelin - 可以进行大数据可视化分析的交互式开发系统，可以承担数据接入、数据发现、数据分析、数据可视化、数据协作等任务。
Drill - Hadoop和NoSQL低延迟的SQL查询引擎。低延迟的分布式海量数据（涵盖结构化、半结构化以及嵌套数据）交互式查询引擎。
Mahout - 提供一些可扩展的机器学习领域经典算法的实现，旨在帮助开发人员更加方便快捷地创建智能应用程序。
Tajo - 一个分布式数据仓库系统，基于 Hadoop 实现，特点是低延迟、高可伸缩，提供专用查询和 ETL 工具。
Avro - 一个数据序列化系统，设计用于支持大批量数据交换的应用。
Pig - 基于Hadoop的大规模数据分析平台，它提供的SQL-LIKE语言叫Pig Latin，该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。Pig为复杂的海量数据并行计算提供了一个简单的操作和编程接口。
Impala - 一个架构于hadoop之上的全新、开源MPP查询引擎，提供低延迟、高并发的以读为主的查询。
Tez - 支持 DAG 作业的开源计算框架，它可以将多个有依赖的作业转换为一个作业从而大幅提升 DAG 作业的性能。计算引擎。
Zookeeper - 一个分布式的，开放源码的分布式应用程序协调服务。
Hbase - 一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。
Cassandra - 一套开源分布式数据库管理系统，由Facebook开发，用于储存特别大的数据。
Redis - 高性能K-Vs数据库。
Chukwa - 一个开源的用于监控大型分布式系统的数据收集系统。
Mesos - 开源分布式资源管理框架，它被称为是分布式系统的内核。
Yarn - 负责Hadoop集群中的资源管理(resource management)和对任务进行调度和监控(scheduling/monitoring)。
MapReduce - 一种编程模型，用于大规模数据集（大于1TB）的并行运算。
Flume - 一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统。
Hdfs - 设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统（Distributed File System）。
Ambari - 一种基于Web的工具，支持Apache Hadoop集群的供应、管理和监控。

Hadoop配置的文件

配置文件名	配置对象	主要内容
core-site.xml	集群全局参数	用于定义系统级别的参数，如HDFS URL、Hadoop的临时目录等。
hdfs-site.xml	HDFS参数	如名称节点和数据节点的存放位置、文件副本的个数、文件读取权限
mapred-site.xml	Mapreduce参数	包括JobHistory Server和应用程序参数两部分，如reduce任务的默认个数、任务所能够使用内存的默认上下限等
yarn-site.xml	集群资源管理系统参数	配置ResourceManager，NodeManager的通信端口，web监控端口等

Hadoop之HDFS

概述

HDFS定义

HDFS(Hadoop Distributed File System) 它是一个文件系统，用于存储文件，通过目录树来定位文件；其次，它是分布式的，由很多服务器联合起来实现其功能，集群中的服务器有各自的角色。

HDFS的使用场景：适合一次写入，多次读出的场景，且不支持文件的修改。适合做数据分析，并不适合用来做网盘应用。

优点

高容错性，数据自动保存多个副本。某一个副本丢失以后，它可以自动恢复。
适合处理大数据。
可在廉价机器上，通过多副本机制提高可靠性。

缺点

不适合低延时数据访问。
无法高效的对大量小文件进行存储。
不支持并发写入、文件随机修改。

HDFS组成架构

NameNode

Master，它是一个主管、管理者。

管理HDFS的名称空间
配置副本策略
管理数据块(Block)映射信息
处理客户端读写请求

DataNode

Slave，NameNode下达命令，DataNode执行实际的操作。

存储实际的数据块
执行数据块的读/写操作

Client客户端

文件切分。文件上传HDFS的时候，Client将文件切分为一个一个Block，然后进行上传
与NameNode交互，获取文件的位置信息
与DataNode交互，读取或者写入数据
Client提供一些命令来管理HDFS，比如NameNode格式化
Clientk可以通过一些命令来访问HDFS，比如对HDFS增删查改操作

Secondary NameNode

并非NameNode的热备。当NameNode挂掉的时候，它并不能马上替换NameNode并提供服务。

辅助NameNode，分担其工作量
在紧急情况下，可辅助恢复NameNode

HDFS文件块

概述

hadoop集群中文件的存储都是以块的形式存储在hdfs中。

默认值

从2.7.3版本开始block size的默认大小为128M，之前版本的默认值是64M.

如何修改block块的大小？

可以通过修改hdfs-site.xml文件中的dfs.blocksize对应的值。

注意：在修改HDFS的数据块大小时，首先停掉集群hadoop的运行进程，修改完毕后重新启动。

block块大小设置规则

在实际应用中，hdfs block块的大小设置为多少合适呢？为什么有的是64M，有的是128M、256M、512呢？

首先我们先来了解几个概念：

1）寻址时间：HDFS中找到目标文件block块所花费的时间。

2）原理：文件块越大，寻址时间越短，但磁盘传输时间越长；文件块越小，寻址时间越长，但磁盘传输时间越短。

block不能设置过大，也不要能设置过小

如果块设置过大，一方面从磁盘传输数据的时间会明显大于寻址时间，导致程序在处理这块数据时，变得非常慢；另一方面，MapReduce中的map任务通常一次只处理一个块中的数据，如果块过大运行速度也会很慢。
如果设置过小，一方面存放大量小文件会占用NameNode中大量内存来存储元数据，而NameNode的内存是有限的，不可取；另一方面块过小，寻址时间增长，导致程序一直在找block的开始位置。因此，块适当设置大一些，减少寻址时间，那么传输一个有多个块组成的文件的时间主要取决于磁盘的传输速度。

多大合适呢？

1）HDFS中平均寻址时间大概为10ms；

2）经过前任的大量测试发现，寻址时间为传输时间的1%时，为最佳状态，所以最佳传输时间为：

10ms/0.01=1000s=1s

3）目前磁盘的传输速度普遍为100MB/s，最佳block大小计算：

00MB/s*1s=100MB

所以我们设置block大小为128MB.

4）实际中，磁盘传输速率为200MB/s时，一般设定block大小为256MB;磁盘传输速率为400MB/s时，一般设定block大小为512MB.

HDFS的Shell操作

Usage: hadoop fs [generic options]
        [-appendToFile <localsrc> ... <dst>]
        [-cat [-ignoreCrc] <src> ...]
        [-checksum <src> ...]
        [-chgrp [-R] GROUP PATH...]
        [-chmod [-R] <MODE[,MODE]... | OCTALMODE> PATH...]
        [-chown [-R] [OWNER][:[GROUP]] PATH...]
        [-copyFromLocal [-f] [-p] [-l] [-d] [-t <thread count>] <localsrc> ... <dst>]
        [-copyToLocal [-f] [-p] [-ignoreCrc] [-crc] <src> ... <localdst>]
        [-count [-q] [-h] [-v] [-t [<storage type>]] [-u] [-x] [-e] <path> ...]
        [-cp [-f] [-p | -p[topax]] [-d] <src> ... <dst>]
        [-createSnapshot <snapshotDir> [<snapshotName>]]
        [-deleteSnapshot <snapshotDir> <snapshotName>]
        [-df [-h] [<path> ...]]
        [-du [-s] [-h] [-v] [-x] <path> ...]
        [-expunge [-immediate]]
        [-find <path> ... <expression> ...]
        [-get [-f] [-p] [-ignoreCrc] [-crc] <src> ... <localdst>]
        [-getfacl [-R] <path>]
        [-getfattr [-R] {-n name | -d} [-e en] <path>]
        [-getmerge [-nl] [-skip-empty-file] <src> <localdst>]
        [-head <file>]
        [-help [cmd ...]]
        [-ls [-C] [-d] [-h] [-q] [-R] [-t] [-S] [-r] [-u] [-e] [<path> ...]]
        [-mkdir [-p] <path> ...]
        [-moveFromLocal [-f] [-p] [-l] [-d] <localsrc> ... <dst>]
        [-moveToLocal <src> <localdst>]
        [-mv <src> ... <dst>]
        [-put [-f] [-p] [-l] [-d] [-t <thread count>] <localsrc> ... <dst>]
        [-renameSnapshot <snapshotDir> <oldName> <newName>]
        [-rm [-f] [-r|-R] [-skipTrash] [-safely] <src> ...]
        [-rmdir [--ignore-fail-on-non-empty] <dir> ...]
        [-setfacl [-R] [{-b|-k} {-m|-x <acl_spec>} <path>]|[--set <acl_spec> <path>]]
        [-setfattr {-n name [-v value] | -x name} <path>]
        [-setrep [-R] [-w] <rep> <path> ...]
        [-stat [format] <path> ...]
        [-tail [-f] [-s <sleep interval>] <file>]
        [-test -[defswrz] <path>]
        [-text [-ignoreCrc] <src> ...]
        [-touch [-a] [-m] [-t TIMESTAMP ] [-c] <path> ...]
        [-touchz <path> ...]
        [-truncate [-w] <length> <path> ...]
        [-usage [cmd ...]]

HDFS的数据流

写数据流程

1、客户端通过Distributed FileSystem模块向NameNode请求上传文件，NameNode检查目标文件是否已存在，父目录是否存在。

2、NameNode返回是否可以上传

3、客户端请求第一个Block上传到哪几个DataNode服务器上。

4、NameNode返回3个DataNode节点，分别为dn1、dn2、dn3。

5、客户端通过FSDataOutputStream模块请求dn1上传数据，dn1收到请求会继续调用dn2，然后dn2调用dn3，将这个通信管道j建立完成。

6、dn1、dn2、dn3逐级应答客户端。

7、客户端开始往dn1上传第一个Block(先从磁盘读取数据放到一个本地内存缓存)，以Packet为单位，dn1收到一个Packet就会传给dn2，dn2传给dn3；dn1没传一个Packet会放入一个应答队列等待应答。

8、当一个Block传输完成之后，客户端再次请求NameNode上传第二个Block的服务器。(重复执行3-7步)。

读数据流程

1、HDFS通过Distributed FileSystem模块向NameNode请求获得文件开始部分或者全部Block列表

2、NameNode返回Block列表

3、Client Node从距离最近的DataNode上读取数据。

4、Client Noded调用read() 方法

5、找出离ClientNode最近的DataNode并连接DataNode读取

HDFS使用的是就近读取。

Hadoop之MapReduce

概述

定义

MapReduce是一个分布式运算程序的编程框架，是用户开发"基于Hadoop的数据分析应用"的核心框架。

MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序，并发运行在一个Hadoop集群中。

注意

不擅长实时计算
不擅长流式计算
不擅长DAG(有向图)计算

MapReduce核心编程思想

1）MapReduce运算程序一般需要分成2个阶段:Map阶段和Reduce阶段。

2）Map阶段的并发MapTask，完全并行运行，互不相干

3）Reduce阶段的并发ReduceTask，完全互不相干，但是他们的数据依赖于上一阶段的所有MapTask并发实例输出

4）MapReduce编程模型只能包含一个Map阶段和一个Reduce阶段，如果用户的业务逻辑非常复杂，那就只能多个MapReduce程序，串行运行。

MapReduce进程

一个完整的MapReduce程序在分布式运行时有三类实例进程

MrAppMaster 负责整个程序的过程调度及状态协调
MapTask 负责Map阶段的整个数据处理流程
ReduceTask 负责Reduce阶段的整个数据处理流程

MapReduce编程规范

Mapper阶段

1、用户自定义的Mapper要继承自己的父类

2、Mapper的输入数据是KVd对形式(KV的类型可自定义)

3、Mapper中的业务逻辑写在map()方法中

4、Mapper的输出数据是KV对的形式(KV的类型可自定义)

5、map()方法(MapTask进程)对每一个调用一次

Reducer阶段

1、用户自定义的Reducer要继承自己的父类

2、Reducer的输入数据类型对应Mapper的输出数据类型，也是KV

3、Reducer的业务逻辑写在reduce()方法中

4、ReduceTask进程对每一组相同K的组调用一次reduce()方法

Driver阶段

相当于YARN集群的客户端，用于提交我们整个程序到YARN集群，提交的是封装了MapReduce程序相关运行参数的job对象

Hadoop序列化

序列化就是把内存中的对象，转换为字节序列(或其他数据传输协议)以便于存储到磁盘(持久化)和网络传输。

反序列化就是将收到字节序列(或其他数据传输协议)或者是磁盘的持久化数据，转换为内存中的对象。

Hadoop自己开发了一套序列化机制(Writable)，特点

紧凑，高效使用存储空间
快速，读写数据的额外开销小
可扩展，随着通信协议的升级而可升级
互操作，支持多语言的交互

MapReduce框架原理

数据切片与MapTask并行度决定机制

一个Job的Map阶段并行度由客户端在提交Job时的切片数决定
每一个Split切片分配一个MapTask并行实例处理
默认情况下，切片大小=BlockSize
切片时不考虑数据集整体，而是逐个针对每一个文件单独切片

FileInputFormat切片源码解析

1、程序先找到数据存储目录
2、遍历处理目录下的每一个文件
3、遍历第一个文件ss.txt
    a、获取文件大小，fs.sizeOf(ss.txt)
    b、计算切片大小
        computeSliteSize(Math.max(minSize,Math.min(maxSize,blockSize)))=blocksize = 128M
    c、默认情况下，切片大小=blocksize
    d、开始切，形成第一个切片 ss.txt - 0-128M
                   第二个切片 128 - 2556M
                   第三个切片 256 - 300M
        (每次切片时，都要判断切完剩下的部分是否大于块的1.1倍，不大于1.1倍就划分一块切片)
    e、将切片信息写到一个切片规划文件中
    f、整个切片的核心过程在getSplit()方法中完成
    g、InputSplit只记录了切片的元数据信息，比如起始位置、长度以及所在的节点列表等。
4、提交切分规划文件到YARN上，YARN上的MrAppMaster就可以根据切片规划文件计算开启MapTask个数。

CombineTextInputFormat切片机制
框架默认的TextInputFormat切片机制是对任务按文件规划切片，不管文件多小，都会是一个单独的切片，都会交给一个MapTask，这样如果有大量小文件，就会产生大量的MapTask，处理效率极其低下。

1、应用场景
CombineTextInputFormat用于小文件过多的场景，它可以将多个小文件从逻辑上规划到一个切片中，
这样多小的文件就可以交给一个MapTask处理。

2、虚拟存储切片最大值设置
CombineTextInputFormat.setMaxInputSplitSize(job,4194304); //4M
注意：虚拟存储切片最大值设置最好根据实际的小文件大小情况来设置具体的值。

KeyValueTextInputFormat
每一行均为一条记录，被分隔符分割为key，value。可以通过在驱动类中设置conf.set(KeyValueLineRecordReader.KEY_VALUE_SEPERATOR,“\t”);来设定分隔符。默认分隔符是tab(\t)。

NLineInputFormat
如果使用NLineInputFormat，代表每个map进程处理的InputSplit不再按Block块去划分，而是按NLineInputFormat指定的行数N来划分。即输入文件的总行数/N=切片数，如果不整除，切片数=商+1.

//设置每个切片InputSplit中划分三条记录
NLineInputFormat.setNumLinesPerSplit(job,3)

Shuffle机制

Map方法之后，Reduce方法之前的数据处理过程称之为Shuffle。

分区

要求将统计结果按照条件输出到不同文件中(分区)。

自定义分区

自定义分区Partitioner步骤
1）自定义类继承Partitioner，重写getPartition()方法
public class CustomPartitioner extends Partitioner{
    public int getPartition(Text key,FlowBean value,int numPartitions){
        //逻辑代码
        
        return partition;
    }
}

2）在Job驱动中，设置自定义Partitioner
job.setPartitionerClass(CustomPartitioner.class);

3）自定义Partition后，要根据自定义Partitioner的逻辑设置相应数量的ReduceTask
job.setNumReduceTasks(5);

分区总结

如果ReduceTask的数量>getPartition的结果数，则会多产生几个空的输出文件part-r-000xx;
如果1
如果ReduceTask的数量=1，则不管MapTask端输出多少个分区文件，最终结果都交给这一个ReduceTask,最终也就只会产生一个结果文件part-r-00000;
分区号必须从零开始，逐一累加。

排序

MapTask和ReduceTask均会对数据按照key进行排序。该操作属于Hadoop的默认行为。任何应用程序中的数据均会被排序，而不管逻辑上是否需要。

默认排序是按照字典顺序排序，且实现该排序的方法是快速排序。

排序分类

1）部分排序：MapReduce根据输入记录的键对数据集排序。保证输出的每个文件内部有序。

2）全排序：最终结果只有一个文件，且文件内部有序。实现方式是只设置一个ReduceTask。但该方法在处理大型文件时效率极低，因为一台机器处理所有文件，完全丧失了MapReduce所提供的并行架构。

3）辅助排序：在Reduce端对key进行分组。应用于：在接收的key为bean对象时，想让一个或几个字段相同（全部字段比较不相同）的key进入到同一个reduce方法时，可以采用分组排序。

4）二次排序：在自定义排序过程中，如果compareTo中的判断条件为两个即为二次排序。

5）自定义排序：Bean需要实现WritableComparble接口重写compareTo方法，就可以实现排序

案例

public class FlowBean implements WritableComparble{
    public int compareTo(FlowBean bean){
        int result;
        
        if(sumFlow > bean.getSumFlow()){
            result = -1;
        }else if(sumFlow < bean.getSumFlow()){
            result = 1;
        }else{
            result = 0;
        }
        
        return result;
    }
}

Combiner合并

(1) Combiner是MR程序中Mapper和Reducer之外的一种组件。

(2) Combiner组件的父类就是Reducer。

(3) Combiner和Reducer的区别在于运行的位置:

Combiner是在每一个MapTask所在的节点运行;

Reducer是接收全局所有Mapper的输出结果;

(4)Combiner的意义就是对每一个MapTask的输出进行局部汇总，以减小网络传输量。

(5) Combiner能够应用的前提是不能影响最终的业务逻辑，而且，Combiner的输出kv应该跟Reducer的输入kv类型要对应起来。

分组排序

1、自定义类继承WritableComparaator

2、重写compare方法

3、创建一个构造将比较对象的类传给父类

Reduce Join

Map端的主要工作:为来自不同表或文件的key/value对, 打标签以区别不同来源的记录。然后用连接字段作为key ,其余部分和新加的标志作为value ,最后进行输出。

Reduce端的主要工作:在Reduce端以连接字段作为key的分组已经完成,我们只需要在每一个分组当中将那些来源于不同文件的记录(在Map阶段已经打标
志)分开,最后进行合并就ok了。

Map Join

Map Join适合于一张表十分小，一张表十分大的场景。

开发总结

** 输入数据接口 InputFormat**

1、默认使用实现类 TextInputFormat

2、TextInputFormat功能逻辑是:
    一次读一行文本，然后将该行的起始编译量作为Key，行内容作为value返回

3、KeyValueTextInputFormat每一行均为一条记录，被分隔符分割为key，value。默认分隔符是tab

4、NlineInputFormat按照指定的行数N来划分切片

5、CombineTextInputFormat可以把多个小文件合并成一个切片处理，提高处理效率。

6、用户还可以自定义InputFormat

逻辑处理接口 Mapper

用户根据业务需求实现其中三个方法
    map() setup() cleanup()

Partitioner分区

默认实现HashPartitioner，逻辑是根据key的哈希值和numReduces来返回一个分区号

用户可自定义分区号

Comparable排序

1、我们用自定义的对象作为key来输出时，就必须要实现WritableComparable接口，重写其中compareTo()方法
2、部分排序：对最终输出每一个文件进行内部排序
3、全排序：对所有数据进行排序，通常只有一个Reduce
4、二次排序：对排序的条件有两个

Combiner

Combiner合并可以提高程序执行效率，减少IO传输，但是使用时必须不能影响原有的业务处理结果。

Reduce端分组 GroupingComparator

在Reduce端对key进行分组。应用于：在接收的key为bean对象时，想让一个或几个字段相同(全部字段比较不相同)的key进入到同一个reduce方法时，可以使用分组排序。

逻辑处理接口 Reducer

用户根据业务需求实现 reduce() setup() cleanup()

输出数据接口 OutputFormat

1、默认实现类是TextOutputFormat，功能逻辑是：将每一个KV对，向目标文本文件输出一行

2、将SequenceFileOutputFormat输出作为后续MapReduce任务输入。

3、用户可自定义OutputFFormat

Hadoop之YARN

概述

Yarn是一个资源调度平台，负责为运算程序提供服务器运算资源，相当于一个分布式的操作系统平台，而MapReduce等运算程序则相当于运行于操作系统之上的应用程序.

你可能感兴趣的:(hadoop,大数据,分布式)

Spring Boot 项目启动时按需初始化加载数据我叫晨曦啊 spring boot spring boot java 后端
1、新建类，类上添加注解@Component，该类用于在项目启动时处理数据加载任务；2、该类实现ApplicationRunner接口，并重写run方法；3、在重写的run方法里处理数据加载任务；注意：有定时加载数据需求的话，添加定时任务即可；一次性加载大数据量时可能内存溢出；同一个项目中，可以定义多个ApplicationRunner的实现类；存在多个ApplicationRunner的实现类时
云原生--微服务、CICD、SaaS、PaaS、IaaS 青秋. 云原生 docker 云原生微服务 kubernetes serverless service_mesh ci/cd
往期推荐浅学React和JSX-CSDN博客一文搞懂大数据流式计算引擎Flink【万字详解，史上最全】-CSDN博客一文入门大数据准流式计算引擎Spark【万字详解，全网最新】_大数据spark-CSDN博客目录1.云原生概念和特点2.常见云模式3.云对外提供服务的架构模式3.1IaaS（Infrastructure-as-a-Service）3.2PaaS（Platform-as-a-Servi
Spring Cloud Config（微服务配置中心详解）白仑色 Spring系列微服务微服务架构配置中心 SpringCloud
关键词：SpringCloudConfig、配置中心、远程仓库、动态刷新、加密解密✅摘要在微服务架构中，随着服务数量的增加，统一管理各服务的配置信息变得尤为重要。传统的本地配置文件方式难以满足多环境、多实例、集中化的需求。SpringCloudConfig是SpringCloud提供的一个分布式配置中心解决方案，支持将配置信息集中存储在Git、SVN或本地文件系统中，并提供给各个微服务动态获取和更
鸿蒙分布式开发实战指南：让设备协同像操作本地一样简单 harmonyos
摘要在如今设备高度互联的时代，一个用户往往会同时使用手机、平板、电视、手表等多个设备。鸿蒙系统基于“分布式能力”，让多个设备协同工作变得更简单，比如手机控制电视播放、手表调节空调，甚至多设备之间自动分工协作。这篇文章就带你从开发者角度出发，手把手了解鸿蒙分布式能力的实现方式。引言：为什么要用鸿蒙的分布式能力？随着物联网的发展，单设备运行逻辑已经难以满足日常复杂场景。鸿蒙系统设计了独特的分布式架构，
想要了解大模型，看懂这一篇就够了！大模型工作流程及核心参数介绍！ Gq.xxu qwen3 vllm transforms 大语言模型部署深度学习人工智能
若想深入探究大模型核心参数的效果与作用，就务必先弄清大模型的工作流程，明确核心参数在流程各阶段的效能与功能，知晓其具体含义。一，大模型的工作流程大模型运行时的工作原理可以概括为输入处理→特征提取→模型推理→结果生成四个核心阶段，整个过程融合了深度学习架构、自然语言处理技术以及分布式计算能力。从用户输入到大模型输出，整个工作的处理流程如下：输入文本→分词→嵌入+位置编码→Transformer多层处
SpringBoot EhCache 缓存一只帆記 Java SpringBoot spring boot 缓存后端
一、EhCache核心原理层级存储堆内缓存（Heap）：高速访问，受JVM内存限制堆外缓存（Off-Heap）：突破JVM堆大小限制（直接内存）磁盘存储（Disk）：持久化超大缓存集群存储（RMI/JGroups）：分布式节点同步（需企业版）数据过期策略LRU（最近最少使用）LFU（最不经常使用）FIFO（先进先出）基于创建/访问时间的TTL（生存时间）缓存工作流程是否方法调用缓存是否存在?返回缓
二进制部署Kubernetes1.32.4最新版本高可用集群及附加组件 Nova_CaoFc 容器云技术专栏 kubernetes 容器云原生
一、前言在云原生技术席卷全球的今天，Kubernetes（K8s）已成为容器编排领域的事实标准。当大家都习惯了kubeadm、kubeasz等自动化工具一键部署的便利时，选择通过二进制方式手动搭建K8s集群更像是一场"知其然亦知其所以然"的深度修行。这种方式将带您穿透抽象层，直面etcd的分布式存储机制、kube-apiserver的RESTful接口设计、kubelet与CRI的交互细节，以及各
鸿蒙操作系统核心特性解析：从分布式架构到高效开发的全景技术图谱
摘要近年来，随着物联网（IoT）、智能家居、智慧办公等领域的发展，传统的移动操作系统在多设备协同和资源共享方面越来越吃力。华为推出的鸿蒙操作系统（HarmonyOS）正是在这样的背景下诞生的。相比于iOS和Android，鸿蒙以“分布式操作系统”理念为核心，实现了跨设备协同、高效通信与统一开发的新生态，为开发者和用户都带来了新的体验。引言传统的移动操作系统大多聚焦在单一终端设备上，比如Androi
零基础上手鸿蒙开发：用ArkTS打造你的第一个HarmonyOS应用 harmonyos
摘要随着HarmonyOS的不断发展，越来越多开发者开始关注这套以分布式能力为核心的国产操作系统。不同于传统Android开发，HarmonyOS引入了更现代的Stage模型以及更高效的声明式UI语言——ArkTS，让应用开发更灵活、更统一。本文将带你从零开始构建一个完整的鸿蒙应用，从环境配置、页面开发到交互实现，逐步掌握入门技能。引言：鸿蒙开发为啥值得学？从2019年首次发布到现在，Harmon
Apache SeaTunnel × Hive 深度集成指南：原理、配置与实践数据库
在大数据处理的复杂生态中，数据的高效流转与整合是实现数据价值的关键。ApacheSeaTunnel作为一款高性能、分布式、易扩展的数据集成框架，能够快速实现海量数据的实时采集、转换和加载；而ApacheHive作为经典的数据仓库工具，为结构化数据的存储、查询和分析提供了坚实的基础。将ApacheSeaTunnel与Hive进行集成，能够充分发挥两者的优势，构建起高效的数据处理链路，满足企业多样化的
操作系统领域的新宠儿：鸿蒙应用深度剖析操作系统内核探秘操作系统内核揭秘 harmonyos 华为 ai
操作系统领域的新宠儿：鸿蒙应用深度剖析关键词：鸿蒙操作系统、微内核架构、分布式软总线、ArkUI框架、DevEcoStudio、跨设备开发、全场景生态摘要：本文深度剖析华为鸿蒙操作系统的核心技术架构与应用开发体系，从微内核设计、分布式协同技术、UI框架创新到全场景开发工具链展开分析。通过数学模型解析分布式一致性算法，结合Python代码演示核心调度逻辑，并以实战案例演示跨设备应用开发流程。探讨鸿蒙
鸿蒙分布式开发实战指南：让设备协同像操作本地一样简单前端世界 harmonyos harmonyos 分布式华为
摘要在如今设备高度互联的时代，一个用户往往会同时使用手机、平板、电视、手表等多个设备。鸿蒙系统基于“分布式能力”，让多个设备协同工作变得更简单，比如手机控制电视播放、手表调节空调，甚至多设备之间自动分工协作。这篇文章就带你从开发者角度出发，手把手了解鸿蒙分布式能力的实现方式。引言：为什么要用鸿蒙的分布式能力？随着物联网的发展，单设备运行逻辑已经难以满足日常复杂场景。鸿蒙系统设计了独特的分布式架构，
Elasticsearch MacJerry elasticsearch 大数据搜索引擎
学习目标[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BGW4RqWM-1635414988340)(es.assets/Snipaste_2020-07-06_13-03-45.png)]Elasticsearch简介与安装什么是Elasticsearch？ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎，基
分库分表之实战-sharding-JDBC水平分库+水平分表配置实战软件编程在线接单（需要可私）分库分表后端 java 数据库 mysql 分布式
大家好，我是工藤学编程一个正在努力学习的小博主，期待你的关注实战代码系列最新文章C++实现图书管理系统（QtC++GUI界面版）SpringBoot实战系列【SpringBoot实战系列】Sharding-Jdbc实现分库分表到分布式ID生成器Snowflake自定义wrokId实战环境搭建大集合环境搭建大集合(持续更新）分库分表分库分表之实战-sharding-JDBC广播表前情摘要：1、数据库
大数据平台之ranger与ldap集成，同步用户和组无级程序员大数据大数据 hadoop
ranger可以通过ranger-usersync与linux系统同步用户，但是，还有个问题，就是我们的hiveserver一般是集群，可以是多台服务器，那么我们空间同步哪一台呢，而且如果用户多了，如何管理用户登录密码呢，所以，还是要用ldap比较合理。首先是安装openldap:yum-yinstallopenldapcompat-openldapopenldap-clientsopenldap
【量化系统实战】深入解析：大规模数据管理与分布式计算，打造你的量化“超级工厂” Natsume1710 python github 开发语言算法大数据数据仓库
前言随着量化策略的不断演进，以及对高频数据、另类数据（新闻、社交媒体、卫星图像等）需求的日益增长，许多朋友可能都会遇到一个棘手的问题：当数据量达到TB甚至PB级别，复杂的因子计算和超大规模回测在单机上变得举步维艰，系统效率严重受限。本文将作为量化系统构建系列的进阶篇，聚焦于大规模数据管理（BigDataManagement）和分布式计算（DistributedComputing）。我们将详细阐述如
多级缓存如何应用 t梧桐树t 缓存
什么是多级缓存提到多级缓存，很多人第一时间想到通过Guava本地缓存+Redis分布式缓存组成的二级缓存。其实，多级缓存可并不只是这两层，在一些场景中，可能有很多层。下面以一个电商的秒杀场景举例，说一说一个多级缓存的真实应用场景。clientCNDNginxGuavaRedis客户端缓存首先，离用户最近的一定是客户端了，比如我们使用的手机、电脑等，在手机上的APP以及电脑的浏览器，都是可以支持做缓
vue-scrollto实现页面组件锚点定位长路 ㅤ 前端 vue.js 前端 javascript
文章目录前言背景操作指南安装及配置步骤vue组件中使用参考文章前言博主介绍：✌目前全网粉丝3W+，csdn博客专家、Java领域优质创作者，博客之星、阿里云平台优质作者、专注于Java后端技术领域。涵盖技术内容：Java后端、大数据、算法、分布式微服务、中间件、前端、运维等。博主所有博客文件目录索引：博客目录索引(持续更新)视频平台：b站-Coder长路背景vue中在hash模式下，页面的动态渲染
seata 的使用初步 RR1335 微服务 SEATA 事务处理 seata 分布式事务 TC TM RM
Seata是一款开源的分布式事务解决方案，致力于在微服务架构下提供高性能和简单易用的分布式事务服务。在Seata开源之前，其内部版本在阿里系内部一直扮演着应用架构层数据一致性的中间件角色，帮助经济体平稳的度过历年的双11，对上层业务进行了有力的技术支撑。经过多年沉淀与积累，其商业化产品先后在阿里云、金融云上售卖。2019.1为了打造更加完善的技术生态和普惠技术成果，Seata正式宣布对外开源，未来
RocketMQ-on-DLedge自动容灾切换集群搭建学亮编程手记后台编程 rocketmq
DledgerDledger快速搭建前言DLedger是一套基于Raft协议的分布式日志存储组件，部署RocketMQ时可以根据需要选择使用DLeger来替换原生的副本存储机制。本文档主要介绍如何快速构建和部署基于DLedger的可以自动容灾切换的RocketMQ集群。1.源码构建构建分为两个部分，需要先构建DLedger，然后构建RocketMQ。1.1构建DLedger$gitclonehtt
谢飞机的Java高级开发面试：从Spring Boot到分布式架构的蜕变之旅
面试现场：谢飞机的求职奇遇记"请坐，谢先生。我看你简历上写了'精通Lombok'？"面试官推了推金丝眼镜。谢飞机一愣："啊...这个..."突然掏出手机，"您看我GitHub开源项目里用了@SneakyThrows，异常处理特别优雅！"面试官嘴角微扬："那说说SpringBoot自动装配原理？""这简单！"谢飞机来了精神，"就是通过@SpringBootApplication组合注解，结合SPI机
Redis 分布式锁详解 wcy0310 redis redis 分布式
Redis分布式锁的实现方法Redis分布式锁是一种利用Redis实现跨进程、跨服务器的互斥锁机制，常用于解决分布式系统中的并发控制问题。以下是几种常见的实现方式及其关键细节。基于SETNX和EXPIRE的实现使用SETNX（SETifNoteXists）命令尝试设置一个键，如果键不存在则设置成功，返回1；否则返回0。结合EXPIRE设置锁的超时时间，避免死锁。SETNXlock_keyuniqu
SQL Server 临时表、表变量与WITH语句的用法与区别 Favor_Yang SQL调优及高级SQL语法编写数据库 sql sqlserver
引言在SQLServer数据处理中，临时表、表变量和WITH语句（CTE）是关键的中间结果集管理工具。临时表适合大数据量操作，表变量优化小数据量场景，而CTE则简化复杂查询逻辑。三者选择需综合考量数据量级、事务需求及代码可读性。本文将深入解析其工作机制，通过实测对比指导场景化选型。1.临时表（TemporaryTables）定义与创建通过#（本地）或##（全局）前缀创建物理表：--本地临时表CRE
从0到1：Vue.js与D3.js搭建AI大数据动态看板
一、引言在当今AI和大数据盛行的时代，数据如同企业的“石油”，蕴含着巨大的价值。随着数据量呈指数级增长，如何从海量数据中快速提取有价值的信息，并以直观、易懂的方式呈现出来，成为了数据分析领域的关键挑战。数据看板作为一种强大的数据可视化工具，能够将复杂的数据转化为直观的图表、图形和指标，帮助用户快速理解数据背后的含义，做出更明智的决策。无论是企业的管理层、业务分析师还是数据科学家，都可以通过数据看板
微服务分布式配置中心详解
一、分布式配置中心概述在微服务架构中，随着服务数量的增多和复杂度的提升，配置管理变得至关重要。分布式配置中心应运而生，它专门用于管理微服务架构中的配置文件。以支持Go语言的viper为例，配置文件管理涵盖了增加、修改、删除配置项等操作，同时要实现配置项在测试、开发和生产环境的隔离。不同环境的配置可能存在差异，例如数据库连接地址、日志级别等，因此需要对这些配置进行有效的管理和区分。二、本地文件配置的
特别放送：关于一个无法修复的系统级Bug 杨小扩 bug 程序人生
大家好，我是阿威。熟悉我的朋友都知道，我的博客基本只聊三件事：代码、架构和偶尔的职业生涯吐槽。但今天，我想破个例。起因是上周熬夜排查一个线上问题，一个分布式系统，流量洪峰一来，某个下游服务就雪崩。查了半天日志，发现系统把警报全发给了那些调用量只有个位数的用户API，说它们“行为异常，导致系统延迟”。而真正的根源，是一个拥有无限重试和最高优先级的内部服务，像个失控的while(true)循环，把整个
spring boot项目配置使用minion
一.Minio概述Minio是一款开源的高性能对象存储服务，兼容AmazonS3API，适用于私有云、混合云及边缘计算场景。它采用分布式架构设计，支持水平扩展，提供数据加密、版本控制、生命周期管理等企业级功能，适用于存储非结构化数据（如图片、视频、日志等）。核心特性S3兼容：完全兼容AmazonS3API，现有S3工具可直接对接。高性能：基于Golang编写，优化了并发和吞吐量，适合高负载场景。分
构建高效分布式系统：bRPC组合Channels与HTTP/H2访问指南 Jay Kay brpc c++http 网络协议网络 brpc
构建高效分布式系统：bRPC组合Channels与HTTP/H2访问指南引言在现代分布式系统中，下游服务访问的复杂性日益增加。bRPC通过组合Channels和HTTP/H2访问优化，提供了解决多层级RPC调用、负载均衡和协议兼容性问题的完整方案。本文将深入解析两大核心功能，助力开发者构建高性能服务。一、组合Channels：复杂访问模式的优雅抽象1.核心价值统一接口：同步/异步调用、超时控制、取
【弃】Selenium官方文档中文版元圆源
【找到官方中文文档，无须个人翻译，可用作参考相关链接】Seleniumg浏览器自动化项目Selenium浏览器自动化项目Selenium是一个涵盖了了一些列工具和库的总体项目，这些工具和库允许和支持网站浏览器的自动化。它提供了模拟用户和浏览器交互的扩展，一个扩展浏览器配置的分布式服务器，以及用于实现W3C(WorldWideWebConsotium万维网联盟)WebDriver规范的基础结构，该规
云计算技术基础第2章云计算的架构及国内外标准化情况（2）学习记录wanxiaowan 数据库云计算概论计算机网络
分布式管理任务组（DMTF）是一个国际标准组织，DMTF工作组致力于分布式IT系统的有效管理，通过聚合众多IT厂商一起来进行管理系统的开发、效用及改进等标准化工作…OGF(开放网格论坛)全球网络存储工业协会（StorageNetworkingIndustryAssociation，SNIA）是成立时间比较早的存储厂家中立的行业协会组织，宗旨是领导全世界范围的存储行业开发…加拿大标准协会（Canad
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出