Flume-NG源码阅读之HDFSEventSink

　　HDFSEventSink是flume中一个很重要的sink，配置文件中type=hdfs。与此sink相关的类都在org.apache.flume.sink.hdfs包中。

　　HDFSEventSink算是一个比较复杂的sink，包下涉及的源代码文件数多达13个。。。可配置的参数众多。。。希望我能讲清楚。

　　一、首先依然是看configure(Context context)方法，用来获取配置文件中的配置信息，及初始化一些重要参数

　1 public void configure(Context context) {  
　2     this.context = context;

  3     //HDFS目录路径，必需(eg hdfs://namenode/flume/webdata/)

  4     filePath = Preconditions.checkNotNull(

  5         context.getString("hdfs.path"), "hdfs.path is required");

  6     //在Hdfs目录中生成的文件名字的前缀

  7     fileName = context.getString("hdfs.filePrefix", defaultFileName);

  8     //文件后缀，例如.avro，一般不用

  9     this.suffix = context.getString("hdfs.fileSuffix", defaultSuffix);

 10     //内部写文件的时候表示正在写的文件的前缀和后缀

 11     inUsePrefix = context.getString("hdfs.inUsePrefix", defaultInUsePrefix);

 12     inUseSuffix = context.getString("hdfs.inUseSuffix", defaultInUseSuffix);//默认是.tmp

 13     String tzName = context.getString("hdfs.timeZone");

 14     timeZone = tzName == null ? null : TimeZone.getTimeZone(tzName);

 15     //当前写入的文件滚动间隔，默认30秒生成一个新的文件，0表示不基于时间间隔来滚动

 16     rollInterval = context.getLong("hdfs.rollInterval", defaultRollInterval);

 17     //以文件大小触发文件滚动，单位字节，0表示不基于文件大小间隔来滚动

 18     rollSize = context.getLong("hdfs.rollSize", defaultRollSize);

 19     //以写入的事件数触发文件滚动， 0表示不基于事件数大小间隔来滚动

 20     rollCount = context.getLong("hdfs.rollCount", defaultRollCount);

 21     //事件刷新到HDFS之前的数量

 22     batchSize = context.getLong("hdfs.batchSize", defaultBatchSize);

 23     //控制文件打开时间，单位：s

 24     idleTimeout = context.getInteger("hdfs.idleTimeout", 0);

 25     //压缩编码类型. one of following : gzip, bzip2, lzo, snappy

 26     String codecName = context.getString("hdfs.codeC");

 27     //文件格式：当前为SequenceFile, DataStream or CompressedStream。

 28     //（1）DataStream不压缩输出文件，不能设置codeC选项，（2）CompressedStream需要设置hdfs.codeC的一个可用的编解码器

 29     fileType = context.getString("hdfs.fileType", defaultFileType);

 30     //允许打开的文件数。如果超过这个数字，最早的文件被关闭。

 31     maxOpenFiles = context.getInteger("hdfs.maxOpenFiles", defaultMaxOpenFiles);

 32     //HDFS的操作允许的毫秒数，如打开，写，刷新，关闭。这个数字应该增加，如果正在发生许多HDFS超时操作。

 33     callTimeout = context.getLong("hdfs.callTimeout", defaultCallTimeout);

 34     //每个HDFS sink用于HDFS io操作的线程数，如打开、写入等操作。

 35     threadsPoolSize = context.getInteger("hdfs.threadsPoolSize",

 36         defaultThreadPoolSize);

 37     //每个HDFS sink用于调度定时文件滚动的线程数

 38     rollTimerPoolSize = context.getInteger("hdfs.rollTimerPoolSize",

 39         defaultRollTimerPoolSize);

 40     //安全认证时使用Kerberos user principal for accessing secure HDFS

 41     kerbConfPrincipal = context.getString("hdfs.kerberosPrincipal", "");

 42     //安全认证时使用Kerberos keytab for accessing secure HDFS

 43     kerbKeytab = context.getString("hdfs.kerberosKeytab", "");

 44     proxyUserName = context.getString("hdfs.proxyUser", "");　　//代理用户

 45 

 46     Preconditions.checkArgument(batchSize > 0,

 47         "batchSize must be greater than 0");

 48     if (codecName == null) {　　//不压缩数据

 49       codeC = null;

 50       compType = CompressionType.NONE;

 51     } else {　　　　//压缩数据

 52       codeC = getCodec(codecName);

 53       // TODO : set proper compression type

 54       compType = CompressionType.BLOCK;

 55     }

 56 

 57     // Do not allow user to set fileType DataStream with codeC together

 58     // To prevent output file with compress extension (like .snappy)

 59     if(fileType.equalsIgnoreCase(HDFSWriterFactory.DataStreamType)//如果fileType是DataStream，则不允许压缩

 60         && codecName != null) {

 61       throw new IllegalArgumentException("fileType: " + fileType +

 62           " which does NOT support compressed output. Please don't set codeC" +

 63           " or change the fileType if compressed output is desired.");

 64     }

 65 

 66     if(fileType.equalsIgnoreCase(HDFSWriterFactory.CompStreamType)) {//如果fileType是压缩类型，则codeC不允许为空

 67       Preconditions.checkNotNull(codeC, "It's essential to set compress codec"

 68           + " when fileType is: " + fileType);

 69     }

 70 

 71     if (!authenticate()) {　　//认证

 72       LOG.error("Failed to authenticate!");

 73     }

 74     //时间戳是否四舍五入（如果为true，会影响所有基于时间的转义序列％t除外）

 75     needRounding = context.getBoolean("hdfs.round", false);

 76 

 77     if(needRounding) {

 78         //The unit of the round down value - second, minute or hour.

 79       String unit = context.getString("hdfs.roundUnit", "second");　　//滚动时间单位

 80       if (unit.equalsIgnoreCase("hour")) {

 81         this.roundUnit = Calendar.HOUR_OF_DAY;

 82       } else if (unit.equalsIgnoreCase("minute")) {

 83         this.roundUnit = Calendar.MINUTE;

 84       } else if (unit.equalsIgnoreCase("second")){

 85         this.roundUnit = Calendar.SECOND;

 86       } else {

 87         LOG.warn("Rounding unit is not valid, please set one of" +

 88             "minute, hour, or second. Rounding will be disabled");

 89         needRounding = false;

 90       }

 91       //Rounded down to the highest multiple of this (in the unit configured using hdfs.roundUnit), less than current time.

 92       this.roundValue = context.getInteger("hdfs.roundValue", 1);　　//滚动时间大小

 93       if(roundUnit == Calendar.SECOND || roundUnit == Calendar.MINUTE){//检查是否符合分、秒数值,0<v<=60

 94         Preconditions.checkArgument(roundValue > 0 && roundValue <= 60,

 95             "Round value" +

 96             "must be > 0 and <= 60");

 97       } else if (roundUnit == Calendar.HOUR_OF_DAY){

 98         Preconditions.checkArgument(roundValue > 0 && roundValue <= 24,　　//检查是否符合时数值0<v<=24

 99             "Round value" +

100             "must be > 0 and <= 24");

101       }

102     }

103 

104     if (sinkCounter == null) {//构造计数器

105       sinkCounter = new SinkCounter(getName());

106     }

107   }

　　上面比较常用的参数有：rollInterval以固定时间间隔滚动文件，rollSize以文件大小为单位滚动文件，rollCount以行数来滚动文件，fileType(有3种SequenceFile(二进制)、DataStream(不能压缩)、CompressedStream(压缩文件))　

　　二、接下来是start()方法。

 1 public void start() {

 2     String timeoutName = "hdfs-" + getName() + "-call-runner-%d";

 3     callTimeoutPool = Executors.newFixedThreadPool(threadsPoolSize,

 4             new ThreadFactoryBuilder().setNameFormat(timeoutName).build());　　//这个线程池用来将event写入HDFS文件

 5 

 6     String rollerName = "hdfs-" + getName() + "-roll-timer-%d";

 7     timedRollerPool = Executors.newScheduledThreadPool(rollTimerPoolSize,

 8             new ThreadFactoryBuilder().setNameFormat(rollerName).build());　　//这个线程池用来滚动文件

 9 

10     this.sfWriters = new WriterLinkedHashMap(maxOpenFiles);　　//用来存储文件的绝对路径以及对应的BucketWriter

11     sinkCounter.start();

12     super.start();

13   }

　　start方法主要是初始化两个线程池。　　

　　三、process()方法，是用来处理channel中的event的，非线程安全的，要确保HDFS中的文件是打开的。

 1 public Status process() throws EventDeliveryException {

 2     Channel channel = getChannel();    //获取对应的channel

 3     Transaction transaction = channel.getTransaction();//获得事务

 4     List<BucketWriter> writers = Lists.newArrayList(); //BucketWriter列表

 5     transaction.begin();

 6     try {

 7       int txnEventCount = 0;

 8       for (txnEventCount = 0; txnEventCount < batchSize; txnEventCount++) {//批量处理

 9         Event event = channel.take();    //获取event

10         if (event == null) {

11           break;

12         }

13 

14         // reconstruct the path name by substituting place holders

15         String realPath = BucketPath.escapeString(filePath, event.getHeaders(),

16             timeZone, needRounding, roundUnit, roundValue);    //格式化后的HDFS目录

17         String realName = BucketPath.escapeString(fileName, event.getHeaders(),

18           timeZone, needRounding, roundUnit, roundValue);    //格式化后的文件名

19 

20         String lookupPath = realPath + DIRECTORY_DELIMITER + realName;    //要写入的文件的HDFS绝对路径

21         BucketWriter bucketWriter = sfWriters.get(lookupPath);    //获取文件的BucketWriter

22 

23         // we haven't seen this file yet, so open it and cache the handle

24         if (bucketWriter == null) {    //如果没有这个文件

25             //根据fileType类型构造HDFSWriter(三种：SequenceFile、DataStream、CompressedStream)

26           HDFSWriter hdfsWriter = writerFactory.getWriter(fileType);    

27 

28           WriterCallback idleCallback = null;

29           if(idleTimeout != 0) {

30             idleCallback = new WriterCallback() {

31               @Override

32               public void run(String bucketPath) {

33                 sfWriters.remove(bucketPath);

34               }

35             };

36           }

37           bucketWriter = new BucketWriter(rollInterval, rollSize, rollCount,

38               batchSize, context, realPath, realName, inUsePrefix, inUseSuffix,

39               suffix, codeC, compType, hdfsWriter, timedRollerPool,

40               proxyTicket, sinkCounter, idleTimeout, idleCallback, lookupPath);

41 

42           sfWriters.put(lookupPath, bucketWriter);    //将文件路径和BucketWriter组成K-V，放入sfWriters

43         }

44 

45         // track the buckets getting written in this transaction

46         if (!writers.contains(bucketWriter)) {//如果BucketWriter列表没有正在写的文件——bucketWriter，则加入

47           writers.add(bucketWriter);

48         }

49 

50         // Write the data to HDFS

51         append(bucketWriter, event);    //将event写入bucketWriter对应的文件中

52       }

53 

54       if (txnEventCount == 0) {    //这次事务没有处理任何event

55         sinkCounter.incrementBatchEmptyCount();

56       } else if (txnEventCount == batchSize) {//一次处理batchSize个event

57         sinkCounter.incrementBatchCompleteCount();

58       } else {//channel中剩余的events不足batchSize

59         sinkCounter.incrementBatchUnderflowCount();

60       }

61 

62       // flush all pending buckets before committing the transaction

63       for (BucketWriter bucketWriter : writers) {    //将所有BucketWriter数据刷新到HDFS中

64         flush(bucketWriter);

65       }

66 

67       transaction.commit();    //提交事务

68 

69       if (txnEventCount < 1) {

70         return Status.BACKOFF;

71       } else {

72         sinkCounter.addToEventDrainSuccessCount(txnEventCount);

73         return Status.READY;

74       }

75     } catch (IOException eIO) {

76       transaction.rollback();//异常后回滚

77       LOG.warn("HDFS IO error", eIO);

78       return Status.BACKOFF;

79     } catch (Throwable th) {

80       transaction.rollback();//异常后回滚

81       LOG.error("process failed", th);

82       if (th instanceof Error) {

83         throw (Error) th;

84       } else {

85         throw new EventDeliveryException(th);

86       }

87     } finally {

88       transaction.close();//关闭事务

89     }

90   }

　　1、获取sink的channel和transaction，transaction.begin()是必要的步骤；

　　2、循环处理批量的event，如果event==null，说明channel已无数据，则退出循环；

　　3、realPath和realName都是格式化后的文件HDFS存储路径及文件名；lookupPath则是要写入的文件完整HDFS路径(目录+文件名)；获取该文件对应的BucketWriter对象，要写入的文件及对应的BucketWriter对象需要存入sfWriters这个LinkedHashMap结构中，表示正在写的文件，BucketWriter类用来滚动文件、处理文件格式以及数据的序列化等操作，其实就是负责数据的写的；

　　4、如果文件对应的bucketWriter不存在，则文件需要滚动，创建一个BucketWriter对象，只有public方法才是线程安全的。

　　创建BucketWriter对象之前需要先构建一个HDFSWriter对象负责写文件，有三种类型：HDFSSequenceFile、HDFSDataStream、HDFSCompressedDataStream。

　　WriterCallback idleCallback是用来超时后滚动文件的时候调用的，前提得是配置文件中有配置hdfs.idleTimeout且不为0；

　　然后是new 一个BucketWriter对象，这有点复杂稍后说；

　　sfWriters.put(lookupPath, bucketWriter)然后就是将文件及对应的bucketWriter对象存入sfWriters中，表示正在写的文件。

　　5、这里要说下new BucketWriter对象的事。BucketWriter的构造函数首先是对众多参数赋值，然后isOpen = false，最后是this.writer.configure(context)，即对writer对象进行配置。复杂就在这，这个writer对象是什么？它是上面4中所说的HDFSWriter。

　　HDFSWriterFactory工厂类会根据配置文件中设置的类型返回相应的HDFSWriter对象，没有配置文件类型的话默认是HDFSSequenceFile。

　　HDFSSequenceFile：configure(context)方法会首先获取写入格式writeFormat即参数"hdfs.writeFormat"，默认格式是二进制的Writable(HDFSWritableSerializer.Builder.class)，还有一个是Text(HDFSTextSerializer.Builder.class)，第三个是null；再获取是否使用HDFS本地文件系统"hdfs.useRawLocalFileSystem"，默认是flase不使用；然后获取writeFormat的所有配置信息serializerContext；然后根据writeFormat和serializerContext构造SequenceFileSerializer的对象serializer。在serializer中并无serializerContext配置的方法，在1.3.0中此处的serializerContext没有任何作用，可能是为以后做的预留。

　　HDFSDataStream：configure(context)方法先获取serializerType类型，默认是TEXT(BodyTextEventSerializer.Builder.class)，此外还有HEADER_AND_TEXT(HeaderAndBodyTextEventSerializer.Builder.class)、OTHER(null)、AVRO_EVENT(FlumeEventAvroEventSerializer.Builder.class)共四种类型；再获取是否使用HDFS本地文件系统"hdfs.useRawLocalFileSystem"，默认是flase不使用；然后获取serializer的所有配置信息serializerContext。serializer的实例化是在HDFSDataStream.open(String filePath)方法中实现的。此处的serializerContext在BodyTextEventSerializer和HeaderAndBodyTextEventSerializer均未用到，可能是做预留，但是FlumeEventAvroEventSerializer在其Builder中用到了，并进行了配置。

　　HDFSCompressedDataStream：configure(context)方法和HDFSDataStream.configure(context)是一样的，serializerType的类型是一样的；其他也是一样。serializer的实例化是在HDFSCompressedDataStream.open(String filePath)方法中实现的，调用open(String filePath, CompressionCodec codec,CompressionType cType)来实例化。

　　6、如果存储着正在写的bucketWriter的writers列表中没有此bucketWriter，则添加进去，writers的存在是为了统一flush方便，后面会有介绍。

　　7、append(bucketWriter, event)这个是让bucketWriter处理event的方法，会使用bucketWriter.append(event)处理。这个方法的代码如下：

 1 public synchronized void append(Event event)

 2           throws IOException, InterruptedException {

 3     checkAndThrowInterruptedException();

 4     if (!isOpen) {

 5       if(idleClosed) {

 6         throw new IOException("This bucket writer was closed due to idling and this handle " +

 7             "is thus no longer valid");

 8       }

 9       open();//已经写完一个文件，新建新文件

10     }

11 

12     // check if it's time to rotate the file

13     if (shouldRotate()) {//检查行数、大小是否改完成一个文件

14       close();

15       open();//新建新文件

16     }

17 

18     // write the event

19     try {

20       sinkCounter.incrementEventDrainAttemptCount();

21       writer.append(event); // could block写数据

22     } catch (IOException e) {

23       LOG.warn("Caught IOException writing to HDFSWriter ({}). Closing file (" +

24           bucketPath + ") and rethrowing exception.",

25           e.getMessage());

26       try {

27         close();

28       } catch (IOException e2) {

29         LOG.warn("Caught IOException while closing file (" +

30              bucketPath + "). Exception follows.", e2);

31       }

32       throw e;

33     }

34 

35     // update statistics

36     processSize += event.getBody().length;

37     eventCounter++;

38     batchCounter++;

39 

40     if (batchCounter == batchSize) {

41       flush();

42     }

43   }

　　A、首先会检查当前线程是否中断checkAndThrowInterruptedException()；

　　B、BucketWriter初次运行时，isOpen=false(表示文件未打开不能写),idleClosed=false，会运行open()——doOpen()。fullFileName是"前缀.时间戳"组成的文件名，从这也可以看出时间戳部分不能更改，也就是HDFS中文件名无法自定义，除非自己定制HDFSSink；另外后缀名和压缩不能同时兼得，即如果没有配置压缩则可以在fullFileName后面添加自定义的后缀(比如后缀为.avro)，否则只能添加压缩类型的后缀；bucketPath表示在HDFS中正在写的文件完整名字，这个名字中有标示正在写的文件的前后缀(inUsePrefix、inUseSuffix)；targetPath这个是文件写完后的要更改成的完整名字，和bucketPath的区别是没有inUsePrefix、inUseSuffix；然后是根据有无压缩配置信息open此witer，没有压缩：writer.open(bucketPath)，有压缩：writer.open(bucketPath, codeC, compType)。需要注意的是当使用Kerberos时，hadoop的RPC操作是非线程安全的包括getFileSystem()操作，open()操作在同一个JVM的同一时刻只能由一个线程使用，因为有可能导致死锁，见FLUME-1231。所以对open进行了同步。另外当在运行flume过程中出现类似异常“java.io.IOException: Callable timed out after 10000 ms on file”和"java.util.concurrent.TimeoutException"时，需要增大callTimeout

　　writer包含的三类均有两个open方法，一个是对应不压缩的open(String filePath) ，一个是对应压缩的open(String filePath, CompressionCodec codec,CompressionType cType)。

　　首先writer若为HDFSSequenceFile，是支持压缩的，open(String filePath)会调用open(filePath, null, CompressionType.NONE)压缩方法，只不过没有压缩类型。压缩open方法先判断是否使用了本地文件系统，然后根据hadoop的配置信息是否支持追加"hdfs.append.support"，构造相应的SequenceFile即writer。其中的serializer若为HDFSWritableSerializer则writer的Key为LongWritable类型，Value为BytesWritable二进制类型；若为HDFSTextSerializer，writer的Key为LongWritable类型，Value为Text文本类型。

　　其次writer若为HDFSDataStream，是不支持压缩的。它的压缩方法open(String filePath, CompressionCodec codec,CompressionType cType)直接调用非压缩方法open(filePath)。open(filePath)判断是否使用了本地文件系统；然后根据是否支持append操作(获取配置的"hdfs.append.support"参数)，构造对应的输出流outStream；然后构造serializer，有三种类型BodyTextEventSerializer、HeaderAndBodyTextEventSerializer、FlumeEventAvroEventSerializer，前两种支持追加，最后一种不支持追加，所以FlumeEventAvroEventSerializer不能将"hdfs.append.support"设置为true。如果支持追加就执行serializer.afterReopen()前两种serializer未实现这个方法(1.3.0)，不支持就serializer.afterCreate()前两种也未实现这个方法，第三种则是dataFileWriter.create(getSchema(), getOutputStream())。

　　最后writer若为HDFSCompressedDataStream，就是针对压缩的，其open(String filePath)会使用默认的DefaultCodec以及CompressionType.BLOCK来调用压缩open(String filePath, CompressionCodec codec,CompressionType cType)。压缩方法和HDFSDataStream的压缩方法类似，区别有两点一个是serializer的输出流变成压缩输出流了；另一个就是最后加了isFinished = false表示压缩流是否完毕。

　　回到BucketWriter，如果rollInterval(按时间滚动文件)不为0，则创建一个Callable，放入timedRollFuture中rollInterval秒之后关闭文件，默认是30s写一个文件，这只是控制文件滚动的3个条件之一；

　　 isOpen = true表示文件已打开，可以write了。

　　C、回到上面7中，shouldRotate()方法会判断文件中的行数和文件的大小是否达到配置文件中的配置，如果任何一个满足条件则可以关闭文件，这是控制文件滚动的3个条件中的两个。close()方法会关闭文件，再清理俩线程池及一些其他的清理工作，及改名(将.tmp文件改名)，再open()就又到了上面B中所说的。

　　D、writer.append(event)这是向HDFS中写数据的地方。这里又要分很多讨论了，因为writer有三类。

　　writer为HDFSSequenceFile：append(event)方法，会先通过serializer.serialize(e)把event处理成一个Key和一个Value。

　　(1)serializer为HDFSWritableSerializer时，则Key会是event.getHeaders().get("timestamp")，如果没有"timestamp"的Headers则使用当前系统时间System.currentTimeMillis()，然后将时间封装成LongWritable;Value是将event.getBody()封装成BytesWritable，代码是bytesObject.set(e.getBody(), 0, e.getBody().length)；

　　(2)serializer为HDFSTextSerializer时，Key和上述HDFSWritableSerializer一样；Value会将event.getBody()封装成Text，代码是textObject.set(e.getBody(), 0, e.getBody().length)。

　　writer.append(event)中会将Key和Value，writer.append(record.getKey(), record.getValue())。

　　writer为HDFSDataStream：append(event)方法直接调用serializer.write(e)。

　　(1)serializer为BodyTextEventSerializer，则其write(e)方法会将e.getBody()写入输出流，并根据配置再写入一个"\n"；

　　(2)serializer为HeaderAndBodyTextEventSerializer,则其write(e)方法会将e.getHeaders() + " "(注意此空格)和e.getBody()写入输出流，并根据配置再写入一个"\n"；

　　(3)serializer为FlumeEventAvroEventSerializer，则其write(e)方法会将event整体写入dataFileWriter。

　　writer为HDFSCompressedDataStream：append(event)方法会首先判断是否完成一个阶段的压缩isFinished，如果是则更新压缩输出流的状态，并isFinished=false，否则剩下的执行和HDFSDataStream.append(event)相同。

　　E、是做一些统计工作processSize是统计文件大小的；eventCounter是统计文件行数的；batchCounter是统计最近一次flush之后的处理的event数；

　　F、如果处理的event数达到batchSize则刷新到HDFS中，flush()。flush()方法会首先执行writer.sync()即写入HDFS，然后清空batchCounter表明这次batch已经完成，可以准备下次的。涉及到writer就会涉及很多写入类型：

　　writer为HDFSSequenceFile：sync()方法执行SequenceFile.Writer.syncFs()将数据写入HDFS中；

　　writer为HDFSDataStream：sync()方法执行

　　writer为HDFSCompressedDataStream：sync()方法先执行serializer.flush()：只有FlumeEventAvroEventSerializer的flush()方法也有实现dataFileWriter.flush()，其他俩BodyTextEventSerializer和HeaderAndBodyTextEventSerializer均未实现flush()方法。然后执行outStream.flush()和outStream.sync()将数据刷新至HDFS中。

　　如果idleTimeout>0，表示文件最长打开时间，超时后就成为无效文件需要关闭(默认是0不允许关闭的)，构造一个Callable对象idleAction执行内容是：close()方法，idleClosed = true表示超时关闭了这个bucketwriter，而且onIdleCallback.run(onIdleCallbackPath)会将onIdleCallbackPath从HDFSEventSink.sfWriters中删除对应对应的bucketwriter，表示这个文件已经写完了。然后将这个idleAction放入timedRollerPool中idleTimeout秒后执行。

　　8、回到HDFSEventSink.process()方法中，会根据这次事务处理的event数量更新相应的计数器；

　　9、遍历writers，挨个刷新BucketWriter至HDFS；

　　10、transaction.commit();//提交事务

　　11、transaction.rollback();//异常后回滚

　　12、transaction.close();//关闭事务

　　四、stop()方法。首先会遍历sfWriters，挨个close(BucketWriter):BucketWriter.close()方法，如果isOpen=true表示文件还处于打开状态，则writer.close()(这里的writer就不分情况了，HDFSSequenceFile就直接writer.close()；其他俩都是先flush(好些都没实现)再beforClose(好些都没实现)输出流再flush、sync、close)，BucketWriter.close()方法方法接下来关闭俩线程池以及改名等清理操作。HDFSEventSink的stop()方法接下来是关闭俩线程池，清理一些数据比如sfWriters.clear()。

ps：1、BucketWriter中的public方法都是线程安全的，包括append、close、flush三个均是同步方法，会调用相应的do方法，做具体的操作。

　　2、callWithTimeout方法需要注意，在HDFSEventSink中多次用到这个方法：append、flush、close，这个方法会将对应的Callable放入callTimeoutPool线程池中执行，并等待callTimeout(默认是10000) ms返回结果。

问题1：WriterLinkedHashMap的sfWriters除了设置hdfs.idleTimeout且>0时才会从sfWriters中remove掉超时的bucketwriter，其它地方并没有发现remove操作，那么以后随着写入文件的增多sfWriters会不会始终增大？

解：肯定不会啊。别忘了还有一个"hdfs.maxOpenFiles"参数默认是5000，追踪发现HDFSEventSink内部静态类WriterLinkedHashMap继承了LinkedHashMap，并重写了removeEldestEntry方法，这个方法在sfWriters.put时总会调用，当sfWriters.size()>maxOpenFiles时就是自动清理之时了。maxOpenFiles就是sfWriters得最大容量。

这次的sink比较复杂，希望我写的大伙能够看懂，期间还有一些细节不太清楚，不过不影响整体的理解。

不解1：bucketwriter类中的doOpen方法中hadoop的RPC线程非安全，说是可以从FLUME-1231这得到解释

不解2：同样doOpen方法中有说“Need to get reference to FS using above config before underlying writer does in order to avoid shutdown hook & IllegalStateExceptions”这里也表示疑问，为什么这么说？

不解3：为什么HDFSWriter的3个实现类的open()方法中，均考虑了conf.getBoolean("hdfs.append.support", false) == true？一个是可追加的一个是不可追加的。但是都是一个SequenceFile.Writer或者FSDataOutputStream，尤其是在HDFSSequenceFile中的writer能不能追加似乎根本没什么区别，充其量是一个writer的参数是FSDataOutputStream，另外一个则不是，其他俩好歹还有需要设置appending=true用来判断是否可重复打开但也是有点牵强，都可以合二为一，但是为什么不那么做呢？

不解4：BucketPath.escapeString这个方法还没搞懂，导致格式化的结果不甚明了。。。哎

解4：escapeString这个会将目录和文件名前缀进行格式化，如果这两个变量中存在正则表达式，则event.headers中必须要有timestamp，也就是source的拦截器使用TimestampInterceptor或者自己写进headers中，会将正则部分格式化成时间对应的部分。realName是对配置文件中的前缀名格式化后的前缀名。会随着event的时间戳来进行变动，从而控制着新文件的滚动。另外由于三个控制文件滚动的参数使得文件滚动较快，写完一个文件后后续的还指向这个realName，则在bucketWriter.append中会根据文件是否写完从新创建一个前缀相同但是时间戳不同的文件；如果三个参数控制文件滚动较慢，realName变化比较快的话不能满足大小和行数就只能等超时的或者时间滚动这个参数设置了，最甚者文件永远不关闭等待满足条件，所有控制文件滚动的三个参数最好不要都为0，尤其是时间参数。这个HDFSEventSink还可以设置时区"hdfs.timeZone"，会在格式化HDFS目录和前缀的时候用到，用的是java自带的java.util.TimeZone类，根据需要可以配置，这个功能应该是收集距离较远异地或者异国时用到。

欢迎大伙交流！！

你可能感兴趣的:(event)

【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
【ARM Cortex-M 系列 2.3 -- Cortex-M7 Debug event 详细介绍】主公讲 ARM #ARM 系列 arm开发 debug event
请阅读【嵌入式开发学习必备专栏】文章目录Cortex-M7DebugeventDebugeventsCortex-M7Debugevent在ARMCortex-M7架构中，调试事件（DebugEvent）是由于调试原因而触发的事件。一个调试事件会导致以下几种情况之一发生：进入调试状态：如果启用了停滞调试（HaltingDebug），一个调试事件会使处理器在调试状态下停滞。通过将DHCSR.C_DE
Android实现监听事件的方法 Amy木婉清
1.通过内部类实现2.通过匿名内部类实现3.通过事件源所在类实现4.通过外部类实现5.布局文件中onclick属性(针对点击事件)1.通过内部类实现代码:privateButtonmBtnEvent;//oncreate中mBtnEvent.setOnClickListener(newOnClick());//内部类实现监听classOnClickimplementsView.OnClickLis
创建一个完整的购物商城系统是一个复杂的项目，涉及前端（用户界面）、后端（服务器逻辑）、数据库等多个部分。由于篇幅限制，我无法在这里提供一个完整的系统代码，但我可以分别给出一些关键部分的示例代码，涵盖几 uthRaman 前端 ui 服务器
前端（HTML/CSS/JavaScript）grsyzp.cnHTML页面结构（index.html）html购物商城欢迎来到购物商城JavaScript（Ajax请求商品数据，app.js）javascriptdocument.addEventListener('DOMContentLoaded',function(){fetch('/api/products').then(response=
Kafka详细解析与应用分析芊言芊语 kafka 分布式
Kafka是一个开源的分布式事件流平台（EventStreamingPlatform），由LinkedIn公司最初采用Scala语言开发，并基于ZooKeeper协调管理。如今，Kafka已经被Apache基金会纳入其项目体系，广泛应用于大数据实时处理领域。Kafka凭借其高吞吐量、持久化、分布式和可靠性的特点，成为构建实时流数据管道和流处理应用程序的重要工具。Kafka架构Kafka的架构主要由
关于django中几个重要的gunicorn worker的配置给我起把狙 django gunicorn
关于django中几个重要的gunicornworker的配置一、worker_classworker_class是Gunicorn的配置参数之一，它指定了工作进程（worker）的类型。不同的worker_class提供了不同的并发模型，适合不同类型的应用场景。sync和gevent是两种常见的worker_class，它们的作用和区别如下：1.sync（同步worker）默认值：如果没有指定w
bat批处理循环执行adb命令 erhtre 程序员 adb
ping-n2127.0>nul等待2s:one::adbshellinputswipe90010007001000adbshellinputkeyevent25%KEYCODE_VOLUME_DOWN%ping-n2127.0>nulgototwo:twoadbshellinputkeyevent25%KEYCODE_VOLUME_DOWN%ping-n3127.0>nulgotoone附：An
Mac 技术篇-应用程序被锁定无法进行卸载问题解决方法，文件、文件夹被锁定无法移入废纸篓处理方法 lq9527_ Mac使用 macos
在卸载Karabiner-Elements和Karabiner-EventViewer软件时，提示应用锁定，无法卸载。参照方法。在进行/bin/ls-dleO@App路径操作后，返回提示信息与链接方法略有区别。/bin/ls-dleO@App路径drwxr-xr-x@3root wheel uchg96 3 1 2022/Applications/Karabiner-Elements.appcom
微信分享到朋友圈,怎么自定义分享的标题,图片,内容? 八分造作
vartit=$('#wx-title').val();//标题varimg=$('#wx-img').val();//图片varcon=$('#wx-con').val();//简介varlink=$('#wx-link').val();//链接document.addEventListener('WeixinJSBridgeReady',functiononBridgeReady(){//发送
分布式框架Celery七(Django-Celery-Flower实现异步和定时爬虫及其监控邮件告警) yjjpp2301 Celery 分布式 django python 后端
Django中集成方式安装模块pipinstallDjango==3.2.22pipinstallcelerypipinstallredispipinstalleventlet#在windows环境下需要安装eventlet包-----------pipinstalldjango-celery-beatpipinstalldjango-celery-resultspipinstalldjango-
Jetpack LiveData源码分析 xiangxiongfly915 #Android Jetpack系列 Jetpack LiveData 源码分析
文章目录JetpackLiveData源码分析前提源码分析注册订阅流程LiveData#observe()LifecycleRegistry#addObserver()ObserverWithState#dispatchEvent()LiveData#removeObserver()LiveData$LifecycleBoundObserver类LifecycleBoundObserver#sho
Tapable 信海利世 webpack webpack 前端
一、Tapable是什么？Tapable是一个类似于Node.js的EventEmitter的库,主要是控制钩子函数的发布与订阅,控制着webpack的插件系统。Tapable库暴露了很多Hook（钩子）类，为插件提供挂载的钩子const{SyncHook,//同步钩子SyncBailHook,//同步熔断钩子即return一个非undefined的值，则不再继续执行后面的监听函数SyncWate
fetch-event-source 如何通过script全局引入 cuiyuchen111 javascript 前端
fetchEventSource源码中导出了两种类型的包cjs和esm。但是有个需求如何在原生是js中通过script标签引呢？需要加上type=module。今天介绍另一种方法下载源码文件：https://github.com/Azure/fetch-event-source.git安装:npminstall--save-devwebpackwebpack-clits-loadertypescr
treeselect只选了分支节点全选_vue Treeselect 树形下拉框:获取选中节点的ids和lables操作... weixin_39637285
API:https://vue-treeselect.js.org/#events1.ids:即value1.lable:需要用到方法：@select(node,instanceId)和@deselect(node,instanceId)v-model="DRHA_EFaultModeTree_value":multiple="true":options="DRHA_EFaultModeTree_
11-js事件基础 echozzi JavaScript基础 javascript 前端开发语言
文章目录一、事件概念二、事件绑定方式1.onxxx2.事件监听器addEventListener三、事件解绑方式方法1：覆盖原事件处理（置空）方法2：移除事件监听器removeEventListener四、事件派发方式方法1：onxxx方法2：dispatchEvent五、事件对象window.event六、点击事件的光标坐标点1.以页面为参考坐标page2.以可视窗口为参考client3.相对事
《昇思 25 天学习打卡营第 25 天 | 基于 MindSpore 实现 BERT 对话情绪识别》 Sam9029 Mindscope模型学习深度学习
《昇思25天学习打卡营第25天|基于MindSpore实现BERT对话情绪识别》活动地址：https://xihe.mindspore.cn/events/mindspore-training-camp签名：Sam9029环境配置确保安装了正确版本的MindSpore和MindNLP库。!pipuninstallmindspore-y!pipinstall-ihttps://pypi.mirror
VB验证码短信接口插件示例短信接口开发
下面为您您提供了VB6版本的验证码短信接口对接DEMO例子免费体验注册地址：http://user.ihuyi.com/?DKimmuPrivateSubForm_Load()Winsock1.Protocol=sckTCPProtocolWinsock1.RemoteHost="106.ihuyi.com"Winsock1.RemotePort=80Winsock1.ConnectDoEvent
react native ScrollView实现滑动锚定，滑动到指定位置君君yui 前端 react native react.js javascript
实现ScrollView滑动视图组件滑动到指定位置，实现tab与具体位置相锚定给需要锚定的组件加上onLayout属性//event.nativeEvent.layout.x是水平方向值，event.nativeEvent.layout.y是数值方向值//this.layoutList用于存储组件位置onLayout={(event)=>{this.layoutList.push(event.na
Linux从入门到开发实战(C/C++)Day09-poll和epoll 黒井深 c语言 c++linux
poll：和select差不多#includeintpoll(structpollfd*fds,nfds_tnfds,inttimeout);与select共同点：还是轮询（轮询结构体数组）区别1：监视的不是描述符号集合，是结构体数组structpollfd{intfd;/*filedescriptor*/shortevents;/*requestedevents需要监视的事件*/shortrev
QLable提升类入梦游 qt
实现：1.图片移动、保持纵横比缩放、右键菜单1.myLabel.h#ifndefMYLABEL_H#defineMYLABEL_H#includeclassMyLabel:publicQLabel{Q_OBJECTpublic:MyLabel(QWidget*parent=nullptr);private:voidcontextMenuEvent(QContextMenuEvent*e)overr
网络安全要点总结大嘴巴子计算机网络 web安全安全
1.入侵检测与防御：1）入侵检测与系统IDS(intrusiondetectionsystem):防火墙之后的第二道闸门；IDS的部署：采用镜像端口或者集线器方式；部署在：服务器交换机上，internet接入路由器后面的第一台交换机上；IRSintrusionresponsesystem入侵响应系统：2）.IPS（intrusionpreventionsystem）:入侵防御系统；检测并中断；检测
C# 图形图像技术（通过Graphics绘制图像）萨达大 c#开发语言
文章目录创建Graphics对象画笔与画刷画笔画刷SolidBrush类HatchBrush类LinerGradientBrush类基本图形绘制矩形椭圆圆弧扇形创建Graphics对象privatevoidForm1_Load(objectsender,Eventargse){Graphicsghs=this.CreateGraphics();}画笔与画刷画笔构造函数publicPen(Color
iView拦截Modal对话框方法 FateOfKing
最近做一个公司内部项目，使用iView框架，遇到了一个问题，弹框关闭之前如果用户有输入数据需要二次确认是否关闭窗口。多番搜索无果，又去研究了一遍API。好不容易找到了方法，和大家分享一下。首先看Modal的两个个APIModalprops的value用来显示和关闭弹框的。Modalevents的on-visible-change用来监听弹框开启和关闭思路：在on-visible-change监听到
微信小程序自定义组件及传参墨染凉梦微信小程序小程序
1.新建文件夹，然后右键选择新建components2.组件的js结构如下图所示3.使用组件，在需要引用组件的页面json配置中引入组件4.组件传参之父传子父组件直接传参子组件在properties中接收，直接使用即可5.子组件传参给父组件子组件使用this.triggerEvent('事件名',参数)进行传参。父组件bind+事件名='回调方法'进行接收，并在回调方法中可以获得传递的参数
HTC Vive开发学习——VRTK（3）更新到新版本SDK！ fcauto2012 Vive开发 HTC Vive Unity C#
上两节中，我们主要对SteamVR_Unity_Toolkit（简称旧版VRTK）中的一些基础控制器脚本进行了学习，包括VRTK_ControllerEvents（以下简写会经常省略VRTK_前缀）、SimplePointer和BasicTeleport三个主要脚本。但是最近查资料的时候发现其实VRTK早已更新了功能更强大的版本。在新的VRTK中，不仅更多的VR环境被支持，而且相比旧版本还扩展了更
vue 预览 word_vue预览word 2401_84437530 程序员 vue.js word 前端
//将file转为bufferletfr=newFileReader();fr.readAsArrayBuffer(content.file);fr.addEventListener("loadend",(e)=>{console.log("loadend---->",e)letbuffer=e.target.result;this.docxRender(buffer);},false);}//"
vue对话框禁止后面页面滚动条滚动的解决方式小橘碎碎记 vue.js javascript 前端
转载https://www.cnblogs.com/mxl123/p/11818125.htmlstopSrcoll(){varmo=function(e){e.preventDefault();};document.body.style.overflow='hidden';document.addEventListener("touchmove",mo,false);//禁止页面滑动},open
vue如何禁止弹窗后面的滚动条滚动？ IT侠客行 Vue.js
methods:{//禁止滚动stop(){varmo=function(e){e.preventDefault();};document.body.style.overflow=‘hidden’;document.addEventListener(“touchmove”,mo,false);//禁止页面滑动},/取消滑动限制/move(){varmo=function(e){e.preventD
【modou网络库】Reactor架构与TCP通信机制分析 gma999 服务器 c++
Reactor模式EventLoop实现逻辑分析针对于EventLoop的设计还是严格遵循其核心思想oneloopperthread思想，也就是说一个线程只可以拥有一个EventLoop实例，那么为什么这样实现？主要有以下两点原因线程安全性：多线程环境下，确保每一个线程只有一个EventLoop实例，这样就可以避免线程竞争条件，因为EventLoop内部大部分操作都是线程不安全的，必须让其所属线程
禁止弹窗底部页面滑动解决方案整理七月的你项目中问题解决方案整理 javascript js css vue.js html
1.如果弹窗内容不可滑动，仅展示方案一：只需要给弹窗蒙层加上@touchmove.prevent即可实现，无兼容性问题方案二：在弹窗蒙层加上touch-action:none;在iPhone5和ipad上可能会没有效果方案三：打开弹窗时，设置body的overflow属性为hidden并阻止默认事件document.body.style.overflow='hidden';varfn=functi
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，