Echo Lee.

Flink Kafka Connector分析

文章目录

Flink Kafka Connector分析

1 FlinkKafkaConsumer

1.1 FlinkKafkaConsumerBase
1.2 AbstractPartitionDiscoverer
1.3 AbstractFetcher
1.4 KafkaConsumerThread
1.5 Handover
1.6 总结

2 FlinkKafkaProducer

Flink Kafka Connector分析

1 FlinkKafkaConsumer

Flink kafka consumer connector 是用来消费kafka数据到flink系统的连接器，作为flink系统的一个source存在。目前flink支持的kafka版本有0.8、0.9、0.10、0.11以及2.0+。由于目前我们使用的kafka版本是0.10.0.1，所以接下来主要基于0.10来分析。

上图是FlinkKafkaConsumer的继承关系图，我们关心的FlinkKafkaConsumer010是继承自FlinkKafkaConsumer09，并且FlinkKafkaConsumer010是一个RichFunction。它的基础类是FlinkKafkaConsumerBase，接下来我们开始分析FlinkKafkaConsumerBase

1.1 FlinkKafkaConsumerBase

FlinkKafkaConsumerBase是FlinkKafkaConsumer的基础类，也是非常核心的一个类，它除了继承自RichParallelSourceFunction，还实现了CheckpointedFunction和CheckpointListener这两个接口，主要用于checkpoint的快照保存和恢复以及快照完成后执行的回调。

public abstract class FlinkKafkaConsumerBase<T> extends RichParallelSourceFunction<T> implements
		CheckpointListener,
		ResultTypeQueryable<T>,
		CheckpointedFunction

下面来看看FlinkKafkaConsumerBase里定义了哪些属性？

//FlinkKafkaConsumerBase
//pendingOffsetsToCommit中最多保存100个checkoint，超过会删除最旧的。
public static final int MAX_NUM_PENDING_CHECKPOINTS = 100;
//partition discovery开关，默认关闭
public static final long PARTITION_DISCOVERY_DISABLED = Long.MIN_VALUE;
//metrics开关
public static final String KEY_DISABLE_METRICS = "flink.disable-metrics";
//partition discovery 间隔时间的key
public static final String KEY_PARTITION_DISCOVERY_INTERVAL_MILLIS = "flink.partition-discovery.interval-millis";
//partition-offset state的名字
private static final String OFFSETS_STATE_NAME = "topic-partition-offset-states";
//topic的描述，即：topic的名称
private final KafkaTopicsDescriptor topicsDescriptor;
//kafka消息反序列化的schema
protected final KafkaDeserializationSchema<T> deserializer;
//从指定offset位置开始订阅topic的分区
private Map<KafkaTopicPartition, Long> subscribedPartitionsToStartOffsets;
//周期性watermark分配器
private SerializedValue<AssignerWithPeriodicWatermarks<T>> periodicWatermarkAssigner;
//间隙性watermark分配器
private SerializedValue<AssignerWithPunctuatedWatermarks<T>> punctuatedWatermarkAssigner;
//基于checkpoint提交offset开关，默认打开
private boolean enableCommitOnCheckpoints = true;
//使用当前topic描述去过滤不匹配的分区(基于快照恢复时)
private boolean filterRestoredPartitionsWithCurrentTopicsDescriptor = true;
//offset提交模式：关闭/基于checkpoint提交/基于kafka周期性提交
private OffsetCommitMode offsetCommitMode;
//partition discovery 间隔时间
private final long discoveryIntervalMillis;
//从指定offset位置开始订阅topic的分区的模式：EARLIEST/LATEST/GROUP_OFFSETS/SPECIFIC_OFFSETS/TIMESTAMP，其中0.10.0.1版本不支持TIMESTAMP
private StartupMode startupMode = StartupMode.GROUP_OFFSETS;
//从指定特殊的offset位置开始订阅topic的分区
private Map<KafkaTopicPartition, Long> specificStartupOffsets;
//从指定特殊的时间对应的offset位置开始订阅topic的分区
private Long startupOffsetsTimestamp;
//记录正在进行的快照(即partition-offset的state)
private final LinkedMap pendingOffsetsToCommit = new LinkedMap();
//用于从kafka 拉取数据
private transient volatile AbstractFetcher<T, ?> kafkaFetcher;
//用于分区实时发现
private transient volatile AbstractPartitionDiscoverer partitionDiscoverer;
//基于该state恢复
private transient volatile TreeMap<KafkaTopicPartition, Long> restoredState;
//保存的partition-offset state，为union state
private transient ListState<Tuple2<KafkaTopicPartition, Long>> unionOffsetStates;
//是否支持从老的状态恢复，老状态是指Flink 1.1 or 1.2.的状态
private boolean restoredFromOldState;
//分区实时发现的线程
private transient volatile Thread discoveryLoopThread;
//运行标志
private volatile boolean running = true;
//mrtrics
private final boolean useMetrics;
private transient Counter successfulCommits;
private transient Counter failedCommits;
private transient KafkaCommitCallback offsetCommitCallback;

FlinkKafkaConsumerBase中暴露给用户的api包括assignTimestampsAndWatermarks、setStartFromEarliest、setStartFromLatest、disableFilterRestoredPartitionsWithSubscribedTopics等，主要用于watermark的设置以及从指定位置开始消费数据。
FlinkKafkaConsumerBase中最先执行的方法是initializeState，主要用于状态的初始化：

(1) 从上下文获取stateStore

(2) 从stateStore中获取状态，包括老状态(应该是为了兼容1.2版本)和新状态,如果有老状态，迁移到unionOffsetStates 中

(3) 将unionOffsetStates 插入到restoredState，用于恢复状态。

	//FlinkKafkaConsumerBase
	public final void initializeState(FunctionInitializationContext context) throws Exception {

		OperatorStateStore stateStore = context.getOperatorStateStore();
		//获取老版本的状态
		ListState<Tuple2<KafkaTopicPartition, Long>> oldRoundRobinListState =
		stateStore.getSerializableListState(DefaultOperatorStateBackend.DEFAULT_OPERATOR_STATE_NAME);
		//从stateStore中获取状态，如果没有会创建。
		this.unionOffsetStates = stateStore.getUnionListState(new ListStateDescriptor<>(
				OFFSETS_STATE_NAME,
				TypeInformation.of(new TypeHint<Tuple2<KafkaTopicPartition, Long>>() {})));
		if (context.isRestored() && !restoredFromOldState) {
			restoredState = new TreeMap<>(new KafkaTopicPartition.Comparator());
			// 迁移老的状态到unionOffsetStates
			for (Tuple2<KafkaTopicPartition, Long> kafkaOffset : oldRoundRobinListState.get()) {
				restoredFromOldState = true;
				unionOffsetStates.add(kafkaOffset);
			}
			oldRoundRobinListState.clear();
			//存在老的状态并且partition discovery没有关闭
			if (restoredFromOldState && discoveryIntervalMillis != PARTITION_DISCOVERY_DISABLED) {
				//抛异常
			}
			// 将unionOffsetStates中的状态插入restoredState中
			for (Tuple2<KafkaTopicPartition, Long> kafkaOffset : unionOffsetStates.get()) {
				restoredState.put(kafkaOffset.f0, kafkaOffset.f1);
			}
			//log
		} else {
			//log
		}
	}

FlinkKafkaConsumerBase的open方法主要用于初始化，执行于initializeState方法之后，下面结合代码来看看具体流程：

(1) 初始化offsetCommitMode，在开启了checkpoint的情况下，如果enableCommitOnCheckpoint开启，则为ON_CHECKPOINTS，否则为DISABLED；如果未开启checkpoint，开启了自动提交offset，则为KAFKA_PERIODIC，否则为DISABLED。最后如果offsetCommitMode为ON_CHECKPOINTS或DISABLED，enable.auto.commit将被设置为false，具体是在adjustAutoCommitConfig方法中实现，比较简单。offsetCommitMode初始化完成后，接着初始化partitionDiscoverer，010创建的是Kafka010PartitionDiscoverer，然后调用AbstractPartitionDiscoverer的open方法，主要是初始化kafka consumer。

offsetCommitMode	描述
DISABLED	不开启offset提交
ON_CHECKPOINTS	确保checkpoint完成以后再提交offset到kafka
KAFKA_PERIODIC	周期性的自动提交offset到kafka

(2) 查找topic对应的所有分区，并初始化每个分区的消费位点，保存到subscribedPartitionsToStartOffsets中。

startupMode	描述
GROUP_OFFSETS	从该组最后提交的offset位置开始消费
EARLIEST	从开始位置开始消费
LATEST	从结束位置开始消费
TIMESTAMP	从指定时间戳对应的提交的offset位置开始消费
SPECIFIC_OFFSETS	从指定的offset位置开始消费

	//FlinkKafkaConsumerBase
	public void open(Configuration configuration) throws Exception {
		// 初始化offsetCommitMode
		this.offsetCommitMode = OffsetCommitModes.fromConfiguration(
				getIsAutoCommitEnabled(),
				enableCommitOnCheckpoints,
				((StreamingRuntimeContext) getRuntimeContext()).isCheckpointingEnabled());
		// 初始化partitionDiscoverer，并调用open方法
		this.partitionDiscoverer = createPartitionDiscoverer(
				topicsDescriptor,
				getRuntimeContext().getIndexOfThisSubtask(),
				getRuntimeContext().getNumberOfParallelSubtasks());
		this.partitionDiscoverer.open();
		subscribedPartitionsToStartOffsets = new HashMap<>();
		// 查找topic的所有分区，后面介绍PartitionDiscoverer时会详细介绍
		final List<KafkaTopicPartition> allPartitions = partitionDiscoverer.discoverPartitions();
		// 如果从状态恢复
		if (restoredState != null) {
			for (KafkaTopicPartition partition : allPartitions) {
				if (!restoredState.containsKey(partition)) {
					//如果恢复的状态不包含该分区，则默认以EARLIEST开始消费，并插入restoredState
					restoredState.put(partition, KafkaTopicPartitionStateSentinel.EARLIEST_OFFSET);
				}
			}
			//遍历restoredState
			for (Map.Entry<KafkaTopicPartition, Long> restoredStateEntry : restoredState.entrySet()) {
				if (!restoredFromOldState) {
					//不从老状态恢复，则分配给该task订阅的分区和offset，并插入subscribedPartitionsToStartOffsets
					if (KafkaTopicPartitionAssigner.assign(
						restoredStateEntry.getKey(), getRuntimeContext().getNumberOfParallelSubtasks())
							== getRuntimeContext().getIndexOfThisSubtask()){
						subscribedPartitionsToStartOffsets.put(restoredStateEntry.getKey(), restoredStateEntry.getValue());
					}
				} else {
					// 老状态直接插入subscribedPartitionsToStartOffsets
					subscribedPartitionsToStartOffsets.put(restoredStateEntry.getKey(), restoredStateEntry.getValue());
				}
			}
			//过滤不匹配的分区
			if (filterRestoredPartitionsWithCurrentTopicsDescriptor) {
				subscribedPartitionsToStartOffsets.entrySet().removeIf(entry -> {
					if (!topicsDescriptor.isMatchingTopic(entry.getKey().getTopic())) {
						//log
						return true;
					}
					return false;
				});
			}
			//log
		} else { // 不从状态恢复
			switch (startupMode) {
				//特殊offset恢复
				case SPECIFIC_OFFSETS:
					if (specificStartupOffsets == null) {
						// throw IllegalStateException
					}

					for (KafkaTopicPartition seedPartition : allPartitions) {
						Long specificOffset = specificStartupOffsets.get(seedPartition);
						if (specificOffset != null) {
							//从specificStartupOffsets中获取分区对应的offset并不为空，并插入subscribedPartitionsToStartOffsets，用于从此位置订阅分区。
							subscribedPartitionsToStartOffsets.put(seedPartition, specificOffset - 1);
						} else {
							//从specificStartupOffsets中获取分区对应的offset为空，默认以GROUP_OFFSET方式订阅
							subscribedPartitionsToStartOffsets.put(seedPartition, KafkaTopicPartitionStateSentinel.GROUP_OFFSET);
						}
					}
					break;
				//指定时间戳对应的offset恢复，适用于0.10.2+版本的kafka
				case TIMESTAMP:
					if (startupOffsetsTimestamp == null) {
						//throw IllegalStateException
					}
					//查找时间戳对应的partition-offset，如果对应的offset为空，默认以LATEST_OFFSET方式订阅
					for (Map.Entry<KafkaTopicPartition, Long> partitionToOffset
							: fetchOffsetsWithTimestamp(allPartitions, startupOffsetsTimestamp).entrySet()) {
						subscribedPartitionsToStartOffsets.put(
							partitionToOffset.getKey(),
							(partitionToOffset.getValue() == null)
									? KafkaTopicPartitionStateSentinel.LATEST_OFFSET
									: partitionToOffset.getValue() - 1);
					}
					break;
				//否则以GROUP_OFFSET方式订阅
				default:
					for (KafkaTopicPartition seedPartition : allPartitions) {
						subscribedPartitionsToStartOffsets.put(seedPartition, startupMode.getStateSentinel());
					}
			}
			//log
		}
	}

初始化完成后，接下来就到了核心的run方法了，这才是实际的执行逻辑，下面来看看run方法做了些什么：

(1) 初始化metric，初始化offsetCommitCallback，创建kafkaFetcher

(2) 如果开启了PARTITION_DISCOVERY，启动partition discovery线程和fetch loop，否则仅启动fetch loop

	//FlinkKafkaConsumerBase
	public void run(SourceContext<T> sourceContext) throws Exception {
		if (subscribedPartitionsToStartOffsets == null) {
			//throw Exception
		}
		// 初始化successfulCommits和failedCommits这两个metric，省略
		//获取当前subtask的index
		final int subtaskIndex = this.getRuntimeContext().getIndexOfThisSubtask();

		//初始化offsetCommitCallback，提交offset的回调函数，省略
		// 如果subscribedPartitionsToStartOffsets为空，发送一个IDLE标记
		if (subscribedPartitionsToStartOffsets.isEmpty()) {
			sourceContext.markAsTemporarilyIdle();
		}
		//log
		//创建Fetcher
		this.kafkaFetcher = createFetcher(
				sourceContext,
				subscribedPartitionsToStartOffsets,
				periodicWatermarkAssigner,
				punctuatedWatermarkAssigner,
				(StreamingRuntimeContext) getRuntimeContext(),
				offsetCommitMode,
				getRuntimeContext().getMetricGroup().addGroup(KAFKA_CONSUMER_METRICS_GROUP),
				useMetrics);

		if (!running) {
			return;
		}
		//如果PARTITION_DISCOVERY_DISABLED开启，执行kafkaFetcher的runFetchLoop，否则执行runWithPartitionDiscovery
		if (discoveryIntervalMillis == PARTITION_DISCOVERY_DISABLED) {
			kafkaFetcher.runFetchLoop();
		} else {
			runWithPartitionDiscovery();
		}
	}

	//FlinkKafkaConsumerBase
	private void runWithPartitionDiscovery() throws Exception {
		final AtomicReference<Exception> discoveryLoopErrorRef = new AtomicReference<>();
		// 创建并启动discorvery线程
		createAndStartDiscoveryLoop(discoveryLoopErrorRef);
		// 启动拉取数据的线程
		kafkaFetcher.runFetchLoop();
		// 将AbstractPartitionDiscoverer的wakeup置为true，并唤醒kafkaConsumer
		partitionDiscoverer.wakeup();
		// join discorvery线程
		joinDiscoveryLoopThread();

		// 如果discovery线程遇到错误，重新抛出RuntimeException
		final Exception discoveryLoopError = discoveryLoopErrorRef.get();
		if (discoveryLoopError != null) {
			throw new RuntimeException(discoveryLoopError);
		}
	}

	//FlinkKafkaConsumerBase
	private void createAndStartDiscoveryLoop(AtomicReference<Exception> discoveryLoopErrorRef) {
		discoveryLoopThread = new Thread(() -> {
			try {
				while (running) {
					//log
					final List<KafkaTopicPartition> discoveredPartitions;
					try {
						//寻找将要订阅的topic的分区，具体分析见AbstractPartitionDiscoverer
						discoveredPartitions = partitionDiscoverer.discoverPartitions();
					} catch (AbstractPartitionDiscoverer.WakeupException | AbstractPartitionDiscoverer.ClosedException e) {
						break;
					}
					//添加到subscribedPartitionStates列表和unassignedPartitionsQueue队列中，具体分析见AbstractFetcher
					if (running && !discoveredPartitions.isEmpty()) {
						kafkaFetcher.addDiscoveredPartitions(discoveredPartitions);
					}
					if (running && discoveryIntervalMillis != 0) {
						try {
							Thread.sleep(discoveryIntervalMillis);
						} catch (InterruptedException iex) {
							break;
						}
					}
				}
			} catch (Exception e) {
				discoveryLoopErrorRef.set(e);
			} finally {
				if (running) {
					cancel();
				}
			}
		}, "Kafka Partition Discovery for " + getRuntimeContext().getTaskNameWithSubtasks());
		discoveryLoopThread.start();
	}

run方法的整体流程图如下：

下面来看看执行快照的方法snapshotState，每次checkpoint的时候会调用：

// FlinkKafkaConsumerBase
	public final void snapshotState(FunctionSnapshotContext context) throws Exception {
		if (!running) {
			//log
		} else {
			// 清空unionOffsetStates
			unionOffsetStates.clear();
			final AbstractFetcher<?, ?> fetcher = this.kafkaFetcher;
			// 正常情况fetcher不为null，如果为null，就将subscribedPartitionsToStartOffsets保存到unionOffsetStates
			if (fetcher == null) {
				// 用subscribedPartitionsToStartOffsets更新unionOffsetStates，并将restoredState加入待提交map中
				for (Map.Entry<KafkaTopicPartition, Long> subscribedPartition : subscribedPartitionsToStartOffsets.entrySet()) {
					unionOffsetStates.add(Tuple2.of(subscribedPartition.getKey(), subscribedPartition.getValue()));
				}
				if (offsetCommitMode == OffsetCommitMode.ON_CHECKPOINTS) {
					pendingOffsetsToCommit.put(context.getCheckpointId(), restoredState);
				}
			} else {
				HashMap<KafkaTopicPartition, Long> currentOffsets = fetcher.snapshotCurrentState();
				// 用subscribedPartitionStates更新unionOffsetStates，并将subscribedPartitionStates加入待提交map中
				if (offsetCommitMode == OffsetCommitMode.ON_CHECKPOINTS) {
					pendingOffsetsToCommit.put(context.getCheckpointId(), currentOffsets);
				}
				for (Map.Entry<KafkaTopicPartition, Long> kafkaTopicPartitionLongEntry : currentOffsets.entrySet()) {
					unionOffsetStates.add(
							Tuple2.of(kafkaTopicPartitionLongEntry.getKey(), kafkaTopicPartitionLongEntry.getValue()));
				}
			}
			// pendingOffsetsToCommit如果超过100个，删除最老的一个，防止OOM
			if (offsetCommitMode == OffsetCommitMode.ON_CHECKPOINTS) {
				while (pendingOffsetsToCommit.size() > MAX_NUM_PENDING_CHECKPOINTS) {
					pendingOffsetsToCommit.remove(0);
				}
			}
		}
	}

当全局checkpoint完成后，会调用notifyCheckpointComplete方法，这就是两阶段提交中的Pre-Commit

	// FlinkKafkaConsumerBase
	public final void notifyCheckpointComplete(long checkpointId) throws Exception {
		if (!running) {
			// log
			return;
		}
		final AbstractFetcher<?, ?> fetcher = this.kafkaFetcher;
		if (fetcher == null) {
			// log debug
			return;
		}
		if (offsetCommitMode == OffsetCommitMode.ON_CHECKPOINTS) {
			// log debug
			try {
				// 查找checkpointId在pendingOffsetsToCommit中的位置
				final int posInMap = pendingOffsetsToCommit.indexOf(checkpointId);
				if (posInMap == -1) {
					// log
					return;
				}
				@SuppressWarnings("unchecked")
				// 根据checkpointId查找pendingOffsetsToCommit中的partition-offset，也就是待提交的offset，记录到offsets中，并从pendingOffsetsToCommit中删除
				Map<KafkaTopicPartition, Long> offsets =
					(Map<KafkaTopicPartition, Long>) pendingOffsetsToCommit.remove(posInMap);
				// remove older checkpoints in map
				for (int i = 0; i < posInMap; i++) {
					pendingOffsetsToCommit.remove(0);
				}
				if (offsets == null || offsets.size() == 0) {
					// log debug
					return;
				}
				// 将offsets提交至kafka，完成Pre-Commit
				fetcher.commitInternalOffsetsToKafka(offsets, offsetCommitCallback);
			} catch (Exception e) {
				if (running) {
					throw e;
				}
				// else ignore exception if we are no longer running
			}
		}
	}

	// AbstractFetcher
	public final void commitInternalOffsetsToKafka(
			Map<KafkaTopicPartition, Long> offsets,
			@Nonnull KafkaCommitCallback commitCallback) throws Exception {
		// 通过filterOutSentinels过滤小于0的offset，执行doCommit
		doCommitInternalOffsetsToKafka(filterOutSentinels(offsets), commitCallback);
	}

	// Kafka09Fetcher
	protected void doCommitInternalOffsetsToKafka(
			Map<KafkaTopicPartition, Long> offsets,
			@Nonnull KafkaCommitCallback commitCallback) throws Exception {
		@SuppressWarnings("unchecked")
		// 获取partitions state，即subscribedPartitionStates，在AbstractFetcher的属性中有解释
		List<KafkaTopicPartitionState<TopicPartition>> partitions = subscribedPartitionStates();

		Map<TopicPartition, OffsetAndMetadata> offsetsToCommit = new HashMap<>(partitions.size());
		// 遍历partitions，提取上次最后处理的offset并插入offsetsToCommit，并将offsetsToCommit保存到state中
		for (KafkaTopicPartitionState<TopicPartition> partition : partitions) {
			Long lastProcessedOffset = offsets.get(partition.getKafkaTopicPartition());
			if (lastProcessedOffset != null) {
				checkState(lastProcessedOffset >= 0, "Illegal offset value to commit");
				long offsetToCommit = lastProcessedOffset + 1;
				offsetsToCommit.put(partition.getKafkaPartitionHandle(), new OffsetAndMetadata(offsetToCommit));
				partition.setCommittedOffset(offsetToCommit);
			}
		}
		// 将offsetsToCommit插入nextOffsetsToCommit中等待异步提交
		consumerThread.setOffsetsToCommit(offsetsToCommit, commitCallback);
	}

	// KafkaConsumerThread
	void setOffsetsToCommit(
			Map<TopicPartition, OffsetAndMetadata> offsetsToCommit,
			@Nonnull KafkaCommitCallback commitCallback) {
		// 将offsetsToCommit插入nextOffsetsToCommit中
		if (nextOffsetsToCommit.getAndSet(Tuple2.of(offsetsToCommit, commitCallback)) != null) {
			// log warn
		}
		handover.wakeupProducer();
		synchronized (consumerReassignmentLock) {
			if (consumer != null) {
				// 调用consumer的wakeup
				consumer.wakeup();
			} else {
				// 设置hasBufferedWakeup为true
				hasBufferedWakeup = true;
			}
		}
	}

在open方法中通过partitionDiscoverer.discoverPartitions()来获取topic的所有分区，其中partitionDiscoverer就是AbstractPartitionDiscoverer。同时上面提到了kafkaFetcher，其抽象类是AbstractFetcher，作用是去拉取kafka数据，下面我们依次详细分析下AbstractPartitionDiscoverer和AbstractFetcher这两个核心类。

1.2 AbstractPartitionDiscoverer

AbstractPartitionDiscoverer是抽象类，作用是去寻找topic的分区，下面我们结合源码来看看具体实现：

首先还是来看看AbstractPartitionDiscoverer的属性

//AbstractPartitionDiscoverer
// topic描述，即：topic名称
private final KafkaTopicsDescriptor topicsDescriptor;
// 当前subtask的index
private final int indexOfThisSubtask;
// 总的subtask个数，即：并行度
private final int numParallelSubtasks;
// closed标志
private volatile boolean closed = true;
// wakeup标志
private volatile boolean wakeup;
// 该subtask分配的分区集合，即：该subtask将要订阅的分区
private Set<KafkaTopicPartition> discoveredPartitions;

AbstractPartitionDiscoverer最核心的方法是discoverPartitions，作用是发现分区：

(1) 获取topic对应的所有分区

(2) 通过KafkaTopicPartitionAssigner定义的算法来决定当前subtask需要订阅的分区集合newDiscoveredPartitions，算法原理是分区对应topic的hash和并行度取余的结果加上分区编号再和并行度取余的结果如果和当前subtask编号相同，则该分区被该subtask订阅。

	//AbstractPartitionDiscoverer
	public List<KafkaTopicPartition> discoverPartitions() throws WakeupException, ClosedException {
		// 非closed并且非wakeup
		if (!closed && !wakeup) {
			try {
				List<KafkaTopicPartition> newDiscoveredPartitions;
				// topic为具体的全称而非正则匹配，直接调用getAllPartitionsForTopics来获取所有分区
				if (topicsDescriptor.isFixedTopics()) {
					newDiscoveredPartitions = getAllPartitionsForTopics(topicsDescriptor.getFixedTopics());
				} else {
					// topic为正则匹配的表达式，先匹配出所有符合条件的topic列表，然后调用getAllPartitionsForTopics来获取所有分区
					List<String> matchedTopics = getAllTopics();
					Iterator<String> iter = matchedTopics.iterator();
					while (iter.hasNext()) {
						if (!topicsDescriptor.isMatchingTopic(iter.next())) {
							iter.remove();
						}
					}
					if (matchedTopics.size() != 0) {
						newDiscoveredPartitions = getAllPartitionsForTopics(matchedTopics);
					} else {
						newDiscoveredPartitions = null;
					}
				}
				if (newDiscoveredPartitions == null || newDiscoveredPartitions.isEmpty()) {
					//throw RuntimeException
				} else {
					Iterator<KafkaTopicPartition> iter = newDiscoveredPartitions.iterator();
					KafkaTopicPartition nextPartition;
					while (iter.hasNext()) {
						nextPartition = iter.next();
						// 检查新发现的分区，不符合要求的过滤掉
						if (!setAndCheckDiscoveredPartition(nextPartition)) {
							iter.remove();
						}
					}
				}
				// 返回符合该subtask的分区，用来订阅。
				return newDiscoveredPartitions;
			} catch (WakeupException e) {
				wakeup = false;
				throw e;
			}
		} else if (!closed && wakeup) {
			wakeup = false;
			throw new WakeupException();
		} else {
			throw new ClosedException();
		}
	}

注意：下面调用partitionsFor方法之前或期间如果调用了kafkaConsumer的wakeup方法，会抛出WakeupException

	// Kafka09PartitionDiscoverer
	protected List<KafkaTopicPartition> getAllPartitionsForTopics(List<String> topics) throws WakeupException {
		List<KafkaTopicPartition> partitions = new LinkedList<>();
		try {
			// 直接调用kafkaConsumer的partitionsFor方法获取topic的所有分区
			for (String topic : topics) {
				for (PartitionInfo partitionInfo : kafkaConsumer.partitionsFor(topic)) {
					partitions.add(new KafkaTopicPartition(partitionInfo.topic(), partitionInfo.partition()));
				}
			}
		} catch (org.apache.kafka.common.errors.WakeupException e) {
			// throw WakeupException();
		}
		return partitions;
	}

	// AbstractPartitionDiscoverer
	public boolean setAndCheckDiscoveredPartition(KafkaTopicPartition partition) {
		if (isUndiscoveredPartition(partition)) {
			discoveredPartitions.add(partition);
			//通过KafkaTopicPartitionAssigner来分配该subtask应该订阅的topic-partition
			return KafkaTopicPartitionAssigner.assign(partition, numParallelSubtasks) == indexOfThisSubtask;
		}
		return false;
	}
	//是否是之前未发现的分区，之前发现的会存到discoveredPartitions中
	private boolean isUndiscoveredPartition(KafkaTopicPartition partition) {
		return !discoveredPartitions.contains(partition);
	}

	// KafkaTopicPartitionAssigner
	public static int assign(KafkaTopicPartition partition, int numParallelSubtasks) {
		// partition对应topic的hash值和并行度取余得到startIndex
		int startIndex = ((partition.getTopic().hashCode() * 31) & 0x7FFFFFFF) % numParallelSubtasks;
		// startIndex加分区编号和并行度取余的结果决定当前分区应该被哪个subtask订阅
		return (startIndex + partition.getPartition()) % numParallelSubtasks;
	}

1.3 AbstractFetcher

AbstractFetcher也是kafka connector非常核心的类，作用是从kafka中poll数据并发送给下游，首先上它的继承关系图：

接下来看看它的属性：

// AbstractFetcher
// source上下文
protected final SourceContext<T> sourceContext;
// checkpoint锁
private final Object checkpointLock;
// 订阅分区的状态，包括分区、消费到的offset、成功提交的offset等
private final List<KafkaTopicPartitionState<KPH>> subscribedPartitionStates;
// 未分配的分区队列，上面discoverPartitions方法的返回值会插入该队列
protected final ClosableBlockingQueue<KafkaTopicPartitionState<KPH>> unassignedPartitionsQueue;
// watermark模式：NO_TIMESTAMPS_WATERMARKS/PERIODIC_WATERMARKS/PUNCTUATED_WATERMARKS
private final int timestampWatermarkMode;
// 周期性watermark分配器
private final SerializedValue<AssignerWithPeriodicWatermarks<T>> watermarksPeriodic;
// 间隙性watermark分配器
private final SerializedValue<AssignerWithPunctuatedWatermarks<T>> watermarksPunctuated;
// 用户代码类加载器
private final ClassLoader userCodeClassLoader;
// 间隙性watermark阈值
private volatile long maxWatermarkSoFar = Long.MIN_VALUE;
// Metrics
private final boolean useMetrics;
private final MetricGroup consumerMetricGroup;
private final MetricGroup legacyCurrentOffsetsMetricGroup;
private final MetricGroup legacyCommittedOffsetsMetricGroup;

AbstractFetcher的构造方法做了很多初始化的工作，包括watermark、metric以及状态相关，我们主要看看subscribedPartitionStates和unassignedPartitionsQueue的初始化

protected AbstractFetcher(
			SourceContext<T> sourceContext,
			Map<KafkaTopicPartition, Long> seedPartitionsWithInitialOffsets,//即FlinkKafkaConsumerBase中的subscribedPartitionsToStartOffsets，初始化partition-offset对应关系
			SerializedValue<AssignerWithPeriodicWatermarks<T>> watermarksPeriodic,
			SerializedValue<AssignerWithPunctuatedWatermarks<T>> watermarksPunctuated,
			ProcessingTimeService processingTimeProvider,
			long autoWatermarkInterval,
			ClassLoader userCodeClassLoader,
			MetricGroup consumerMetricGroup,
			boolean useMetrics) throws Exception {
			//创建分区状态的句柄
			this.subscribedPartitionStates = createPartitionStateHolders(
				seedPartitionsWithInitialOffsets,
				timestampWatermarkMode,
				watermarksPeriodic,
				watermarksPunctuated,
				userCodeClassLoader);
			//将subscribedPartitionStates插入unassignedPartitionsQueue中
			for (KafkaTopicPartitionState<KPH> partition : subscribedPartitionStates) {
				unassignedPartitionsQueue.add(partition);
			}
		}

	//AbstractFetcher
	private List<KafkaTopicPartitionState<KPH>> createPartitionStateHolders(
			Map<KafkaTopicPartition, Long> partitionsToInitialOffsets,
			int timestampWatermarkMode,
			SerializedValue<AssignerWithPeriodicWatermarks<T>> watermarksPeriodic,
			SerializedValue<AssignerWithPunctuatedWatermarks<T>> watermarksPunctuated,
			ClassLoader userCodeClassLoader) throws IOException, ClassNotFoundException {
		List<KafkaTopicPartitionState<KPH>> partitionStates = new CopyOnWriteArrayList<>();
		switch (timestampWatermarkMode) {
			case NO_TIMESTAMPS_WATERMARKS: {
				for (Map.Entry<KafkaTopicPartition, Long> partitionEntry : partitionsToInitialOffsets.entrySet()) {
					// handle：topic-partition
					KPH kafkaHandle = createKafkaPartitionHandle(partitionEntry.getKey());
					// partitionEntry.getKey()和kafkaHandle不是一样的吗？不明白为啥都封装到partitionState 里
					KafkaTopicPartitionState<KPH> partitionState =
							new KafkaTopicPartitionState<>(partitionEntry.getKey(), kafkaHandle);
					// 设置订阅的起始offset
					partitionState.setOffset(partitionEntry.getValue());
					partitionStates.add(partitionState);
				}
				return partitionStates;
			}
			case PERIODIC_WATERMARKS: {
				for (Map.Entry<KafkaTopicPartition, Long> partitionEntry : partitionsToInitialOffsets.entrySet()) {
					KPH kafkaHandle = createKafkaPartitionHandle(partitionEntry.getKey());
					AssignerWithPeriodicWatermarks<T> assignerInstance =
							watermarksPeriodic.deserializeValue(userCodeClassLoader);
					// partitionState： topic-partition、watermark assigner、offset
					KafkaTopicPartitionStateWithPeriodicWatermarks<T, KPH> partitionState =
							new KafkaTopicPartitionStateWithPeriodicWatermarks<>(
									partitionEntry.getKey(),
									kafkaHandle,
									assignerInstance);
					partitionState.setOffset(partitionEntry.getValue());
					partitionStates.add(partitionState);
				}
				return partitionStates;
			}
			case PUNCTUATED_WATERMARKS: {
				for (Map.Entry<KafkaTopicPartition, Long> partitionEntry : partitionsToInitialOffsets.entrySet()) {
					KPH kafkaHandle = createKafkaPartitionHandle(partitionEntry.getKey());
					AssignerWithPunctuatedWatermarks<T> assignerInstance =
							watermarksPunctuated.deserializeValue(userCodeClassLoader);
					// partitionState： topic-partition、watermark assigner、offset
					KafkaTopicPartitionStateWithPunctuatedWatermarks<T, KPH> partitionState =
							new KafkaTopicPartitionStateWithPunctuatedWatermarks<>(
									partitionEntry.getKey(),
									kafkaHandle,
									assignerInstance);
					partitionState.setOffset(partitionEntry.getValue());
					partitionStates.add(partitionState);
				}
				return partitionStates;
			}
			default:
				throw new RuntimeException();
		}
	}

addDiscoveredPartitions方法是将新发现的partition加入到subscribedPartitionStates列表和unassignedPartitionsQueue队列中

	public void addDiscoveredPartitions(List<KafkaTopicPartition> newPartitions) throws IOException, ClassNotFoundException {
		List<KafkaTopicPartitionState<KPH>> newPartitionStates = createPartitionStateHolders(
				newPartitions,
				KafkaTopicPartitionStateSentinel.EARLIEST_OFFSET,
				timestampWatermarkMode,
				watermarksPeriodic,
				watermarksPunctuated,
				userCodeClassLoader);
		if (useMetrics) {
			registerOffsetMetrics(consumerMetricGroup, newPartitionStates);
		}
		for (KafkaTopicPartitionState<KPH> newPartitionState : newPartitionStates) {
			subscribedPartitionStates.add(newPartitionState);
			unassignedPartitionsQueue.add(newPartitionState);
		}
	}

在FlinkKafkaConsumerBase中会调用Fetcher的runFetchLoop方法，runFetchLoop在AbstractFetcher是一个抽象方法，具体由子类去实现，我们关心的是Kafka09Fetcher的runFetchLoop实现，Kafka10Fetcher用的也是Kafka09Fetcher的runFetchLoop，它自己没有实现该方法，接下来我们看看这个方法做了什么？

// 反序列化数据的schema
private final KafkaDeserializationSchema<T> deserializer;
// 在consumer thread和task thread之间进行数据和异常交换
private final Handover handover;
// consumer thread
private final KafkaConsumerThread consumerThread;
// 运行标志
private volatile boolean running = true;

(1) 启动consumerThread线程

(2) 从handover拉取一批数据并发往下游

	// Kafka09Fetcher
	public void runFetchLoop() throws Exception {
		try {
			final Handover handover = this.handover;
			// 启动consumer thread
			consumerThread.start();
			while (running) {
				// poll一批数据
				final ConsumerRecords<byte[], byte[]> records = handover.pollNext();
				// 遍历subscribedPartitionStates中的所有分区
				for (KafkaTopicPartitionState<TopicPartition> partition : subscribedPartitionStates()) {
					// 获取partition 对应的records并转为ConsumerRecord列表
					List<ConsumerRecord<byte[], byte[]>> partitionRecords =
							records.records(partition.getKafkaPartitionHandle());
					// 遍历partitionRecords
					for (ConsumerRecord<byte[], byte[]> record : partitionRecords) {
						// 反序列化
						final T value = deserializer.deserialize(record);
						// 流的isEndOfStream默认为false，批的我们暂不关心
						if (deserializer.isEndOfStream(value)) {
							running = false;
							break;
						}
						// 发送到下游，最终调用sourceContext.collectWithTimestamp(T element, long timestamp)方法，对于无watermark/周期性watermark/间隙性watermark有点区别，区别在于传的timestamp不一样。
						emitRecord(value, partition, record.offset(), record);
					}
				}
			}
		}
		finally {
			//shutdown
			consumerThread.shutdown();
		}
		try {
			// 等待consumerThread运行结束
			consumerThread.join();
		}
		catch (InterruptedException e) {
			Thread.currentThread().interrupt();
		}
	}

	// Kafka010Fetcher
	protected void emitRecord(
			T record,
			KafkaTopicPartitionState<TopicPartition> partition,
			long offset,
			ConsumerRecord<?, ?> consumerRecord) throws Exception {
		emitRecordWithTimestamp(record, partition, offset, consumerRecord.timestamp());
	}

	//AbstractFetcher
	protected void emitRecordWithTimestamp(
			T record, KafkaTopicPartitionState<KPH> partitionState, long offset, long timestamp) throws Exception {

		if (record != null) {
			if (timestampWatermarkMode == NO_TIMESTAMPS_WATERMARKS) {
				synchronized (checkpointLock) {
					// 发往下游
					sourceContext.collectWithTimestamp(record, timestamp);
					// 更新partitionState中对应分区的offset
					partitionState.setOffset(offset);
				}
			} else if (timestampWatermarkMode == PERIODIC_WATERMARKS) {
				emitRecordWithTimestampAndPeriodicWatermark(record, partitionState, offset, timestamp);
			} else {
				emitRecordWithTimestampAndPunctuatedWatermark(record, partitionState, offset, timestamp);
			}
		} else {
			synchronized (checkpointLock) {
				partitionState.setOffset(offset);
			}
		}
	}

接下来看看consumerThread线程干了些啥？

1.4 KafkaConsumerThread

//KafkaConsumerThread
// 在consumer thread和task thread之间进行数据和异常交换
private final Handover handover;
// 下一次待提交的offsets
private final AtomicReference<Tuple2<Map<TopicPartition, OffsetAndMetadata>, KafkaCommitCallback>> nextOffsetsToCommit;
// kafka消费者配置
private final Properties kafkaProperties;
// 未分配的partition队列
private final ClosableBlockingQueue<KafkaTopicPartitionState<TopicPartition>> unassignedPartitionsQueue;
// bridge，定义了订阅分区assign方法，以及seekToBeginning和seekToEnd方法
private final KafkaConsumerCallBridge09 consumerCallBridge;
// poll超时时间，超过这个时间拉取不到数据将返回
private final long pollTimeout;
// kafka consumer
private volatile KafkaConsumer<byte[], byte[]> consumer;
// consumer锁，kafka consumer是线程不安全的
private final Object consumerReassignmentLock;
// 存在待分配的分区
private boolean hasAssignedPartitions;
// wakeup标志
private volatile boolean hasBufferedWakeup;
// 运行标志
private volatile boolean running;
// offset提交中的标志
private volatile boolean commitInProgress;
//？
private FlinkConnectorRateLimiter rateLimiter;
//metrics
private final boolean useMetrics;
private final MetricGroup subtaskMetricGroup;
private final MetricGroup consumerMetricGroup;

它的构造方法主要用于初始化部分属性，接下来我们看看run方法

(1) 初始化kafka consumer

(2) 设置kafka metric等信息

(3) 如果开启了checkpoint并且没有正在进行offset提交，则异步提交offset到kafka

(4) 从unassignedPartitionsQueue拉取待订阅的分区，订阅拉取到的分区并将初始位点重置到指定位置

(5) 调用consumer.poll拉取一批消息发送到handover

	public void run() {
		// 运行标志不为true，直接返回，running初始化为true，shutdown会将running置为false。
		if (!running) {
			return;
		}
		final Handover handover = this.handover;
		try {
			// 初始化kafka consumer
			this.consumer = getConsumer(kafkaProperties);
		}
		catch (Throwable t) {
			// 遇到异常汇报错误并返回
			handover.reportError(t);
			return;
		}
		try {
			if (useMetrics) {
				//metrics
			}
			// 再次检查running标志
			if (!running) {
				return;
			}
			ConsumerRecords<byte[], byte[]> records = null;
			List<KafkaTopicPartitionState<TopicPartition>> newPartitions;
			// 死循环，遇到异常或正常shutdown才退出
			while (running) {
				// 没有进行offset commit的时候进入
				if (!commitInProgress) {
					// 只有开启checkpoint的时候nextOffsetsToCommit才能get到值
					final Tuple2<Map<TopicPartition, OffsetAndMetadata>, KafkaCommitCallback> commitOffsetsAndCallback =
							nextOffsetsToCommit.getAndSet(null);
					// 开启checkpoint才会进入
					if (commitOffsetsAndCallback != null) {
						commitInProgress = true;
						// 异步提交offset
						consumer.commitAsync(commitOffsetsAndCallback.f0, new CommitCallback(commitOffsetsAndCallback.f1));
					}
				}
				try {
					// caseB 后面发现分区，比如新增了分区，不阻塞拉取分区
					if (hasAssignedPartitions) {
						newPartitions = unassignedPartitionsQueue.pollBatch();
					}
					// caseA 首次订阅，会获取所有分区，阻塞拉取分区
					else {
						newPartitions = unassignedPartitionsQueue.getBatchBlocking();
					}
					if (newPartitions != null) {
						// 分配并订阅分区
						reassignPartitions(newPartitions);
					}
				} catch (AbortedReassignmentException e) {
					continue;
				}

				if (!hasAssignedPartitions) {
					continue;
				}
				if (records == null) {
					try {
						// 拉取数据
						records = getRecordsFromKafka();
					}
					catch (WakeupException we) {
						continue;
					}
				}
				try {
					// 将records插入handover中
					handover.produce(records);
					records = null;
				}
				catch (Handover.WakeupException e) {
					// fall through the loop
				}
			}
			// end main fetch loop
		}
		catch (Throwable t) {
			handover.reportError(t);
		}
		finally {
			handover.close();
			if (rateLimiter != null) {
				rateLimiter.close();
			}
			try {
				consumer.close();
			}
			catch (Throwable t) {
				// log
			}
		}
	}

reassignPartitions的作用是在之前订阅的分区基础上再增加订阅newPartitions

	// KafkaConsumerThread
	void reassignPartitions(List<KafkaTopicPartitionState<TopicPartition>> newPartitions) throws Exception {
		// 如果newPartitions大小为0，直接返回
		if (newPartitions.size() == 0) {
			return;
		}
		// 设置hasAssignedPartitions为true，标记不是首次reassign
		hasAssignedPartitions = true;
		boolean reassignmentStarted = false;
		// 临时consumer
		final KafkaConsumer<byte[], byte[]> consumerTmp;
		synchronized (consumerReassignmentLock) {
			// 将consumer赋给consumerTmp，将consumer置为null，这里为什么要用tmp来交换呢？
			consumerTmp = this.consumer;
			this.consumer = null;
		}
		//获取已经订阅过的partition，一开始应该为空
		final Map<TopicPartition, Long> oldPartitionAssignmentsToPosition = new HashMap<>();
		try {
			for (TopicPartition oldPartition : consumerTmp.assignment()) {
				oldPartitionAssignmentsToPosition.put(oldPartition, consumerTmp.position(oldPartition));
			}

			final List<TopicPartition> newPartitionAssignments =
				new ArrayList<>(newPartitions.size() + oldPartitionAssignmentsToPosition.size());
			
			newPartitionAssignments.addAll(oldPartitionAssignmentsToPosition.keySet());
			// 添加新发现的partition，一开始应该是所有partition
			newPartitionAssignments.addAll(convertKafkaPartitions(newPartitions));
			// 订阅老的partition和新发现的partition
			consumerCallBridge.assignPartitions(consumerTmp, newPartitionAssignments);
			// 标记订阅已经开始
			reassignmentStarted = true;
			for (Map.Entry<TopicPartition, Long> oldPartitionToPosition : oldPartitionAssignmentsToPosition.entrySet()) {
				// 对于之前已经订阅过的partition，还是恢复到上次的offset
				consumerTmp.seek(oldPartitionToPosition.getKey(), oldPartitionToPosition.getValue());
			}
			//对于新的partition，根据待消费的offset来定位到起始消费位置
			for (KafkaTopicPartitionState<TopicPartition> newPartitionState : newPartitions) {
				if (newPartitionState.getOffset() == KafkaTopicPartitionStateSentinel.EARLIEST_OFFSET) {
					consumerCallBridge.seekPartitionToBeginning(consumerTmp, newPartitionState.getKafkaPartitionHandle());
					newPartitionState.setOffset(consumerTmp.position(newPartitionState.getKafkaPartitionHandle()) - 1);
				} else if (newPartitionState.getOffset() == KafkaTopicPartitionStateSentinel.LATEST_OFFSET) {
					consumerCallBridge.seekPartitionToEnd(consumerTmp, newPartitionState.getKafkaPartitionHandle());
					newPartitionState.setOffset(consumerTmp.position(newPartitionState.getKafkaPartitionHandle()) - 1);
				} else if (newPartitionState.getOffset() == KafkaTopicPartitionStateSentinel.GROUP_OFFSET) {
					newPartitionState.setOffset(consumerTmp.position(newPartitionState.getKafkaPartitionHandle()) - 1);
				} else {
					consumerTmp.seek(newPartitionState.getKafkaPartitionHandle(), newPartitionState.getOffset() + 1);
				}
			}
		} catch (WakeupException e) {
			// 遇到异常就回滚，还是消费之前老的分区并定位到上次的位置，新的分区等待下一次再订阅。
			synchronized (consumerReassignmentLock) {
				this.consumer = consumerTmp;
				if (reassignmentStarted) {
					consumerCallBridge.assignPartitions(
							this.consumer, new ArrayList<>(oldPartitionAssignmentsToPosition.keySet()));
					for (Map.Entry<TopicPartition, Long> oldPartitionToPosition : oldPartitionAssignmentsToPosition.entrySet()) {
						this.consumer.seek(oldPartitionToPosition.getKey(), oldPartitionToPosition.getValue());
					}
				}
				hasBufferedWakeup = false;
				for (KafkaTopicPartitionState<TopicPartition> newPartition : newPartitions) {
					unassignedPartitionsQueue.add(newPartition);
				}
				throw new AbortedReassignmentException();
			}
		}
		//将consumerTmp赋给consumer
		synchronized (consumerReassignmentLock) {
			this.consumer = consumerTmp;
			if (hasBufferedWakeup) {
				this.consumer.wakeup();
				hasBufferedWakeup = false;
			}
		}
	}

	// KafkaConsumerThread
	protected ConsumerRecords<byte[], byte[]> getRecordsFromKafka() {
		// 拉取一批数据
		ConsumerRecords<byte[], byte[]> records = consumer.poll(pollTimeout);
		// rateLimiter 是用来限流的，目前还未启用，rateLimiter为null
		if (rateLimiter != null) {
			int bytesRead = getRecordBatchSize(records);
			rateLimiter.acquire(bytesRead);
		}
		return records;
	}

	private int getRecordBatchSize(ConsumerRecords<byte[], byte[]> records) {
		int recordBatchSizeBytes = 0;
		for (ConsumerRecord<byte[], byte[]> record: records) {
			if (record.key() != null) {
				recordBatchSizeBytes += record.key().length;
			}
			recordBatchSizeBytes += record.value().length;

		}
		return recordBatchSizeBytes;
	}

上面多次用到Handover，比如从kafka拉取一批数据后，是直接发到Handover中，Kafka09Fetcher中拉取数据也是从Handover中拉取。KafkaConsumerThread线程中遇到异常也是通过向Handover汇报。下面就来分析下Handover。

1.5 Handover

Handover的作用是对consumer thread和task thread之间进行数据和异常交换

//Handover
// 对象锁
private final Object lock = new Object();
// 一批数据
private ConsumerRecords<byte[], byte[]> next;
// 异常
private Throwable error;
// wakeup标志
private boolean wakeupProducer;

核心的方法是produce和pollNext，分别用来生产数据和消费数据，中间通过next来保存数据，其中KafkaConsumerThread会调用produce，Kafka09Fetcher的runFetchLoop方法会调用pollNext，也就是task线程，这样Handover就成了两个线程之间的桥梁。

//Handover
	public void produce(final ConsumerRecords<byte[], byte[]> element)
			throws InterruptedException, WakeupException, ClosedException {
		//判空
		checkNotNull(element);
		synchronized (lock) {
			// 如果next为空并且没有wakeup，锁等待
			while (next != null && !wakeupProducer) {
				lock.wait();
			}
			wakeupProducer = false;
			if (next != null) {
				throw new WakeupException();
			}
			// next为null，将element赋给next 
			else if (error == null) {
				next = element;
				lock.notifyAll();
			}
			else {
				throw new ClosedException();
			}
		}
	}


	public ConsumerRecords<byte[], byte[]> pollNext() throws Exception {
		synchronized (lock) {
			while (next == null && error == null) {
				lock.wait();
			}
			ConsumerRecords<byte[], byte[]> n = next;
			if (n != null) {
				// 拉取到数据，将next置为null，并返回拉取到的数据
				next = null;
				lock.notifyAll();
				return n;
			}
			else {
				ExceptionUtils.rethrowException(error, error.getMessage());
				return ConsumerRecords.empty();
			}
		}
	}

1.6 总结

本章主要介绍了FlinkKafkaConsumerBase是如何从kafka拉取消息并发往下游的，其run方法是执行在Task线程中的，同时会启动两个子线程，分别是consumer thread和discovery thread，启动discovery thread需要通过设置flink.partition-discovery.interval-millis参数来开启，作用是周期检测是否有新的分区需要订阅。consumer thread的作用是从kafka拉取数据。线程之间的交互图如下所示：

2 FlinkKafkaProducer

FlinkKafkaProducer010相对FlinkKafkaConsumer010从实现上来说简单很多，主要方法是invoke，FlinkKafkaProducer011相对复杂一些，因为支持了事务提交，可以保证EXACTLY-ONCE语义。下面我们先来看看FlinkKafkaProducer010的继承关系：

//FlinkKafkaProducer010
//是否需要写入时间到kafka
private boolean writeTimestampToKafka = false;

	public void invoke(T value, Context context) throws Exception {
		//检查错误
		checkErroneous();
		byte[] serializedKey = schema.serializeKey(value);
		byte[] serializedValue = schema.serializeValue(value);
		String targetTopic = schema.getTargetTopic(value);
		if (targetTopic == null) {
			targetTopic = defaultTopicId;
		}
		Long timestamp = null;
		if (this.writeTimestampToKafka) {
			timestamp = context.timestamp();
		}

		ProducerRecord<byte[], byte[]> record;
		int[] partitions = topicPartitionsMap.get(targetTopic);
		if (null == partitions) {
			partitions = getPartitionsByTopic(targetTopic, producer);
			topicPartitionsMap.put(targetTopic, partitions);
		}
		// 构造record
		if (flinkKafkaPartitioner == null) {
			record = new ProducerRecord<>(targetTopic, null, timestamp, serializedKey, serializedValue);
		} else {
			record = new ProducerRecord<>(targetTopic, flinkKafkaPartitioner.partition(value, serializedKey, serializedValue, targetTopic, partitions), timestamp, serializedKey, serializedValue);
		}
		if (flushOnCheckpoint) {
			synchronized (pendingRecordsLock) {
				pendingRecords++;
			}
		}
		// 发送消息
		producer.send(record, callback);
	}

其中FlinkKafkaProducerBase的initializeState方法说明也没做，snapshotState实现也比较简单：

pendingRecords记录了正在发送的记录数，当成功发送一条后会减1

//FlinkKafkaProducerBase
	public void snapshotState(FunctionSnapshotContext ctx) throws Exception {
		//检查错误
		checkErroneous();
		if (flushOnCheckpoint) {
			flush();
			synchronized (pendingRecordsLock) {
				if (pendingRecords != 0) {
					//throw IllegalStateException
				}
				//检查错误
				checkErroneous();
			}
		}
	}

你可能感兴趣的:(Flink)

Flink：处理有界流数据的wordcount 小易学编程 flink 大数据
数据源：helloworldhelloflinkhelloscala有界流：packagechapter02importorg.apache.flink.streaming.api.scala._/***ClassName:BoundedStreamWordCount*Package:chapter02*Description:**@Author小易日拱一卒*@Create2025-06-272:
10.jobManager初始化流程
JobManager初始化流程1.找到入口类StandaloneSessionClusterEntrypoint该类位于Flink源码的以下路径中：flink-runtime/src/main/java/org/apache/flink/runtime/entrypoint/StandaloneSessionClusterEntrypoint.java2.查看main方法/**Entrypoint
绝佳组合 SpringBoot + Lua + Redis = 王炸！
Java精选面试题（微信小程序）：5000+道面试题和选择题，真实面经，简历模版，包含Java基础、并发、JVM、线程、MQ系列、Redis、Spring系列、Elasticsearch、Docker、K8s、Flink、Spark、架构设计、大厂真题等，在线随时刷题！前言曾经有一位魔术师，他擅长将SpringBoot和Redis这两个强大的工具结合成一种令人惊叹的组合。他的魔法武器是Redis的
聊聊flink的RpcService go4it
序本文主要研究一下flink的RpcServiceRpcServiceflink-release-1.7.2/flink-runtime/src/main/java/org/apache/flink/runtime/rpc/RpcService.javapublicinterfaceRpcService{StringgetAddress();intgetPort();CompletableFutu
ARTS-第七周梧上擎天
Algorithm一、用链表和二叉树实现Set集合GitHub地址二、散列表散列表就是使用数组下标随机访问时候复杂度为O（1）的特性，当我们按照键值查找元素时，通过散列函数将key转化为下标然后进行访问，当有大量散列冲突时会退化为O（n）的时间复杂度。解决散列冲突的方法：开放寻址法和链表法ReviewFlink动态表概念原文地址流和表为什么可以相互转换呢？我们都知道传统Mysql的主从复制是通过b
如何解决一个flink on yarn集群上已经跑了一个job，再提交第二个job的时候，task报java heap size oom的问题 fzip Flink flink java 大数据
在FlinkonYARN集群中提交第二个Job时出现Task的JavaHeapSizeOOM（内存溢出），核心原因是集群资源不足（第一个Job已占用大量资源，第二个Job分配的内存不够）或Job资源配置不合理（单个Job申请资源过多，或内存参数设置与实际需求不匹配）。解决需从“资源排查”“Job配置优化”“集群资源扩容”三个维度入手，具体步骤如下：一、先排查核心原因：确认资源占用与配置是否匹配1.
flink sql读hive catalog数据，将string类型的时间戳数据排序后写入kafka，如何保障写入kafka的数据是有序的 fzip Flink flink sql hive
在FlinkSQL中，要确保从Hive读取的STRING类型时间戳数据排序后有序写入Kafka，需要结合批处理模式、时间类型转换、单分区写入和Kafka生产者配置。以下是完整解决方案：一、核心解决方案1.批处理模式+全局排序将作业设置为批处理模式，并对字符串时间戳进行类型转换后排序：--设置为批处理模式（关键！）SET'execution.runtime-mode'='batch';--从Hive
flink-sql读写hive-1.13 第一片心意 flink flink sql hive
1.版本说明本文档内容基于flink-1.13.x，其他版本的整理，请查看本人博客的flink专栏其他文章。1.1.概述ApacheHive已经成为了数据仓库生态系统中的核心。它不仅仅是一个用于大数据分析和ETL场景的SQL引擎，同样也是一个数据管理平台，可用于发现，定义，和演化数据。Flink与Hive的集成包含两个层面。一是利用了Hive的MetaStore作为持久化的Catalog，用户可通
flink sql如何对hive string类型的时间戳进行排序
在FlinkSQL中对Hive表的STRING类型时间戳进行排序，需要先将字符串转换为时间类型，再基于时间类型排序。以下是具体方法和示例：一、核心解决方案1.字符串转TIMESTAMP后排序若Hive中的时间戳格式为'yyyy-MM-ddHH:mm:ss'（如'2024-01-0112:00:00'），可直接转为TIMESTAMP排序：SELECT*FROMhive_tableORDERBYTO_
基于Socket来构建无界数据流并通过Flink框架进行处理每天五分钟玩转人工智能 Flink技术实战 flink 大数据 Flink 分布式无界数据
本文重点随着大数据技术的不断发展，实时数据流处理已成为企业应对海量数据、实现快速决策的关键技术。ApacheFlink是一个开源的流处理框架，它能够对无界数据流进行高效的、精确的处理。本文将介绍如何通过Socket构建无界数据流，并利用Flink框架进行无界流处理。基于Socket构建无界数据无界数据指的是源源不断产生的数据，这些数据通常来自各种实时数据源，如用户行为日志、传感器数据等。Socke
Flink cdc同步增量数据timestamp字段相差八小时（分析｜解决）不是粘贴复制的！ BUG FIXER 大数据 flink android 大数据
问题我使用flinkcdc同步mysql到mysql遇到了timestamp字段缺少八小时的问题。很少无语，flink,cdc,debezium时区都设置了，没有任何效果！分析问题出现在mysqlbinlog身上！！！因为默认mysql会使用UTC来存储binlog,你可以使用下方的sql验证：mysqlbinlog--base64-output=DECODE-ROWS-v--start-date
如何解决Flink CDC同步时间类型字段8小时时间差的问题，以MySQL为例智海观潮 Flink flink flink cdc 大数据实时数据同步
在使用FlinkCDC进行数据同步时，默认情况下经常会遇到时间类型的字段与实际值相差8个小时的问题。本文以MySQL为例提供解决方案，其他数据源也可以参考这类实现。原文链接：https://mp.weixin.qq.com/s/_f41ES8UquM-kj3Ie8JU_g1.设置server时区比如MySQL服务的时区为UTC时间，可以参考以下code设置时区。MySqlSourcemySqlSo
Paimon对比基于消息队列（如Kafka）的传统实时数仓方案的优势 lifallen Paimon 大数据数据库数据结构 java 分布式 apache 数据仓库
弊端：数据重复->优势：Paimon主键表原生去重原方案弊端(Kafka)问题:消息队列（Kafka）是仅支持追加（Append-Only）的日志流。当Flink作业发生故障恢复（Failover）或业务逻辑迭代重跑数据时，同样的数据会被再次写入消息队列，形成重复数据。影响:下游应用（如DWS层、ADS层或直接对接的BI报表）必须自己实现复杂的去重逻辑，这不仅消耗大量计算资源（“资源消耗至少增加一
Flink 流处理的核心基石【时间语义、水位线、状态、检查点、反压】 csdn_tom_168 大数据 flink 核心时间语义水位线状态检查点反压
Flink流处理的核心基石【时间语义、水位线、状态、检查点、反压】，这些概念相互协作，构建了Flink高吞吐、低延迟、高容错的实时计算能力。以下是这些核心技术的深度解析及其内在联系：一、五大基石的内在联系驱动触发计算持久化保护恢复时间语义水位线状态管理检查点反压二、核心组件深度解析1.时间语义（TimeSemantics）核心作用：定义事件的时间维度//设置事件时间语义（关键配置）env.setS
用Flink实现的一个实时订单对账功能, Flink的双流实时对账
1.为什么业务订单数据不用Mysql之类的强事务性数据库监控反而用Flink的实时?一般这种涉及到订单的数据流都要用mysql监控实现,但是鉴于减少mysql的数据库压力和提高更实时性,可以考虑用Flink实时的数据流做实时的参考2.如何处理乱序数据?使用watermark水位保证第一层数据延迟.PS:这里的水位不能设置太长延迟使用processfuntion更加灵活的处理迟到数据,设置一个定时器
Flink 多流转换（三）CoProcessFunction合流操作案例 Alienware^ #Flink Flink
文章目录下面是CoProcessFunction的一个具体示例：我们可以实现一个实时对账的需求，也就是app的支付操作和第三方的支付操作的一个双流Join。App的支付事件和第三方的支付事件将会互相等待5秒钟，如果等不来对应的支付事件，那么就输出报警信息。程序如下：Gitee源代码如下publicclassBillCheckExample{publicstaticvoidmain(String[]
Flink双流处理：实时对账实现1
Flink双流处理：实时对账实现1去发现同类优质开源项目:https://gitcode.com/资源描述本资源文件详细介绍了Flink双流处理的实时对账实现。内容涵盖了基础概念、双流处理的方法以及实战案例，帮助开发者深入理解Flink在实时对账场景中的应用。内容概述基础概念介绍了Flink的基本概念和架构，为后续的双流处理打下基础。双流处理方法详细讲解了Flink中双流处理的核心方法和技巧，帮助
Flink双流实时对账
在电商、金融、银行、支付等涉及到金钱相关的领域，为了安全起见，一般都有对账的需求。比如，对于订单支付事件，用户通过某宝付款，虽然用户支付成功，但是用户支付完成后并不算成功，我们得确认平台账户上是否到账了。针对上述的场景，我们可以采用批处理，或离线计算等技术手段，通过定时任务，每天结束后，扫描数据库中的数据，核对当天的支付数据和交易数据，进行对账。想要达到实时对账的效果，比如有的用户支付成功但是并没
[特殊字符] 实时数据洪流突围战：Flink+Paimon实现毫秒级分析的架构革命（附压测报告）——日均百亿级数据处理成本降低60%的工业级方案 Lucas55555555 flink 大数据
引言：流批一体的时代拐点据阿里云2025白皮书显示，实时数据处理需求年增速达240%，但传统Lambda架构资源消耗占比超运维成本的70%。某电商平台借助Flink+Paimon重构实时数仓后，端到端延迟从分钟级压缩至800ms，计算资源节省5.6万核/月。技术红利窗口期：2025年ApachePaimon1.0正式发布，支持秒级快照与湖仓一体，成为替代Iceberg的新范式一、痛点深挖：实时数仓
Flink 2.0 DataStream算子全景 Edingbrugh.南空大数据 flink flink 人工智能
在实时流处理中，ApacheFlink的DataStreamAPI算子是构建流处理pipeline的基础单元。本文基于Flink2.0，聚焦算子的核心概念、分类及高级特性。一、算子核心概念：流处理的"原子操作1.数据流拓扑（StreamTopology）每个Flink应用可抽象为有向无环图（DAG），由源节点（Source）、算子节点（Operator）和汇节点（Sink）构成，算子通过数据流（S
FlinkSQL 自定义函数详解 Tit先生基础 flink sql 大数据 java
FlinkSQL函数详解自定义函数除了内置函数之外，FlinkSQL还支持自定义函数，我们可以通过自定义函数来扩展函数的使用FlinkSQL当中自定义函数主要分为四大类:1.ScalarFunction:标量函数特点:每次只接收一行的数据，输出结果也是1行1列典型的标量函数如:upper(str),lower(str),abs(salary)2.TableFunction:表生成函数特点:运行时每
Flink自定义函数之聚合函数（UDAGG函数）土豆马铃薯 Flink flink 大数据
1.聚合函数概念聚合函数：将一个表的一个或多个行并且具有一个或多个属性聚合为标量值。聚合函数理解：假设一个关于饮料的表。表里面有三个字段，分别是id、name、price，表里有5行数据。假设你需要找到所有饮料里最贵的饮料的价格，即执行一个max()聚合。你需要遍历所有5行数据，而结果就只有一个数值。2.聚合函数实现聚合函数主要通过扩展AggregateFunction类实现。AggregateF
Flink时间窗口详解 bxlj_jcj Flink flink 大数据
一、引言在大数据流处理的领域中，Flink的时间窗口是一项极为关键的技术，想象一下，你要统计一个电商网站每小时的订单数量。由于订单数据是持续不断产生的，这就形成了一个无界数据流。如果没有时间窗口的概念，你就需要处理无穷无尽的数据，难以进行有效的统计分析。而时间窗口的作用，就是将这无界的数据流按照时间维度切割成一个个有限的“数据块”，方便我们对这些数据进行处理和分析。比如，我们可以定义一个1小时的时
Flink DataStream API详解（一） bxlj_jcj Flink flink 大数据
一、引言Flink的DataStreamAPI，在流处理领域大显身手的核心武器。在很多实时数据处理场景中，如电商平台实时分析用户购物行为以实现精准推荐，金融领域实时监控交易数据以防范风险，DataStreamAPI都发挥着关键作用，能够对源源不断的数据流进行高效处理和分析。接下来，就让我们一起深入探索FlinkDataStreamAPI。二、DataStream编程基础搭建在开始使用FlinkDa
flink自定义函数逆风飞翔的小叔 flink 入门到精通 flink 大数据 big data
前言在很多情况下，尽管flink提供了丰富的转换算子API可供开发者对数据进行各自处理，比如map()，filter()等，但在实际使用的时候仍然不能满足所有的场景，这时候，就需要开发人员基于常用的转换算子的基础上，做一些自定义函数的处理1、来看一个常用的操作原始待读取的文件核心代码importorg.apache.flink.api.common.functions.FilterFunction
Flink自定义函数的常用方式飞Link Water flink java 大数据
一、实现Flink提供的接口//自定义函数classMyMapFunctionimplementsMapFunction{publicIntegermap(Stringvalue){returnInteger.parseInt(value
Flink DataStream API详解（二）
一、引言咱两书接上回，上一篇文章主要介绍了DataStreamAPI一些基本的使用，主要是针对单数据流的场景下，但是在实际的流处理场景中，常常需要对多个数据流进行合并、拆分等操作，以满足复杂的业务需求。Flink的DataStreamAPI提供了一系列强大的多流转换算子，如union、connect和split等，下面我们来详细了解一下它们的功能和用法。二、多流转换2.1union算子union算
【Kafka】Failed to send data to Kafka: Expiring 30 record(s) for xxx 732453 ms has passed since last 九师兄 kafka big data zookeeper
文章目录1.美图2.背景2.尝试方案13.尝试解决24.场景再现25.场景46.场景57.场景78.场景8M.拓展本文为博主九师兄（QQ:541711153欢迎来探讨技术）原创文章，未经允许博主不允许转载。1.美图问题与【Flink】Flink写入kafka报错FailedtosenddatatoKafka:Expiring4record(s)for20001mshaspassed重复了。2.背景
【Flink】flink Kafka报错 : Failed to send data to Kafka: This server is not the leader for that topic-pa 九师兄 flink kafka 大数据
1.背景出现这个问题的背景请参考：【Kafka】FailedtosenddatatoKafka:Expiring30record(s)forxxx732453mshaspassedsincelast[2020-09-0513:16:09
安全运维的 “五层防护”：构建全方位安全体系 KKKlucifer 安全运维
在数字化运维场景中，异构系统复杂、攻击手段隐蔽等挑战日益突出。保旺达基于“全域纳管-身份认证-行为监测-自动响应-审计溯源”的五层防护架构，融合AI、零信任等技术，构建全链路安全运维体系，以下从技术逻辑与实践落地展开解析：第一层：全域资产纳管——筑牢安全根基挑战云网基础设施包含分布式计算（Hadoop/Spark）、数据流处理（Storm/Flink）等异构组件，通信协议繁杂，传统方案难以全面纳管
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str