大嘴吧Lucy

技术分享：Flink源码分析-Task执行

本文作者：擎创科技研发总监a coder

在介绍JobMaster之前，先插播一篇分析从Task被提交到TaskExecutor后到运行的过程。所有的分布式计算引擎都有一个序列化任务然后提交给各Worker节点去执行的过程，我们在开始开发Flink作业或者Spark作业时，也经常会遇到一些序列化相关的异常，所有这些都牵扯到几个问题：

Flink如何来描述我们开发的数据处理逻辑(绝大部分是user Function)。
Flink如何来序列化以及反序列化我们开发的数据处理逻辑。
Flink最终如何执行我们开发的数据处理逻辑。

这几个问题包括了任务提交客户端、JobMaster 以及 TaskExecutor三个环节，牵扯到了StreamGraph，JobGraph，ExecutionGraph 以及 Task等概念。我准备采取倒序的方式，从后向前一段段进行分析，今天我们先分析Task被提交到Task Executor之后这一段，首先我们来看看Task提交的入口，从方法签名以及实现来看反序列化后的TaskInformation应该就包含了任务执行所需要的信息。

submitTask

public CompletableFuture submitTask(
			TaskDeploymentDescriptor tdd,
			JobMasterId jobMasterId,
			Time timeout) {

                        //...
			// deserialize the pre-serialized information
			final JobInformation jobInformation;
			final TaskInformation taskInformation;
			try {
				jobInformation = tdd.getSerializedJobInformation().deserializeValue(getClass().getClassLoader());
                                //反序列化拿到Task的信息
				taskInformation = tdd.getSerializedTaskInformation().deserializeValue(getClass().getClassLoader());
			} catch {}
			...

			Task task = new Task(
				jobInformation,
				taskInformation//,
                                //...
				);

			log.info("Received task {}.", task.getTaskInfo().getTaskNameWithSubtasks());

			boolean taskAdded;

			try {
				taskAdded = taskSlotTable.addTask(task);
			} catch (SlotNotFoundException | SlotNotActiveException e) {
				throw new TaskSubmissionException("Could not submit task.", e);
			}

			if (taskAdded) {
                                //启动Task
				task.startTaskThread();
				taskCompletionTracker.trackTaskCompletion(task);

				//...
                        }
    }

TaskInformation

public class TaskInformation implements Serializable {

	private static final long serialVersionUID = -9006218793155953789L;

	/** Job vertex id of the associated job vertex */
	private final JobVertexID jobVertexId;

	/** Name of the task */
	private final String taskName;

	/** The number of subtasks for this operator */
	private final int numberOfSubtasks;

	/** The maximum parallelism == number of key groups */
	private final int maxNumberOfSubtaks;

	/** Class name of the invokable to run */
	private final String invokableClassName;

	/** Configuration for the task */
	private final Configuration taskConfiguration;
}

这个类的结构比较简单，关键的成员有如下两个：

invokableClassName，顾名思义以及根据注释这应该是后面需要构造以及执行的类的名称。
taskConfiguration，其内部包含了一个Map结构来存储具体的序列化后的配置信息。

我通过代码调试，截取了一些这个结构实例化后的值作为参考：

invokableClassName 为 SourceStreamTask
taskConfiguration中有两个键值比较关键：serializedUDF 以及 chainedTaskConfig_。具体的用户后面会分析。

Task

我们先来看一下SourceStreamTask，从之前的代码注释(invokableClassName)来看，这个类会作为这个Task的创建以及调用入口，首先看看这个类的继承关系：

为了阅读方便，我去掉了范型以及接口的关系，上面的结构很清楚，下面大致介绍一下几个类的作用

AbstractInvokable，下面是该类的介绍，意思很明确：所有TaskManager能执行的任务都是继承自它。

This is the abstract base class for every task that can be executed by a TaskManager.
Concrete tasks extend this class, for example the streaming and batch tasks.

StreamTask，意思也很明确，所有的流处理任务都继承自它，每一个任务包含一个或多个算子，多个算子可以合成一条Chain，在一个线程内执行。

Base class for all streaming tasks. A task is the unit of local processing that is deployed
and executed by the TaskManagers. Each task runs one or more StreamOperators which form the Task's operator chain. Operators that are chained together execute synchronously in the same thread and hence on the same stream partition. A common case for these chains are successive map/flatmap/filter tasks.

SourceStreamTask，故名思议代表一个流数据源的任务，它里面包含一个实际产生数据的SourceSource(包含了用户实现的SourceFunction)。

StreamTask for executing a StreamSource.

OneInputStreamTask，有一个输入的流处理任务。

A StreamTask for executing a OneInputStreamOperator

其他的几个子类，大家可以自行去阅读，基本上每一个子类对应一类任务，包含了某一类算子。

Operator

上面的Task介绍里面，都提到了Operator，网上找到的Flink原理介绍文章里面，也可以常常看见"算子"。我们在开发Flink作业时，最常见的就是去实现一些Function，比如：SourceFunction，RichFlatMapFunction，MapFunction等等，这些Function被用来构造Operator，下面是StreamFlatMap算子的定义，从代码可以看到我们编写的FlatMapFunction作为构造参数来进行实例化StreamFlatMap算子。

//DataStream
public  SingleOutputStreamOperator flatMap(FlatMapFunction flatMapper) {

		TypeInformation outType = TypeExtractor.getFlatMapReturnTypes(clean(flatMapper),
				getType(), Utils.getCallLocationName(), true);

		return transform("Flat Map", outType, new StreamFlatMap<>(clean(flatMapper)));

}

public class StreamFlatMap
		extends AbstractUdfStreamOperator>
		implements OneInputStreamOperator {

	private static final long serialVersionUID = 1L;

	private transient TimestampedCollector collector;

	public StreamFlatMap(FlatMapFunction flatMapper) {
		super(flatMapper);
		chainingStrategy = ChainingStrategy.ALWAYS;
	}

	@Override
	public void open() throws Exception {
		super.open();
		collector = new TimestampedCollector<>(output);
	}

	@Override
	public void processElement(StreamRecord element) throws Exception {
		collector.setTimestamp(element);
		userFunction.flatMap(element.getValue(), collector);
	}
}

那么这些Operator(算子) 是如何被嵌入到Task中间去执行的呢？我们以StreamTask为例来一探究竟。

StreamTask

实例化

先来看一下StreamTask的实例化过程。回顾一下前面的TaskInformation里面，我们已经拿到了invokableClassName 以及 taskConfig，实例化代码如下，可以看到在初始化时，只是利用反射的方法找到构造函数，然后进行实例化，没有做额外的其他逻辑。

private static AbstractInvokable loadAndInstantiateInvokable(
		ClassLoader classLoader,
		String className,
		Environment environment) throws Throwable {

		final Class invokableClass;
		try {
                //根据className获取到其对应的类
			invokableClass = Class.forName(className, true, classLoader)
				.asSubclass(AbstractInvokable.class);
		} catch (Throwable t) {
			throw new Exception("Could not load the task's invokable class.", t);
		}

		Constructor statelessCtor;

		try {
                 //找到其有Environment参数的构造函数
			statelessCtor = invokableClass.getConstructor(Environment.class);
		} catch (NoSuchMethodException ee) {
			throw new FlinkException("Task misses proper constructor", ee);
		}

		// instantiate the class
		try {
			//noinspection ConstantConditions  --> cannot happen
                        //实例化Task
			return statelessCtor.newInstance(environment);
		} catch (InvocationTargetException e) {
			// directly forward exceptions from the eager initialization
			throw e.getTargetException();
		} catch (Exception e) {
			throw new FlinkException("Could not instantiate the task's invokable class.", e);
		}
	}

invoke

所有Task调用开始执行的入口为invoke方法，以下为invoke方法的执行步骤介绍

invoke()
* +----> Create basic utils (config, etc) and load the chain of operators
* +----> operators.setup()
* +----> task specific init()
* +----> initialize-operator-states()
* +----> open-operators()
* +----> run()
* +----> close-operators()
* +----> dispose-operators()
* +----> common cleanup
* +----> task specific cleanup()

本文会详细介绍粗体的两个步骤(OperatorChain的构建以及 Run)，其他的步骤主要是一些任务、算子、状态的初始化以及回收，不影响执行的主体步骤，这里不再做分析。通过看invoke的代码，可以发现OperatorChain的构造在beforeInvoke方法中，而run的具体方法为runMailboxLoop。

@Override
public final void invoke() throws Exception {
        try {
            beforeInvoke();

            // final check to exit early before starting to run
            if (canceled) {
                throw new CancelTaskException();
            }

            // let the task do its work
            runMailboxLoop();

            // if this left the run() method cleanly despite the fact that this was canceled,
            // make sure the "clean shutdown" is not attempted
            if (canceled) {
                throw new CancelTaskException();
            }

            afterInvoke();
        } catch (Throwable invokeException) {
            failing = !canceled;
            try {
                cleanUpInvoke();
            }
            // TODO: investigate why Throwable instead of Exception is used here.
            catch (Throwable cleanUpException) {
                Throwable throwable =
                        ExceptionUtils.firstOrSuppressed(cleanUpException, invokeException);
                ExceptionUtils.rethrowException(throwable);
            }
            ExceptionUtils.rethrowException(invokeException);
        }
        cleanUpInvoke();
    }

protected void beforeInvoke() throws Exception {
        disposedOperators = false;
        LOG.debug("Initializing {}.", getName());

        operatorChain = new OperatorChain<>(this, recordWriter);
        mainOperator = operatorChain.getMainOperator();

        // task specific initialization
        init();

        // save the work of reloading state, etc, if the task is already canceled
        if (canceled) {
            throw new CancelTaskException();
        }

        // -------- Invoke --------

    }

还是老规矩，我们以结果为导向，先分析runMailboxLoop，经过分析runMailboxLoop方法以及mailboxProcessor的构造，可以得出runMailboxLoop方法最终调用了processInput方法，具体的代码推导片段如下

public void runMailboxLoop() throws Exception {
        mailboxProcessor.runMailboxLoop();
}

//mailboxProcesser的构造
this.mailboxProcessor = new MailboxProcessor(this::processInput, mailbox, actionExecutor);

//mailboxProcessor的runMailboxLoop方法实现
    /** Runs the mailbox processing loop. This is where the main work is done. */
    public void runMailboxLoop() throws Exception {
    ...
        final MailboxController defaultActionContext = new MailboxController(this);

        while (isMailboxLoopRunning()) {
            // The blocking `processMail` call will not return until default action is available.
            processMail(localMailbox, false);
            if (isMailboxLoopRunning()) {
                //开始执行
                mailboxDefaultAction.runDefaultAction(
                        defaultActionContext); // lock is acquired inside default action as needed
            }
        }
    }

protected void processInput(MailboxDefaultAction.Controller controller) throws Exception {
        //执行入口
        InputStatus status = inputProcessor.processInput();
        if (status == InputStatus.MORE_AVAILABLE && recordWriter.isAvailable()) {
            return;
        }
        if (status == InputStatus.END_OF_INPUT) {
            controller.allActionsCompleted();
            return;
        }
    }

终于来到了真正的入口InputProcessor，StreamTask里面并没有去实例化这个对象，我们以OneInputStreamTask为例进行分析，inputProcessor的实例化在init方法中，inputProcessor的processInput方法经过几次中转，最终调用到了mainOperator.processElement方法，具体代码如下：

public void init() throws Exception {
        StreamConfig configuration = getConfiguration();
        int numberOfInputs = configuration.getNumberOfNetworkInputs();

        if (numberOfInputs > 0) {
            DataOutput output = createDataOutput(numRecordsIn);
            StreamTaskInput input = createTaskInput(inputGate);
            //构造Processor需要input, output 以及 operatorChain
            inputProcessor = new StreamOneInputProcessor<>(input, output, operatorChain);
        }
    }

    private DataOutput createDataOutput(Counter numRecordsIn) {
        return new StreamTaskNetworkOutput<>(
                mainOperator, getStreamStatusMaintainer(), inputWatermarkGauge, numRecordsIn);
    }

    private StreamTaskInput createTaskInput(CheckpointedInputGate inputGate) {
        int numberOfInputChannels = inputGate.getNumberOfInputChannels();
        StatusWatermarkValve statusWatermarkValve = new StatusWatermarkValve(numberOfInputChannels);
        TypeSerializer inSerializer =
                configuration.getTypeSerializerIn1(getUserCodeClassLoader());
        return new StreamTaskNetworkInput<>(
                inputGate, inSerializer, getEnvironment().getIOManager(), statusWatermarkValve, 0);
    }

public final class StreamOneInputProcessor implements StreamInputProcessor {
    private final StreamTaskInput input;
    private final DataOutput output;

    private final BoundedMultiInput endOfInputAware;

    public StreamOneInputProcessor(
            StreamTaskInput input, DataOutput output, BoundedMultiInput endOfInputAware) {

        this.input = checkNotNull(input);
        this.output = checkNotNull(output);
        this.endOfInputAware = checkNotNull(endOfInputAware);
    }

    @Override
    public InputStatus processInput() throws Exception {
        InputStatus status = input.emitNext(output);
        ...
    }
}

public final class StreamTaskNetworkInput implements StreamTaskInput {
    @Override
    public InputStatus emitNext(DataOutput output) throws Exception {
        while (true) {
            // get the stream element from the deserializer
            if (currentRecordDeserializer != null) {
                DeserializationResult result;
                try {
                    result = currentRecordDeserializer.getNextRecord(deserializationDelegate);
                } catch (IOException e) {
                    throw new IOException(
                            String.format("Can't get next record for channel %s", lastChannel), e);
                }
                if (result.isBufferConsumed()) {
                    currentRecordDeserializer.getCurrentBuffer().recycleBuffer();
                    currentRecordDeserializer = null;
                }

                if (result.isFullRecord()) {
                    processElement(deserializationDelegate.getInstance(), output);
                    return InputStatus.MORE_AVAILABLE;
                }
            }

            Optional bufferOrEvent = checkpointedInputGate.pollNext();
            if (bufferOrEvent.isPresent()) {
                // return to the mailbox after receiving a checkpoint barrier to avoid processing of
                // data after the barrier before checkpoint is performed for unaligned checkpoint
                // mode
                if (bufferOrEvent.get().isBuffer()) {
                    processBuffer(bufferOrEvent.get());
                } else {
                    processEvent(bufferOrEvent.get());
                    return InputStatus.MORE_AVAILABLE;
                }
            } else {
                if (checkpointedInputGate.isFinished()) {
                    checkState(
                            checkpointedInputGate.getAvailableFuture().isDone(),
                            "Finished BarrierHandler should be available");
                    return InputStatus.END_OF_INPUT;
                }
                return InputStatus.NOTHING_AVAILABLE;
            }
        }
    }

    private void processElement(StreamElement recordOrMark, DataOutput output) throws Exception {
        if (recordOrMark.isRecord()) {
            output.emitRecord(recordOrMark.asRecord());
        } else if (recordOrMark.isWatermark()) {
            statusWatermarkValve.inputWatermark(
                    recordOrMark.asWatermark(), flattenedChannelIndices.get(lastChannel), output);
        } else if (recordOrMark.isLatencyMarker()) {
            output.emitLatencyMarker(recordOrMark.asLatencyMarker());
        } else if (recordOrMark.isStreamStatus()) {
            statusWatermarkValve.inputStreamStatus(
                    recordOrMark.asStreamStatus(),
                    flattenedChannelIndices.get(lastChannel),
                    output);
        } else {
            throw new UnsupportedOperationException("Unknown type of StreamElement");
        }
    }

    private void processEvent(BufferOrEvent bufferOrEvent) {
        // Event received
        final AbstractEvent event = bufferOrEvent.getEvent();
        // TODO: with checkpointedInputGate.isFinished() we might not need to support any events on
        // this level.
        if (event.getClass() == EndOfPartitionEvent.class) {
            // release the record deserializer immediately,
            // which is very valuable in case of bounded stream
            releaseDeserializer(bufferOrEvent.getChannelInfo());
        }
    }

    private void processBuffer(BufferOrEvent bufferOrEvent) throws IOException {
        lastChannel = bufferOrEvent.getChannelInfo();
        checkState(lastChannel != null);
        currentRecordDeserializer = recordDeserializers.get(lastChannel);
        checkState(
                currentRecordDeserializer != null,
                "currentRecordDeserializer has already been released");

        currentRecordDeserializer.setNextBuffer(bufferOrEvent.getBuffer());
    }

   private static class StreamTaskNetworkOutput extends AbstractDataOutput {

        private final OneInputStreamOperator operator;
        private StreamTaskNetworkOutput(
                OneInputStreamOperator operator,
                StreamStatusMaintainer streamStatusMaintainer,
                WatermarkGauge watermarkGauge,
                Counter numRecordsIn) {
            super(streamStatusMaintainer);

            this.operator = checkNotNull(operator);
            this.watermarkGauge = checkNotNull(watermarkGauge);
            this.numRecordsIn = checkNotNull(numRecordsIn);
        }

        @Override
        public void emitRecord(StreamRecord record) throws Exception {
            numRecordsIn.inc();
            operator.setKeyContextElement1(record);
            //这里开始调用operator
            operator.processElement(record);
        }
    }

接下来的问题就是要搞清楚mainOperator的来历，发现mainOperator和OperatorChain都是在beforeInvoke方法中构造的，代码片段如下，而且mainOperator也是来自OperatorChain，看来所有的谜底都需要去OperatorChain去寻找了。

protected void beforeInvoke() throws Exception {
    disposedOperators = false;
    LOG.debug("Initializing {}.", getName());

    operatorChain = new OperatorChain<>(this, recordWriter);
    mainOperator = operatorChain.getMainOperator();
...
}

OperatorChain

几乎所有的逻辑都在OperatorChain的构造函数里面，包括算子的构造以及算子之间Chain关系的构建，算子关联关系的构建是通过递归去创建的，单纯看代码比较绕，大致的过程如下：

大致的过程就是，遍历需要Chain在一起的所有Operator，针对每一个判断其是否有输出到下一个Operator的边，如果有则去递归创建Operator，最终递归退出后，得到了一个可以递归指向所有Operator的Output，最后再拿这个Output去创建MainOperator 或者老版本里面的HeadOperator，得到了大致如下的一个Chain，每个算子在执行完毕后，调用Output去collect，而Output的collect方法里面会去push给它的下一个Operator

Output有几种实现，最常用的有CopyingChainingOutput，下面是其实现，可以看到每次在push给下一个Operator时，会先用序列化器执行一次深copy，数据量大的情况下应该会有性能的损耗，可以通过env.getConfig().enableObjectReuse()避免深copy。

final class CopyingChainingOutput extends ChainingOutput {

    @Override
    public void collect(StreamRecord record) {
        if (this.outputTag != null) {
            // we are not responsible for emitting to the main output.
            return;
        }

        pushToOperator(record);
    }

    @Override
    public  void collect(OutputTag outputTag, StreamRecord record) {
        if (this.outputTag == null || !this.outputTag.equals(outputTag)) {
            // we are not responsible for emitting to the side-output specified by this
            // OutputTag.
            return;
        }

        pushToOperator(record);
    }

    @Override
    protected  void pushToOperator(StreamRecord record) {
        try {
            // we know that the given outputTag matches our OutputTag so the record
            // must be of the type that our operator (and Serializer) expects.
            @SuppressWarnings("unchecked")
            StreamRecord castRecord = (StreamRecord) record;

            numRecordsIn.inc();
            StreamRecord copy = castRecord.copy(serializer.copy(castRecord.getValue()));
            input.setKeyContextElement(copy);
            input.processElement(copy);
        } catch (ClassCastException e) {
            if (outputTag != null) {
                // Enrich error message
                ClassCastException replace =
                        new ClassCastException(
                                String.format(
                                        "%s. Failed to push OutputTag with id '%s' to operator. "
                                                + "This can occur when multiple OutputTags with different types "
                                                + "but identical names are being used.",
                                        e.getMessage(), outputTag.getId()));

                throw new ExceptionInChainedOperatorException(replace);
            } else {
                throw new ExceptionInChainedOperatorException(e);
            }
        } catch (Exception e) {
            throw new ExceptionInChainedOperatorException(e);
        }
    }
}

最后还有一个问题，就是算子里面真正的数据处理逻辑(我们自己写的那些Function的类)，是在什么时候构建的？

还记得我们上面的taskConfig里面有一个键值为"serializedUDF"的配置项吗？经过观察，Flink只是简单把我们写的那些Function类以及相关的Operator简单粗暴的序列化为Byte数组，然后塞到这个键里面，最后在TaskExecutor侧构建OperatorChain时，进行直接的反序列化。所以如果我们自己的开发的Function类里面，有不可序列化的变量，则会报异常：

StreamOperatorFactory operatorFactory =
                configuration.getStreamOperatorFactory(userCodeClassloader);

public > T getStreamOperatorFactory(ClassLoader cl) {
        try {
            return InstantiationUtil.readObjectFromConfig(this.config, SERIALIZEDUDF, cl);
        }
}
    
public static  T readObjectFromConfig(Configuration config, String key, ClassLoader cl)
            throws IOException, ClassNotFoundException {
        byte[] bytes = config.getBytes(key, null);
        if (bytes == null) {
            return null;
        }

        return deserializeObject(bytes, cl);
    }

总结一下牵扯到的这几个概念：

Task：(AbstractInvokable，StreamTask，OneInputStreamTask) 是TaskExecutor的执行入口，通过反射的方法去构建，之后调用其invoke方法去执行。
Processor： 负责给Task接收数据的类(StreamOneInputProcessor，StreamTwoInputProcessor)，如果是SourceStreamTask的话逻辑不同，因为SourceStreamTask自己产生数据。其收到数据后，会传递给OperatorChain中的第一个Operator。
OperatorChain：第一个Operator收到数据后，通过Output作为连接纽带，依次传给所有的Operator。
Operator：Operator收到数据后，调用userFunction去进行数据处理，之后通过其Output传给下一个Operator，Operator的构建是简单粗暴的Java序列化/反序列化。

到这里，我们就了解了从TaskExecutor收到Task请求到执行的过程，接下来的文章，我们会分析从收到Dispatcher的job提交请求(submitJob(JobGraph jobGraph))，到提交任务Task到TaskExecutor第二个环节。

#Flink#

Selenium 处理表单、弹窗与文件上传：从基础到实战二向箔reverse selenium 爬虫自动化
在Web自动化领域，表单交互、弹窗处理和文件上传是最常见也最容易踩坑的场景。想象一下：你编写的脚本明明定位到了输入框，却无法输入文字；点击按钮后弹出的对话框让脚本瞬间“卡壳”；好不容易找到文件上传按钮，却发现Selenium无法直接操作系统文件选择框……这些问题往往让新手头疼不已。本文将系统讲解Selenium在这三类场景中的解决方案，结合实战案例帮你突破瓶颈。一、表单处理：搞定输入、选择与提交网
《Cocos2d-x实战 Lua卷》上线了
感谢大家一直以来的支持！各大商店均开始销售：京东：http://item.jd.com/11659697.html当当：http://product.dangdang.com/23659810.html《Cocos2d-x实战Lua卷》源码及样章下载地址：源码下载地址：http://51work6.com/forum.php?mod=viewthread&tid=1198&extra=page%3
数据分析全攻略：从基础概念到实战应用的完整指南 SickeyLee 产品经理人工智能大数据信息可视化
数据分析全攻略：从基础概念到实战应用的完整指南数据分析已成为现代商业决策的核心驱动力，但很多人在面对数据时，常常陷入“不知道看什么、怎么分析、如何应用”的困境。本文将系统梳理数据分析的核心知识，从数据的本质到分析流程，从方法工具到实战指标，帮你搭建一套完整的数据分析思维框架，让数据真正为业务服务。一、数据是什么？不止于数字的“信息载体”提到数据，很多人会首先想到数字，但实际上数据的范畴远更广阔。数
数据呈现进阶：漏斗图与雷达图的实战指南 SickeyLee 信息可视化 python 数据分析
数据可视化的魅力在于，不同的图表能解锁不同的业务洞察。当你需要分析用户转化路径，或对比多维度性能差异时，基础的柱状图、折线图往往力不从心。本文将聚焦两种进阶图表——漏斗图和雷达图，详解它们的适用场景、分析逻辑和实战案例，帮你掌握“用图表解决复杂问题”的技能。一、漏斗图：追踪转化路径，定位流失“重灾区”漏斗图以“上宽下窄”的形状，直观展示了用户在固定流程中的转化与流失情况。它就像业务流程的“X光片”
【实战派×学院派】45｜上线 KPIs 不断增，监控却成一堆告警噪音？郭菁菁 (BA/PM)实战派常踩的坑学院派如何补上数据库业务分析需求分析 BA
学院派：用KPI–AlertMapping表+SLO/SLA体系+告警分级与演练流程，把监控从“告警堆积”变成“稳定保障”。你是不是也遇到过这样的场景：“告警每天响，根本看不过来。”“真出问题了，反而没人注意到。”“监控项越来越多，但问题总是事后才发现。”“告警一多，大家直接无视，干脆全关了。”监控体系经常陷入：指标越来越全→阈值随意设→告警泛滥失效→真正风险无法预警。✅实战派常见误区：监控项随便
渗透测试工程师(NISP-PT) 网安世纪小鹅NISP_CISP 网络网络安全安全
第一阶段：网络安全基础知识（2周）【学生可掌握的核心能力】1、能够根据企业办公环境和信息点数，为企业组建中小型企业网络，并能指导实施;2、能够根据网络拓扑图，根据企业需求，配置路由器与交换机，实现企业网络全网互通;3、按照正确的操作方法和顺序，监控设备和网络的运行状态，维护设备和网络传输媒介的正常工作;完成设备的升级、配置文件的备份和还原等;完成网络的日常维护。【学习价值】具备市场网络中级水平，能
【免费下载】 RTL8211F(D)(I) 参考原理图：千兆以太网 PHY 设计的利器富阔典
RTL8211F(D)(I)参考原理图：千兆以太网PHY设计的利器【下载地址】RTL8211FDI参考原理图本仓库提供了RTL8211F(D)(I)芯片的参考原理图，适用于电子工程师和硬件开发者进行电路设计和参考。RTL8211F(D)(I)是一款高性能的千兆以太网PHY芯片，广泛应用于网络设备和通信系统中。项目地址:https://gitcode.com/open-source-toolkit/
防止应用调试分析IP被扫描加固实战教程咕噜企业签名分发-大圣 tcp/ip 网络协议网络
防止应用调试分析IP被扫描加固实战教程主要包括以下几个方面的措施：一、应用层面的加固措施1.确保通信加密：使用HTTPS协议进行所有网络通信，加密传输的数据，防止中间人攻击（MITM）。在Android应用中，可以通过NetworkSecurityConfiguration强制使用HTTPS。创建network_security_config.xml文件，并在AndroidManifest.xml
Orange3实战教程：图像分析---图像嵌入 err2008 Orange3 实战教程数据挖掘神经网络自然语言处理机器学习计算机视觉深度学习 orange3中文版
图像嵌入通过深度神经网络实现图像嵌入。输入图像：图像列表。输出嵌入向量：用数字向量表示的图像。跳过的图像：未计算嵌入向量的图像列表。图像嵌入功能读取图像并将其上传至远程服务器或本地计算。深度学习模型用于为每张图像计算特征向量。该功能返回一个增强的数据表，包含额外的列（图像描述符）。图像可以通过导入图像小部件导入，也可以通过电子表格中的图像路径导入。在这种情况下，包含图像路径的列需要一个三行表头，第
数据呈现高阶技巧：散点图与桑基图的独特价值
在数据可视化的工具箱中，有些图表看似小众，却能解决特定场景的分析难题。当你需要探索两个变量的关联，或追踪复杂的流量路径时，散点图和桑基图会成为强大的武器。本文将深入解析这两种图表的适用场景、分析逻辑和实战案例，帮你突破传统图表的局限，挖掘更深入的业务洞察。一、散点图：探索变量关系，发现群体特征散点图的核心价值在于展示大样本中两个变量的分布关系。它不像柱状图那样聚焦分类对比，也不像折线图那样追踪时间
《亿级流量系统架构设计与实战》通用高并发架构设计读场景 Momentary_SixthSense 系统架构 mysql redis 架构
高并发架构设计的要点场景分类读多写少、写多读少，读多写多高并发读场景方案1：数据库读/写分离数据库承受的高并发请求压力，主要来自读请求。我们可以把数据库按照读/写请求分成专门负责处理写请求的数据库（写库）和专门负责处理读请求的数据库（读库），让所有的写请求都落到写库，写库将写请求处理后的最新数据同步到读库，所有的读请求都从读库中读取数据。这就是数据库读/写分离的思路。数据库读/写分离使大量的读请求
《亿级流量系统架构设计与实战》MySQL高可用架构 Momentary_SixthSense 系统架构 mysql 架构
主从模式一台MySQL服务器作为Master（主节点）,若干MySQL服务器作为Slave（从节点）。在正常情况下，只有Master处理写数据请求，同时Master与Slave通过主从复制技术保持数据一致。当Master发生故障宕机时，某个Slave会被提升为Master继续对外提供服务。主从复制技术：当Master数据发生变更(包括新增、删除、修改等操作)时，Master将数据的变更日志写入二进
Uniapp微信小程序开发：后端服务器搭建指南（语言选择+部署方案）
目录前言：Uniapp+微信小程序的架构模式️后端服务器的作用后端语言选择（Node.js/Java/Python/PHP/Go）☁️服务器部署方案（云服务器vsServerless）实战：如何连接Uniapp与后端API安全优化：HTTPS、JWT、接口鉴权数据库选择（MySQL、MongoDB、云数据库）总结&最佳实践1.前言：Uniapp+微信小程序的架构模式Uniapp是一个基于Vue.j
一文详解REST风格 AA-代码批发V哥 JavaEE 开发技巧/知识 restful
一文详解REST风格一、REST风格的核心概念1.1什么是REST？1.2REST与HTTP的关系二、REST风格的核心原则2.1资源为中心，URI表示资源2.2用HTTP方法表示操作类型2.3用HTTP状态码表示结果2.4响应格式标准化2.4.1成功响应2.4.2错误响应2.5无状态通信三、RESTfulAPI设计实战案例3.1资源定义3.2API设计清单3.3进阶设计：关联资源与过滤排序3.3
Python爬虫实战：深入无限滚动页面抓取原理与Playwright实现 Python爬虫项目 python 爬虫开发语言区块链 json
一、前言：无限滚动页面的挑战在现代Web开发中，「无限滚动（InfiniteScrolling）」早已取代了传统的分页模式。以微博热搜流、知乎首页、抖音推荐页为例，用户向下滚动时会自动加载更多内容，这种体验虽提升了交互性，却让传统爬虫面临巨大挑战：页面初始只加载一部分内容剩余内容由JavaScript在滚动事件中动态加载requests类爬虫无法感知页面行为为什么传统爬虫抓不到数据？因为页面数据不
【Linux指南】Linux系统 -权限全面解析倔强的石头_ Linux指南 linux 服务器运维
引言本文从权限的本质概念出发，逐步拆解Linux系统中用户角色、文件权限标识、权限操作命令等核心要素，不仅深入解析chmod、chown等基础命令的底层逻辑，还会揭示目录权限的特殊规则与默认权限生成机制。无论你是初次接触Linux的新手，还是希望完善权限管理知识体系的系统管理员，都能通过本文构建从理论到实战的完整认知框架，最终掌握在复杂场景下精准配置权限的核心技能。文章目录引言一、Linux权限的
Python爬虫实战：研究Korean库相关技术 ylfhpy 爬虫项目实战 python 爬虫 easyui korean
一、引言1.1研究背景与意义随着韩流文化在全球的传播，韩语网页内容急剧增加。韩国在科技、娱乐等领域的信息具有重要研究价值。然而，韩语独特的黏着语特性（如助词体系、词尾变化）给信息处理带来挑战。传统爬虫缺乏对韩语语言特点的针对性处理，本研究旨在开发一套完整的韩语网页内容分析系统，填补这一技术空白。1.2研究目标与方法研究目标：设计高效的韩语网页爬虫框架实现精准的韩语内容识别与处理构建多维度的韩语内容
Python爬虫实战：研究Genius库相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 genius
1.引言在当今数字化时代，音乐数据的分析与挖掘成为了音乐学、计算机科学等领域的研究热点。歌词作为音乐的重要组成部分，蕴含着丰富的情感、文化和社会信息。通过对歌词数据的分析，可以揭示音乐风格的演变、流行趋势的变化以及社会情绪的波动等。Genius是一个专注于歌词解析与音乐知识分享的平台，拥有大量的歌词文本以及用户对歌词的注释和解读。Genius提供了API接口，允许开发者获取歌曲、艺术家和歌词等信息
python量化实战_Python与量化投资从基础到实战.pdf weixin_39841709 python量化实战
作者：王小川出版发行:北京：电子工业出版社,2018.03ISBN号：978-7-121-33857-1页数：408原书定价:99.00开本:16开主题词:软件工具-程序设计-应用-投资中图法分类号:F830.59-39(经济->财政、金融->金融、银行->金融、银行理论)内容提要:本书主要讲解如何利用Python进行量化投资，包括对数据的获取、整理、分析挖掘、信号构建、策略构建、回测、策略分析等
从面试到晋升：美团技术专家的职业发展全记录 AI天才研究院 ChatGPT 实战 ChatGPT AI大模型应用入门实战与进阶面试职场和发展 ai
从面试到晋升：美团技术专家的职业发展全记录关键词：美团技术专家、技术职级体系、面试准备、晋升路径、能力模型、技术管理、职业发展摘要：本文深度解析美团技术专家的职业发展路径，从面试准备阶段的简历优化、技术笔试、多轮面试策略，到晋升过程中的能力模型构建、项目实战经验、跨团队协作技巧，结合具体案例和实战经验，完整呈现从初级工程师到资深技术专家的成长轨迹。通过剖析美团独特的T序列职级体系、能力评估标准和考
为什么你越害怕发生的事情，越容易发生猴得住
美国人爱德华·墨菲是一名工程师，他曾参加过美国空军于1949年进行的MX981实验。这个实验的目的是为了测定人类对加速度的承受极限。其中有一个实验项目是将16个火箭加速度计悬空装置在受试者上方，当时有两种方法可以将加速度计固定在支架上，而不可思议的是，竟然有人有条不紊地将16个加速度计全部装在错误的位置。于是墨菲作出了“事情如果有变坏的可能，不管这种可能性有多小，它总会发生，并引起最大可能的损失”
ABP VNext + Kubernetes & Istio：微服务网格实战指南
ABPVNext+Kubernetes&Istio：微服务网格实战指南目录ABPVNext+Kubernetes&Istio：微服务网格实战指南一、引言二、环境与依赖️三、项目与基础部署3.1生成Kubernetes资源3.2构建Docker镜像3.3HelmChart目录结构与参数注入四、安装Istio&定义入口五、Mermaid全链路流程概览六、将服务注入IstioMesh七、流量管理与金丝雀
渗透测试视角：Web 应用常见漏洞的利用与防御策略
Web应用已成为企业业务的核心载体，但SQL注入、XSS、文件上传漏洞等安全问题频发。从渗透测试视角分析漏洞的利用原理，才能制定更有效的防御策略。本文将结合实战案例，解析Web应用常见漏洞的利用方式与防御方法。一、SQL注入漏洞：数据库的“隐形后门”SQL注入是最常见的Web漏洞之一，攻击者通过在参数中插入SQL语句，操控数据库获取数据或执行命令。漏洞原理与利用场景当Web应用未对用户输入进行过滤
Python量化实战：基于索提诺比率的价值投资策略回测量化价值投资入门到精通 python 网络开发语言 ai
Python量化实战：基于索提诺比率的价值投资策略回测关键词：Python量化分析、索提诺比率、价值投资策略、回测框架、风险调整收益、下行风险、量化实战摘要：本文深入探讨如何利用Python构建基于索提诺比率（SortinoRatio）的价值投资策略，并通过完整的回测框架验证策略有效性。首先解析索提诺比率的数学原理与核心优势，对比传统夏普比率的差异；其次详细演示价值投资策略的构建步骤，包括低估值因
iOS WebView 调试实战页面跳转失效与历史记录错乱的排查路径 2501_92835650 ios
在混合开发中，Web页面通过WebView承载后，经常会遇到这样的问题：点击跳转没有反应、历史记录错乱、后退页面空白，甚至浏览器里的history.back()无效。这些问题在浏览器调试时很难复现，却在iOSWebView容器中频繁出现。本文基于一个真实案例，拆解iOSWebView中涉及页面跳转的核心机制、调试路径与协同流程，并结合调试工具实践，包括WebDebugX在其中所完成的关键观察任务。
Python+Allpairspy实战：高效正交法测试用例设计全攻略聪明的一休哥哥测试开发技术大全 python 测试用例自动化测试
引言：正交法的核心价值正交实验法是一种通过科学筛选参数组合来优化测试用例设计的技术。其核心思想是从所有可能的参数组合中，选择最具代表性的N个组合进行测试，既能显著减少用例数量（通常可减少30%-70%），又能保证覆盖关键场景。例如：传统全组合测试：3因素×3水平=27种组合正交法优化后：仅需4-9种组合即可覆盖核心场景1、Allpairspy库安装与基础使用1.1、安装命令pipinstallal
SpringBoot单元测试全攻略：MockMVC+Testcontainers+覆盖率分析 fanxbl957 Web spring boot 单元测试后端
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot单元测试全攻略：
Vue 2现代模式打包：双包架构下的性能突围战 Jokerator javascript javascript vue.js
文章目录一、场景痛点：兼容性与性能的撕裂二、技术解析：ModernMode的双引擎驱动1.基础认知：什么是ModernMode？2.原理深入：HTML智能分发与Safari10修复3.性能收益对比表三、Vue2项目实战：启用Modern模式与深度优化1.基础启用步骤2.避坑指南：常见问题与解决方案3.二次优化策略（结合Modern模式）四、总结：三层认知升华面对ES2015+语法在旧浏览器的兼容包
HLA仿真程序设计实战：FoodFight_MFC案例剖析
本文还有配套的精品资源，点击获取简介：HLA仿真程序设计利用高级语言抽象构建集成分布式仿真系统，促进仿真组件之间的互操作性。以”FoodFight_MFC”为例，该案例基于MicrosoftFoundationClass(MFC)库，介绍HLA编程基础概念和实践。通过学习HLA接口、MFC应用框架、对象模型设计、数据同步机制、联邦管理和性能优化，学习者能掌握分布式仿真系统的构建和运行。1.HLA仿
并发编程原理与实战（十八）ReentrantLock API全面解析
上一篇讲解了Lock接口核心API和相比于synchronized的关键优势，本文来进一步学习Lock接口的具体实现类ReentrantLock。认识ReentrantLock基本行为和语义下面我们先看ReentrantLock的定义。/***Areentrantmutualexclusion{@linkLock}withthesamebasic*behaviorandsemanticsasthe
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc

技术分享：Flink源码分析-Task执行

Task

StreamTask

你可能感兴趣的:(工程师实战,flink)