hxcaifly

【Flink原理和应用】：Flink的累加器（Accumulator）应用

文章目录

1. 累加器的简单介绍
2. 案例说明
3. 代码实现

3.1. 主函数入口分析
3.2. 逻辑实现关键步骤分析

3.2.1. 得到数据集
3.2.2. 过滤含有空值的行
3.2.3. 执行任务并输出过滤行
3.2.4. 通过注册时的key值来获得累加器的结果

4. 程序正确执行的结果：
5. 总结

1. 累加器的简单介绍

累加器是从用户函数和操作中，分布式地统计或者聚合信息。每个并行实例创建并更新自己的Accumulator对象, 然后合并收集器的不同并行实例。在作业结束时由系统合并。

累加器的结果可以从作业执行的结果中获得，也可以从Web运行时监视器中获得。

累加器是受Hadoop/MapReduce计数器的启发。但是要注意添加到累加器的类型可能与返回的类型不同。比如：我们添加单个对象,但是结果返回的是对象的set集合。

可以先看下Flink源码对累加器Accumulator的定义：

package org.apache.flink.api.common.accumulators;

import org.apache.flink.annotation.Public;

import java.io.Serializable;

/** * 累加器从用户函数和操作中，分布式地统计信息或聚合。 * 每个并行实例创建并更新自己的Accumulator对象, 然后合并收集器的不同并行实例。 在作业结束时由系统合并。 * 结果可以从作业执行的结果中获得，也可以从Web运行时监视器中获得。 * * 累加器是受Hadoop/MapReduce计数器而激发出来的。 * * 添加到收集器的类型可能与返回的类型不同. * 例如set类机器: 我们添加单个对象,但是结果返回的是对象的set集合 * * @param  添加到累加器的值的类型 * * @param  将向客户端报告的累加器结果的类型 * */
@Public
public interface Accumulator<V, R extends Serializable> extends Serializable, Cloneable {
	/** * @param value 要添加到Accumulator对象的值。 * */
	void add(V value);

	/** * @return local 当前UDF上下文中的本地值。 */
	R getLocalValue();

	/** * 重置本地值。这只影响当前的UDF上下文。 */
	void resetLocal();

	/** * 由系统内部使用，用于在作业结束时合并收集器的收集部分。 * * @param other 对要合并的收集器的引用。 */
	void merge(Accumulator<V, R> other);

	/** * 复制收集器。所有子类都需要正确地实现克隆，并且不能报错 {@link java.lang.CloneNotSupportedException} * * @return 复制的累加器。 */
	Accumulator<V, R> clone();
}

所有我们在任务中自定义的累加器必须要实现这个Accumulator接口。

2. 案例说明

本案例是要实现筛选并计数csv文件中包含空字段的行。并且使用自定义累加器计算csv文件中每列的空字段数。在此案例中，空字段是指那些最多包含空格和制表符等空白字符的字段。

输入文件是纯文本的csv文件，以分号作为字段分隔符，双引号作为字段分隔符和三列。

从这个案例中，我们可以学习到：

自定义累加器
tuple数据类型
内联定义函数
命名大型元组类型

3. 代码实现

3.1. 主函数入口分析

从main主函数分析程序的逻辑比较直接点。在代码注释中，主要注释出了四步，因为这四步比较关键。后面的讲述也将围绕这四步来分开讲解。

package org.apache.flink.examples.java.relational;

import org.apache.flink.api.common.JobExecutionResult;
import org.apache.flink.api.common.accumulators.Accumulator;
import org.apache.flink.api.common.functions.RichFilterFunction;
import org.apache.flink.api.java.DataSet;
import org.apache.flink.api.java.ExecutionEnvironment;
import org.apache.flink.api.java.tuple.Tuple3;
import org.apache.flink.api.java.utils.ParameterTool;
import org.apache.flink.configuration.Configuration;

import org.apache.commons.lang3.StringUtils;

import java.util.ArrayList;
import java.util.Collection;
import java.util.List;

public class EmptyFieldsCountAccumulator {
	
	private static final String EMPTY_FIELD_ACCUMULATOR = "empty-fields";

	public static void main(final String[] args) throws Exception {

		final ParameterTool params = ParameterTool.fromArgs(args);

		final ExecutionEnvironment env = ExecutionEnvironment.getExecutionEnvironment();
		env.getConfig().setGlobalJobParameters(params);

		// 1. 得到数据集
		final DataSet<StringTriple> file = getDataSet(env, params);

		// 2. 过滤含有空值的行
		final DataSet<StringTriple> filteredLines = file.filter(new EmptyFieldFilter());

		JobExecutionResult result;
		// 3. 执行任务并输出过滤行
		if (params.has("output")) {
			filteredLines.writeAsCsv(params.get("output"));
			// 执行程序
			result = env.execute("Accumulator example");
		} else {
			System.out.println("Printing result to stdout. Use --output to specify output path.");
			filteredLines.print();
			result = env.getLastJobExecutionResult();
		}

		// 4. 通过注册时的key值来获得累加器的结果
		final List<Integer> emptyFields = result.getAccumulatorResult(EMPTY_FIELD_ACCUMULATOR);
		System.out.format("Number of detected empty fields per column: %s\n", emptyFields);
	}
}

3.2. 逻辑实现关键步骤分析

3.2.1. 得到数据集

final DataSet<StringTriple> file = getDataSet(env, params);

这里继续看下getDataSet(env, params)方法：

/** * 得到数据集 * @param env * @param params * @return */
@SuppressWarnings("unchecked")
private static DataSet<StringTriple> getDataSet(ExecutionEnvironment env, ParameterTool params) {
	// 如果指定了input参数
	if (params.has("input")) {
		return env.readCsvFile(params.get("input"))
			.fieldDelimiter(";")
			.pojoType(StringTriple.class);
	// 否则，读取默认的数据集
	} else {
		System.out.println("Executing EmptyFieldsCountAccumulator example with default input data set.");
		System.out.println("Use --input to specify file input.");
		return env.fromCollection(getExampleInputTuples());
	}
}

这步是定义了获取输入数据集的逻辑。如果指定了input参数，那么将直接读取指定的csv文件，否则就读取默认的数据集。这个默认的数据集，我们继续看getExampleInputTuples()方法。

/** * * 得到例子输入Tuple * @return */
private static Collection<StringTriple> getExampleInputTuples() {
	Collection<StringTriple> inputTuples = new ArrayList<StringTriple>();
	inputTuples.add(new StringTriple("John", "Doe", "Foo Str."));
	inputTuples.add(new StringTriple("Joe", "Johnson", ""));
	inputTuples.add(new StringTriple(null, "Kate Morn", "Bar Blvd."));
	inputTuples.add(new StringTriple("Tim", "Rinny", ""));
	inputTuples.add(new StringTriple("Alicia", "Jackson", " "));
	return inputTuples;
}

默认数据集是Collection集合。这个集合的元素类型是StringTriple。StringTriple是自定义的三元组数据结构。

/** * 当数据集有比较多的字段时，那么推荐是用POJOs，而不是TupleX */
public static class StringTriple extends Tuple3<String, String, String> {

	public StringTriple() {}

	public StringTriple(String f0, String f1, String f2) {
		super(f0, f1, f2);
	}
}

其实StringTriple就是一个三元的Tuple数据结构。不过当字段比较多时，还是不建议应用Tuple数据结构，建议直接应用POJOs要好点。

3.2.2. 过滤含有空值的行

这步是执行过滤操作：

final DataSet<StringTriple> filteredLines = file.filter(new EmptyFieldFilter());

EmptyFieldFilter类实现如下：

/** * 此函数筛选所有具有一个或多个空字段的传入元组 * * 这样做的同时，它还计算带有累加器（在下注册）的每个属性的空字段数。 * {@link EmptyFieldsCountAccumulator#EMPTY_FIELD_ACCUMULATOR}). */
public static final class EmptyFieldFilter extends RichFilterFunction<StringTriple> {

	// 在每个筛选函数实例中创建新的收集器
	// 以后可以合并累加器
	private final VectorAccumulator emptyFieldCounter = new VectorAccumulator();

	@Override
	public void open(final Configuration parameters) throws Exception {
		super.open(parameters);

		// 注册收集器实例
		getRuntimeContext().addAccumulator(EMPTY_FIELD_ACCUMULATOR,
				this.emptyFieldCounter);
	}

	@Override
	public boolean filter(final StringTriple t) {
		boolean containsEmptyFields = false;

		// 遍历tuple的所有字段，寻找有没有空值
		for (int pos = 0; pos < t.getArity(); pos++) {

			final String field = t.getField(pos);
			if (field == null || field.trim().isEmpty()) {
				containsEmptyFields = true;

				// 如果遇到空字段，请更新累加器
				this.emptyFieldCounter.add(pos);
			}
		}

		return !containsEmptyFields;
	}
}

上述过滤逻辑一开始就初始化了一个累加器VectorAccumulator ，然后把累加器注册到上下文执行环境中。这里累加器VectorAccumulator的定义，应该是我们本文的重点了，下面我们重点分析这一块。

VectorAccumulator的定义逻辑

/** * 这个累加器保持一个计数向量. 调用 {@link #add(Integer)} 来增加第n-th列的值. * 矢量的大小是自动管理的. */
public static class VectorAccumulator implements Accumulator<Integer, ArrayList<Integer>> {

	/** 存储累积向量分量. */
	private final ArrayList<Integer> resultVector;

	/** * 构造函数 */
	public VectorAccumulator(){
		this(new ArrayList<Integer>());
	}

	public VectorAccumulator(ArrayList<Integer> resultVector){
		this.resultVector = resultVector;
	}

	/** * 将指定位置的结果向量分量增加1. */
	@Override
	public void add(Integer position) {
		updateResultVector(position, 1);
	}

	/** * 将指定位置的结果向量分量增加指定的增量。 */
	private void updateResultVector(int position, int delta) {
		// 如果position超出了列的最大索引，那么就再起一列。
		while (this.resultVector.size() <= position) {
			this.resultVector.add(0);
		}

		// 增加该列的值，列索引为position
		final int component = this.resultVector.get(position);
		this.resultVector.set(position, component + delta);
	}

	@Override
	public ArrayList<Integer> getLocalValue() {
		return this.resultVector;
	}

	@Override
	public void resetLocal() {
		// 如果应重用收集器实例，则清除结果向量
		this.resultVector.clear();
	}

	@Override
	public void merge(final Accumulator<Integer, ArrayList<Integer>> other) {
		// 合并两个累加器 
		final List<Integer> otherVector = other.getLocalValue();
		for (int index = 0; index < otherVector.size(); index++) {
			updateResultVector(index, otherVector.get(index));
		}
	}

	@Override
	public Accumulator<Integer, ArrayList<Integer>> clone() {
		return new VectorAccumulator(new ArrayList<Integer>(resultVector));
	}

	@Override
	public String toString() {
		return StringUtils.join(resultVector, ',');
	}
}

VectorAccumulator是累加元素类型为Integer，然后返回类型为ArrayList的累加器，其功能是对空列进行计数累加。其中position参数表示列的所以，比如0表示第0列，1表示第1列等。

分析完VectorAccumulator的逻辑。让我们再重新回到EmptyFieldFilter的filter方法的具体逻辑：其逻辑是对于每行数据，遍历其每列的值，如果某一列有空值，那么就过滤掉该元素，那么最后保留下来就只用没有空值的行了。

另外filter中执行了如下逻辑：

this.emptyFieldCounter.add(pos);

这一步是对空字段进行累加。其中pos表示列的索引。

3.2.3. 执行任务并输出过滤行

这一步简单，就是执行任务，然后打印出结果。

3.2.4. 通过注册时的key值来获得累加器的结果

累加器在生成时，我们是通过：

getRuntimeContext().addAccumulator(EMPTY_FIELD_ACCUMULATOR,
					this.emptyFieldCounter);

注册到了执行上下文环境中，当任务执行完了，其累加器的值，其实保留在了内存中。

通过key值去获取累加器，然后把累加器的值打印出来。

4. 程序正确执行的结果：

(John,Doe,Foo Str.)
Number of detected empty fields per column: [1, 0, 3]

上述打印结果不仅打印出来了没有空值列的行数据。然后也打印出了累加器结果，即表示第0列有1处空值，第1列没有空值，第2列有3处空值。

5. 总结

累加器其实也算是一种有状态（state）的计算，这种状态计算其实在实际应用中非常广泛。学习该案例，我们可以对累加器的用法有一定的理解。

你可能感兴趣的:(Flink,Flink原理和应用)

python类方法和类的实例化 Cachel wood 程序设计杂事 python 开发语言 mysql hive sql 机器学习数据库
文章目录类方法实例方法类方法静态方法特殊方法私有方法Python类的实例化1.调用`__new__`方法2.调用`__init__`方法3.返回实例对象总结类方法在Python里，类的自定义方法是类中用户自行定义的函数，这些方法能够实现特定的功能，并且可以访问和操作类的属性。下面详细介绍Python类中常见的自定义方法。实例方法定义：实例方法是类中最常见的方法，它的第一个参数通常是self，代表类
机器视觉工程师必须知道读码器如何选型视觉人机器视觉杂说数码相机 3d 人工智能 c#
一、明确核心需求应用场景工业场景（产线、仓储）：需高防护等级（IP65+）、抗震动/冲击、宽温工作（-20℃~50℃）。商业场景（零售、物流）：注重扫描速度、多码兼容性（一维/二维码混合）。移动场景（手持设备、AGV）：选择无线连接（蓝牙/Wi-Fi）、轻便设计。特殊环境（高粉尘、强光）：需配备强光源补偿、高帧率图像传感器。码的类型一维码：传统激光扫描器（成本低）或线性图像式扫描器（破损码容错）。
k8s1.3、containerd2.0部署实战不明觉厉二十年 kubernetes 容器云原生
k8s1.3、containerd2.0部署实战参考博客containerd二进制安装与使用测试下载nerdctl-fullk8s安装参考博客containerd二进制安装与使用测试containerd可以和docker共存，直接二进制安装，nerdctl-full包含containerd和nerdctl命令行工具可以代替docker单机使用下载nerdctl-full建议下载-full版本下载后
AI人工智能代理工作流AI Agent WorkFlow：设计智能任务处理流程 AI天才研究院计算 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：设计智能任务处理流程作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在当今的数字化时代，随着数据量的爆炸式增长和复杂性的提升，传统的手动任务处理方式已经无法满足高效、准确的需求。人工智能技术的发展为自动化任务处理提供了新的可能性。AI人工智能代理（AIAgent）作为一
98-二叉树-验证二叉搜索树 Hello_Git javascript
树|深度优先搜索|二叉搜索树|二叉树一、二叉搜索树（BST）的性质首先，了解二叉搜索树（BinarySearchTree,BST）的定义和性质是解决这类问题的基础。BST的定义左子树：节点的左子树只包含小于当前节点的数。右子树：节点的右子树只包含大于当前节点的数。递归性质：左子树和右子树本身也必须是二叉搜索树。简单来说，BST具有以下特点：中序遍历BST可以得到一个递增的有序序列。每个节点的值都大
蓝桥杯练习-3.17 梨绘小棠蓝桥杯贪心算法 c++
蓝桥杯练习-3.17代码练习•旅行家的预算-贪心问题描述一个旅行家想驾驶汽车以最少的费用从一个城市到另一个城市（假设出发时油箱是空的）。给定两个城市之间的距离D1、汽车油箱的容量C（以升为单位）、每升汽油能行驶的距离D2、出发点每升汽油价格P和沿途油站数N（N可以为零），油站i离出发点的距离Di、每升汽油价格Pi（i=1，2，……N）。计算结果四舍五入至小数点后两位。如果无法到达目的地，则输出“N
杭州宇树科技有限公司（Hangzhou Yushu Science And Technology Co., Ltd.） [19]，简称宇树，是一家从事软件和信息技术服务业民用机器人公司 [19-20] 分享是一种传递，一种快乐杂学百货铺-啥都学人工智能
UnitreeRoboticsisaworld-renownedcivilianroboticscompany,whichisfocusingontheR&D,production,andsalesofconsumerandindustry-classhigh-performancegeneral-purposeleggedandhumanoidrobots,six-axismanipulator
使用Deepseek书写一篇综述论文，如何提示？学术乙方小知识经验分享
使用DeepSeek撰写综述论文时，可以通过以下提示和步骤来高效完成任务：明确研究主题与范围在开始撰写之前，首先需要明确研究主题、文献综述的时间跨度、地理范畴和文献类型。这有助于聚焦研究方向，避免偏离主题。制定详细的提示词提示词的设计是高效利用DeepSeek的关键。可以参考以下模板：研究背景与现状：请帮我梳理XXX领域的研究背景与现状，包括国内外的主要研究成果和研究热点。文献筛选与阅读：请帮我筛
《Linux运维总结：基于银河麒麟V10+ARM64架构部署多机elasticsearch7.17.21分布式集群+单机kibana7.17.21二进制版ssl集群》东城绝神《Linux运维实战总结》运维 linux elasticsearch ssl
总结：整理不易，如果对你有帮助，可否点赞关注一下？更多详细内容请参考：Linux运维实战总结一、背景elasticsearch是一个分布式、实时、高性能的搜索和分析引擎，它广泛应用于企业级搜索、日志分析、实时数据处理等领域。随着elasticsearch的广泛应用，安全性变得越来越重要。这里将从安全策略和访问控制两方面来部署elasticsearch集群安全策略涉及到数据安全、访问安全和操作安全等
macos 搭建 ragflow 开发环境 Dickence macos
ragflow是一个很方便的本地RAG库。本文主要记录一下在本机的部署过程1、总体架构说明开发环境：macbookpro（m1），16G内存+512G固态因本机的内存和硬盘比较可怜，所以在服务器上部署基础docker包，本机仅运行rag-server部分。服务器环境：28核56线程，64G，CentOS82、服务器部署服务器安装docker，过程略服务器安装docker-compose，过程略安装
HAProxy的ACL Hurry6 网络服务器运维
访问控制列表（ACL，AccessControlLists）是一种基于包过滤的访问控制技术，它可以根据设定的条件对经过服务器传输的数据包进行过滤(条件匹配)，即对接收到的报文进行匹配和过滤，基于请求报文头部中的源地址、源端口、目标地址、目标端口、请求方法、URL、文件后缀等信息内容进行匹配并执行进一步操作，比如允许其通过或丢弃。定义ACL匹配规范，即：判断条件hdrstring，提取在一个HTTP
Rocky Linux安装部署Elasticsearch（ELK日志服务器）_rockylinux elk 2401_83739411 程序员服务器 linux elasticsearch
一、Elasticsearch的简介Elasticsearch是一个强大的开源搜索和分析引擎，可用于实时处理和查询大量数据。它具有高性能、可扩展性和分布式特性，支持全文搜索、聚合分析、地理空间搜索等功能，是构建实时应用和大规模数据分析平台的首选工具。二、RockyLinux系统安装链接：VMwareWorkstation下载安装（含秘钥）链接：VMwareWorkstation创建虚拟机链接：Ro
【图论】并查集的学习和使用猪猪成 C++学习算法图论
目录并查集是什么？举个例子组成父亲数组：find函数：union函数：代码实现：fa[]初始化code:findcode：递归实现:非递归实现:unioncode:画图模拟：路径压缩：路径压缩Code：并查集是什么？是一种树形的数据结构，一般用来处理集合的合并，查询操作。举个例子告诉你1的父节点是22的父节点是34的父节点是56没有父节点那么可以画出三个集合，或者说是树。然后我们一般用并查集判断：
施磊老师c++(八) Zhuai-行淮施磊老师cpp c++开发语言
语法是很不重要的,基本的回会了就行了cpp面经文章目录cpp面经1.程序的内存布局?--可以详看施磊老师第一节课2.堆栈区别3.函数调用参数是怎么传递的?4.为什么函数调用从右往左压栈5.函数题6.类和结构体的内存对齐----空结构体1.程序的内存布局?–可以详看施磊老师第一节课布局大概.text(代码段,放指令),.rodata(只读数据段,比如:常量字符串)—只读,不写.data(数据段:存放
基于STM32+微信小程序设计的环境监测系统（腾讯云IOT） DS小龙哥智能家居与物联网项目实战 stm32 微信小程序腾讯云
一、设计需求基于STM32设计的环境检测系统(腾讯云物联网+微信小程序实现)【1】项目背景随着人们生活水平的提高，人们对生活环境的求越来越高尤其是在家居环境有害气体污染已经引起了人们的注意，温度和湿度控制等。有关研究人员发现，天然气主要组成部分为甲烷气，而且还有少量的乙烷、丙烷、丁烷等烷烃，还含有二氧化碳、氧、氮、硫化氢、水分等。甲醛是一种破坏生物细胞蛋白质的原生质毒物，会对人的皮肤、呼吸道及内脏
施磊老师c++笔记(三) Zhuai-行淮施磊老师cpp c++笔记
c++模板编程-学习cpp类库的编程基础文章目录c++模板编程-学习cpp类库的编程基础1.函数模板2.理解模板函数3.实现cpp的vector向量容器4.理解容器空间配置器allocator的重要性1.函数模板内容:模板的实例化,模板函数,模板类型参数,模板非类型参数,模板的实参推演,模板的特例化,模板函数模板的特例化非模板函数的重载关系区分函数模板和模板函数的概念!!!模板的意义?对类型也可以
ffmpeg+ubuntu16.04编译ffmpeg库小gpt& QT+FFMPEG实战 ffmpeg linux
个人使用环境：ubuntudesktop16.04+ffmpeg4.2.1以下的库进行完整编译ffmpeg介绍FFmpeg是一个开源的多媒体框架，广泛用于处理音频、视频、字幕等多媒体数据。它包含了丰富的工具和库，能够进行音视频的编解码、转码、流媒体处理、滤镜应用等操作。FFmpeg是许多多媒体应用程序和工具的核心引擎，功能强大且灵活，支持几乎所有常见的音视频格式。FFmpeg的主要组成部分ffmp
初识金融行业 Alessio Micheli 金融职场和发展
金融行业确实是一个竞争激烈、压力巨大的领域，尤其是对于从业人员来说，考核压力、业绩目标、职场竞争等问题常常让人感到疲惫和焦虑。以下是一些建议，帮助你在这样的环境中更好地应对挑战：1.调整心态，接受现实金融行业的竞争是常态，业绩波动也是不可避免的。接受这一点，可以减少不必要的心理负担。设定合理的目标，不要过于苛求自己，避免陷入“完美主义”的陷阱。2.提升核心竞争力不断学习和提升专业技能，保持对市场的
C++消息总线和数据总线，可实现代码间交互完全解耦 flower980323 C++c++开发语言架构设计模式
特性1.可以解耦所有源文件之间的交互编译依赖，作为中间者控制交互2.可使用不同枚举作为软件的模块消息或是数据标识，且编译无需依赖枚举头文件，可随意修改3.简单，只需少量代码即可实现，支持注册和触发4.消息总线支持优先级，控制消息触发顺序消息总线，可以实现函数调用的解耦#pragmaonce#include#include#include#includeclassMsgHandler{public:
Spring Boot自动配置原理深度解析：揭开@SpringBootApplication的魔法面纱 Sendingab Spring boot 从入门到精通 spring boot 后端 java 前端 spring
SpringBoot自动配置原理深度解析：揭开@SpringBootApplication的魔法面纱https://example.com/spring-boot-auto-config前言SpringBoot的**"约定大于配置"理念极大简化了开发流程，其核心秘密在于自动配置（Auto-Configuration）**机制。本文将深入剖析自动配置的实现原理，手把手教你自定义Starter，彻底掌
链表操作：分区与回文判断共享家9527 数据结构数据结构 c语言开发语言 leetcode 链表
目录链表分区（Partition）功能概述代码实现要点与难点注意事项链表回文判断（PalindromeList）功能概述代码实现要点与难点注意事项总结在链表相关的算法问题中，理解链表的基本结构和操作至关重要。今天我们深入探讨两个经典的链表问题：链表分区和链表回文判断，通过详细分析代码实现，理解其中的要点、难点和注意事项。作者主页：共享家9527-CSDN博客链表分区（Partition）功能概述链
Flutter IconButton完全指南：高效使用与性能优化秘籍帅次 Flutter flutter android ios android studio macos kotlin swift
目录一、引言二、IconButton的基本用法三、进阶技巧3.1自定义形状与背景3.2带文本的IconButton（使用Column组合）3.3自定义交互反馈3.4动态图标切换3.5组合式按钮（图标+文字）四、高级应用4.1与主题深度整合4.2手势扩展（长按/双击）4.3动画增强点击效果五、性能与最佳实践5.1避免重建5.1.1声明常量图标5.1.2带参数的常量图标5.1.3常量图标按钮5.1.4
文本纠错（Text Correction） dundunmm 人工智能数据挖掘文本纠错人工智能数据挖掘文本纠错深度学习
文本纠错（TextCorrection）是自然语言处理（NLP）中的一个重要任务，旨在自动检测并修正文本中的错误，包括拼写、语法、语义等层面的错误。其核心目标是通过算法模型将错误文本转换为符合语言规范的表达。该任务在自动写作辅助、搜索引擎优化、智能客服、教育等多个领域具有广泛应用。输入：包含错误的原始文本（如“我明天要去北京，希望天汽好。”）输出：修正后的规范文本（如“我明天要去北京，希望天气好。
Python,C++开发餐饮后厨环境远程管理APP Geeker-2025 python c++
开发一款用于**餐饮后厨环境远程管理**的App，结合Python和C++的优势，可以实现高效的后端数据处理、实时的环境监控以及用户友好的前端界面。以下是一个详细的开发方案，涵盖技术选型、功能模块、开发步骤等内容。##技术选型###后端（Python）-**编程语言**：Python-**Web框架**：Django或Flask-**数据库**：PostgreSQL或MySQL-**实时通信**：
【面试问题】Java 接口与抽象类的区别刘小炮吖i Java Java后端开发面试题 java 开发语言面试
引言在Java面向对象编程中，接口（Interface）和抽象类（AbstractClass）是两个重要的抽象工具。它们都能定义未实现的方法，但设计目标和使用场景截然不同。本文将通过语法、特性和实际案例，深入解析两者的核心区别。一、基础概念回顾抽象类（AbstractClass）定义：使用abstract关键字声明的类，包含抽象方法（无实现）和具体方法（有实现）。特点：不能被实例化，必须通过子类继
施磊老师高级c++(一) Zhuai-行淮施磊老师cpp c++开发语言
对象被优化后,才是高效的c++编程文章目录对象被优化后,才是高效的c++编程1.对象使用背后调用了哪些方法2.函数调用过程中对象背后调用方法3.总结三条对象优化的规则4.CMyString的代码问题5.添加带右值引用参数的拷贝构造和赋值函数6.String类在vector上的应用--面试题7.move移动语义和forword类型完美转发move移动语义的作用代码:**问题:**解决办法:最终代码:
3.5 Spring Boot邮件服务：从基础发送到模板邮件进阶 Sendingab Spring boot 从入门到精通零基础7天精通Spring Boot spring boot python 后端
SpringBoot邮件服务：从基础发送到模板邮件进阶引言在现代企业级应用中，邮件服务是不可或缺的基础能力。从用户注册验证、密码重置，到订单通知、系统告警，再到营销推广等场景，邮件始终扮演着关键角色。SpringBoot通过spring-boot-starter-mail模块，将JavaMail的复杂配置简化为几行代码即可实现的便捷操作。本文将手把手带您实现从基础文本邮件发送到高级模板邮件的完整开
机器视觉中图像的腐蚀和膨胀是什么意思？它能用来做什么？ yuanpan 机器学习人工智能计算机视觉图像处理
腐蚀（Erosion）和膨胀（Dilation）是两种基本的形态学操作，通常用于二值图像（黑白图像）的处理。它们是形态学图像处理的基础，广泛应用于图像分割、边缘检测、噪声去除等任务。1.腐蚀（Erosion）腐蚀操作通过对图像中的前景区域（通常为白色像素）进行“收缩”来去除边界上的像素。具体来说，腐蚀操作使用一个结构元素（通常是一个小的矩阵或核）在图像上滑动，只有当结构元素完全覆盖前景区域时，中心
目前市场上主流的机器视觉的框架有哪些？他们的特点及优劣 yuanpan 机器学习计算机视觉
目前市场上主流的机器视觉框架和工具可以分为商业软件、开源工具和深度学习框架三大类。以下是它们的总结及特点对比：1.商业软件(1)Halcon(MVTec)特点：专注于工业机器视觉，提供高精度、高效率的算法。支持复杂的工业应用，如缺陷检测、3D视觉、深度学习等。提供图形化开发工具HDevelop和多种编程接口。优势：算法优化好，适合实时工业应用。硬件兼容性强，支持多种工业相机和设备。劣势：商业软件，
matsim开发教程若木胡大数据信息可视化
以下是基于MATSim的二次开发教程指南，结合交通仿真框架的核心功能和开发实践，提供从环境搭建到高级开发的完整路径：一、MATSim简介MATSim（Multi-AgentTransportSimulation）是一个基于Java的开源交通仿真框架，专注于大规模多智能体（Agent）交通行为模拟，支持动态需求建模、路径规划优化、政策评估等应用场景。二、开发环境搭建1.基础依赖JavaJDK11+：
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他