fansy1990

Hadoop MapReduce链式实践--ChainReducer

版本：CDH5.0.0，HDFS：2.3.0，Mapreduce:2.3.0,Yarn:2.3.0。

场景描述：求一组数据中按照不同类别的最大值，比如，如下的数据：

data1:

A,10
A,11
A,12
A,13
B,21
B,31
B,41
B,51

data2:

A,20
A,21
A,22
A,23
B,201
B,301
B,401
B,501

最后输出为：

A,23
B,501

假如这样的逻辑的mapreduce数据流如下：

假设C组数据比较多，同时假设集群有2个节点，那么这个任务分配2个reducer，且C组数据平均分布到两个reducer中，（这样做是为了效率考虑，如果只有一个reducer，那么当一个节点在运行reducer的时候另外一个节点会处于空闲状态）那么如果在reducer之后，还可以再次做一个reducer，那么不就可以整合数据到一个文件了么，同时还可以再次比较C组数据中，以得到真正比较大的数据。

首先说下，不用上面假设的方式进行操作，那么一般的操作方法。一般有两种方法：其一，直接读出HDFS数据，然后进行整合；其二，新建另外一个Job来进行整合。这两种方法，如果就效率来说的话，可能第一种效率会高点。

考虑到前面提出的mapreduce数据流，以前曾对ChainReducer有点印象，好像可以做这个，所以就拿ChainReducer来试，同时为了学多点知识，也是用了多个Mapper（即使用ChainMapper）。

主程序代码如下：

package chain;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.conf.Configured;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.FileInputFormat;
import org.apache.hadoop.mapred.FileOutputFormat;
import org.apache.hadoop.mapred.JobClient;
import org.apache.hadoop.mapred.JobConf;
import org.apache.hadoop.mapred.TextInputFormat;
import org.apache.hadoop.mapred.TextOutputFormat;
import org.apache.hadoop.mapred.lib.ChainMapper;
import org.apache.hadoop.mapred.lib.ChainReducer;
import org.apache.hadoop.util.Tool;
import org.apache.hadoop.util.ToolRunner;

public class ChainDriver2 extends Configured implements Tool{

	/**
	 * ChainReducer 实战
	 * 验证多个reducer的整合
	 * 逻辑：寻找最大值
	 * @param args
	 */
	
	private String input=null;
	private String output=null;
	private String delimiter=null;
	private int reducer=1;
	public static void main(String[] args) throws Exception {
		ToolRunner.run(new Configuration(), new ChainDriver2(),args);
	}
	
	@Override
	public int run(String[] arg0) throws Exception {
		configureArgs(arg0);
		checkArgs();
		Configuration conf = getConf();
		conf.set("delimiter", delimiter);
		JobConf  job= new JobConf(conf,ChainDriver2.class);
		
		ChainMapper.addMapper(job, MaxMapper.class, LongWritable.class,
				Text.class, Text.class, IntWritable.class, true, new JobConf(false)) ;
		
		ChainMapper.addMapper(job, MergeMaxMapper.class, Text.class,
				IntWritable.class, Text.class, IntWritable.class, true, new JobConf(false));
		
		ChainReducer.setReducer(job, MaxReducer.class, Text.class, IntWritable.class,
				Text.class, IntWritable.class, true, new JobConf(false));
		ChainReducer.addMapper(job, MergeMaxMapper.class, Text.class,
				IntWritable.class, Text.class, IntWritable.class, false, new JobConf(false));
		job.setJarByClass(ChainDriver2.class);
		job.setJobName("ChainReducer test job");
		
        job.setMapOutputKeyClass(Text.class);
        job.setMapOutputValueClass(IntWritable.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);
        
       /* job.setMapperClass(MaxMapper.class);
        job.setReducerClass(MaxReducer.class);*/
        job.setInputFormat(TextInputFormat.class);;
        job.setOutputFormat(TextOutputFormat.class);
        job.setNumReduceTasks(reducer);
        
        FileInputFormat.addInputPath(job, new Path(input));
        FileOutputFormat.setOutputPath(job, new Path(output));
        
        JobClient.runJob(job);
		return 0;
	}
	
	
	/**
	 * check the args 
	 */
	private void checkArgs() {
		if(input==null||"".equals(input)){
			System.out.println("no input...");
			printUsage();
			System.exit(-1);
		}
		if(output==null||"".equals(output)){
			System.out.println("no output...");
			printUsage();
			System.exit(-1);
		}
		if(delimiter==null||"".equals(delimiter)){
			System.out.println("no delimiter...");
			printUsage();
			System.exit(-1);
		}
		if(reducer==0){
			System.out.println("no reducer...");
			printUsage();
			System.exit(-1);
		}
	}

	/**
	 * configuration the args
	 * @param args
	 */
	private void configureArgs(String[] args) {
    	for(int i=0;i<args.length;i++){
    		if("-i".equals(args[i])){
    			input=args[++i];
    		}
    		if("-o".equals(args[i])){
    			output=args[++i];
    		}
    		
    		if("-delimiter".equals(args[i])){
    			delimiter=args[++i];
    		}
    		if("-reducer".equals(args[i])){
    			try {
    				reducer=Integer.parseInt(args[++i]);
				} catch (Exception e) {
					reducer=0;
				}
    		}
    	}
	}
	public static void printUsage(){
    	System.err.println("Usage:");
    	System.err.println("-i input \t cell data path.");
    	System.err.println("-o output \t output data path.");
    	System.err.println("-delimiter  data delimiter , default is blanket  .");
    	System.err.println("-reducer  reducer number , default is 1  .");
    }
	
}

MaxMapper：

package chain;

import java.io.IOException;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.JobConf;
import org.apache.hadoop.mapred.MapReduceBase;
import org.apache.hadoop.mapred.Mapper;
import org.apache.hadoop.mapred.OutputCollector;
import org.apache.hadoop.mapred.Reporter;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

public class MaxMapper extends MapReduceBase implements Mapper<LongWritable ,Text,Text,IntWritable>{
	private Logger log = LoggerFactory.getLogger(MaxMapper.class);
	private String delimiter=null;
	@Override
	public void configure(JobConf conf){
		delimiter=conf.get("delimiter");
		log.info("delimiter:"+delimiter);
		log.info("This is the begin of MaxMapper");
	}
	
	@Override
	public void map(LongWritable key, Text value,
			OutputCollector<Text, IntWritable> out, Reporter reporter)
			throws IOException {
		// TODO Auto-generated method stub
		String[] values= value.toString().split(delimiter);
		log.info(values[0]+"-->"+values[1]);
		out.collect(new Text(values[0]), new IntWritable(Integer.parseInt(values[1])));
		
	}
	public void close(){
		log.info("This is the end of MaxMapper");
	}
}

MaxReducer：

package chain;

import java.io.IOException;
import java.util.Iterator;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.JobConf;
import org.apache.hadoop.mapred.MapReduceBase;
import org.apache.hadoop.mapred.OutputCollector;
import org.apache.hadoop.mapred.Reducer;
import org.apache.hadoop.mapred.Reporter;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

public   class MaxReducer extends MapReduceBase implements Reducer<Text,IntWritable,Text,IntWritable>{
	private Logger log = LoggerFactory.getLogger(MaxReducer.class);
	@Override
	public void configure(JobConf conf){
		log.info("This is the begin of the MaxReducer");
	}
	@Override
	public void reduce(Text key, Iterator<IntWritable> values,
			OutputCollector<Text, IntWritable> out, Reporter reporter)
			throws IOException {
		// TODO Auto-generated method stub
		int max=-1;
		while(values.hasNext()){
			int value=values.next().get();
			if(value>max){
				max=value;
			}
		}
		log.info(key+"-->"+max);
		out.collect(key, new IntWritable(max));
		
	}
	
	@Override
	public void close(){
		log.info("This is the end of the MaxReducer");
	}
}

MergeMaxMapper：

package chain;

import java.io.IOException;
//import java.util.ArrayList;
//import java.util.HashMap;
//import java.util.Map;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.JobConf;
import org.apache.hadoop.mapred.MapReduceBase;
import org.apache.hadoop.mapred.Mapper;
import org.apache.hadoop.mapred.OutputCollector;
import org.apache.hadoop.mapred.Reporter;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

public class MergeMaxMapper extends MapReduceBase implements Mapper<Text ,IntWritable,Text,IntWritable>{
	private Logger log = LoggerFactory.getLogger(MergeMaxMapper.class);
//	private Map<Text,ArrayList<IntWritable>> outMap= new HashMap<Text,ArrayList<IntWritable>>();
	@Override
	public void configure(JobConf conf){
		log.info("This is the begin of MergeMaxMapper");
	}
	
	@Override
	public void map(Text key, IntWritable value,
			OutputCollector<Text, IntWritable> out, Reporter reporter)
			throws IOException {
		log.info(key.toString()+"_MergeMaxMapper"+"-->"+value.get());
		out.collect(new Text(key.toString()+"_MergeMaxMapper"), value);
		
	}
	
	@Override
	public void close(){
		log.info("this is the end of MergeMaxMapper");
	}
}

编程思路如下：原始测试数据data1、data2首先经过MaxMapper（由于两个文件，所以生成了2个map），然后经过MergeMaxMapper，到MaxReducer，最后再次经过MergeMaxMapper。

在程序中添加了输出数据的log，可以通过log来查看各个map和reduce的数据流程。

mapper端的log（其中的一个mapper）：

2014-05-14 17:23:51,307 INFO [main] chain.MaxMapper: delimiter:,
2014-05-14 17:23:51,307 INFO [main] chain.MaxMapper: This is the begin of MaxMapper
2014-05-14 17:23:51,454 INFO [main] chain.MergeMaxMapper: This is the begin of MergeMaxMapper
2014-05-14 17:23:51,471 INFO [main] chain.MaxMapper: A-->20
2014-05-14 17:23:51,476 INFO [main] chain.MergeMaxMapper: A_MergeMaxMapper-->20
2014-05-14 17:23:51,476 INFO [main] chain.MaxMapper: A-->21
2014-05-14 17:23:51,477 INFO [main] chain.MergeMaxMapper: A_MergeMaxMapper-->21
2014-05-14 17:23:51,477 INFO [main] chain.MaxMapper: A-->22
2014-05-14 17:23:51,477 INFO [main] chain.MergeMaxMapper: A_MergeMaxMapper-->22
2014-05-14 17:23:51,477 INFO [main] chain.MaxMapper: A-->23
2014-05-14 17:23:51,477 INFO [main] chain.MergeMaxMapper: A_MergeMaxMapper-->23
2014-05-14 17:23:51,477 INFO [main] chain.MaxMapper: B-->201
2014-05-14 17:23:51,477 INFO [main] chain.MergeMaxMapper: B_MergeMaxMapper-->201
2014-05-14 17:23:51,477 INFO [main] chain.MaxMapper: B-->301
2014-05-14 17:23:51,477 INFO [main] chain.MergeMaxMapper: B_MergeMaxMapper-->301
2014-05-14 17:23:51,478 INFO [main] chain.MaxMapper: B-->401
2014-05-14 17:23:51,478 INFO [main] chain.MergeMaxMapper: B_MergeMaxMapper-->401
2014-05-14 17:23:51,478 INFO [main] chain.MaxMapper: B-->501
2014-05-14 17:23:51,478 INFO [main] chain.MergeMaxMapper: B_MergeMaxMapper-->501
2014-05-14 17:23:51,481 INFO [main] chain.MaxMapper: This is the end of MaxMapper
2014-05-14 17:23:51,481 INFO [main] chain.MergeMaxMapper: this is the end of MergeMaxMapper

通过上面log，可以看出，通过ChainMapper添加mapper的方式的mapper的处理顺序为：首先初始化第一个mapper（即调用configure方法）；接着初始第二个mapper（调用configure方法）；然后开始map函数，map函数针对一条记录，首先采用mapper1进行处理，然后使用mapper2进行处理；最后是关闭阶段，关闭的顺序同样是首先关闭mapper1（调用close方法），然后关闭mapper2。

reducer端的log（其中一个reducer）

2014-05-14 17:24:10,171 INFO [main] chain.MergeMaxMapper: This is the begin of MergeMaxMapper
2014-05-14 17:24:10,311 INFO [main] chain.MaxReducer: This is the begin of the MaxReducer
2014-05-14 17:24:10,671 INFO [main] chain.MaxReducer: B_MergeMaxMapper-->501
2014-05-14 17:24:10,672 INFO [main] chain.MergeMaxMapper: B_MergeMaxMapper_MergeMaxMapper-->501
2014-05-14 17:24:10,673 INFO [main] chain.MergeMaxMapper: this is the end of MergeMaxMapper
2014-05-14 17:24:10,673 INFO [main] chain.MaxReducer: This is the end of the MaxReducer

通过上面的log可以看出，通过ChainReducer添加mapper的方式，其数据处理顺序为：首先初始化Reducer之后的Mapper，接着初始化Reducer（看configure函数即可知道）；然后处理reducer，reducer的输出接着交给mapper处理；最后先关闭Mapper，接着关闭reducer。

同时，注意到，reducer后面的mapper也是两个的，即有多少个reducer，就有多少个mapper。

通过实验得到上面的ChainReducer的数据处理流程，且ChainReducer没有addReducer的方法，也即是不能添加reducer了，那么最开始提出的mapreduce数据流程就不能采用这种方式实现了。

最后，前面提出的mapreduce数据流程应该是错的，在reducer out里面C组数据不会被拆分为两个reducer，相同的key只会向同一个reducer传输。这里同样做了个试验，通过对接近90M的数据（只有一个分组A）执行上面的程序，可以看到有2个mapper，2个reducer（此数值为设置值），但是在其中一个reducer中并没有A分组的任何数据，在另外一个reducer中才有数据。其实，不用试验也是可以的，以前看的书上一般都会说相同的key进入同一个reducer中。不过，如果是这样的话，那么这样的数据效率应该不高。

返回最开始提出的场景，最开始提出的问题，如果相同的key只会进入一个reducer中，那么最后的2个数据文件（2个reducer生成2个数据文件）其实里面不会有key冲突的数据，所以在进行后面的操作的时候可以直接读多个文件即可，就像是读一个文件一样。

会产生这样的认知错误，应该是对mapreduce 原理不清楚导致。

分享，成长，快乐

转载请注明blog地址：http://blog.csdn.net/fansy1990

【大模型面试】大模型Prompt Engineer面试题及参考答案大模型知识 prompt 人工智能开发语言 python chatgpt 深度学习大模型
一、基础概念类1.什么是大模型？大模型通常指具有庞大参数规模的机器学习模型，尤其是在自然语言处理（NLP）和计算机视觉等领域。这些模型能够学习到大量数据中的复杂模式和特征，具备强大的泛化能力，可在多种任务上表现出色，如GPT系列、BERT等。2.大模型与传统机器学习模型的区别是什么？传统机器学习模型参数规模相对较小，往往针对特定任务进行设计和训练，需要较多人工特征工程。而大模型参数数量庞大，通过在
大规模预训练语言模型的参数高效微调
人工智能咨询培训老师叶梓转载标明出处大规模预训练语言模型（PLMs）在特定下游任务上的微调和存储成本极高，这限制了它们在实际应用中的可行性。为了解决这一问题，来自清华大学和北京人工智能研究院的研究团队探索了一种优化模型中一小部分参数的方法，同时保持其他参数不变，以大幅降低计算和存储成本。研究团队提出了“delta-tuning”这一概念，将优化的参数部分称为“delta”，即在训练过程中被“改变”
大语言模型应用提示工程Prompt Engineering 全栈你个大西瓜人工智能大模型自然语言处理 prompt 人工智能提示工程
提示工程（PromptEngineering）是指通过精心设计和优化输入提示（prompt），以引导人工智能模型（如大型语言模型）生成更符合预期的输出。一、提示工程的核心任务明确任务目标确定模型需要完成的具体任务（如文本生成、翻译、分类、问答等）。示例：需要模型生成一篇产品评测vs.需要模型总结文章要点。设计提示结构包含必要的上下文、示例、格式要求和约束条件。示例：请根据以下产品参数生成一段吸引人
ToT：思维树：借助大语言模型进行审慎的问题求解 AI专题精讲 Paper阅读语言模型人工智能大模型
摘要语言模型正日益被部署于广泛任务中的通用问题求解，但在推理阶段仍受限于token级、从左到右的决策过程。这意味着在需要探索、战略前瞻，或初始决策起关键作用的任务中，语言模型可能表现不佳。为克服这些挑战，我们提出了一种新的语言模型推理框架——“思维树（TreeofThoughts,ToT）”，它是对当前广泛使用的“思维链（ChainofThought）”提示方法的推广，能够在连贯的文本单元（即“思
使用系统监视工具如何判断CPU、内存和磁盘I/O的瓶颈？
1.CPU性能（1）平均负载，通过top或uptime命令可以显示系统平均负载。在一段时间之内，若系统有n个CPU且平均负载小于n，则说明某些CPU还有空闲的时间片处理任务；反之则说明CPU工作繁忙。（2）和心态和用户提进程：通过top或vmstat命令可以显示核心态和用户态进程。在一段时间之内，当sy%+us%90%表示系统负荷很重，CPU资源短缺。在一段时间之内，若持续地id%2us%，表示C
OpenCV图像边缘检测慕婉0307 opencv基础 opencv 人工智能计算机视觉
一、边缘检测基础概念边缘检测是图像处理中最基本也是最重要的操作之一，它能识别图像中亮度或颜色急剧变化的区域，这些区域通常对应物体的边界。OpenCV提供了多种边缘检测方法，从传统的算子到基于深度学习的现代方法。1.1为什么需要边缘检测？数据降维：将图像转换为边缘表示可大幅减少数据量特征提取：边缘是图像最重要的视觉特征之一预处理步骤：为物体识别、图像分割等高级任务做准备噪声抑制：某些边缘检测方法具有
破译AI黑箱：如何用20行Python理解ChatGPT？ Ven% 简单入门pytorch 人工智能 python chatgpt
文章目录一、核心概念：大模型本质二、代码逐行解析（以线性回归为例）三、关键概念详解四、与大模型的本质联系五、大模型训练核心思想六、如何扩展成真实大模型七、总结：AI训练的本质一、核心概念：大模型本质大模型=复杂数学函数+数据驱动训练现实任务（如图像识别、语言翻译）过于复杂，人类无法直接编写数学函数解决。解决方案：构建参数化的数学模型（如神经网络）用大量数据训练，自动寻找最优参数得到能解决特定任务的
【PHP】增量式垃圾回收 gskyi php
增量式垃圾回收（IncrementalGarbageCollection,IGC）是一种分阶段、逐步进行垃圾回收的技术，旨在减少全量垃圾回收带来的性能开销。与传统的全量垃圾回收相比，增量式垃圾回收将垃圾回收的任务分解为多个小步骤，并在多个周期中执行，而不是一次性地执行所有回收任务。在增量式垃圾回收中，整个回收过程被划分为多个较小的“增量”阶段，每个阶段执行一小部分工作。这样做的好处是，垃圾回收的执
Python时间管理工具：实现定时任务的时间点循环更新龙潜月七 python java 服务器
Python时间管理工具：实现定时任务的时间点循环更新在自动化任务、定时推送等场景中，我们常常需要按照预设的时间点循环执行操作。本文将介绍一个实用的Python工具，它可以根据预设的时间点列表自动计算下一个执行时间，并将其保存到文件中，适用于定时任务调度、内容发布等场景。一、工具功能与应用场景这个时间管理工具的核心功能是：维护一个预设时间点列表（如每天6:00、12:00、18:00、22:00）
Laravel的瑞士军刀：Artisan命令行工具的多面用途 2401_85743969 laravel php
Laravel的瑞士军刀：Artisan命令行工具的多面用途LaravelArtisan命令行工具是Laravel框架的核心组件之一，它为开发者提供了一个强大而灵活的命令行界面，用于执行各种日常任务和自动化操作。从生成应用代码到管理数据库，Artisan工具箱中的命令几乎涵盖了Laravel开发的所有方面。本文将深入探讨LaravelArtisan命令行工具的多种用途，并通过实际代码示例，展示如何
什么是栗子表格？——一款为教育与办公场景而生的智能表格提取工具流形填表自动化 word excel ai
“我们不需要更多的AI，而是更聪明地完成琐碎工作的工具。”在日常工作中，尤其是教育、培训、行政管理等领域，几乎每个人都面对过这样一个重复任务：拿到几十份Word文档；每份里面都有表格；我们需要把这些表格中的信息整理成Excel，便于后续统计、导入或上传平台……这本应该是自动化完成的事，但现实中却依然靠人工复制粘贴、手动校对、字段比对，效率低不说，出错率还高。我们开发的工具「栗子表格」，就是为了解决
AI办公自动化：用kimi批量将word文档部分文件名保存到Excel中 AIGCTribe 人工智能 word excel
文件夹中有很多个word文档，现在只要英文部分的文件名，保存到一个Excel文件中。可以在kimi中输入提示词：你是一个Python编程专家，要完成一个编写Python脚本的任务，具体步骤如下：打开文件夹：F:\AI自媒体内容\AI视频教程下载\新建文件夹读取文件夹里面所有docx文档的文件名；去掉文件名中的“AI视频教程下载：”，剩下的文件名保存到Excel文件“新建XLSX工作表.xlsx”的
！LangChain链的并行执行与异步处理深度解析(32) Android 小码蜂测试专栏 langchain
LangChain链的并行执行与异步处理深度解析一、LangChain链的基础概念与执行逻辑1.1LangChain链的定义与作用LangChain链（Chain）是LangChain框架的核心组件之一，它通过将多个组件（如提示模板、大语言模型、输出解析器等）串联起来，形成一个完整的处理流程，以实现特定的自然语言处理任务。例如，在问答系统中，链可以先使用提示模板构建问题，然后调用大语言模型生成回答
SpringBoot教程（二十二） | SpringBoot实现分布式定时任务之elastic-job Slow菜鸟 #SpringBoot学习篇 spring boot 分布式后端
SpringBoot教程（二十二）|SpringBoot实现分布式定时任务之elastic-job简介适用场景前置条件：需要ZooKeeper配合1、引入相关依赖2、application.yml中配置注册中心和作业调度巨坑（配置修改无效）3、job实例4、ElasticJob-UI监控平台（相当于管理端页面）参考文章：【1】SpringBoot整合分布式任务调度Elastic-Job【2】Ela
分布式作业: Elastic-Job 赤橙红的黄 Spring 分布式
1.背景介绍Spring框架自带的定时任务scheduled如果部署多台机器时，同一个任务会执行多次，比如给用户计算收益定时任务，每天定时给用户计算收益，如果部署了多台，同一个用户将重复计算多次收益（业务错误），但如果只部署一台机器，无法保证高可用性，如果定时任务机器宕机，无法故障转移；Elastic-Job基于Zookeeper、Quartz开发的Java分布式定时任务解决方案。2.优点高可用性
分布式定时任务：Elastic-Job-Lite
Elastic-Job-Lite是一款由Apache开源的轻量级分布式任务调度框架，属于ShardingSphere生态体系的一部分。它专注于分布式任务调度，支持弹性伸缩、分片处理、高可用等特性，且不依赖中心化架构。一、基础（一）核心特性分布式协调通过ZooKeeper实现作业的分布式调度和协调，确保任务在集群环境中不重复、不遗漏地执行。分片机制支持将任务拆分为多个分片（Sharding）并行执行
43.Textbox的数据绑定 C#例子 WPF例子军训猫猫头 c#wpf java
固定最简步骤，包括XAML：题头里引入命名空间标题下面引入类box和block绑定属性C#：通知的类，及对应固定的任务引入字段引入属性属性双触发，其中一个更新block的属性block=>指向box的属性从Textbox这行看binding是绑定的意思，后面的inputtext是类里的一个属性意思就是它的文本和这个属性绑定了updatesourcetrigger是一个触发，后面等号后的内容是不同的
大文件上传类设计（OC实现）瓜子三百克 iOS开发 ios oracle objective-c
下面我将设计一个支持断点续传、多线程上传的大文件上传类，采用Objective-C实现，考虑线程安全、数据库持久化和高效上传。设计概览类文件划分FileUploadManager.h/m-上传任务管理中心FileUploadTask.h/m-单个上传任务控制ChunkUploadOperation.h/m-分块上传操作UploadDatabaseManager.h/m-数据库操作FileChunk
c语言程序设计基础教案,《c语言编程基础》电子教案 weixin_39906114 c语言程序设计基础教案
《c语言编程基础》电子教案宾县职业技术教育中心学校教导处制课题(内容)1.1C语言简史及特点课时1教学任务分析知识技能通过本节课的教学，使学生了解并熟悉编程语言C的发展历史、特点及其种类和适用范围。过程与方法通过C语言的发展，引出C语言的特点，从而激学生学好本门课程的兴趣。教学目标情感态度培养学生的动脑思考能力重点C语言的特点难点C语言的特点课前准备教具学具补充材料教材、教案笔记教学流程设计教师活
Python 数据结构之队列（Queue）
Python中的队列（Queue）概述队列是一种遵循先进先出（FIFO,FirstInFirstOut）原则的线性数据结构，这意味着最早进入队列的元素将最先被移除。常用于任务调度、缓冲区管理等场景。Python提供了多种实现队列的方式，包括内置模块和第三方库。Python中queue的主要类型Python的queue模块提供了几种常用的队列类型，每种类型都有其独特的特性和应用场景。1.QueueQ
RabbitMQ(rabbitmq-delayed-message-exchange)实现延时任务 qiang_gege rabbitmq rabbitmq 分布式 spring boot 中间件
引言：什么是延时任务？在我们生活中比较常业务见场景的如下：红包24小时未被查收，需要延迟执退还业务；订单下单之后30分钟后，用户如果没有付钱，系统需要自动取消订单在如上场景中延时周期为固定时段。另外还有一种延时周期不固定的业务场景如下：业务场景：平台方发布预运行计划，预计划中需限定申报截至时间，参与方需在截止前申报各自实际运行计划给平台后由平台统筹运行计划安排。需求分析：由于是预计划，会存在截至时
LLM归因的限制和挑战
LLM归因虽然能提升任务性能和模型的可解释性，但面临多个方面的限制。参考ASurveyofLargeLanguageModelsAttribution，LLM归因的限制和挑战总结如下1）难以确定何时以及如何进行归因LLM区分一般知识(可能不需要引文)和专业知识(需要归因)是一项微妙的任务，难以达成一致。2）归因的准确性无法得到保证LLM可能会将生成的答案和不相关或错误的来源关联起来，这种错误归因可
react控制打印机打印_React实现浏览器打印指定内容 weixin_39637179 react控制打印机打印
近期着手项目任务的打印功能，在此作个记录，本文介绍基于React的一种调用浏览器打印页面指定内容的方法。整体思路：通过构建一个隐藏的元素(该元素包裹需打印的内容)，当打印行为触发时，将页面其他的一些不需要打印的元素隐藏，然后将需打印的元素追加到body中，打印完成后，再恢复初始状态即可。浏览器打印的本质还是将web页面中的元素打印出来而已。1.构建待打印元素在页面中构建一个display为none
Python 进攻性渗透测试（二）
原文：annas-archive.org/md5/dccde1d96c9ad81f97529d78e3e69c9b译者：飞龙协议：CCBY-NC-SA4.0第四章：追捕我吧！在今天的世界里，绕过和劫持软件在互联网上到处都是。然而，明确的使用和执行方式才是让你成为一名优秀的业余黑客的关键。这可以通过正确选择工具并遵循必要的过程，完美地完成手头的任务来实现。在本章中，我们将涵盖以下主题，帮助你实现这一
航天器基频：概念、影响因素、应用与计算方法
航天器基频：概念、影响因素、应用与计算方法1.引言在航天器结构设计中，基频（FundamentalFrequency）是一个至关重要的动力学参数，它直接影响航天器在发射、在轨运行及变轨过程中的振动特性。基频过低可能导致航天器与运载火箭或外部激励发生共振，引发结构失效。因此，准确计算和控制航天器的基频是航天工程中的核心任务之一。本文将从基本概念、影响因素、应用领域和计算方法四个方面详细介绍航天器的基
Kotlin协程与异步编程
协程通过轻量级线程模型和挂起机制，彻底改变了Android开发和服务器端编程的异步处理方式。今天我们将聚焦于Kotlin协程这一现代异步编程的核心工具。下面直接开始一、协程基础架构解析1.1协程的轻量级特性协程并非传统线程，而是通过状态机实现的协作式任务调度单元。单个线程可承载数千个协程，其内存占用仅为线程的1/100。例如：funmain()=runBlocking{repeat(10_000)
Hadoop入门案例WordCount 码喵喵 hadoop mapreduce 大数据
wordcount可以说是hadoop的入门案例，也是基础案例主要体现思想就是mapreduce核心思想原始文件为hadoop.txt，内容如下：hello,javahello,java,linux,hadoophadoop,java,linuxhello,java,linuxlinux,c,javac,php,java在整个文件中单词所出现的次数Hadoop思维：Mapreduce-----》M
Hadoop入门案例 'Wu' 学习日常大数据 hadoop hdfs 大数据
Hadoop的运行流程：客户端向HDFS请求文件存储或使用MapReduce计算。NameNode负责管理整个HDFS系统中的所有数据块和元数据信息；DataNode则实际存储和管理数据块。客户端通过NameNode查找需要访问或处理的文件所在的DataNode，并将操作请求发送到相应的DataNode上。当客户端上传一个新文件时（比如输入某些日志），它会被分成固定大小（默认64MB）并进行数据复
【Python基础】13 知识拓展：CPU、GPU与NPU的区别和联系智算菩萨 python 开发语言人工智能
引言：处理器大战背后的技术革命在人工智能蓬勃发展的今天，我们经常听到CPU、GPU、NPU这些术语，但你是否真正理解它们之间的区别和联系？作为Python开发者，我们更关心的是：在什么场景下选择哪种处理器？如何在Python中充分发挥它们的性能优势？这篇文章将从技术原理出发，结合Python实战代码，深入解析这三种处理器的特点、应用场景和发展趋势，帮助你在面对不同计算任务时做出最优选择。第一章：C
AI 大模型重塑软件开发流程的四点观察：跃迁/重构/变革/挑战敖行客 Allthinker Thinker说人工智能大模型
作为软件开发的从业者，笔者深刻感受到AI大模型对开发流程的颠覆性影响。从最初的代码补全工具到如今能够自主完成复杂任务的智能协作者，AI的角色转变正推动软件开发范式发生系统性变革。基于实际开发经验与行业案例，从四个维度，浅显讲述一下AI大模型重塑软件开发流程的观察。观察一：编码能力突破——从“助手”到“协作者”的技术跃迁核心变化：AI从“补全代码片段”进化为“自主构建完整系统”过去，AI在开发中的角
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found

Hadoop MapReduce链式实践--ChainReducer

你可能感兴趣的:(chainmapper,chainreducer,hadoop链式任务)