king_tt

MapReduce流程分析

MapReduce流程分析

接触Hadoop已经1年了，一直没时间好好学习下。这几天打算好好研究下Hadoop.本来是想打算改写下TextInputFormat。看了源码后，反而更迷糊了。所以干脆连MapReduce的整个流程写下来。也当为这几天的学习作个总结。

先来一个我们常写的main函数。

Configuration conf = new Configuration();

String[] otherArgs = new GenericOptionsParser(conf, args).getRemainingArgs();

if (otherArgs.length != 2){

System.exit(2);

}

Job job = new Job(conf, "wordcount");

job.setJarByClass(mywordcount.class);

job.setInputFormatClass(TextInputFormat.class);

job.setOutputKeyClass(Text.class);

job.setOutputValueClass(IntWritable.class);

job.setMapperClass(wordcountMapper.class);

job.setReducerClass(wordcountReduce.class);

job.setCombinerClass(wordcountReduce.class);

FileInputFormat.setInputPaths(job, new Path(otherArgs[0]));

FileOutputFormat.setOutputPath(job, new Path(otherArgs[1]));

job.waitForCompletion(true);

上述程序我就不分析。直接来分析下运行流程。

在master节点的NameNode, SecondedNameNode,JobTracker和slaves节点的DataNode, TaskTracker都已经启动后，JobTracker一直在等待JobClient通过RPC提交作业,而TaskTracker一直通过RPC向 JobTracker发送心跳heartbeat询问有没有任务可做。

而主程序中通过job.waitForCompletion(true)函数通过调用JobClient.runJob()函数将MapReduce作业交与JobTrack进行执行。

1：JobClient.runJob()

runjob会根据用户的设置（job.setInputFormatClass（））来将需要输入的数据划分成小的数据集，同时返回划分后split想的相应信息（这里的split路径信息我估计应该是hdfs里的路径和偏移，因为我们要处理的数据早应该上传到了hdfs系统）。同时根据split设置MapTask的个数。获取了上面信息后，就将运行任务所需要的全部数据、信息全部上传至HDFS。上传的内容主要包括三个包： job.jar, job.split和job.xml

job.xml: 作业配置，例如Mapper, Combiner, Reducer的类型，输入输出格式的类型等。
job.jar: jar包,里面包含了执行此任务需要的各种类，比如 Mapper,Reducer等实现。
job.split: 文件分块的相关信息，比如有数据分多少个块，块的大小(默认64m)等。

进行完上述工作后，本地的工作就完成了，函数jobSubmitClient.submitJob(jobId)调用真正的JobTracker执行Task。

2:JobTracker.submitJob()

当JobTracker接收到新的job请求（即submitJob()函数被调用）后，会创建一个JobInProgress对象并通过它来管理和调度任务。JobInProgress在创建的时候会初始化一系列与任务有关的参数，调用FileSystem，把在JobClient端上传的所有任务文件下载到本地的文件系统中的临时目录里。这其中包括上传的*.jar文件包、记录配置信息的xml、记录分割信息的文件。

在JobTracker的构造函数中，会生成一个taskScheduler成员变量，来进行Job的调度,默认为JobQueueTaskScheduler，也即按照FIFO的方式调度任务。而在offerService函数中也为JobTracker(也即taskScheduler的taskTrackerManager)注册了两个Listener：

JobQueueJobInProgressListener jobQueueJobInProgressListener用于监控job的运行状态
EagerTaskInitializationListener eagerTaskInitializationListener用于对Job进行初始化

EagerTaskInitializationListener的jobAdded函数就是向jobInitQueue中添加一个JobInProgress对象，于是自然触发了此Job的初始化操作。由JobInProgress的initTasks函数完成：

3：initTasks（）

任务Task分两种: MapTask 和reduceTask，它们的管理对象都是TaskInProgress 。

在initTasks函数，会通过JobClient的readSplitFile()获得已分解的输入数据的RawSplit列表，然后通过这个列表创建相应的TaskInProgress(MapTask)同时还会读取相应数据块所在DataNode的主机名（通过FileSplit的getLocations()函数获取）。创建完TaskInProgress后，就会调用createCache()方法为这些TaskInProgress对象产生一个未执行任务的Map缓存nonRunningMapCache。当TaskTracker向JobTrack中发送心跳，请求任务时，就会去直接去这个缓存中取任务。

JobInProgress也会创建Reduce的监控对象- TaskInProgress，而这个的数量就是根据用户在程序里的设置，默认的是一个。同样地，initTasks()也会通过createCache()方法产生nonRunningReduceCache成员。JobInProgress再接着进行清理工作。最后再记录一下Job的执行日志。

至此Job的初始化就全部完成。

4：TaskTracker

TaskTracker从启动后，就每隔一定的时间向JobTracker发送一次心跳(默认10s，发送的内容包括自己的当前状态，当满足一定状态时就可以向JobTracker申请新的任务。如Map Task、 Reduce Task都还有运行的能力)通过transmitHeartBeat()发送心跳后再接受JobTracker返回的HeartbeatResponse。然后调用HeartbeatResponse的getActions()函数获得JobTracker传过来的所有指令即一个TaskTrackerAction数组。再遍历这个数组，就可以知道需要完成的事情。（这些事情可能是LaunchTaskAction 执行新任务、 KillTaskAction 结束一个任务）如果有分配好的任务将其加入队列，调用addToTaskQueue，如果是map task则放入mapLancher(类型为TaskLauncher)，如果是reduce task则放入reduceLancher(类型为TaskLauncher)

5 JobTracker：heartbeat（）

JobTracker是通过heartbeat（）函数来接受TaskTracker的心跳，如果TaskTracker是请求任务的指令。Heartbeat（）函数就会调用默认的任务调度器（JobQueueTaskScheduler）来分配任务。先计算Map和Reduce的剩余工作量，再计算每个TaskTracker应有的工作量。如果TaskTracker上运行的map task数目小于平均的工作量，则向其分配map task。分配完Map Task后再分配Reduce task.而这里有一个函数findNewMapTask（）就是从nonRunningMapCache和nonRunningReduceCache中查找出map task的TaskInProgress和Reduce task. 的TaskInProgress再返回给TaskTracker。

findNewMapTask()从近到远一层一层地寻找，首先是同一节点，然后在寻找同一机柜上的节点，接着寻找相同数据中心下的节点，直到找了maxLevel层结束。这样的话，在JobTracker给TaskTracker派发任务的时候，可以迅速找到最近的TaskTracker，让它执行任务。(通过寻找本任务split所在的DataNode,然后判断发送心跳的TaskTracker和本任务split所在的DataNode是不是同一主机。如果是则分配这个MapTask给发送心跳的Tracker，如果不是者返回null不进行分配。)

再调用localizeJob（）进行真正的初始化（TaskTracker上的Task）。而localizeJob又调用TaskLauncher

6：TaskLauncher

TaskLauncher是一个线程就是从上面的队列中取出TaskInProgress然后调用startNewTask(TaskInProgress tip)来启动一个task。

这里又会再次将Task有关的数据包、信息包从HDFS拷贝回本地文件系统包括：job.split，job.xml以及job.jar，当所有的资源拷贝回来后，就调用launchTaskForJob()开始执行Task.

launchTaskForJob函数又调用launchTask（）

7：launchTask（）

launchTask()函数首先通过createRunner（）函数是创建MapTaskRunner来启动子进程和创建ReduceTaskRunner来启动子进程。TaskRunner负责将一个任务放到一个进程里面来执行。它会调用run()函数来处理。run()函数会初始化一系列环境变量等。最后生成一个新进程并运行即runChild。

8 Child进程

真正的map task和reduce task都是在Child进程中运行的。Child进程会运行Task.

9：MapTask

如果是MapTask，MapTask.run()首先向TaskTracker汇报情况，再设置Mapper的输出格式。接着读取input split，按照其中的信息，生成RecordReader来读取数据。这其中会生成一个MapRunnable

，而MapRunnable要完成的任务就时通过RecordReader的next函数读取循环从split中读取交给map函数进行处理，然后使用OutputCollector收集每次处理对后得到的新的对.

10:OutputCollector

OutputCollector的作用是收集每次调用map后得到的新的kv对，宁把他们spill到文件或者放到内存，以做进一步的处理，比如排序，combine等。

MapOutputCollector 有两个子类：MapOutputBuffer和DirectMapOutputCollector。 DirectMapOutputCollector用在不需要Reduce阶段的时候。如果Mapper后续有reduce任务，系统会使用MapOutputBuffer做为输出， MapOutputBuffer使用了一个缓冲区对map的处理结果进行缓存，放在内存中.在适当的时机，缓冲区中的数据会被spill到硬盘中。spillThread线程实现将缓冲区的数据写入硬盘。

向硬盘中写数据的时机:

（1）当内存缓冲区不能容下一个太大的kv对时。spillSingleRecord方法。

（2）内存缓冲区已满时。SpillThread线程。

（3）Mapper的结果都已经collect了，需要对缓冲区做最后的清理。Flush方法。

11：ReduceTask

ReduceTask .run()函数同样先进行一系列的初始化工作。之后进入正式的工作，主要有这么三个步骤：Copy、Sort、Reduce。

11.1:copy

copy就是从执行各个Map任务的服务器那里，搜罗map的输出文件。

拷贝的任务的是由ReduceTask.ReduceCopier 类来负责。ReduceCopier先向父TaskTracker询问此作业个Map任务的完成状况，获取到map服务器的相关信息后由线程MapOutputCopier做具体的拷贝工作。在拷贝过来的同时也会做一些归并排序以减轻后面sort的负担。

11.2 Sort

排序工作，就相当于上述排序工作的一个延续。它会在所有的文件都拷贝完毕后进行。使用工具类Merger归并所有的文件。经过这一个流程，一个合并了所有所需Map任务输出文件的新文件产生了。而那些从其他各个服务器网罗过来的 Map任务输出文件，全部删除了。

11.3Reduce

Reduce任务的最后一个阶段。

输入方面：他会准备根据自定义或默认的KeyClass、ValueClass构造出Reducer所需的键类型，和值的迭代类型Iterator

输出方面：它会准备一个OutputCollector收集输出与MapTask不同，这个OutputCollector更为简单，仅仅是打开一个RecordWriter，collect一次(排序完成的那个文件)，write一次（写往HDFS）。

有了输入，有了输出，不断循环调用自定义的Reducer，最终，Reduce阶段完成。

写本文之际参看了很多牛人的大作，在这里一并感谢。

最后，我还有三个问题没理解，请教高手解答一下。

Des1:当Jobtracker向Tasktracker分配任务时是先判断Tasktracker上运行的Task是否小于平均工作量，小于者向其分配Task。（假如我们这里是MapTask。）然后调用函数obtainNewMapTask()中的findNewMapTask（）来查找nonRunningMapCache中的TaskInProgress。
findNewMapTask（）函数会从近到远一层一层地寻找。首先是同一节点，然后在寻找同一机柜上的节点，接着寻找相同数据中心下的节点，直到找了maxLevel层结束。（这段话是我从网上看到的。没理解这句话的意思。）
Q1:我想请问下， findNewMapTask在这里寻找的是什么？（TaskTracker）我的理解是：通过寻找本任务split所在的DataNode,然后判断发送心跳的TaskTracker和本任务split所在的DataNode是不是同一主机。如果是则分配这个MapTask给发送心跳的Tracker，如果不是者返回null不进行分配。如果我理解错了，请解释下。谢谢了。

Des2:当客户端提交任务后，首先会通过用户设置的InputFormat将文件进行划分。而hadoop默认的TextInputFormat.class.查看源码知道。TextInputFormat是继承的FileInputFormat.并且将isSplitable进行了关闭。所以默认的是不对文件进行划分。
Q2:在运行一个MapReduce程序时，原始数据都会提前上传到HDFS文件系统，大于64M的文件都会被划分存储到多个DataNode。。假如我有一个128M的文件上传到了HDFS，那天文件应该被划分成了2份。那么TextInputFormat在处理输入时不对文件进行划分，在TaskTracker处理文件时，处理的是64M,还是128M呢？

（这个问题已经解决，应该是64M）
Q3：如果是64M是不是会开启两个TaskTracker来处理文件，又因为TextInputFormat对文件不进行划分，所以每个
TaskTracker上只会开启一个Map Task来处理Map任务。最后两个TaskTracker启动两个Reduce生成两个文件？

半导体可靠性测试解析：HTOL、LTOL与Burn-In 赛卡硬件架构汽车车载系统
引言在半导体器件复杂度与可靠性要求同步提升的今天，高温工作寿命测试（HTOL）、低温寿命测试（LTOL）和老化筛选测试（Burn-In）构成了芯片可靠性验证的三大支柱。这些测试通过模拟极端环境下的失效机制，帮助制造商提前发现潜在缺陷，优化设计并满足汽车、工业等领域的严苛标准。本文将从测试原理、标准要求及报告解读维度展开深度解析。一、核心测试方法的技术边界与协同逻辑1.HTOL（高温工作寿命测试）测
DeepSeek：全栈开发者视角下的AI革命者大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 人工智能
DeepSeek：全栈开发者视角下的AI革命者写在前面随着人工智能（AI）技术的不断进步，AI已经成为各行各业创新的核心动力。从自动驾驶到智能制造，再到自然语言处理和图像识别，AI正在逐渐渗透并改变着我们的生活和工作方式。DeepSeek，作为AI领域的新兴技术，凭借其独特的技术架构和颠覆性的创新理念，成为了全栈开发者关注的焦点。本文将从全栈开发者的角度出发，详细解析DeepSeek的诞生、技术架
面试运维没工作经验怎么办？_没有运维经验去面试运维岗位慕烟疏雨面试运维职场和发展网络安全 web安全网络程序员
面试运维没工作经验怎么办大家都知道面试，都是需要工作经验，刚转行或者刚毕业哪里有什么经验呢？面试时候基本都是被拒之门外怎么办：今天我分享下我的经验：面试简历方面：一定要对自己的简历很熟悉，简历写得技能一定能说出一二，因为面试官很多问题都是挑的你的简历你写得问的，比如你写了熟练mysql主从同步原理集群搭建，一般肯定会问你，主从同步原理呀，如果你写了都说不出来，面试官咋样，肯定回家等通知了如果面试官
黑板架构风格 BGM不迷路架构
一、定义黑板架构（BlackboardArchitecture）是一种用于解决复杂问题的系统架构模式，其中多个独立的组件（通常称为知识源）共同工作，通过共享一个共同的“黑板”（通常是一个全局的共享数据结构）来实现解决方案的推演的架构风格。每个组件根据黑板上的信息做出贡献，修改黑板上的状态，直到最终完成任务。二、组成黑板架构由黑板（Blackboard）、知识源（KnowledgeSources）、
MCU的工作原理：嵌入式系统的控制核心绿算技术 MCU架构介绍单片机嵌入式硬件
MCU的工作原理可以概括为以下几个步骤：1.初始化上电后，MCU从Flash存储器中加载程序代码，并初始化外设和寄存器。2.任务执行根据程序逻辑，MCU执行数据处理、外设控制和通信等任务。通过中断系统实时响应外部事件。3.低功耗管理在空闲时，MCU进入低功耗模式，等待外部事件唤醒。4.结果输出通过GPIO、通信接口或模拟接口输出处理结果。MCU的架构：模块化与可扩展性MCU的架构设计注重模块化和可
基于ASP.NET校园二手交易网站设计与实现汐泽学园 asp.net 后端
摘要校园二手交易市场伴随互联网技术的迅猛发展以及校园内资源共享需求的增长而逐渐兴起。基于ASP.NET开发的校园二手交易网站，目的在于为高校师生打造一个便捷、安全且高效的二手物品交易平台。此网站借助ASP.NET技术开展开发工作，并且结合SQLServer数据库来存储数...关键词ASP.NET；校园二手交易；网站设计AbstractWiththerapiddevelopmentofInterne
什么是mybatis？十二.413 mybatis java 数据库
目录一、mybatis框架介绍二、mybatis配置三、mybatis逆向工程三、userMapper.xml配置一、mybatis框架介绍1.1mybatis本是apache的一个开源项目iBatis,2010年这个项目由apachesoftwareoundation迁移到了googlecode，并且改名为MyBatis。2013年11月迁移到Github。mybatis是一个基于Java的持久
【MyBatis笔记06】MyBatis中的三种关联查询方式（一对一、一对多、多对多） Mr.小朱同学 SSM专栏笔记 mybatis 关联查询一对一一对多多对多
这篇文章，主要介绍MyBatis中的三种关联查询方式（一对一、一对多、多对多）。目录一、MyBatis关联查询1.1、准备环境（1）SQL建表语句（2）创建实体类1.2、一对一查询（1）创建Mapper接口方法（2）创建XML映射文件（3）测试程序1.2、一对多关联查询（1）实体类（2）创建XML映射文件（3）测试程序1.3、多对多关联查询一、MyBatis关联查询MyBatis框架支持三种关联查
爬取电影标题、评论、评分（21-11-4）穆桥 Python爬虫 XPath解析 MySQL数据库电影信息疾病数据
功能描述：1、爬取网页1中的电影名称、评分、简介到mysql数据库中。2、爬取网页2中的标题、时间、正文、采集时间到mysql数据库中。使用的技术:requests请求、xpath解析、mysqlxpath解析语法//子孙节点/直接子节点.选取当前节点…选取当前节点的父节点@选取属性通过Python的lxml库，利用XPath进行HTML的解析。scrapy封装了lxml也可以导入scrapy任务
什么是Mybatis？最全的Mybatis知识点整合！ Tyloo_wdnmd 数据库 mybatis java python mysql
什么是Mybatis？最全的Mybatis知识点整合！一、什么是Mybatis？MyBatis是一个半ORM（对象关系映射）框架，它内部封装了JDBC，开发时只需要关注SQL语句本身，不需要花费精力去加载驱动、创建连接、创建Statement等繁杂过程。程序员直接编写原生态sql，可以严格控制sql执行性能，灵活度高。Mybatis可以使用XML或注解来配置和映射原生信息，将POJO映射成数据库中
MyBatis高级查询：一对多查询详解蓝天资源分享 mybatis tomcat java
MyBatis高级查询：一对多查询详解MyBatis是一个优秀的持久层框架，它支持定制化SQL、存储过程以及高级映射。MyBatis免除了几乎所有的JDBC代码和手动设置参数以及获取结果集的工作。MyBatis可以使用简单的XML或注解用于配置和原始映射，将接口和Java的POJOs（PlainOldJavaObjects，普通的Java对象）映射成数据库中的记录。本文将深入探讨MyBatis中的
什么是 MyBatis？总是学不会. Mybatis mybatis 开发 java 后端
文章目录1️⃣MyBatis简介MyBatis主要特点2️⃣MyBatisvs传统JDBCvsHibernate3️⃣MyBatis核心组件️1.SqlSessionFactory2.SqlSession3.Mapper（映射器）4️⃣MyBatis配置文件结构`mybatis-config.xml`示例`UserMapper.xml`示例5️⃣MyBatis的典型使用流程6️⃣适用场景与总结1️
前端开发：Web蜜罐详解三掌柜666 前端网络安全
前言在当今数字化时代，网络安全威胁日益复杂，攻击手段层出不穷。对于前端开发人员来说，不仅要关注代码的性能和用户体验，还需要具备应对安全威胁的能力。在网络安全领域，Web蜜罐作为一种主动防御技术，正逐渐受到关注，它通过模拟真实的Web应用程序，吸引攻击者并记录其行为，为安全专家提供了宝贵的情报。对于前端开发人员来说，了解Web蜜罐的工作原理、特点和应用场景具有重要意义。那么本文就来探讨Web蜜罐的工
tomcat的工作流程 My heart is toward you tomcat
目录1、程序基本内容：2、实现原理：3、浏览器与tomcat4、tomcat核心功能5、总结：tomcat有主方法，servlet借助tomcat运行。tomcat文件夹1、程序基本内容：bin：包含各种脚本conf：是confige的缩写，有很多配置文件，程序启动肯定会读取配置文件lib：程序的主体部分，包含程序的主体代码logs：运行日志，运行期间的各种情况webapps：存放网站，一个文件就
使用Python爬取豆瓣用户信息：从入门到实战 Python爬虫项目 2025年爬虫实战项目 python 开发语言人工智能爬虫大数据
引言豆瓣作为一个知名的社交平台，拥有丰富的用户信息。对于数据分析师、研究人员或普通用户来说，获取豆瓣用户信息具有重要的价值。本文将详细介绍如何使用Python及其相关库来爬取豆瓣用户信息，并展示如何利用最新的技术手段来实现这一目标。1.准备工作在开始编写爬虫之前，我们需要准备一些工具和环境：Python3.x：确保你已经安装了Python3.x版本。Requests库：用于发送HTTP请求。Bea
深入 Python 网络爬虫开发：从入门到实战南玖yy python python爬虫
一、为什么需要爬虫？在数据驱动的时代，网络爬虫是获取公开数据的重要工具。它可以帮助我们：监控电商价格变化抓取学术文献构建数据分析样本自动化信息收集二、基础环境搭建1.核心库安装pipinstallrequestsbeautifulsoup4lxmlseleniumscrapy2.开发工具推荐PyCharm（专业版）VSCode+Python扩展JupyterNotebook（适合调试）三、爬虫开发
JavaScript 内置对象-Math对象咖啡の猫 javascript 开发语言
在JavaScript编程中，处理各种数学运算和数值操作是不可避免的任务。幸运的是，JavaScript提供了一个非常有用的内置对象——Math对象，它包含了大量用于执行常见数学任务的方法和属性。本文将详细介绍Math对象的主要特性和使用方法，帮助你更高效地进行数学相关的编程工作。一、什么是Math对象？Math是一个内置的对象，提供了对数学常量和函数的访问。与其它全局对象不同，Math不是一个构
使用agent搭建一个简易的ai论文写作程序喂喂喂喂位 langChain手搓AI Agent记录人工智能 langchain 深度学习 python AIGC
本程序能够自动化完成从规划、研究、撰写到修改的整个论文创作流程。基于LangGraph和LangChain框架构建，利用大型语言模型和搜索工具协同工作，形成了一个完整的论文写作流水线。核心功能分析计划生成功能(plan_node)这个node将接收状态，然后创建一个消息列表。其中一个将是PLAN_PROMPT，那将是SystemMessage。然后创建HumanMessage，传入我们要做的tas
【数字IC验证】博客内容全览 MoorePlus 数字IC验证百宝箱经验分享面试数字IC 芯片验证 SV
【导读】：数字IC验证百宝箱涵盖博主在实际工作中常用的技能与工具，包括但不限于SV、UVM、Formal、脚本(perl/python/shell)及EDA工具快速上手使用等。无论你是刚踏入职场的验证小白，还是希望回顾基础寻找跳槽机会的从业者，本专栏都能为你提供实用的技术支持，在达成目标的路上，助你一臂之力。“凡是能用钱买来的时间就是便宜的；凡是能用时间换来的注意力持续就是有价值的。”（附上超链接
Java多线程与高并发专题——原子类和 volatile、synchronized 有什么异同？黄雪超技术基础 java 开发语言并发编程
原子类和volatile异同首先，通过我们对原子类和的了解，原子类和volatile都能保证多线程环境下的数据可见性。在多线程程序中，每个线程都有自己的工作内存，当多个线程访问共享变量时，可能会出现一个线程修改了共享变量的值，而其他线程不能及时看到最新值的情况。原子类和volatile关键字都能在一定程度上解决这个问题。例如，当一个变量被volatile修饰后，对该变量的写操作会立即刷新到主内存，
前端面试：axios 是否可以取消请求？ returnShitBoy 前端
在实际工作中，取消请求的场景通常出现在以下几种情况中：用户导航离开页面：如果用户在请求数据的过程中快速切换到另一个页面，可以通过取消未完成的请求来优化性能。输入框的搜索提示：当用户在输入框中输入内容时，可以结合防抖的方式取消之前的请求，从而只保留最新的请求，避免发送过多的请求。取消请求的实现方式Axios提供了CancelToken的功能来实现请求的取消。以下是具体的代码示例：importaxio
远程推送didReceiveRemoteNotification代理方法调用详细说明 Ethan. L iOS开发 UIApplication 远程推送代理
前言最近工作中实现远程推送点击状态栏的提醒，直接进入相应地详细界面的功能。遇到了问题，解决之后整理出来！UIApplication有两个关于接收到远程推送的代理：-application:didReceiveRemoteNotification:fetchCompletionHandler:-application:didReceiveRemoteNotification:这两个是什么关系？点击远
NPU的工作原理：神经网络计算的流水线绿算技术 NPU架构介绍神经网络人工智能深度学习
NPU的工作原理可以概括为以下几个步骤：1.模型加载·将训练好的神经网络模型加载到NPU的内存中。2.数据输入·输入数据（如图像、语音）通过接口传输到NPU。3.计算执行·NPU根据模型结构，依次执行卷积、池化、全连接等计算任务。·矩阵乘法单元和卷积加速器并行工作，高效完成计算。4.结果输出·计算完成后，输出结果（如分类标签、检测框）返回给主机或其他处理器。5.任务调度·在多任务场景下，NPU的任
MyBatis相关的面试题努力的搬砖人. java 面试 mybatis
以下是150道MyBatis相关的面试题及详细答案：MyBatis基础1.MyBatis是什么？MyBatis是一个优秀的持久层框架，它支持自定义SQL语句、存储过程以及高级映射，避免了几乎所有的JDBC代码和手动设置参数以及获取结果的操作。2.MyBatis的优缺点是什么？优点：•提高开发效率，减少重复的JDBC代码。•提供XML和注解两种方式编写SQL，灵活方便。•支持动态SQL，可以根据不同
分布式系统中分布式ID生成方案的技术详解心存の思念分布式
分布式系统中分布式ID生成方案的技术详解在复杂的分布式系统中，数据被分散存储在不同的节点上，每个节点都有自己独立的数据库。为了保证数据的唯一性和一致性，我们需要为每个数据项生成一个全局唯一的主键ID。本文将详细解析几种常用的分布式ID生成方案，包括它们的工作原理、优缺点以及适用场景。一、分布式系统唯一ID的特点全局唯一性：不能出现重复的ID号，这是最基本的要求。趋势递增：在MySQLInnoDB引
18.使用读写包操作Excel文件：xlrd、xlwt 和 xlutils 包杜子腾dd Excel Python 25.3.1 excel pandas 数据挖掘 python numpy
一xlrd、xlwt和xlutils包的介绍OpenPyXL和xlrd、xlwt、xlutils的区别在笔记15。二如何使用xlrd读取文件1.获取所有工作表的名称book.sheet_names()：得到一个列表。importxlrdimportxlwtfromxlwt.Utilsimportcell_to_rowcol2importxlutilsimportexcelbook=xlrd.ope
如何快速开发一款AI小程序？基于微信云开发的实战指南一键难忘人工智能小程序微信
如何快速开发一款AI小程序？基于微信云开发的实战指南引言微信小程序凭借其轻便、易推广等特点，已成为应用开发的重要方式之一。而AI技术的快速发展让智能化应用成为可能。通过微信云开发（CloudBase）与小程序结合，开发者可以实现从前端到后端的一站式AI应用开发。本文将深入讲解如何利用微信云开发快速搭建一款AI小程序，展示从模型训练到云端部署的完整流程。准备工作在开始开发之前，确保完成以下准备工作：
自动化测试：从入门到精通的全面指南测试工程师成长之路测试工程师成长之路自动化测试
一、引言在当今数字化时代，软件行业蓬勃发展，软件产品的更新换代愈发频繁。为了确保软件的质量和稳定性，测试工作变得至关重要。然而，随着软件规模的不断扩大和功能的日益复杂，传统的手工测试方法逐渐暴露出效率低下、容易出错等问题。自动化测试作为一种高效、可靠的测试手段，应运而生并迅速发展，成为现代软件测试领域不可或缺的一部分。自动化测试是指借助专门的测试工具和编程技术，将原本由人工执行的测试用例转化为机器
51单片机的工作过程二年级程序员 51单片机嵌入式硬件单片机
目录一、51单片机的总线结构（一）地址总线（AB）（二）数据总线（DB）（三）控制总线（CB）二、51单片机的工作过程第一步：取指令第二步：指令译码第三步：执行指令一、51单片机的总线结构（一）地址总线（AB）地址总线用于传送单片机访问存储器或I/O端口的地址信息。51单片机的地址总线为16位，这意味着它可以寻址的范围为B=64KB。例如，当CPU要从只读存储器（ROM）中读取某条指令时，会通过地
现代游戏UI架构深度解析——以UIController为核心的模块化界面管理系统晴空了无痕项目框架游戏 ui 架构
一、架构全景与设计哲学本文将以重构后的UIController为核心，深入探讨Unity引擎下的高效UI管理方案。该体系采用"分层-分治"设计理念，通过界面生命周期管理、动态适配策略、资源优化机制三个维度的协同工作，构建了适应复杂交互需求的弹性UI框架。我们将从以下关键维度展开技术分析：二、核心模块技术解析2.1中枢控制器（UIController）namespaceGameCore.Interf
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc

MapReduce流程分析

你可能感兴趣的:(mapreduce,hadoop,工作,xml)