Java基础之MapReduce框架总结与扩展知识点

一、MapTask工作机制

MapTask就是Map阶段的job，它的数量由切片决定

二、MapTask工作流程：

1.Read阶段：读取文件，此时进行对文件数据进行切片(InputFormat进行切片)，通过切片，从而确定MapTask的数量,切片中包含数据和key(偏移量)

2.Map阶段：这个阶段是针对数据进行map方法的计算操作，通过该方法，可以对切片中的key和value进行处理

3.Collect收集阶段：在用户编写map()函数中，当数据处理完成后，一般会调用OutputCollector.collect()输出结果。在该函数内部，它会将生成的key/value分区（调用Partitioner），并写入一个环形内存缓冲区中。

4.Spill阶段：即“溢写”，当环形缓冲区满后，MapReduce会将数据写到本地磁盘上，生成一个临时文件。需要注意的是，将数据写入本地磁盘之前，先要对数据进行一次本地排序，并在必要时对数据进行合并、压缩等操作。

5.Combine阶段：当所有数据处理完成后，MapTask对所有临时文件进行一次合并，以确保最终只会生成一个数据文件,这个阶段默认是没有的，一般需要我们自定义

6.当所有数据处理完后，MapTask会将所有临时文件合并成一个大文件，并保存到文件output/file.out中，同时生成相应的索引文件output/file.out.index。

7.在进行文件合并过程中，MapTask以分区为单位进行合并。对于某个分区，它将采用多轮递归合并的方式。每轮合并io.sort.factor（默认10）个文件，并将产生的文件重新加入待合并列表中，对文件排序后，重复以上过程，直到最终得到一个大文件。

8.让每个MapTask最终只生成一个数据文件，可避免同时打开大量文件和同时读取大量小文件产生的随机读取带来的开销

第四步溢写阶段详情：

步骤1：利用快速排序算法对缓存区内的数据进行排序，排序方式是，先按照分区编号Partition进行排序，然后按照key进行排序。这样，经过排序后，数据以分区为单位聚集在一起，且同一分区内所有数据按照key有序。
步骤2：按照分区编号由小到大依次将每个分区中的数据写入任务工作目录下的临时文件output/spillN.out（N表示当前溢写次数）中。如果用户设置了Combiner，则写入文件之前，对每个分区中的数据进行一次聚集操作。
步骤3：将分区数据的元信息写到内存索引数据结构SpillRecord中，其中每个分区的元信息包括在临时文件中的偏移量、压缩前数据大小和压缩后数据大小。如果当前内存索引大小超过1MB，则将内存索引写到文件output/spillN.out.index中。

三、ReduceTask工作机制

ReduceTask就是Reduce阶段的job，它的数量由Map阶段的分区进行决定

四、ReduceTask工作流程：

1.Copy阶段：ReduceTask从各个MapTask上远程拷贝一片数据，并针对某一片数据，如果其大小超过一定阈值，则写到磁盘上，否则直接放到内存中。

2.Merge阶段：在远程拷贝数据的同时，ReduceTask启动了两个后台线程对内存和磁盘上的文件进行合并，以防止内存使用过多或磁盘上文件过多。

3.Sort阶段：按照MapReduce语义，用户编写reduce()函数输入数据是按key进行聚集的一组数据。为了将key相同的数据聚在一起，Hadoop采用了基于排序的策略。由于各个MapTask已经实现对自己的处理结果进行了局部排序，因此，ReduceTask只需对所有数据进行一次归并排序即可。

4.Reduce阶段：reduce()函数将计算结果写到HDFS上

五、数据清洗（ETL）

我们在大数据开篇概述中说过，数据是低价值的，所以我们要从海量数据中获取到我们想要的数据，首先就需要对数据进行清洗，这个过程也称之为ETL

还记得上一章中的Join案例么，我们对pname字段的填充，也算数据清洗的一种，下面我通过一个简单的案例来演示一下数据清洗

数据清洗案例

需求：过滤一下log日志中字段个数小于11的日志（随便举个栗子而已）

测试数据：就拿我们这两天学习中HadoopNodeName产生的日志来当测试数据吧,我将log日志信息放到我的windows中,数据位置如下

/opt/module/hadoop-3.1.3/logs/hadoop-xxx-nodemanager-hadoop102.log

编写思路：

直接通过切片，然后判断长度即可，因为是举个栗子，没有那么复杂

真正的数据清洗会使用框架来做，这个我后面会为大家带来相关的知识

ETLDriver

package com.company.etl;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import java.io.IOException;

public class ETLDriver {
    public static void main(String[] args) throws Exception {
        Job job = Job.getInstance(new Configuration());

        job.setJarByClass(ETLDriver.class);

        job.setMapperClass(ETLMapper.class);

        job.setNumReduceTasks(0);

        job.setMapOutputKeyClass(Text.class);
        job.setMapOutputValueClass(NullWritable.class);


        FileInputFormat.setInputPaths(job,new Path("D:\\io\\input8"));
        FileOutputFormat.setOutputPath(job,new Path("D:\\io\\output88"));

        job.waitForCompletion(true);
    }
}

ETLMapper

package com.company.etl;

import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Counter;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

public class ETLMapper extends Mapper {
    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {

        //清洗（过滤）
        String line = value.toString();
        String[] info = line.split(" ");
        //判断
        if (info.length > 11){
            context.write(value,NullWritable.get());
        }
    }
}

六、计数器应用

顾名思义，计数器的作用就是用于计数的，在Hadoop中，它内部也有一个计数器，用于监控统计我们处理数据的数量
我们通常在MapReduce中通过上下文 context进行应用，例如在Mapper中，我通过step方法进行初始化计数器，然后在我们map方法中进行计数

七、计数器案例

在上面数据清洗的基础上进行计数器的使用，Driver没什么变化，只有Mapper

我们在Mapper的setup方法中，创建计数器的对象，然后在map方法中调用它即可

ETLMapper

package com.company.etl;

import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Counter;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

public class ETLMapper extends Mapper {

    private Counter sucess;
    private Counter fail;
    /*
        创建计数器对象
     */
    @Override
    protected void setup(Context context) throws IOException, InterruptedException {
        /*
             getCounter(String groupName, String counterName);
             第一个参数 ：组名 随便写
             第二个参数 ：计数器名 随便写
         */
        sucess = context.getCounter("ETL", "success");
        fail = context.getCounter("ETL", "fail");

    }

    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {

        //清洗（过滤）
        String line = value.toString();
        String[] info = line.split(" ");
        //判断
        if (info.length > 11){
            context.write(value,NullWritable.get());
            //统计
            sucess.increment(1);
        }else{
            fail.increment(1);
        }

    }
}

八、MapReduce总结

好了，到这里，我们MapReduce就全部学习完毕了，接下来，我再把整个内容串一下，还是MapReduce的那个图

MapReduce的主要工作就是对数据进行运算、分析，它的工作流程如下：

1.我们会将HDFS中的数据通过InputFormat进行进行读取、切片,从而计算出MapTask的数量

2.每一个MapTask中都会有Mapper类，里面的map方法就是任务的具体实现，我们通过它，可以完成数据的key,value封装，然后通过分区进入shuffle中来完成每个MapTask中的数据分区排序

3.通过分区来决定ReduceTask的数量，每一个ReduceTask都有一个Reducer类，里面的reduce方法是ReduceTask的具体实现，它主要是完成最后的数据合并工作

4.当Reduce任务过重，我们可以通过Combiner合并，在Mapper阶段来进行局部的数据合并，减轻Reduce的任务量，当然，前提是Combiner所做的局部合并工作不会影响最终的结果

5.当Reducer的任务完成，会将最终的key,value写出，交给OutputFormat，用于数据的写出，通过OutputFormat来完成HDFS的写入操作

每一个MapTask和ReduceTask内部都是循环进行读取，并且它有三个方法：setup() map()/reduce() cleanup()
setup()方法是在MapTask/ReduceTask刚刚启动时进行调用，cleanup()是在任务完成后调用

到此这篇关于Java基础之MapReduce框架总结与扩展知识点的文章就介绍到这了,更多相关Java MapReduce框架内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

5月阅读写作践行总结旦卉
图片发自App01阅读《臣服实验》因是台版书，繁体竖排，有点挑战大脑的惯性。刚开始时读慢一点，几天下来就适应了。很是敬佩这种在困境中，不内耗、不抱怨，却全然地努力，臣服于生命之流的状态。《走出剧情——活在人生的真相里》看过武志红老师的书籍后，再来看这本，才理解到武老师的书荐：“能把潜意识中复杂缠绕的感受和动力，如此清澈透亮地表达出来，这样的文字总是让我感动和赞叹。”尹建莉的书荐：“我怀疑，李雪24
天文图像处理：星系分类与天体定位 xcLeigh 计算机视觉CV 图像处理分类人工智能 AI 计算机视觉
天文图像处理：星系分类与天体定位一、前言二、天文图像处理基础2.1天文图像的获取2.2天文图像的格式2.3天文图像处理的基本流程三、天文图像预处理3.1去噪处理3.2平场校正3.3偏置校正四、星系分类4.1星系的分类体系4.2基于特征提取的星系分类方法4.3基于深度学习的星系分类方法五、天体定位5.1天体坐标系统5.2基于星图匹配的天体定位方法5.3基于深度学习的天体定位方法六、总结与展望致读者一
【python做接口测试的学习记录day6——pytest+yaml+allure自动化测试框架之URL拼接】小丫么小二郎~ 学习 pytest python 功能测试测试工具
在之前的测试框架中，可以发现的是，我们的yaml数据中所有的url中的除了路径不同外，其余都是相同的，我们想办法将这一部分自动化，这样的yaml中写用例url的时候就不用再每次都写上域名，只需要输入路径即可首先我们需要更改下之前的用例yaml文件中的url，将域名删除只留下路径即可，例如：接下来我们在根目录创建一个config.yam文件，用于存储我们的URL中的公共部分，这里由于公司相关，我隐藏
【python做接口测试的学习记录day9——pytest自动化测试框架之yaml数据驱动封装】小丫么小二郎~ pytest python pycharm 接口测试用例
之前我们的框架中，如果有多个测试用例，则需要在yaml文件中写入多个用例，而每个用例可能不同的仅仅只是个别参数值，这就导致很多重复代码，现在我们使用数据驱动就可以解决这个问题了。我依旧采用之前的登录接口为例，简单记录一下数据驱动封装的全过程一、DDT数据驱动yaml文件在根目录下创建包datas，用来存放我们的数据驱动yaml文件，在datas下新建一个get_token_data.yaml文件，
Gemini CLI Web 实现
GeminiCLIWeb简化版：基于Core包的智能Web扩展架构详解项目地址：https://github.com/lovelyqun/gemini-cli-web.git前言在AI应用开发领域，如何将强大的命令行工具转化为易用的Web应用是一个常见挑战。本文将深入分析packages/web-simple的实现，这是一个基于GeminiCLICore包构建的Web扩展，展示了如何优雅地复用现有
Docker深度详解：从原理到实践的全方位指南一切皆有迹可循 docker容器技术 docker 容器 linux 服务器后端 java
前言Docker作为容器化技术的标杆，凭借其轻量级、可移植性和隔离性，彻底改变了软件的开发、部署和运维方式。本文将深入解析Docker的核心原理、架构设计及实战技巧，结合具体代码示例和生产级经验，帮助读者全面掌握这一现代软件开发的关键技术。一、Docker核心概念与架构1.基础概念扩展（1）镜像分层原理#查看镜像层信息dockerhistoryubuntu:20.04#输出示例IMAGECREAT
2018-7-24 grace2039
一、学习与实践1.付出不亚于任何人的努力2.要谦虚，不要骄傲3.要每天反省4.活着，就要感谢5.积善行，思利他6.不要有感性的烦恼二、今日分享这几天财务部全体人员都在加班加点上传数据，因为系统不是很稳定，大家干一会儿后不得不陪着系统“休息”一下，听说昨天嵘姐在休息时一试系统可以操作了，于是自己马上抓紧录入，没顾得上通知其他人，过了一会儿被旁边的小伙伴发现后，大家都笑骂她吃独食，真是积极乐观的团队呀
2019.10.13 蚂蚁_caec
日精进打卡第203天姓名:李敏499期学员努力一组公司:上海缘缀包装材料有限公司【知～学习】《六项精进》1遍，共201遍；《大学》1遍，共201遍未背诵企业使命、愿景、价值观【经典名句分享】付出不亚于任何人的努力一、修身：练字调理身体纠正驼背垃圾分类反省养生二、齐家：与妈妈打电话与骆驼互道早安晚安与骆驼一起做饭三、建功：关注备案信息转发公众号文章关注公司活动沟通奖励票事宜四、【积善】：发愿从201
【电脑】电源供应器（PSU）的基础知识 Mike_Wuzy 电脑
电源供应器（PowerSupplyUnit,PSU）是计算机和其他电子设备的核心组件之一，负责将外部电能转换成设备所需的稳定电压输出，以供主板、硬盘、风扇等各个部件使用。以下是关于电源供应器的一些详细知识：1.主要功能转换与稳压：将交流电（AC）转换为适合计算机内部各组件的直流电（DC），并保持电压稳定。分配电力：通过不同的连接线缆和插座，将不同类型的输出电压输送至各个部件。2.核心元件电源供应器
2023-07-12 chener_33f3
山理学子三下乡：砼心探盐渍，聚力惠民生中国青年网滨州7月11电（通讯员李鹤展）为进一步加强合作交流，拓展更加广阔和深入的学生实践空间，7月11上午，山东理工大学建筑工程与空间信息学院团委委员王凯旋、辅导员李聪、曹修磊以及“‘砼’生共长，‘建’行黄河”实践团全体成员赴滨州市沾化区自然资源局进行共建大学生社会实践基地签约暨揭牌仪式。国土空间生态修复中心主任刘燕霞、行政综合办主任李志勇、自然资源监管综合
PromptX 核心架构深度解析：从革命性理念到工程实践的全景解读步子哥智能涌现架构人工智能
核心理念：AIuseCLIgetpromptforAI-让AI通过命令行获取专业提示词，从通用助手进化为专业专家团队引言：一场关于AI认知的革命当我们深入研究PromptX项目的核心架构文档时，会发现这不仅仅是一个技术框架，而是一套完整的AI认知重构理论。这些文档展现了从哲学思考到工程实践的完整链条，重新定义了人类与AI的协作模式。今天，让我们从这些核心文档开始，深度解析PromptX如何重塑AI
Navicat操作指南：MySQL数据库配置与Todo应用部署像风一样自由2020 数据库 mysql adb
Navicat操作指南：MySQL数据库配置与Todo应用部署前言本文档详细记录了使用Navicat管理MySQL数据库，并配置Todo应用的完整操作步骤。适用于使用Navicat作为MySQL管理工具的开发者。操作目标启动MySQL服务使用Navicat连接MySQL数据库创建todoapp数据库配置Todo应用环境变量验证应用正常运行步骤一：启动MySQL服务Windows用户方法1：通过Wi
换手机（君子蘭花语之727）分湖芝蘭
文分湖芝蘭（贝儿由里）2021年9月15日周三阵雨23～28度先生的手机从外观上看手机壳很破旧了，上面的皮已经开裂，这是好几年前就变得不像样了。我一直叫他换一只手机，他就是不肯。他说，难看不要紧的，只要好用就可以，我又不用其他东西，就打打电话，看看新闻和微信。朋友们看到他的手机成这个模样，都劝他把这手机换了吧。他就说用用蛮好。我在一旁听了心里就不舒服，人家以为我不关心他，我可能会被他们误解。先生的
编程语言与API函数库速查字典大全一一MIO一一
本文还有配套的精品资源，点击获取简介：《Delphi、VB、TC、API函数库速查字典1.0》提供了一个全面的编程语言参考资源，涵盖了Delphi、VB、TurboC以及WindowsAPI的函数库。它包括一个名为"lib"的文件，用于快速查询和理解不同编程语言和API的相关函数。Delphi以其组件库和面向对象的特性受到青睐，VB则因其易用性而广受欢迎，而TC作为经典的C编译器，API函数库则提
高效休息法（二） GAI2012
正念呼吸法1、采取基本坐姿，坐在座椅上（稍微挺直背部，背部离开椅背）。腹部放松，双手放在大腿上，双腿不交叉，闭上眼睛（如果采用睁着眼睛的方式，则双眼不聚焦地望向前方2米左右的位置）2、有意识地关注身体的感觉，感受与周围环境的接触（脚底与地板，臀部与座椅，手与大腿等）、身体被重力吸引的感觉。3、关注呼吸，关注与呼吸相关的感觉（通过鼻腔的空气，因空气出入而引起的胸部和腹部的起伏，呼吸与呼吸之间的停顿，
AI 人工智能与 Copilot 的融合发展策略 AI天才研究院 AI人工智能与大数据人工智能 copilot ai
AI人工智能与Copilot的融合发展策略关键词：人工智能、Copilot、代码生成、人机协作、机器学习、自然语言处理、软件开发摘要：本文探讨了人工智能与Copilot技术的融合发展策略。我们将从技术原理、实现方法、应用场景等多个维度深入分析，提出一套完整的融合框架和发展路径。文章首先介绍背景和核心概念，然后详细讲解关键技术，包括自然语言处理、代码生成算法等，接着通过实际案例展示应用效果，最后讨论
AI 人工智能与 Copilot 碰撞出的火花 AI天才研究院 AI大模型企业级应用开发实战人工智能 copilot ai
AI人工智能与Copilot碰撞出的火花关键词：AI人工智能、Copilot、代码辅助、智能编程、人机协作、软件开发、技术创新摘要：本文深入探讨了AI人工智能与Copilot碰撞所产生的一系列效应。首先介绍了相关背景，包括目的、预期读者、文档结构和术语表。接着阐述了核心概念与联系，展示了其原理和架构的示意图及流程图。详细讲解了核心算法原理和具体操作步骤，并通过Python代码进行说明。同时给出了数
致良知之寄希渊书如歌z
不要轻易地指责别人，学会宽容和尊重，才能更好地与人相处。一个真正的有文化修养的人,能够用“慈悲心和包容心”去成就别人,其实也是在成就自己。幸福并不取决于财富、权利和容貌,而是取决于你和周围人的相处。你想做个幸福快乐的人,那么就从善待他人开始吧!
分布式系统中优化ELK日志采集性能 Alex艾力的IT数字空间 elk 微服务中间件架构 ux 安全性测试可用性测试
架构设计、组件调优、资源分配等多维度入手一、架构优化：分布式与解耦设计分层采集与缓冲Filebeat轻量级采集：在每台服务器部署Filebeat替代Logstash作为日志收集器，降低资源占用（CPU/内存减少70%以上）。引入缓冲队列：通过Redis或Kafka作为日志缓冲池，缓解Logstash或Elasticsearch的突发流量压力，避免数据丢失（如Logstash异常时Redis暂存数据
临时节点授权方案实际应用中可能面临的安全问题和对应的防范策略 Alex艾力的IT数字空间网络架构中间件安全运维功能测试安全架构
一、核心安全风险与防御方案1.重放攻击（ReplayAttack）风险场景：攻击者截获有效授权令牌后重复发送请求，导致权限被恶意复用防御措施：动态令牌机制：在授权节点ID中嵌入时间戳（timestamp）和随机数（nonce），服务端校验时间差（如±5分钟）并记录已使用nonce值签名验证：使用HMAC-SHA256对nodeId+timestamp+secretKey生成签名，防止参数篡改示例代
HW prefetcher之CDP(Content-Directed Data Prefetching) Chip Design xPU Chip Design CPU GEM5
CDP是Content-DirectedDataPrefetching的缩写，它基于RobertCooksey和StephanJourdan提出的"Stateless,Content-DirectedDataPrefetchingMechanism"论文实现。是一种内容导向的数据预取机制，CDP通过分析内存中的数据内容来识别可能的指针，当识别到指针时，它会预取指针指向的内存地址。CDP使用VPN表
表态发言可爱婷好
何烊：.严格要求自己，强化教研，提高课堂效果黄磊：对领导，各科老师的肯定，英语老师课间抽几个学生进行指导，共同努力的结果。王康：讲故事，向敬佩的班主任学习脚踏实地，做好自己的事情，对学生真心负出，与学生关系好，创造一个舒适的学习环境，饭要一口一口的吃，事要一件一件的做，路要一步一步的走，踏实平稳地坚持下去，成功的把握好每"一步"的大小是成功的关键。李亦非：慈善之心太强赵件兵：对学生估计过高，重落实
硬件预取的几个问题 1
1.硬件预取的定义和目标是什么？答案：硬件预取是CPU在程序执行前自动预测并加载可能使用的数据到缓存中的技术，目标是减少缓存未命中带来的延迟，提升指令吞吐量。2.硬件预取与软件预取的核心区别？答案：硬件预取由CPU内部逻辑自动触发，透明且通用；软件预取需程序员显式插入指令（如prefetch），可针对特定场景优化，但依赖代码适配。3.预取算法的主要分类？答案：分为规则驱动型（如顺序、步长预取）和机
威海项目通宵实施有感九型观心临在践行
心心念威海之滨火红始于黄海岸，谁人知工作熬人加班加点重负担。睁眼看日出日落黑夜尽去昼复来，低头思人生苦乐潮去潮起静是欢。何为觉知何为禅？何为临在何为爱？愿自己，拿得起金戈铁马，放得下恩怨纠缠。
Linux 系统进阶操作实践：目录管理与系统信息查看指南小任今晚几点睡 RHCSA linux 网络运维
文章摘要本文详细记录了Linux系统中通过Xshell远程管理的核心操作，包括系统信息查询、复杂目录结构创建与树形展示、多级目录快速生成、文件创建与删除、大文件制作等实践步骤。通过命令示例与输出解析，清晰呈现每一步操作的逻辑与效果，帮助读者掌握目录管理、系统信息查看及文件操作的实用技巧，适合Linux实操学习者参考。一、通过Xshell远程登录及系统信息查询使用Xshell通过root账户登录Li
对生命说是 255b13afce2f
对可能结束的关系说是有时候就是分不清自我，才想去改变别人，也让他人受影响，世界上有两件事是最难的，一个是让别人接受你的思想，一个是从别人口袋里掏钱出来。没有完美的人存在，只有你看人时候的心态不同，显现的人物个性不同，是温柔的，善解人意的，完美的，都是自己的看法，其实演绎的都是自己想要的而已，与他人无关。
畅远正面管教【爱的52种习惯】之21天践行打卡Day13~ 零花钱雪_8316
最早开始给孩子零花钱，主要目的是延迟满足，控制他每天路过好邻居都想买一个奇趣蛋的冲动。于是我们商定，每周有15元零花钱。他可以自己安排如何花，如果都用来买奇趣蛋，就只能买两次，如果用来买其他的小物件，也许有机会买更多东西。当然一开始很快把钱花光，会讨价还价，不行，我就要！这个时候是对父母的考验，尤其是有社会压力的情况下。让他从错误设想结果中学习的唯一方式，就是认可他们的感受，等待他平静下来，利用启
ThreadLocal 在 Spring 与数据库交互中的应用笔记笑衬人心。 JAVA学习笔记数据库 spring 笔记
一、基本概念1.1什么是ThreadLocal？ThreadLocal是Java提供的一个线程本地存储工具类。每个线程访问ThreadLocal时，都只能看到自己线程范围内的变量副本，线程之间互不影响。常用于保存线程上下文信息，如用户登录信息、事务状态、数据库连接等。ThreadLocalthreadLocal=newThreadLocal>resources=newNamedThreadLoca
魏晋士人的双向人生笑春风ma
自古以来，人们都在追求“学成文武艺，货与帝王家”。货与帝王家，能实现自己的人生价值，于是各路人马争先恐后的打扮好自己，以求得君王的宠爱，从而形成了几大官僚集团——文官集团、武官集团、宦官集团、外戚集团。而历史上治理得好的时期，往往也是文官集团掌权的时期，他们饱读经书、史书，知道历史的盛衰兴亡，从而形成自己的治国理政逻辑，尽力将国家带向稳定繁荣。汉朝的萧曹，唐朝的房杜、姚宋，宋朝的赵普，明朝的于谦、
深度对比：innerHTML vs 虚拟DOM——原理、性能与应用全解析止观止前端前端框架前端 html5 javascript reactjs xss
引言在现代Web开发中，高效操作DOM（文档对象模型）是构建高性能应用的关键。传统方法如innerHTML和新兴的虚拟DOM（VirtualDOM）技术代表了两种截然不同的DOM更新策略。innerHTML作为浏览器原生API，直接操纵HTML字符串；虚拟DOM则是通过JavaScript对象树进行优化更新，广泛应用于React、Vue等框架。本文深入对比两者的核心原理、技术细节、应用场景及优劣，
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他