萧邦主

Hadoop学习之路(四)：Hadoop排序之全排序的原理及实现

Hadoop实现全排序

一、全排序简介
二、全排序的原理
三、准备数据
四、全排序的实现

1.创建Java工程，添加Maven支持
2.编写Map类
3.编写Reduce类
4.编写作业主类
5.将代码打包提交到集群
6.运行程序

五、总结

一、全排序简介

全排序其实就是全局排序，就是使得所有数据按序排列输出，和我们平常做的给一个数组排序没有什么区别，唯一的区别就是数据量的不同，这里涉及的数据量是TB级别的，这就意味着不可能简单地把数据加载进内存进行排序，需要用到分布式计算，所以就产生了Hadoop的全排序,Hadoop的全排序在实际应用有着重要的作用。

二、全排序的原理

其实，实现Hadoop全排序有着一个很简单的方法，那就是只使用一个Reducer，因为Hadoop默认对Key升序排序，所以当只使用一个Reducer时，所有数据都会落在一台主机上，从而达到全排序的目的，但是这就失去了分布式的意义，造成了数据倾斜。为了充分使用集群资源，我们把Reducer设置为多个进行全排序，比如3个，如图：

每一个Reducer内的数据是有序的，但是Reducer与Reducer之间的数据是无序的，所以最后的结果不满足全排序的要求，这是因为数据是根据哈希值进入不同分区的，是随机的，为此我们可以重写分区类，使得数据有条件地进入各个分区，比如还是3个Reducer，划分三个条件，使得Reducer与Reducer之间的数据有序：

这是个办法，Reducer内的数据大小：Reducer1 < Reducer2 < Reducer3，把最后输出的三个文件按序整合就是全排序的结果了，但还存在一个问题：可能造成数据倾斜，这是因为划分分区区间的时候，无法估计区间内的数据量，假设小于1000的数据有500G，其他两个期间的数据加起有100G，这时候就会有热点问题，这是因为区间是人为划分的，无法估计各个区间的数据量。

综合以上，Hadoop的全排序原理就是：Hadoop事先会对待排序的数据进行抽样，这就要求输入的Key必需具有可比较性，然后根据Reducer的个数科学地指定分区的条件，最后再进行运算。

三、准备数据

数据的Key必须具备可比性才可以被Hadoop抽样，因而本次演示使用序列文件(SequenceFile)，序列文件本质上是K-V对，结合本次演示，让Key为整数，Value为null即可，以下给出产生序列文件的代码 NumberProducer：

public class NumberProducer {

    public static void main(String[] args) throws Exception {
        Configuration conf = new Configuration();
        //将Hadoop文件系统改为本地文件系统
        conf.set("fs.defaultFS", "file:///");
        FileSystem fs = FileSystem.get(conf);
        //序列文件存放的本地路径
        Path path = new Path("C:\\Users\\seq\\number.seq");
        //设置KV对为(int,null)
        SequenceFile.Writer writer = SequenceFile.createWriter(fs, conf, path, IntWritable.class, NullWritable.class);
        Random random = new Random();
        int number = 0;
        //一共产生5000个整数
        int count = 5000;
        for (int i = 1; i <= count; i++) {
            number = random.nextInt(10000) - 2000;
            //将整型数写入序列文件
            writer.append(new IntWritable(number),NullWritable.get());
        }
        //一定不可以漏
        writer.close();
    }
}

产生的序列文件number.seq为二进制文件，不可以直接查看，将其上传至HDFS，然后使用命令查看number.seq：hdfs dfs -text + 存放number.seq的HDFS路径,可以看到：

四、全排序的实现

本次演示使用的Hadoop版本是：2.6.0-cdh5.7.0
开发工具是IDEA2018

1.创建Java工程，添加Maven支持

完整的依赖如下：

<properties>
    <hadoop.version>2.6.0-cdh5.7.0</hadoop.version>
</properties>

  <repositories>
    <repository>
      <id>cloudera</id>
      <url>https://repository.cloudera.com/artifactory/cloudera-repos</url>
    </repository>
  </repositories>

  <dependencies>
    <dependency>
      <groupId>org.apache.hadoop</groupId>
      <artifactId>hadoop-client</artifactId>
      <version>${hadoop.version}</version>
    </dependency>
  </dependencies>

  <build>
    <pluginManagement><!-- lock down plugins versions to avoid using Maven defaults (may be moved to parent pom) -->
      <plugins>
        <plugin>
          <artifactId>maven-clean-plugin</artifactId>
          <version>3.0.0</version>
        </plugin>
        <!-- see http://maven.apache.org/ref/current/maven-core/default-bindings.html#Plugin_bindings_for_jar_packaging -->
        <plugin>
          <artifactId>maven-resources-plugin</artifactId>
          <version>3.0.2</version>
        </plugin>
        <plugin>
          <artifactId>maven-compiler-plugin</artifactId>
          <version>3.7.0</version>
        </plugin>
        <plugin>
          <artifactId>maven-surefire-plugin</artifactId>
          <version>2.20.1</version>
        </plugin>
        <plugin>
          <artifactId>maven-jar-plugin</artifactId>
          <version>3.0.2</version>
        </plugin>
        <plugin>
          <artifactId>maven-install-plugin</artifactId>
          <version>2.5.2</version>
        </plugin>
        <plugin>
          <artifactId>maven-deploy-plugin</artifactId>
          <version>2.8.2</version>
        </plugin>
      </plugins>
    </pluginManagement>
  </build>

2.编写Map类

Map类完整代码如下：

/**
 * 全排序Map类，直接接数据取出传递给Reducer即可
 */
public class Map extends Mapper<IntWritable, NullWritable, IntWritable, NullWritable> {

    @Override
    protected void map(IntWritable key, NullWritable value, Context context) throws IOException, InterruptedException {
        context.write(key,value);
    }
}

3.编写Reduce类

/**
 * 全排序Reducer类
 * 因为本次演示只是简单的排序，没有其他业务
 * 所以只需将数据输出即可
 */
public class Reduce extends Reducer<IntWritable, NullWritable,IntWritable,NullWritable> {

    @Override
    protected void reduce(IntWritable key, Iterable<NullWritable> values, Context context) throws IOException, InterruptedException {
       //获得values的迭代器
       Iterator<NullWritable> it =  values.iterator();
       //将数据输出即可
       while (it.hasNext()){
           context.write(key,it.next());
       }
    }
}

4.编写作业主类

public class AllSortApp {

    public static void main(String[] args) throws Exception {
        Configuration conf = new Configuration();
        Job job = Job.getInstance(conf,"AllSortApp");

        //文本输入格式
        job.setInputFormatClass(SequenceFileInputFormat.class);
        //设置作业主类
        job.setJarByClass(AllSortApp.class);
        //待排序数据的输入路径
        FileInputFormat.setInputPaths(job,new Path(args[0]));
        //排序结果存放路径
        FileOutputFormat.setOutputPath(job,new Path(args[1]));

        //设置Reducer的个数
        job.setNumReduceTasks(3);

        //设置Map类
        job.setMapperClass(Map.class);
        //设置Reducer类
        job.setReducerClass(Reduce.class);

        //设置Map类Key的输出类型
        job.setMapOutputKeyClass(IntWritable.class);
        //设置Map类Value的输出类型
        job.setMapOutputValueClass(NullWritable.class);
        //设置Reducer类Key的输出类型
        job.setOutputKeyClass(IntWritable.class);
        //设置Reducer类Value的输出类型
        job.setOutputValueClass(NullWritable.class);

        //创建随机采样器
        //freq:采样率
        //numSamples:样本总数
        //maxSplitsSampled:最大采样切片数
        InputSampler.Sampler sampler = new InputSampler.RandomSampler<IntWritable,NullWritable>
                (0.8,1000,3);

        //设置存放分区文件的HDFS路径
        TotalOrderPartitioner.setPartitionFile(job.getConfiguration(),new Path("/data/tmp/par.list"));

        //设置全排序分区类：TotalOrderPartitioner
        job.setPartitionerClass(TotalOrderPartitioner.class);

        //写入分区文件
        InputSampler.writePartitionFile(job,sampler);

        //等待执行
         job.waitForCompletion(true);
    }
}

5.将代码打包提交到集群

在该工程的目录下的target文件夹下有生成的jar包，把jar包提交到集群。

6.运行程序

执行命令：hadoop jar allsortapp1.0.0.jar com.hadoop.allsort.AllSortApp hdfs://hadoop00:/data/number.seq hdfs://hadoop00:/data/out,后面两个路径分别是序列文件路径和结果输出路径。作业结束后，我们先查看Hadoop抽样生成的分区文件(路径已在作业主类中设置)：
使用命令：hdfs dfs -text /data/tmp/par.list：

可以得出Hadoop将三个分区定为 x < 1237、1237 <= x < 4524 、 x >= 4524 。排序结果在三个文件中(一个Reducer输出一个文件)，查看排序结果：hdfs dfs -cat /data/out/part-r-0000*：

至此，全排序结束。

五、总结

本次演示了Hadoop的全排序，以及Hadoop全排序的原理和实现，其本质就是Hadoop事先会对待排序的数据进行抽样，然后根据Reducer的个数科学地指定分区的条件。其实除了本次演示所用的随机抽样器外，还有切片抽样、间隔抽样，随机抽样使用的最多。我是人间，感谢你的阅读！

你可能感兴趣的:(Hadoop生态,大数据生态)

Spark任务读取hive表数据导入es 小小小小小小小小小小码农 hive elasticsearch spark java
使用elasticsearch-hadoop将hive表数据导入es，超级简单1.引入pomorg.elasticsearchelasticsearch-hadoop9.0.0-SNAPSHOT2.创建sparkconf//spark参数设置SparkConfsparkConf=newSparkConf();//要写入的索引sparkConf.set("es.resource","");//es集
HarmonyNext实战：基于ArkTS的分布式任务调度系统开发 harmonyos-next
HarmonyNext实战：基于ArkTS的分布式任务调度系统开发引言在HarmonyNext生态系统中，分布式任务调度是一个核心且复杂的技术领域。随着设备互联的普及，如何在多设备间高效、可靠地分配和执行任务成为开发者面临的重要挑战。本文将深入探讨如何利用ArkTS语言构建一个高性能的分布式任务调度系统，涵盖从架构设计到代码实现的完整过程。分布式任务调度系统概述分布式任务调度系统的核心目标是将任务
深度剖析苹果签名与应用程序的紧密关系 ios
在苹果的生态系统中，应用程序的发布和使用有着一套严格且独特的规则，而苹果签名在其中扮演着举足轻重的角色。对于广大苹果用户和应用开发者来说，深入了解苹果签名与应用程序之间的关系，有助于更好地把握苹果应用市场的运行机制。一、苹果签名的基本概念苹果签名是苹果公司为了确保应用程序来源可靠、内容安全，以及维护整个应用生态的有序性而采用的一种数字认证技术。简单来说，它就像是给应用程序贴上了一个“数字身份证”。
OSPO Summit 2025 正式定档！议题征集同步开启开源
历经二十余年的发展，OSPO已然成为企业数字化转型的战略枢纽、产学研协同创新的关键桥梁、公共领域开放生态建设的核心引擎。作为这一进程的重要见证者和推动者，OSPOSummit也将在2025年6月12日迎来它的第三次进化。会议信息时间：2025年6月12日地点：北京议题征集，期待你的声音现在，我们面向全球开源社区决策者、企业技术管理者、学术机构研究者及一线开发者，发起议题征集！诚邀您分享OSPO如何
ChatGPT、DeepSeek、Grok 三者对比：AI 语言模型的博弈与未来一ge科研小菜菜人工智能人工智能
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言随着人工智能技术的飞速发展，AI语言模型已经成为人机交互、内容创作、代码生成、智能问答等领域的重要工具。其中，ChatGPT（OpenAI）、DeepSeek（中国团队研发）和Grok（xAI，ElonMusk旗下公司）是当前三大具有代表性的AI语言模型。它们在技术架构、应用场景、用户体验、生态开放性等多个维度各具特色，并针对不同的用户需
CVE-2017-5645(使用 docker 搭建) JM丫网络安全
介绍:是一个与ApacheLog4j2相关的安全漏洞,属于远程代码执行,它可能允许攻击者通过构造恶意的日志信息在目标系统上执行任意代码Log4j2介绍Log4j2是Apache的一个日志记录工具,属于Java应用的日志框架,它是Log4j的升级版,性能更好,功能更多.它被广泛的适用于Java应用程序中,帮助开发者记录程序运行的时候的日子信息,是Java生态系统中最重要的一个日志框架之一漏洞编号:C
GitHub一周热门ai项目 2025.3.17 BillyXie23 AI探索 ai 人工智能
项目1：Significant-Gravitas/AutoGPT地址:significant-gravitas.github.com/AutoGPT描述:AutoGPT致力于为所有人提供可访问的AI工具，让用户专注于重要事务。Stars:173,449推荐理由:适合想要探索自动化AI应用的开发者，支持自定义扩展，开源生态强大，适合构建智能助手、自动化流程等场景。项目2：AUTOMATIC1111/
hive-进阶版-1 数据牧马人 hive hadoop 数据仓库
第6章hive内部表与外部表的区别Hive是一个基于Hadoop的数据仓库工具，用于对大规模数据集进行数据存储、查询和分析。Hive支持内部表（ManagedTable）和外部表（ExternalTable）两种表类型，它们在数据存储、管理方式和生命周期等方面存在显著区别。以下是内部表和外部表的主要区别：1.数据存储位置内部表：数据存储在Hive的默认存储目录下，通常位于HDFS（HadoopDi
HarmonyNext实战：基于ArkTS的分布式任务调度系统开发 harmonyos-next
HarmonyNext实战：基于ArkTS的分布式任务调度系统开发引言在HarmonyNext生态系统中，分布式任务调度是一个核心且复杂的技术领域。随着设备互联的普及，如何在多设备间高效、可靠地分配和执行任务成为开发者面临的重要挑战。本文将深入探讨如何利用ArkTS语言构建一个高性能的分布式任务调度系统，涵盖从架构设计到代码实现的完整过程。分布式任务调度系统概述分布式任务调度系统的核心目标是将任务
基于HarmonyNext的ArkTS实战：构建高性能跨平台应用 harmonyos-next
基于HarmonyNext的ArkTS实战：构建高性能跨平台应用引言在HarmonyNext生态系统中，ArkTS作为新一代的编程语言，凭借其强大的类型系统和高效的运行时性能，成为开发高性能跨平台应用的首选。本文将深入探讨如何利用ArkTS构建一个复杂的跨平台应用，涵盖从项目架构设计到具体实现的完整流程。我们将通过一个实战案例——构建一个支持多端同步的笔记应用，来展示ArkTS在HarmonyNe
苹果签名的战略价值：解析六大核心优势与商业赋能逻辑 ios
苹果签名的战略价值：解析六大核心优势与商业赋能逻辑（因篇幅过长所以分为两篇帖子发~）在iOS应用生态中，签名机制既是技术护城河，也是开发者突破分发限制的关键武器。本文将从开发效率、商业变现、安全管控等维度，深度剖析苹果签名体系带来的独特价值。一、突破AppStore审核壁垒，加速产品验证苹果签名最核心的优势在于规避冗长审核流程。根据2023年统计，AppStore平均审核周期为24小时，首次提交通
天吉智芯「星核」智能充气泵 —— 以芯为核，定义车载充气新标杆天吉智芯充气泵打气泵一体机人工智能单片机嵌入式硬件
一、品牌基因：12年车规级芯片的技术沉淀天吉智芯（TJX-CHIP）作为深圳天吉芯技术旗下高端品牌，深耕汽车电子领域12年，累计交付超500万颗车规级MCU芯片。「星核」充气泵是品牌首款终端产品，搭载自主研发的TJX8F003Pro车规级芯片（IATF16949认证），以芯片级定制重构充气泵的智能边界——不止是工具，更是汽车安全生态的智能终端。二、产品定位：全场景胎压管家，重新定义「可靠」目标用户
精选AI大模型读物：《从ChatGPT到AIGC：智能创作与应用赋能》——探索智能时代的创作力量 AGI大模型老王人工智能 chatgpt AIGC AI大模型大模型
自2023年以来，AI聊天机器人ChatGPT火爆互联网，其颠覆性的使用体验重塑了人们对于AI的认知。而ChatGPT背后的技术―AIGC也引起了互联网圈的关注，打开了人们对AI应用的想象空间。本书从ChatGPT入手，以AIGC为中心，对AIGC的理论知识、应用场景、未来发展等内容进行了全面的梳理。首先，本书对AIGC的概念、技术构成、产业生态、市场现状等进行了讲解，以便读者对AIGC形成一个清
案例驱动的 IT 团队管理：创新与突破之路：第一章重构 IT 团队管理：从传统到创新-2.1.2关键岗位胜任力模型设计言析数智案例驱动的 IT 团队管理：创新与突破之路 IT项目管理关键岗位胜任力模型
点击关注不迷路点击关注不迷路点击关注不迷路文章大纲第二章团队组建：从人才画像到生态构建-2.1.2关键岗位胜任力模型设计一、胜任力模型的核心理念与价值1.**传统选才vs胜任力驱动选才**2.**冰山模型：胜任力的分层结构**二、胜任力模型构建的六步法1.**战略对齐与岗位分析**2.**行为事件访谈（BEI）**3.**数据建模与验证**4.**模型分层与指标定义**5.**试点应用与迭代优化*
Ubuntu安装docker-compose-plugin报错“无法定位软件包”终极解决方案川星弦 ubuntu docker linux
摘要：本文针对Ubuntu系统中安装docker-compose-plugin时出现的E:无法定位软件包错误，提供两种解决方案——官方源修复与国内镜像源替换法，并附赠镜像加速配置技巧。一、问题背景在Ubuntu系统通过aptinstall安装Docker生态工具时，常因软件源配置问题导致以下报错：E:无法定位软件包docker-compose-plugin此问题多由Docker官方软件源未正确添加
Python入门实战：Python的代码重构 AI智能涌现深度研究 DeepSeek R1 &大数据AI人工智能大数据人工智能语言模型 AI LLM Java Python 架构设计
1.背景介绍Python是一种基于社区发展、易用性、生态系统完善、可扩展性强、性能卓越等特点的高级编程语言。作为一门解释型语言，它具有高效率、简洁语法、丰富的库函数、跨平台能力和多种开发范式等优点。但随着项目不断迭代更新，代码量逐渐增加，导致代码结构混乱、缺乏模块化设计、重复逻辑过多、命名不规范等问题。如何有效地组织、管理和维护代码、提升代码质量、更好地实现功能，是一个技术人的日常工作。如何进行代
HarmonyOS ArkTS声明式UI开发实战教程 harmonyos
引言：为何选择ArkTS？在HarmonyOS生态快速发展的当下，ArkTS作为新一代声明式UI开发框架，正在引发移动应用开发范式的变革。笔者曾在多个跨平台框架开发中经历过"命令式编程之痛"，直到接触ArkTS后才发现，原来UI开发可以如此直观高效。本文将通过完整案例解析，带您掌握声明式UI设计的精髓。一、ArkTS声明式设计核心理念1.1与命令式开发的本质差异传统开发中，我们需要逐步指示每个UI
大模型系列——正式推出 Spring AI MCP：用于 MCP（模型上下文协议）的 Java SDK 不二人生大模型人工智能大模型
大模型系列——正式推出SpringAIMCP：用于MCP（模型上下文协议）的JavaSDK我们很高兴推出SpringAIMCP，它是模型上下文协议（ModelContextProtocol，MCP）的强大JavaSDK实现。SpringAI生态系统的这一新成员为Java平台带来了标准化的AI模型集成能力。MCP是什么？模型上下文协议（MCP）是一种开放式协议，它规范了应用程序为大型语言模型（LLM
MindSpore：华为全场景AI框架的技术全景与生态实践彩旗工作室人工智能人工智能
一、框架概述MindSpore（昇思）是华为自主研发的全场景AI计算框架，于2020年3月开源，旨在实现易开发、高效执行、灵活部署三大核心目标。作为华为昇腾AI生态的基石，MindSpore支持端、边、云全场景覆盖，并深度融合昇腾处理器的算力特性，提供从模型开发、训练到推理部署的端到端能力。截至2025年，其月度开发者访问量已突破12万，成为国内开源社区最活跃的AI框架之一。二、架构设计MindS
PyTorch从入门到精通：探索深度学习新境界 lmtealily 深度学习 pytorch 人工智能
引言PyTorch作为当前最受欢迎的深度学习框架之一，凭借其动态计算图的独特设计和与Python生态的无缝集成，正重塑着人工智能开发的新范式1。从NVIDIA的研究实践到Meta的产业应用，PyTorch的价值已渗透至学术研究、工业部署的每个角落。本文将带领您从张量操作基础开始，逐步探索GPU加速、动态图机制、框架生态集成等高级主题，最终实现理论与实战的双重突破。一、PyTorch核心基础构建1.
探索Haskell开发的新境界：利用haskell.nix与Nix构建高效生态系统计蕴斯Lowell
探索Haskell开发的新境界：利用haskell.nix与Nix构建高效生态系统haskell.nixAlternativeHaskellInfrastructureforNixpkgs项目地址:https://gitcode.com/gh_mirrors/ha/haskell.nix在快速演进的软件开发世界中，Haskell以其严谨的类型系统和高度表达性脱颖而出。而当结合强大的Nix工具链时，
2.5 python接口编程 nervermore990 Python python
在现代软件开发的复杂生态系统中，不同系统、模块之间的交互协作至关重要。接口编程作为一种关键机制，定义了组件之间的通信规范与交互方式。Python凭借其卓越的灵活性、丰富的库资源以及简洁易读的语法，在接口编程领域占据了重要地位，广泛应用于各类项目开发中，从Web应用到数据处理，再到自动化测试等场景。一、接口编程基础概念（一）接口的定义从本质上讲，接口是一种抽象的规范，它规定了一组方法或行为的签名，但
uv：颠覆你的Python项目管理，速度提升10-100倍强化学习曾小健2 uv python 开发语言
uv：颠覆你的Python项目管理，速度提升10-100倍原创工业开源好项目工业开源好项目2025年01月05日00:01湖南Python生态系统繁荣的同时，也带来了一些挑战：繁多的包管理工具、缓慢的依赖安装速度、以及复杂的虚拟环境管理。面对这些问题，uv应运而生。它是一个用Rust编写的高性能Python包和项目管理器，旨在以更快的速度、更简洁的方式，解决Python开发中的诸多痛点。本文将详细
R语言的移动应用开发滕若岚包罗万象 golang 开发语言后端
R语言的移动应用开发在数据科学和统计分析的大潮中，R语言因其强大的数据处理和可视化能力而备受青睐。然而，R语言对移动应用开发的适用性并未得到广泛关注。本文将探讨R语言在移动应用开发中的潜力及其工具，并提供一些实践示例，希望能为读者在这一新兴领域的探索提供帮助。一、R语言概述R语言是一种用于统计计算和图形绘制的编程语言，因其简洁的语法和丰富的包生态系统受到数据科学家的广泛使用。R语言的强大之处在于其
深入理解Spring Boot：快速构建现代化的Java应用杨凯凡 Spring spring boot java spring
大家好！今天我们来聊聊Java开发中最流行的框架之一——SpringBoot。SpringBoot是Spring生态系统中的一个重要模块，它旨在简化Spring应用的开发和部署。通过SpringBoot，开发者可以快速构建独立、生产级的应用程序，而无需繁琐的配置。本文将深入探讨SpringBoot的核心特性、自动配置、配置文件、Web开发、数据库集成、缓存、安全以及监控等内容，帮助你全面掌握Spr
区块链和大模型的结合 hanyongyi 1531 区块链
大模型@区块链（4个应用）_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1mu4y1W7bY/?spm_id_from=333.337.search-card.all.click&vd_source=8d683f22b43d55b6630d3bec03cfdb6d通过使用自然语言询问有关Aptos区块链生态系统的任何问题，使用户能够无缝地进入web3
鸿蒙开发：权限管理之权限声明
前言本文基于Api13。为什么要有权限管理？最大原因是提高用户对隐私和数据安全的控制权，防止恶意软件滥用权限，试想一下，如果没有权限管理，肯定会有一些恶意软件利用这些默认授权权限，获取用户的敏感信息，对用户隐私构成威胁‌，这是其一，其二就是用户的体验，因为用户无法根据自己的需求授权权限，可能导致不必要的权限被授予，于公于私，于情于理，权限管理都是必须且坚决要执行的。鸿蒙生态中，可以说，权限管理从始
HarmonyOS NEXT 开发环境搭建与金融理财类APP开发指南 harmonyos
引言随着华为鸿蒙操作系统HarmonyOSNEXT的推出，越来越多的开发者开始关注并投入到这一新生态系统的开发中。本文将详细介绍如何在HarmonyOSNEXT上搭建开发环境，并通过一个金融理财类财务记账APP的示例，展示如何进行应用程序的技术开发。开发环境搭建首先，开发者需要准备一台运行Windows或macOS的计算机，并确保安装了最新版本的JavaDevelopmentKit(JDK)。接下
鸿蒙开发：权限管理之权限声明
前言本文基于Api13。为什么要有权限管理？最大原因是提高用户对隐私和数据安全的控制权，防止恶意软件滥用权限，试想一下，如果没有权限管理，肯定会有一些恶意软件利用这些默认授权权限，获取用户的敏感信息，对用户隐私构成威胁‌，这是其一，其二就是用户的体验，因为用户无法根据自己的需求授权权限，可能导致不必要的权限被授予，于公于私，于情于理，权限管理都是必须且坚决要执行的。鸿蒙生态中，可以说，权限管理从始
大数据手册(Spark)--Spark安装配置 WilenWu 数据分析(Data Analysis)大数据 spark 分布式
本文默认在zsh终端安装配置，若使用bash终端，环境变量的配置文件相应变化。若安装包下载缓慢，可复制链接到迅雷下载，亲测极速～准备工作Spark的安装过程较为简单，在已安装好Hadoop的前提下，经过简单配置即可使用。假设已经安装好了hadoop（伪分布式）和hive，环境变量如下JAVA_HOME=/usr/opt/jdkHADOOP_HOME=/usr/local/hadoopHIVE_HO
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他