Java大数据开发Hadoop MapReduce

1 MapRedcue的介绍

1.1 MapReduce定义

MapReduce是一个进行分布式运算的编程框架，使用户开发基于hadoop进行数据分析的核心框架。 MapReduce 核心功能就是将用户编写的业务逻辑代码和自带的默认组件整合成一个完整的分布式运算程序，并发运行在一个 Hadoop 集群上。

1.2 MapReduce的思想

MapReduce的思想核心是分而治之，适用于大规模数据处理场景。

map负责分，将复杂的任务拆解成可以并行计算的若干个任务来处理

reduce负责合，对map阶段的结果进行全局汇总

比如说：老师作业留的有点多，一个人写太费劲了，就可以用MapReduce这种分而治之的思想，将作业进行map处理，分给不同的人，最后所有写完的部分发到群里进行reduce汇总，复杂的作业简简单单。

1.3 MapReduce优点

易于编程

MapReduce将做什么和怎么做分开了，提供了一些接口，程序员只需关注应用层上的问题。具体如何实现并行计算任务则被隐藏了起来。

扩展性

当计算资源不足时，可以增加机器来提高扩展能力

高容错

一台机器挂了，可以将计算任务转移到另一台节点上进行

适合PB级海量数据的离线处理

1.4 MapReduce的缺点

不擅长实时计算

无法做到在毫秒级别返回结果

不擅长流式计算

MapReduce处理的数据源只能是静态的，不能动态变化

不擅长DAG(有向无环图)计算

每个MR作业处理结束，结果都会写入到磁盘，造成大量的磁盘IO，导致性能低下

1.5 MapReduce进程

一个MapReduce程序在分布式运行时有三类的实例进程

MrAppMaster : 负责整个程序的过程调度及状态协调
MapTask : 负责Map阶段的数据处理流程
ReduceTask ：负责Reduce阶段的数据处理流程

1.6 MapReduce-WordCount

import java.io.IOException;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class WordCount {
  public static class TokenizerMapper
       extends Mapper{
    private final static IntWritable one = new IntWritable(1);
    private Text word = new Text();
    public void map(Object key, Text value, Context context) throws IOException, InterruptedException {
      StringTokenizer itr = new StringTokenizer(value.toString());
      while (itr.hasMoreTokens()) {
        word.set(itr.nextToken());
        context.write(word, one);
      }
    }
  }
  public static class IntSumReducer
       extends Reducer {
    private IntWritable result = new IntWritable();
    public void reduce(Text key, Iterable values,Context context) throws IOException, InterruptedException {
      int sum = 0;
      for (IntWritable val : values) {
        sum += val.get();
      }
      result.set(sum);
      context.write(key, result);
    }
  }
  public static void main(String[] args) throws Exception {
    Configuration conf = new Configuration();
    Job job = Job.getInstance(conf, "word count");
    job.setJarByClass(WordCount.class);
    job.setMapperClass(TokenizerMapper.class);
    job.setCombinerClass(IntSumReducer.class);
    job.setReducerClass(IntSumReducer.class);
    job.setOutputKeyClass(Text.class);
    job.setOutputValueClass(IntWritable.class);
    FileInputFormat.addInputPath(job, new Path(args[0]));
    FileOutputFormat.setOutputPath(job, new Path(args[1]));
    System.exit(job.waitForCompletion(true) ? 0 : 1);
  }
}

以上代码实现了两个类：TokenizerMapper和IntSumReducer，它们分别实现了Map和Reduce功能。

Map函数将输入的每一行文本进行分词，并将每个单词映射为一个键值对，其中键为单词，值为1，然后将这些键值对输出给Reduce函数。

Reduce函数将相同键的值相加，并将最终结果输出。

在这个例子中，CombinerClass被设置为相同的Reducer类，用于在Map任务结束后本地合并中间结果，以减少网络传输。

最后，将输入文件和输出文件的路径作为命令行参数传递给main函数，并启动MapReduce作业。

job的讲解

在Hadoop MapReduce程序中，Job对象是用来定义和运行一个MapReduce作业的。

Job对象的主要功能是封装了整个MapReduce作业的配置和运行信息，包括输入数据和输出数据的路径、Mapper类和Reducer类的设置、中间结果的输出类型和格式、作业的提交方式等。

在main函数中，我们创建一个Job对象并设置它的相关属性。

Job.getInstance()方法返回一个新的Job实例，其中的Configuration对象用来指定作业的一些配置信息。

setJarByClass()方法用来设置作业的jar包，它的参数是定义MapReduce作业的主类。

setMapperClass()、setCombinerClass()和setReducerClass()方法用来指定Mapper、Combiner和Reducer的实现类。

setOutputKeyClass()和setOutputValueClass()方法分别用来设置MapReduce作业的输出键和输出值的类型。

FileInputFormat.addInputPath()和FileOutputFormat.setOutputPath()方法用来指定输入文件和输出文件的路径。

最后，我们调用job.waitForCompletion()方法来提交并运行作业，并等待作业完成。

如果作业成功完成，waitForCompletion()方法将返回true，否则返回false。

如果作业失败，我们可以通过job.getJobState()方法来获取作业的状态信息，或者查看作业的日志信息来进行排错和调试。

2 Hadoop序列化

2.1 序列化的定义

序列化就是将内存中对象转换成字节序列，便于存储到磁盘和网络传输

反序列化时将字节序列或磁盘中的持久化数据转换成内存中的对象

一般来说，对象只能在本地进程中使用，不能通过网络发送到另一台计算机

序列化可以存储对象，可以将对象发送到远程计算机

2.2 hadoop序列化和java序列化的区别

Hadoop序列化和Java序列化都是将对象转换为字节序列以便于在网络上传输或者存储到磁盘等持久化存储介质中。它们的主要区别在于以下几点：

序列化速度和效率不同：Hadoop序列化比Java序列化更快，因为它采用的是二进制格式，而Java序列化采用的是基于文本的XML或JSON格式。
支持的数据类型不同：Hadoop序列化支持的数据类型比Java序列化更多，包括基本类型、数组、集合、映射、枚举、自定义类等。
序列化后的数据大小不同：Hadoop序列化生成的字节流比Java序列化生成的字节流更小，因为它使用更紧凑的二进制格式，这对于在网络上传输和存储到磁盘等介质中非常重要。
可移植性不同：Java序列化生成的字节流只能被Java程序读取，而Hadoop序列化生成的字节流可以被任何语言的程序读取，因为它使用了通用的二进制格式。

总的来说，Hadoop序列化更适合用于大规模数据的处理和分布式计算，而Java序列化更适合用于小规模数据的传输和存储。

3 MapReduce 的原理

3.1 MapReduce 工作的过程

数据输入：MapReduce从Hadoop分布式文件系统（HDFS）中读取输入数据，并将其分成固定大小的数据块，每个数据块大小通常为64MB。

Map阶段：在Map阶段，MapReduce将每个数据块分发给一组可扩展的计算节点，每个计算节点运行Map函数来处理它们分配的数据块。Map函数将输入数据转换为一组键值对（Key-Value Pairs）的形式，这些键值对可以被后续的Reduce函数处理。

Shuffle阶段：在Map函数处理完数据之后，MapReduce框架将所有的键值对按照它们的键进行排序，并将相同键的值合并在一起。这个过程通常被称为“Shuffle”。

Reduce阶段：在Reduce阶段，MapReduce框架将合并后的键值对发送到一组可扩展的计算节点。每个节点运行Reduce函数来处理它们收到的所有键值对，并生成最终的输出结果。

数据输出：在Reduce函数处理完数据之后，MapReduce将输出结果写入HDFS中。

这些步骤中，Map和Reduce函数是由开发者自行编写的，它们实现了具体的业务逻辑。MapReduce框架提供了分布式计算的基础设施，负责管理计算节点、任务分配、故障处理等任务，以保证整个计算过程的可靠性和高效性。

总的来说，MapReduce框架的原理是将大数据集划分成多个小数据块，然后将这些数据块分发给多个计算节点并行处理，最后将处理结果合并为一个最终结果。它通过这种方式来充分利用集群中的计算资源，提高计算效率和数据处理能力。

3.2 InputFormat 数据输入

3.2.1 切片

数据块：Block时HDFS在物理上对数据进行切块，是HDFS存储数据的单位

数据切片：数据切片是在逻辑上对输入进行切片。切片是MR程序计算输入数据的单位，一个切片会启动一个MapTask

客户端提交job时的切片数决定了map阶段的并行度

默认情况下，切片大小为BlockSize

切片不会考虑数据整体，是对每个文件进行单独切片

3.2.2 FileInputFormat

在MapReduce中，FileInputFormat是一个抽象类，用于定义如何将文件分割成输入数据块并生成适合Mapper处理的RecordReader。它是MapReduce中的输入格式类之一，用于读取Hadoop分布式文件系统（HDFS）或本地文件系统中的数据。

FileInputFormat包括两个关键方法：getSplits()和createRecordReader()。

getSplits()方法将输入文件划分成适合Map任务的数据块，每个数据块对应一个Map任务。该方法返回一个InputSplit对象的数组，其中每个InputSplit表示一个文件数据块。

createRecordReader()方法创建一个RecordReader对象，用于读取InputSplit中的数据块。RecordReader负责读取一个数据块中的所有记录，并将它们转换成key-value对。

FileInputFormat还提供了一些其他的方法，如isSplitable()用于判断一个文件是否可以被划分成多个数据块。

Hadoop提供了一些预定义的FileInputFormat类，如TextInputFormat用于读取文本文件，SequenceFileInputFormat用于读取SequenceFile格式的文件等，用户也可以通过继承FileInputFormat自定义输入格式类。

3.2.3 TextInputFormat

TextInputFormat是FileInputFormat默认的实现类，按行读取每条记录

key为该行的起始字节偏移量，为LongWritable类型

value 为这一行的内容，不包括终止符，为Text类型

3.2.4 CombineTextInputFormat

TextInputFormat是按文件进行规划分片，不管文件有多小，都是是一个单独的切片，这样会产生大量的MapTask，效率低下

CombineTextInputFormat用于小文件过多的场景，可以将多个小文件在逻辑上划分到一个切片

决定哪些块放入同一个分片时，CombineTextInputFormat会考虑到节点和机架的因素，所以在MR作业处理输入的速度不会下降

CombineTextInputFormat不仅可以很好的处理小文件，在处理大文件时也有好处，因为它在每个节点生成了一个分片，分片可能又多个块组成，CombineTextInputFormat使map操作中处理的数据量和HDFS中文件块的大小的耦合度降低了

3.3 MapReduce工作机制

3.3.1 MapTask工作机制

读取输入数据：MapTask通过InputFormat获得RecordReader，从输入InputSplit中解析出KV
Map阶段：将解析出的KV交给map()函数处理，产生一系列新的KV
Collect收集：数据处理完成之后，会调用OutputCollector.collect()输出结果。在该函数的内部，会生成KV分区，写入环形缓冲区中
Spill阶段：环形缓冲区满了之后，MR会将数据写到本地磁盘，形成一个临时文件，在写入之前，会对数据进行一次排序
merge阶段：所有数据处理完毕之后，MapTask会对所有临时文件进行一次合并，确保只生成一个数据文件

Spill阶段详情：

通过快速排序对环形缓冲区内的数据进行排序，先按照partition(后面会介绍)编号进行排序，然后再按照K进行排序。排序过后，数据以分区为单位聚集，分区内的所有数按照K有序
按照分区编号由小到大将分区数据写入工作目录下的临时文件 output/spillN.out(N表示当前溢写的次数)，如果设置了combiner(后面会介绍)，则写入文件之前，还会将分区中的数据进行一次聚集操作
将分区数据的元数据写入到内存索引数据结构SpillRecord中，每个分区的元数据包括临时文件的偏移量、压缩前后的数据大小，如果内存索引大于1MB，会将内存索引写到文件 output.spillN.out.index中

3.3.2 Partition分区

在MapReduce计算模型中，Map任务会将生成的键值对按照键进行排序，并将其划分到不同的分区中。分区的数量通常等于Reduce任务的数量。具体来说，Map任务会按照Partitioner函数定义的分区规则对键值对进行划分。Partitioner函数将每个键值对映射到一个分区编号，然后Map任务将其输出到对应的分区中。

Partitioner函数通常是由用户自定义实现的，其作用是将键值对映射到一个特定的分区。Hadoop提供了默认的Partitioner实现，即HashPartitioner，它将键哈希后取模得到分区编号，从而实现对键值对的划分。在实际应用中，用户可以根据自己的需求自定义Partitioner函数，以便将键值对划分到特定的分区中。

如果ReduceTask数量 > Partition数量，会产生多个空的输出文件

如果ReduceTask数量 < Partition数量，会导致有分区的数据无处安放，会Exception

如果ReduceTask数量 = 1，则不管有多少个分区文件，最终都会只产生一个文件

3.3.3 Combiner合并

Combiner在每个mapTask所在的节点运行

Combiner对每个MapTask的输出进行局部汇总，减少reduce阶段的负担

Combiner使用的前提是不能影响业务逻辑

3.3.4 ReduceTask工作机制

Copy：拉取数据，Reduce进程启动copy进程(Fetcher)，通过HTTP的方式请求maptask获取自己的文件，map task分区表示每个map task属于哪个reduce task

Merge：ReduceTask启动两个线程对内存和磁盘中的文件进行合并，防止文件过多。当内存中的数据达到一定阈值时，就会启动内存到磁盘的merge，与map端的相似。直到没有map端的数据才结束

合并排序：将数据合并成一个大数据，并进行排序

对排序后的数据调用reduce方法：对键相同的键值对调用reduce方法，每次调用会产生零个或多个键值对，最后将输出的键值对存入HDFS。

3.3.5 shuffle机制

Shuffle阶段的过程可以分为三个阶段：

Map端的输出：Map任务将生成的键值对按照键排序，并将其划分到不同的分区中。如果Map任务的输出缓存区已满，则需要将其溢出到本地磁盘的临时文件中。

数据传输：在Shuffle阶段中，Map任务的输出需要传输到Reduce任务所在的节点，以便Reduce任务可以从中提取和合并数据。数据传输是Shuffle阶段的关键步骤，其速度和效率直接影响整个MapReduce作业的性能。

Reduce端的输入：Reduce任务需要从本地磁盘读取属于自己的分区的临时文件，并对同一个分区中的键值对进行合并和排序。Reduce任务将合并后的结果输出到最终的输出文件中。

Shuffle阶段是MapReduce计算模型中非常重要的一个阶段，它的性能和效率对整个作业的执行时间和性能影响非常大。因此，优化Shuffle阶段的性能和效率是MapReduce应用程序优化的一个关键方向。

3.3.6 排序的解释

MapTask和ReduceTask对key进行排序是为了方便后续的数据处理和计算。

具体来说，对于MapTask而言，对输出的key进行排序可以将具有相同key值的记录聚合在一起，方便ReduceTask进行处理。

而对于ReduceTask而言，对输入的key进行排序可以让具有相同key值的记录相邻排列，方便进行聚合和计算。

一般来说，在Map任务中，对键值对进行快速排序的次数是一次，即将数据写入环形缓冲区之前对其中的键值对进行排序。这是因为，对于同一个Map任务的输出，在Map输出的环形缓冲区中进行快速排序即可满足Reduce任务在Shuffle阶段的需求，而不需要进行额外的排序。

在Shuffle阶段，如果存在多个环形缓冲区需要合并，Reduce任务会对它们进行归并排序。这是因为，不同Map任务的输出在Shuffle阶段需要合并，而这些输出之间的顺序是无序的，因此需要进行排序以便进行合并。这次排序是对整个数据集进行的，而不是对单个Map任务的输出进行的。

当Reduce任务接收到来自多个Map任务的中间结果时，它会对同一个分区内的所有键值对进行排序。这里采用的排序算法一般也是归并排序，因为归并排序的时间复杂度是O(nlogn)，且适合对大量数据进行排序。这次排序也是对整个数据集进行的，而不是对单个Map任务的输出进行的。

因此，总体来说，Shuffle阶段需要进行多次排序，具体排序的次数可能因具体实现而有所不同。但无论是哪种具体实现，Shuffle阶段都需要对整个数据集进行排序以便后续的计算和处理。

4 数据压缩

4.1 压缩算法对比

4.2 压缩位置选择

到此这篇关于Java大数据开发Hadoop MapReduce的文章就介绍到这了,更多相关Java Hadoop MapReduce内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

基于Redis分布锁+事务补偿解决数据不一致性问题 yiridancan 并发编程 Redis 分布式 redis 数据库缓存
基于Redis的分布式设备库存服务设计与实现概述本文介绍一个基于Redis实现的分布式设备库存服务方案，通过分布式锁、重试机制和事务补偿等关键技术，保证在并发场景下库存操作的原子性和一致性。该方案适用于物联网设备管理、分布式资源调度等场景。代码实现importjava.util.HashMap;importjava.util.Map;importorg.slf4j.Logger;importorg
Java并发实战——CountDownLatch优化商品详情页数据加载 1加1等于 Java并发 java 开发语言多线程
本文将结合电商场景比如优化商品详情页数据加载，深入探讨CountDownLatch的工作原理及实际应用。本文目录1.简介2.商品详情页数据加载优化实战3.CountDownLatch的优势4.其他应用场景5.使用误区1.简介CountDownLatch是Java并发包java.util.concurrent中的一个同步工具类。允许一个或多个线程等待，直到其他一组线程完成一系列操作。CountDow
Java进阶——常用类及常用方法详解 1加1等于 Java java
本文将深入探讨Java常用类的核心知识点以及在日常工作中的使用场景。本文目录一、String类1.不可变性2.字符串常量池3.比较字符串二、日期时间常用类1.Java8引入2.时间计算三、Math数值处理四、Optional空值处理五、异常处理类六、枚举类一、String类1.不可变性String类是不可变的，这意味着一旦创建就不能被修改。在进行字符串拼接时，需要注意性能问题。//不推荐：会创建多
Java进阶——数组超详细整理 1加1等于 Java java 数据结构
数组是一种基础且重要的数据结构，广泛应用于各种场景，本文将深入探讨Java数组的相关知识点，并结合实际场景展示其应用。本文目录一、数组声明与初始化1.声明方式2.初始化方法3.长度特性二、内存管理三、数组遍历与操作1.遍历方式2.数组填充四、多维数组五、数组工具类Arrays六、数组与集合的转换1.数组转集合2.集合转数组总结一、数组声明与初始化1.声明方式数组的声明有两种方式：int[]prod
Vue——Vue-cli脚手架+前端路由 pdsu_zhao Vue Vue学习之旅 vue v-router v-resource vue-cli ES6
Vue-cli是Vue的脚手架工具可以进行目录结构、本地调试、代码部署、热加载、单元测试1、MVVM框架View——ViewModel——Model（视图）（通讯）（数据）“DOM”“观察者vue实例”“Javascript”注意：交互为双向的特点：（1）针对具有复杂交互逻辑的前端应用；（2）提供基础的架构抽象；（3）通过Ajax数据持久化，保证前端用户体验。2、什么是Vue.js它是一个轻量级M
AsyncHttpClient使用说明书有梦想的攻城狮 netty学习专栏 Java asynchttpclient 异步处理 netty
[[toc]]AsyncHttpClient（AHC）是一个高性能、异步的HTTP客户端库，广泛用于Java和Scala应用中，特别适合处理高并发、非阻塞的HTTP请求。它基于Netty或Java原生的异步HTTP客户端实现，支持HTTP/1.1和HTTP/2协议，适用于微服务、API调用、爬虫等场景。1.核心特性特性说明异步非阻塞基于事件驱动模型，避免线程阻塞，支持高并发（如每秒数千请求）。HT
Java的包结构 MingDong523 笔记
Java的包结构类就相当于文件夹(目录)。包结构的作用一般有以下两个方面第一个就是Java的包是根据Java文件的功能和性质来区分，方便区分和查找另一个就是重复的文件名可以存在于不同的包(文件夹)里。当我们选择去创建Java包时有两种创建方式，其中一种就是手动创建，手动创建包太过繁琐，不推荐。而另一种就是使用代码去创建(打包语句package)，当我们使用打包语句时要注意一下几点1.在写packa
Java中String类型的20个方法 MingDong523 笔记
根据长度来使用的方法：返回类型：int方法签名：String.length()作用：用来计算String中字符的个数根据数组来使用的方法：返回类型：byte类型的数组byte[]方法签名：String.getBytes()作用：将String类型转换成byte类型的数组返回类型：char类型的数组char[]方法签名：String.toCharArray()作用：将String类型转变成char类
深入浅出：序列化与反序列化的全面解析进击的小白菜一些开发常识开发语言开发常识
文章目录1.引言2.什么是序列化？2.1为什么需要序列化？3.什么是反序列化？3.1反序列化的重要性4.序列化与反序列化的实现4.1JSON(JavaScriptObjectNotation)4.2XML(eXtensibleMarkupLanguage)4.3ProtocolBuffers(Protobuf)4.4MessagePack5.安全性考虑6.性能优化7.结论附录：常见问题解答Q1:什
Java高频面试之集合-13 牛马baby 面试职场和发展 java 哈希算法 HashMap
hello啊，各位观众姥爷们！！！本baby今天来报道了！哈哈哈哈哈嗝面试官：为什么hash函数能降哈希碰撞？哈希函数通过以下核心机制有效降低碰撞概率，确保不同输入尽可能映射到不同的哈希值：一、设计原理与数学基础均匀分布（UniformDistribution）目标：使任意输入经过哈希计算后，结果在输出空间中均匀分布。数学方法：利用模运算、位操作等，确保输入变化时哈希值的变化无规律。示例：#简单哈
Java高频面试之集合-08 牛马baby java 面试 python
hello啊，各位观众姥爷们！！！本baby今天来报道了！哈哈哈哈哈嗝面试官：详细说说CopyOnWriteArrayListCopyOnWriteArrayList详解CopyOnWriteArrayList是Java并发包（java.util.concurrent）中提供的线程安全列表，基于“写时复制”（Copy-On-Write）机制实现。它适用于读多写少的高并发场景，如事件监听器列表、配置
Java高频面试之集合-02 牛马baby java 面试开发语言
hello啊，各位观众姥爷们！！！本baby今天来报道了！哈哈哈哈哈嗝面试官：说说队列queueJava队列（Queue）详解队列（Queue）是Java集合框架中一种先进先出（FIFO）的线性数据结构，广泛应用于生产者-消费者模型、任务调度、线程池等场景。Java提供了丰富的队列实现，涵盖线程安全、阻塞、优先级等特性。一、队列的核心接口与操作Java队列的顶层接口是java.util.Queue
Java高频面试之集合-07 牛马baby java 面试开发语言
hello啊，各位观众姥爷们！！！本baby今天来报道了！哈哈哈哈哈嗝面试官：ArrayList和Vector的区别是什么？ArrayList与Vector的区别详解ArrayList和Vector都是Java中基于动态数组实现的List接口的实现类，但它们在设计、性能和线程安全性上有显著差异。以下是两者的核心区别：1.线程安全性特性ArrayListVector线程安全非线程安全（方法未同步）线
Java高频面试之SE-23 牛马baby java 面试 windows
hello啊，各位观众姥爷们！！！本baby今天又来了！哈哈哈哈哈嗝Java中的Stream是Java8引入的一种全新的数据处理方式，它基于函数式编程思想，提供了一种高效、简洁且灵活的方式来操作集合数据。Stream的核心思想是声明式编程（告诉程序“做什么”，而不是“怎么做”）。1.Stream的核心特点无存储：Stream不存储数据，只是对数据源的视图（如集合、数组、I/O通道等）。函数式操作：
2025计算机毕设全流程实战指南：Java/Python+协同过滤+小程序开发避坑手册启点毕设课程设计 java python 大四论文指南查重降重技巧毕业设计 spring
技术框架的选择是项目开发的关键起点，直接影响开发效率和最终成果质量。然而，许多开发者在选择技术框架时面临困难：现有知识储备不足以支撑复杂项目需求，团队经验有限，框架选择缺乏前瞻性常导致后期问题。尽管技术框架的选择过程充满挑战，但合适的框架能为项目开发和维护奠定基础，而不当的选择则可能带来持续的技术债务和开发困扰。所以，建议对项目技术框架把握不好的同学，最好是找自己的研究生学长或者老师详细的把关机技
linux服务器上的项目读取本地文件,java访问linux服务器读取文件路径防晒霜白癜风患者
java访问linux服务器读取文件路径内容精选换一换通过ADC将文件传输到Host。参见准备环境完成环境配置。以运行用户登录安装Toolkit组件的服务器。执行命令，将A.java文件传输到Host的指定路径下。adc--hostxx.xx.xx.xx:22118--sync/tmp/A.java"~/ide_daemon"将xx.xx.xx.xx替换为实际的Host的IP地址。如果Conv2D
[0948]基于JAVA的城市路网智慧管理系统的设计与实现阿鑫学长【毕设工场】 java python 人工智能毕业设计课程设计
毕业设计（论文）开题报告表姓名学院专业班级题目基于JAVA的城市路网智慧管理系统的设计与实现指导老师（一）选题的背景和意义开题报告背景与意义：随着我国城市化进程的加快，城市路网系统日益庞大复杂，交通管理面临的挑战愈发严峻。传统的路网管理模式由于信息更新不及时、数据处理效率低下、智能化程度不足等问题，已无法满足现代城市管理对高效、精准、智能交通管理的需求。因此，设计并实现一套基于Java的城市路网智
45-JavaEE 开发中的动态代理与序列化技术只不过是胆小鬼罢了 WEB安全开发 java
在JavaEE开发领域，动态代理与序列化技术是两个关键知识点，它们在很多场景下发挥着重要作用。以下是对这两部分知识的深入探讨。动态代理代理模式概述代理模式是Java中常用的设计模式之一，其核心思想是代理类与委托类实现相同的接口。代理类的主要职责是为委托类进行预处理、消息过滤、转发消息以及事后处理等操作。这种模式在很多场景下都有应用，比如权限控制、日志记录、事务管理等。JDK动态代理实现步骤创建接口
Electron打包文件生成.exe文件打开即可使用糕冷小美n electron javascript 前端
1、Electron打包，包括需要下载的内容和环境配置步骤注意：Electron是一个使用JavaScript、HTML和CSS构建跨平台桌面应用程序的框架首先需要电脑环境有Node.js和npm我之前的文章有关nvm下载node的说明也可以去官网下载检查是否有node和npm环境命令node-vnpm-v输出版本号，说明安装成功2、创建Electron项目2.1创建项目目录打开命令行工具，创建一
JavaScript基础-事件对象難釋懷 javascript 开发语言
在现代Web开发中，事件处理是实现动态和交互式网页的核心。当用户与页面进行交互时（如点击按钮、提交表单等），浏览器会生成相应的事件。为了有效地响应这些事件，JavaScript提供了事件对象，它包含了关于事件的详细信息。本文将详细介绍事件对象的概念、重要的属性和方法，并通过实例展示其应用场景。一、什么是事件对象？每当一个事件被触发时，浏览器都会创建一个事件对象，这个对象包含了该事件的所有相关信息，
Java 常用类Date 浅橙boy java 开发语言
这次介绍Java中常用类中的一种Date，一般常用的Date的包名为util即java.util.Date。还有一种Date类的包名为spl即java.spl.Date，这次不做介绍。包名为spl的Date类作用于和spl数据库打交道，其内容只包括日期，没有时间，包名为util的Date类作用于平常日期使用其内容包括日期和时间，且大部分的构造器和方法已经过时了，下面介绍的是平时还可以使用的方法和构
学习-Java常用类之Calendar类 AIains Educoder—Java java
第1关：学习-Java常用类之Calendar类任务描述相关知识编程要求测试说明任务描述本关任务：获取给定年月的最后一天。相关知识我们通过之前的学习已经能够格式化并创建一个日期对象了，但是我们如何才能设置和获取日期数据的特定部分呢，比如说小时，日，或者分钟?我们又如何在日期的这些部分加上或者减去值呢?calendar类是一个抽象类，是Java日期处理的核心类之一。Calendar类为操作日历字段，
Java基础回顾 Day5 小斌的Debug日记 Java基础回顾 java 开发语言
基础数据类型4类8种byte8位（常用流操作）short16位（运用场景不多）int32位（最常用）long64位（常用于表示时间毫秒）float32位（精度为7位，精度低）double64位（精度为15位，更常用）char16位（也可以算术运算）boolean8位（值为true或者false）基本数据类型的转换小转大为隐式转换，大转小为显式转换可能会丢失精度i++和++ii++是先取值在加1，而
Three.js世界中的三要素：场景、相机、渲染器 Front_Yue 3D技术实践指南 javascript three.js 3d
一、Three.js简介Three.js是一个基于WebGL的JavaScript库，它允许开发者在网页上创建和显示复杂的3D图形和动画，而无需用户安装任何额外的插件或软件。Three.js在Web开发中的地位非常重要，它通过提供简单直观的API，极大地降低了3D图形开发的门槛，使得开发者可以更专注于实现创意。Three.js广泛应用于游戏开发、虚拟现实、数据可视化、艺术创作等多个领域。二、场景：
【Kivy App】Pyjnius是什么？ Botiway 移动APP Kivy python
Pyjnius是一个Python库，用于在Python中访问Java类和方法，特别适用于在Kivy或其它Python应用中调用AndroidAPI。以下是Pyjnius的详细介绍、安装和使用方法：1.Pyjnius是什么？Pyjnius是一个Python-to-Java的桥接工具，允许Python代码直接调用Java类和方法。它基于JavaNativeInterface(JNI)，主要用于以下场景
代码训练day7哈希表2 徵686 散列表数据结构
1.四数相加IIleetcode454哈希表判断是否存在classSolution{//四数相加ii统计个数publicintfourSumCount(int[]nums1,int[]nums2,int[]nums3,int[]nums4){HashMapmap=newHashMapmagazine.length())returnfalse;//java字符串长度s.length()for(cha
若依集成knife4j实现swagger文档增强 Roc-xb knife4j
knife4j的前身是swagger-bootstrap-ui，为了契合微服务的架构发展,由于原来swagger-bootstrap-ui采用的是后端Java代码+前端Ui混合打包的方式,在微服务架构下显的很臃肿,因此项目正式更名为knife4j。目录一、单体版本1、ruoyi-admin\pom.xml模块添加整合依赖2、SwaggerController.java修改跳转访问地址二、前后端分离
猫头虎分享已解决Bug || java.lang.ClassNotFoundException 全解析与解决方案 AI后端已解决的Bug专栏 bug java 开发语言服务发现 rust python pip
猫头虎分享已解决Bug||java.lang.ClassNotFoundException全解析与解决方案摘要：最近有粉丝在后台留言，问到项目启动时遇到了一个经典问题：java.lang.ClassNotFoundException。这个问题看似简单，却困扰了无数开发者。今天，猫头虎以真实开发经历为背景，从Bug原因剖析到全方位解决方案，手把手带你攻克这个问题！本文涵盖了：问题原因：从类加载机制到
Android Studio 中将 AAR 包发布到 Maven 本地仓库帅次 Android Studio android studio maven android kotlin flutter gradle macos
目录1.配置build.gradle.kts（或build.gradle）2.配置publishing任务3.发布到本地Maven仓库3.1Couldnotfindmethodpublications()forarguments...3.2bash:./gradlew:Permissiondenied3.3AndroidGradlepluginrequiresJava17torun.Youarec
android视频缓存框架 [AndroidVideoCache](https://github.com/danikula/AndroidVideoCache) 源码解析与评估 MrJarvisDong third party 源码
文章目录android视频缓存框架[AndroidVideoCache](https://github.com/danikula/AndroidVideoCache)源码解析与评估引言使用方式关键类解析HttpProxyCacheServer代理缓存服务类**java.net.ProxySelector**代理选择Pinger判断本地serverSocket是否存活GetRequest封装用于获取
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他