core_cto

Hadoop 多表 join：map side join 范例

在没有 pig 或者 hive 的环境下，直接在 mapreduce 中自己实现 join 是一件极其蛋疼的事情，MR中的join分为好几种，比如有最常见的 reduce side join，map side join，semi join 等。今天我们要讨论的是第 2 种：map side join，这种 join 在处理多个小表关联大表时非常有用，而 reduce join 在处理多表关联时是比较麻烦的，一次只能处理一张表。

1、原理：

之所以存在reduce side join，是因为在map阶段不能获取所有需要的join字段，即：同一个key对应的字段可能位于不同map中。但 Reduce side join是非常低效的，因为shuffle阶段要进行大量的数据传输。Map side join是针对以下场景进行的优化：两个待连接表中，有一个表非常大，而另一个表非常小，以至于小表可以直接存放到内存中。这样，我们可以将小表复制多份，让每个map task内存中存在一份（比如存放到hash table中），然后只扫描大表：对于大表中的每一条记录key/value，在hash table中查找是否有相同的key的记录，如果有，则连接后输出即可。为了支持文件的复制，Hadoop提供了一个类DistributedCache，使用该类的方法如下：

（1）用户使用静态方法DistributedCache.addCacheFile()指定要复制的文件，它的参数是文件的URI（如果是HDFS上的文件，可以这样：hdfs://jobtracker:50030/home/XXX/file）。JobTracker在作业启动之前会获取这个URI列表，并将相应的文件拷贝到各个TaskTracker的本地磁盘上。

（2）用户使用DistributedCache.getLocalCacheFiles()方法获取文件目录，并使用标准的文件读写API读取相应的文件。

2、环境：

本实例需要的测试文件及 hdfs 文件存放目录如下：

hadoop fs -ls /test/decli
Found 4 items
-rw-r--r--   2 root supergroup        152 2013-03-06 02:05 /test/decli/login
drwxr-xr-x   - root supergroup          0 2013-03-06 02:45 /test/decli/output
-rw-r--r--   2 root supergroup         12 2013-03-06 02:12 /test/decli/sex
-rw-r--r--   2 root supergroup         72 2013-03-06 02:44 /test/decli/user

测试文件内容分别为：

root@master 192.168.120.236 02:58:03 ~/test/table >
cat login # 登录表，需要判断 uid 列是否有效，并得到对应用户名、性别、访问次数
1       0       20121213
2       0       20121213
3       1       20121213
4       1       20121213
1       0       20121114
2       0       20121114
3       1       20121114
4       1       20121114
1       0       20121213
1       0       20121114
9       0       20121114
root@master 192.168.120.236 02:58:08 ~/test/table >
cat sex # 性别表
0       男
1       女
root@master 192.168.120.236 02:58:13 ~/test/table >
cat user # 用户属性表
1       张三    hubei
3       王五    tianjin
4       赵六    guangzhou
2       李四    beijing
root@master 192.168.120.236 02:58:16 ~/test/table >

测试环境 hadoop 版本：

     view source 
    
 print ? 
   
       1 
       echo  $HADOOP_HOME 
      
       2 
       /work/hadoop-0.20.203.0

好了，废话少说，上代码：

3、代码：

     view source 
    
 print ? 
   
       001 
       import  java.io.BufferedReader; 
      
       002 
       import  java.io.FileReader; 
      
       003 
       import  java.io.IOException; 
      
       004 
       import  java.util.HashMap; 
      
       005 
       import  java.util.Map; 
      
       006 
         
       007 
       import  org.apache.hadoop.conf.Configuration; 
      
       008 
       import  org.apache.hadoop.conf.Configured; 
      
       009 
       import  org.apache.hadoop.filecache.DistributedCache; 
      
       010 
       import  org.apache.hadoop.fs.Path; 
      
       011 
       import  org.apache.hadoop.io.LongWritable; 
      
       012 
       import  org.apache.hadoop.io.Text; 
      
       013 
       import  org.apache.hadoop.mapreduce.Job; 
      
       014 
       import  org.apache.hadoop.mapreduce.Mapper; 
      
       015 
       import  org.apache.hadoop.mapreduce.Reducer; 
      
       016 
       import  org.apache.hadoop.mapreduce.lib.input.FileInputFormat; 
      
       017 
       import  org.apache.hadoop.mapreduce.lib.input.TextInputFormat; 
      
       018 
       import  org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; 
      
       019 
       import  org.apache.hadoop.mapreduce.lib.output.TextOutputFormat; 
      
       020 
       import  org.apache.hadoop.util.GenericOptionsParser; 
      
       021 
       import  org.apache.hadoop.util.Tool; 
      
       022 
       import  org.apache.hadoop.util.ToolRunner; 
      
       023 
         
       024 
       public  class MultiTableJoin extends Configured implements Tool { 
      
       025 
           public static class  MapClass extends  Mapper<LongWritable, Text, Text, Text> { 
      
       026 
         
       027 
               // 用于缓存 sex、user 文件中的数据 
      
       028 
               private Map<String, String> userMap = new HashMap<String, String>(); 
      
       029 
               private Map<String, String> sexMap = new HashMap<String, String>(); 
      
       030 
         
       031 
               private Text oKey = new Text(); 
      
       032 
               private Text oValue = new Text(); 
      
       033 
               private String[] kv; 
      
       034 
         
       035 
               // 此方法会在map方法执行之前执行 
      
       036 
               @Override 
      
       037 
               protected void setup(Context context) throws IOException, 
      
       038 
                       InterruptedException { 
      
       039 
                   BufferedReader in = null; 
      
       040 
         
       041 
                   try { 
      
       042 
                       // 从当前作业中获取要缓存的文件 
      
       043 
                       Path[] paths = DistributedCache.getLocalCacheFiles(context 
      
       044 
                               .getConfiguration()); 
      
       045 
                       String uidNameAddr = null; 
      
       046 
                       String sidSex = null; 
      
       047 
                       for (Path path : paths) { 
      
       048 
                           if (path.toString().contains("user")) { 
      
       049 
                               in = new BufferedReader(new FileReader(path.toString())); 
      
       050 
                               while (null  != (uidNameAddr = in.readLine())) { 
      
       051 
                                   userMap.put(uidNameAddr.split("\t", -1)[0], 
      
       052 
                                            uidNameAddr.split("\t", -1)[1]); 
      
       053 
                               } 
      
       054 
                           } else if (path.toString().contains("sex")) { 
      
       055 
                               in = new BufferedReader(new FileReader(path.toString())); 
      
       056 
                               while (null  != (sidSex = in.readLine())) { 
      
       057 
                                   sexMap.put(sidSex.split("\t", -1)[0], sidSex.split( 
      
       058 
                                            "\t", -1)[1]); 
      
       059 
                               } 
      
       060 
                           } 
      
       061 
                       } 
      
       062 
                   } catch (IOException e) { 
      
       063 
                       e.printStackTrace(); 
      
       064 
                   } finally { 
      
       065 
                       try { 
      
       066 
                           if (in != null) { 
      
       067 
                               in.close(); 
      
       068 
                           } 
      
       069 
                       } catch (IOException e) { 
      
       070 
                           e.printStackTrace(); 
      
       071 
                       } 
      
       072 
                   } 
      
       073 
               } 
      
       074 
         
       075 
               public void map(LongWritable key, Text value, Context context) 
      
       076 
                       throws IOException, InterruptedException { 
      
       077 
         
       078 
                   kv = value.toString().split("\t"); 
      
       079 
                   // map join: 在map阶段过滤掉不需要的数据 
      
       080 
                   if (userMap.containsKey(kv[0]) && sexMap.containsKey(kv[1])) { 
      
       081 
                       oKey.set(userMap.get(kv[0]) + "\t" + sexMap.get(kv[1])); 
      
       082 
                       oValue.set("1"); 
      
       083 
                       context.write(oKey, oValue); 
      
       084 
                   } 
      
       085 
               } 
      
       086 
         
       087 
           } 
      
       088 
         
       089 
           public static class  Reduce extends  Reducer<Text, Text, Text, Text> { 
      
       090 
         
       091 
               // private Text oValue = new Text(); 
      
       092 
               // private StringBuilder sb; 
      
       093 
         
       094 
               public void reduce(Text key, Iterable<Text> values, Context context) 
      
       095 
                       throws IOException, InterruptedException { 
      
       096 
                   int sumCount = 0; 
      
       097 
         
       098 
                   for (Text val : values) { 
      
       099 
                       sumCount += Integer.parseInt(val.toString()); 
      
       100 
                   } 
      
       101 
         
       102 
                   context.write(key, new Text(String.valueOf(sumCount))); 
      
       103 
               } 
      
       104 
         
       105 
           } 
      
       106 
         
       107 
           public int run(String[] args) throws Exception { 
      
       108 
               Job job = new Job(getConf(), "MultiTableJoin"); 
      
       109 
         
       110 
               job.setJobName("MultiTableJoin"); 
      
       111 
               job.setJarByClass(MultiTableJoin.class); 
      
       112 
               job.setMapperClass(MapClass.class); 
      
       113 
               job.setReducerClass(Reduce.class); 
      
       114 
         
       115 
               job.setInputFormatClass(TextInputFormat.class); 
      
       116 
               job.setOutputFormatClass(TextOutputFormat.class); 
      
       117 
         
       118 
               job.setOutputKeyClass(Text.class); 
      
       119 
               job.setOutputValueClass(Text.class); 
      
       120 
         
       121 
               String[] otherArgs = new GenericOptionsParser(job.getConfiguration(), 
      
       122 
                       args).getRemainingArgs(); 
      
       123 
         
       124 
               // 我们把第1、2个参数的地址作为要缓存的文件路径 
      
       125 
               DistributedCache.addCacheFile(new Path(otherArgs[1]).toUri(), job 
      
       126 
                       .getConfiguration()); 
      
       127 
               DistributedCache.addCacheFile(new Path(otherArgs[2]).toUri(), job 
      
       128 
                       .getConfiguration()); 
      
       129 
         
       130 
               FileInputFormat.addInputPath(job, new Path(otherArgs[3])); 
      
       131 
               FileOutputFormat.setOutputPath(job, new Path(otherArgs[4])); 
      
       132 
         
       133 
               return job.waitForCompletion(true) ? 0 : 1; 
      
       134 
           } 
      
       135 
         
       136 
           public static void  main(String[] args) throws  Exception { 
      
       137 
               int res = ToolRunner.run(new Configuration(), new MultiTableJoin(), 
      
       138 
                       args); 
      
       139 
               System.exit(res); 
      
       140 
           } 
      
       141 
         
       142 
       }

运行命令：

     view source 
    
 print ? 
   
       1 
       hadoop jar MultiTableJoin.jar MultiTableJoin /test/decli/sex /test/decli/user /test/decli/login /test/decli/output

4、结果：

运行结果：

root@master 192.168.120.236 02:47:18 ~/test/table >
hadoop fs -cat /test/decli/output/*|column -t
cat: File does not exist: /test/decli/output/_logs
张三男 4
李四男 2
王五女 2
赵六女 2
root@master 192.168.120.236 02:47:26 ~/test/table >

TIPS：

更多关于 hadoop mapreduce 相关 join 介绍，请参考之前的博文：

MapReduce 中的两表 join 几种方案简介

http://my.oschina.net/leejun2005/blog/95186

你可能感兴趣的:(Hadoop 多表 join：map side join 范例)

tauri v2 开源项目学习（一）
前言:tauri2编程，前端部分和electron差不多，框架部分差别大，资料少，官网乱，AI又骗我所以在gitee上，寻找tauriv2开源项目，通过记录框架部分与rust部分的写法，对照确定编程方式提示：不要在VSCode里自动运行Cargo，在powershell里运行Cargobuild，不会卡住1.tauri-desktophttps://gitee.com/MapleKing/taur
解决Mybatis-Plus分页插件无效，total返回0的问题
问题描述：分页失效，mapper.selectPage返回记录，total还是0，往上大多数问题都是老版本的解决方式，mybatis-plus3.4.x版本无法解决原因：mybatis-plus3.4.x貌似通过拦截器进行分页的，这里没有启用，主要原因是数据库配置没有引入，以下为代码情况：1：xml依赖情况com.baomidoumybatis-plus-boot-starter3.4.32：增加
SpringBoot返回文件让前端下载的几种方式一朵梨花压海棠go spring boot 前端后端
01背景在后端开发中，通常会有文件下载的需求，常用的解决方案有两种：不通过后端应用，直接使用nginx直接转发文件地址下载（适用于一些公开的文件，因为这里不需要授权）通过后端进行下载，同时进行一些业务处理本篇主要以方法2进行介绍，方法2的原理步骤如下：读取文件，得到文件的字节流将字节流写入到响应输出流中02一次性读取到内存，通过响应输出流输出到前端@GetMapping("/file/downlo
大数据集群架构hadoop集群、Hbase集群、zookeeper、kafka、spark、flink、doris、dataeas(二) 争取不加班！ hadoop hbase zookeeper 大数据运维
zookeeper单节点部署wget-chttps://dlcdn.apache.org/zookeeper/zookeeper-3.8.4/apache-zookeeper-3.8.4-bin.tar.gz下载地址tarxfapache-zookeeper-3.8.4-bin.tar.gz-C/data/&&mv/data/apache-zookeeper-3.8.4-bin//data/zoo
CVPR2024 分割Segmentation相关论文37篇速览木木阳 CVPR2024 Segmentation 分割论文
Paper1MFP:MakingFullUseofProbabilityMapsforInteractiveImageSegmentation摘要小结:最近的交互式分割算法中，将先前的概率图作为网络输入，以帮助当前分割轮次的预测。然而，尽管使用了先前的掩膜，概率图中包含的有用信息并没有很好地传播到当前预测中。在本文中，为了克服这一局限性，我们提出了一种新颖有效的基于点击的交互式图像分割算法MFP，
MyBatis SQL 执行过程原理分析（附源码）代理层：Mapper 接口动态代理路由层：MapperMethod 分发核心引擎：SqlSession 执行夜雨hiyeyu.com mybatis sql 数据库数据库架构 java spring boot db
MyBatisSQL执行过程原理分析（附源码）1.代理层：Mapper接口动态代理2.路由层：MapperMethod分发3.核心引擎：SqlSession执行4.执行器：Executor调度5.处理器层：StatementHandler执行6.结果映射：ResultSetHandler转换核心执行流程图关键设计亮点性能优化建议MyBatis的SQL执行过程可以分为6个核心阶段，我们将通过源码逐层
mongodb 基本概念重生之我是一名程序员 mongodb
mongodb基本概念基于mongo:4.4.2databasedatabase数据库tablecollection数据库表/集合rowdocument数据记录行/文档columnfield数据字段/域indexindex索引tablejoins表连接,MongoDB不支持primarykeyprimarykey主键,MongoDB自动将_id字段设置为主键MongoDB数据类型数据类型描述Str
通过 Java 调用 ChromeDriver 启动 Chrome 浏览器后，当用户**手动点击按钮**时导致标签页崩溃 Esengnet java
importorg.openqa.selenium.WebDriver;importorg.openqa.selenium.chrome.ChromeDriver;importorg.openqa.selenium.chrome.ChromeOptions;importorg.openqa.selenium.remote.CapabilityType;importjava.util.HashMap
输入hadoop version时，解决Cannot execute /home/hadoop/libexec/hadoop-config.sh.的方法有奇妙能力吗 ubuntu hadoop hdfs linux 大数据分布式
在ubuntu用hadoopversion遇到了一个错误：Cannotexecute/home/hadoop/hadoop2.8/libexec/hadoop-config.sh.解决方法：在/etc/profile中找到了这个HADOOP_HOME全局变量，将其删除运行source/etc/profile输入vim.bashrc命令，在最后一行输入unsetHADOOP_HOMEsource.b
nanoGPT复现——prepare拆解（自己构建词表 VS tiktoken） 2301_80365274 python 开发语言
在nanoGPT的data文件夹有两个很相似的文件夹结构：shakespeare和shakespeare-char，这两种都是对shakespeare数据集的处理，但是shakespeare使用的是tiktoken对文字进行编码，另一个则是使用自己构建的词表一、shakespeare-char（自己构建词表）数据获取data_path=os.path.join(os.path.dirname(__
PgSQL内核特性 | Brin索引 yzs87 搜索引擎数据库
PgSQL内核特性|Brin索引数据库在进行过滤扫描或者join时，如果该表特别大，那么就需要顺序扫描表的所有数据然后进行过滤，或者扫描所有数据进行join条件探测。这对IO的负载影响特别大，当在join时，比如HashJoin的外表，需要对每个数据都进行Hash表探测，进一步影响性能。现有列存比如Infobright、Parquet、hydra等都对存储进行了类似的改进，在每个block中增加了
Kotlin集合与泛型 Devil枫安卓 kotlin windows 开发语言
一、集合类型Kotlin提供了三种主要的集合类型：List、Set和Map。List（列表）有序集合，允许重复元素。funmain(){//不可变Listvalnumbers:List=listOf(1,2,3,4,5)println("不可变List:$numbers")//可变ListvalmutableNumbers=mutableListOf(10,20,30)mutableNumbers
PAT A 1003 Emergency cwn_ 算法数据结构图论 c++
Asanemergencyrescueteamleaderofacity,youaregivenaspecialmapofyourcountry.Themapshowsseveralscatteredcitiesconnectedbysomeroads.Amountofrescueteamsineachcityandthelengthofeachroadbetweenanypairofcities
Java基础集合框架结构分类图形骑牛小道士 java jvm 开发语言
集合集合分类分类图Collection分类Collection集合子结构之List合集Collection集合子结构之Set合集Collection集合子结构之Queue合集Map分类集合就是一个放数据的容器，准确的说是放数据对象引用的容器集合分类分类图java中集合分类有两大根接口Collection和Map集合CollectionMapCollection分类Collection集合的架构粗略
38、Seabor的联合图和成对图的绘制【用Python进行AI数据分析进阶教程】理工男大辉郎 python 人工智能数据分析
用Python进行AI数据分析进阶教程38：Seabor的联合图和成对图的绘制关键词：Seaborn、联合图（JointPlot）、成对图（PairPlot）、数据类型、变量关系摘要：本文介绍了Seaborn库中的联合图（JointPlot）和成对图（PairPlot）的绘制方法。联合图用于展示两个变量之间的关系及各自分布，支持散点图、直方图、核密度估计图等多种类型，适用于连续型变量分析，可自定义
高性能 List 转 Map 解决方案（10,000 元素）快乐肚皮 list 数据结构 java
文章目录前言一、问题背景：为什么List转Map如此重要？二、基础方法对比：StreamvsFor循环三、性能优化关键点四、面试回答技巧前言遇到一个有意思的面试题，如标题所说，当10,000条数据的List需要转Map，如何完成高性能的转换，本文将深入探讨这个问题。一、问题背景：为什么List转Map如此重要？在Java开发中，List转Map是最常见的集合操作之一：//常见场景ListuserL
SWING HACKS电子书及范例代码 CY20080125 swing swing hacks
SWINGHACKS电子书及范例代码购书地址:http://www.oreilly.com.cn/index.php?func=book&isbn=978-7-302-14334-5介绍Java编程语言一般是和重要的企业级应用程序联系在一起的，运行它们的服务器可能就位于蒙大拿的某个冰冷的机房里。不过，是桌面应用催生了Java，未来也必将是桌面应用让Java能更加光彩夺目。通过AWT和现在的Swin
SQL学习笔记5 彤银浦 sql 学习笔记
多表查询1、多表关系MySQL是一个关系型数据库，数据库中表与表之间存在关联。它们的关系根据一张表包含另外一张表数据的多少可以分为：（使用外键建立关系的方法不常用）一对多或多对一：在多的一方加入外键对应少的一方的主键多对一：在两张表中加入一张中间表，中间表中加入两个外键对应两张表的主键一对一：在一张表加入另一张表的外键，且将外键约束为唯一2、多表查询概述多表查询的语法：select字段from表1
在 Java 中，是否使用 Stream 进行遍历并不完全取决于数据量的大小，但数据量大小是一个重要的考虑因素。以下是对于不同数据量情况的分析：流量留 Java细节 java
在Java中，是否使用Stream进行遍历并不完全取决于数据量的大小，但数据量大小是一个重要的考虑因素。以下是对于不同数据量情况的分析：###小数据量***传统遍历优势明显**：当数据量很少，比如只有几个或十几个元素时，使用传统的for循环或增强for循环通常更为简单直接，代码的可读性和执行效率都很高。StreamAPI在这种情况下可能会因为内部的一些额外操作，如流的创建、中间操作的管道连接等，反
并发编程（2）——线程管控爱吃土豆zzz 并发编程并发编程 C++线程
目录二、day21.线程管控1.1归属权转移1.2joining_thread1.2.1如何使用joining_thread1.3std::jthread1.3.1零开销原则1.3.2线程停止1.4容器管理线程对象1.4.1使用容器1.4.2如何选择线程运行数量1.5线程id二、day2今天学习如何管理线程，包括：1）线程的归属权如何进行转移2）joining_thread3）jthread4）如
Hadoop、Spark、Flink 三大大数据处理框架的能力与应用场景
一、技术能力与应用场景对比产品能力特点应用场景Hadoop-基于MapReduce的批处理框架-HDFS分布式存储-容错性强、适合离线分析-作业调度使用YARN-日志离线分析-数据仓库存储-T+1报表分析-海量数据处理Spark-基于内存计算，速度快-支持批处理、流处理（StructuredStreaming）-支持SQL、ML、图计算等-支持多语言（Scala、Java、Python）-近实时处
js 允许生成特殊的变量名基于字符集编码混淆的 XSS 绕过漏洞 -- Google 2025 Lost In Transliteration A5rZ 网络安全
题目实现了一个字符转换工具在/file路由用户可以通过ct参数自定义Content-Type//文件路由-提供静态文件服务（JS和CSS），支持内容类型验证app.MapGet("/file",(stringfilename="",string?ct=null,string?q=null)=>{//根据文件名查找对应的模板文件string?template=FindFile(filename);i
es6数组的flat()，flatMap()函数用法实例分析 PrinciplesMan #Es6 es6 javascript 开发语言
数组的成员有时还是数组，Array.prototype.flat()用于将嵌套的数组“拉平”，变成一维数组。该方法返回一个新数组，对原数据没有影响。[1,2,[3,4]].flat()//[1,2,3,4]上面代码中，原数组的成员里面有一个数组，flat()方法将子数组的成员取出来，添加在原来的位置。flat()默认只会“拉平”一层，如果想要“拉平”多层的嵌套数组，可以将flat()方法的参数写成
重磅教程！华为鸿蒙 4.2/4.3 也能用谷歌？教你轻松安装 Google 框架，畅享原汁原味体验！ AI创界者华为 harmonyos
随着华为鸿蒙系统的发展，越来越多用户开始使用HarmonyOS4.2/4.3作为日常主力系统。然而，对于一些有海外App使用需求，或需要使用Google生态服务（如Gmail、YouTube、GoogleMaps、Play商店）的用户来说，无法直接使用谷歌框架一直是一个遗憾。今天，我们就来教大家一个低风险、亲测有效的安装方式，让你的鸿蒙设备也能顺利运行谷歌应用，畅享更全面的移动体验！准备工作在开始
树结构和数组之间的转化 weixin_45907435 javascript 开发语言 ecmascript
1、树结构转为数组treeToArray(treeData,returnValue=[]){letnewValue=[...returnValue]treeData.map(item=>{if(item.children){const{children,...treeObj}={...item}newValue.push(treeObj)newValue=this.treeToArray(chil
25年银行行业java后端常问高频面试题小凡敲代码 java java后端 java面试 Java面试题互联网大厂 Java八股文后端开发
一、技术八股文高频题（银行侧重点）1.Java基础&并发编程HashMap在JDK1.8中的优化？ConcurrentHashMap如何保证线程安全？银行系统对线程安全要求极高，需深入理解CAS+synchronized的实现细节。synchronized和ReentrantLock的区别？银行系统更推荐哪种？银行系统倾向ReentrantLock（可中断、公平锁），需解释AQS原理。Thread
2025年Java后端面试必刷题：场景题与八股文高频考点小凡敲代码 java 面试 Java面试 java面试题互联网大厂 java面试 java场景题
一、高频八股文面试题Java基础篇HashMap与ConcurrentHashMap的区别HashMap非线程安全，JDK1.8后采用数组+链表/红黑树结构ConcurrentHashMap线程安全，JDK1.8改用CAS+synchronized优化锁粒度synchronized与ReentrantLock区别synchronized是JVM内置锁，自动释放，非公平锁ReentrantLock可
ASP .NET Core实战-集成Mapster code_shenbing ASP.NET Core实战教程 .netcore asp.net c#mvc restful 后端中间件
Mapster简介Mapster是一个高性能的.NET对象映射工具，旨在简化对象之间的转换过程。它提供了一种简洁、灵活且高效的方式来处理对象映射，特别适用于需要频繁进行对象转换的应用程序。一、核心特性1.高性能零反射：通过代码生成技术避免运行时反射，显著提高映射性能编译时优化：生成的映射代码在编译时确定，运行时无额外开销轻量级：相比其他映射工具，Mapster具有更小的体积和更低的内存占用2.简单
Linux基础命令集合牛岚风 linux 运维服务器
目录文件目录相关命令lscdcpfindmkdirmvrmtouchfiletreechattrlsattrmd5sum查看文件以及内容处理相关命令vimcatmore和headtailcutsortuniqwcgreptr文件压缩以及解压缩相关命令tarunzipgzipzip软件包管理相关命令rpmyumapt-get信息显示相关命令unamehostnameuptimestatdudftop
Python邮件处理（使用imaplib和email库实现自动化邮件处理）老哥不老 python 自动化 java
在日常工作中，我们经常需要自动化处理电子邮件，比如自动下载附件、解析邮件内容、处理特定格式的数据等。本文将通过一个实际案例，详细介绍如何使用Python的imaplib和email库来实现邮件的自动化处理。目录环境准备与库介绍IMAP邮件服务器连接邮件搜索与获取邮件内容解析附件处理实战案例：自动化处理Excel附件最佳实践与注意事项1.环境准备与库介绍首先，我们需要导入必要的库：importima
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他