大数据技术与架构

你不知道的冷知识 | 指数退避思想及其在Flume/Hadoop中的应用

前言

前段时间爆改Codis的Java客户端Jodis，它的测试类中用到了指数退避算法。这是大学计算机网络课程会讲到的知识，本文权当复习，并且看看它的思想是如何应用在大数据组件中的。

计算机网络中的指数退避

所谓指数退避（exponential backoff），是一种根据系统反馈来成倍地削减操作的速率（比如数据流的速率）的算法，直到系统可以稳定地进行处理为止。在计算机网络的世界里，它一般用来控制数据帧/包的重传，避免密集的冲突与网络拥塞。

以以太网中使用的数据链路层协议CSMA/CD（载波监听多路访问/冲突检测）为例，其处理冲突的方式就是截断二进制指数退避（truncated binary exponential backoff），具体逻辑如下：

确定退避时间的初始值。一般是用端到端的往返时间2τ，该时间也称为冲突窗口（collision window）或争用期，以太网习惯取值51.2μs。
冲突发生时，设冲突次数为c，定K=min(c, 10)。从集合[0, 1, 2, 3, ..., 2^K - 1]中随机取一个整数k，等待冲突窗口时长的k倍，然后再尝试重新发送帧。
当c > 16时，认定此帧发送失败，向高层报告错误。

可见，该方法名为“二进制”是因为冲突窗口倍数的可取值有2^K个，名为“截断”是因为最多重试16次就失败，不会无限重试下去。随着重试次数增多，退避时间的期望值也就越大，从而在竞争激烈时减少碰撞发生的概率。

下图是CSMA/CD的流程图，蓝框中就是指数退避流程。

指数退避的思想非常简单而有效，在除网络之外的其他方面也有应用。作为大数据工程师，挑两个大数据组件稍微讲解一下吧。

Flume中的指数退避

Flume是一个高效的日志数据采集与聚合框架，它由数据源Source、数据通道Channel、数据汇集Sink三大部分组成。其中，数据源有一个经典且常用的实现SpoolDirectorySource，它负责读取特定目录下的日志文件，其中用到了指数退避算法。它的主要逻辑在SpoolDirectoryRunnable这个线程中，下面来看其run()方法。（Flume版本为我们在用的1.7.0）

@Override	
  public void run() {	
    int backoffInterval = 250;	
    try {	
      while (!Thread.interrupted()) {	
        List events = reader.readEvents(batchSize);	
        if (events.isEmpty()) {	
          break;	
        }	
        sourceCounter.addToEventReceivedCount(events.size());	
        sourceCounter.incrementAppendBatchReceivedCount();	
	
        try {	
          getChannelProcessor().processEventBatch(events);	
          reader.commit();	
        } catch (ChannelFullException ex) {	
          logger.warn("The channel is full, and cannot write data now. The " +	
              "source will try again after " + backoffInterval +	
              " milliseconds");	
          hitChannelFullException = true;	
          backoffInterval = waitAndGetNewBackoffInterval(backoffInterval);	
          continue;	
        } catch (ChannelException ex) {	
          logger.warn("The channel threw an exception, and cannot write data now. The " +	
              "source will try again after " + backoffInterval +	
              " milliseconds");	
          hitChannelException = true;	
          backoffInterval = waitAndGetNewBackoffInterval(backoffInterval);	
          continue;	
        }	
        backoffInterval = 250;	
        sourceCounter.addToEventAcceptedCount(events.size());	
        sourceCounter.incrementAppendBatchAcceptedCount();	
      }	
    } catch (Throwable t) {	
      logger.error("FATAL: " + SpoolDirectorySource.this.toString() + ": " +	
          "Uncaught exception in SpoolDirectorySource thread. " +	
          "Restart or reconfigure Flume to continue processing.", t);	
      hasFatalError = true;	
      Throwables.propagate(t);	
    }	
  }	
	
  private int waitAndGetNewBackoffInterval(int backoffInterval) throws InterruptedException {	
    if (backoff) {	
      TimeUnit.MILLISECONDS.sleep(backoffInterval);	
      backoffInterval = backoffInterval << 1;	
      backoffInterval = backoffInterval >= maxBackoff ? maxBackoff :	
          backoffInterval;	
    }	
    return backoffInterval;	
  }

该方法先通过ReliableSpoolingFileEventReader.readEvents()方法获取事件，再调用ChannelProcessor.processEventBatch()方法将事件批次放入对应的Channel中并提交。如果Channel已满或者写入发生异常，就以250ms为起始值进行退避，每次退避后等待时长都会翻倍，直到变量maxBackoff设定的最大值（默认为4000ms）。一旦提交成功，等待时长会重设回250ms，多次提交不成功的话也不会截断。

可见，Flume的指数退避方法比CSMA/CD的方法来得更加简单直接。

Hadoop中的指数退避

本来想用ZK客户端Curator举例子的，但是它比较默默无闻，还是用Hadoop吧。

hadoop-common项目里的RetryPolicies类中提供了非常多种重试策略，其中就有指数退避。

  public static final RetryPolicy exponentialBackoffRetry(	
      int maxRetries, long sleepTime, TimeUnit timeUnit){	
    return new ExponentialBackoffRetry(maxRetries, sleepTime, timeUnit);	
  }	
	
  static class ExponentialBackoffRetry extends RetryLimited {	
    public ExponentialBackoffRetry(	
        int maxRetries, long sleepTime, TimeUnit timeUnit){	
      super(maxRetries, sleepTime, timeUnit);	
	
      if (maxRetries < 0) {	
        throw new IllegalArgumentException("maxRetries = " + maxRetries + " < 0");	
      } else if (maxRetries >= Long.SIZE - 1) {	
        throw new IllegalArgumentException("maxRetries = " + maxRetries	
            + " >= " + (Long.SIZE - 1));	
      }	
    }	
    	
    @Override	
    protected long calculateSleepTime(int retries) {	
      return calculateExponentialTime(sleepTime, retries + 1);	
    }	
  }

可见，ExponentialBackoffRetry类强制规定了最大重试次数maxRetries，初始等待时间为sleepTime，实际等待时间则由calculateExponentialTime()方法来计算。

private static long calculateExponentialTime(long time, int retries,	
      long cap){	
    long baseTime = Math.min(time * (1L << retries), cap);	
    return (long) (baseTime * (RANDOM.get().nextDouble() + 0.5));	
  }	
	
  private static long calculateExponentialTime(long time, int retries) {	
    return calculateExponentialTime(time, retries, Long.MAX_VALUE);	
  }

该方法使用cap参数来限制等待时间的最大值，默认是不限制的。除了在初始时间的基础上乘2的重试次数次幂之外，还会用0.5~1.5区间内的随机数加权，比较“聪明”一点。

— THE END —

◤半年文章精选系列◥

Flink从入门到放弃之源码解析系列

《Flink组件和逻辑计划》
《Flink执行计划生成》
《JobManager中的基本组件(1)》
《JobManager中的基本组件(2)》
《JobManager中的基本组件(3)》
《TaskManager》
《算子》
《网络》
《水印WaterMark》
《CheckPoint》
《任务调度及负载均衡》
《异常处理》

大数据成神之路-基础篇

《HashSet》
《HashMap》
《LinkedList》
《ArrayList/Vector》
《ConcurrentSkipListMap》
《ConcurrentHashMap1.7》
《ConcurrentHashMap1.8 Part1》
《ConcurrentHashMap1.8 Part2》
《CopyOnWriteArrayList》
《CopyOnWriteArraySet》
《ConcurrentLinkedQueue》
《LinkedBlockingDeque》
《LinkedBlockingQueue》
《ArrayBlockingQueue》
《ConcurrentSkipListSet》

大数据成神之路-进阶篇

《JVM&NIO基础入门》
《分布式理论基础和原理》
《分布式中的常见问题解决方案(分布式锁/事务/ID)》
《Zookeeper》
《RPC》
《Netty入门篇》
《Netty源码篇》
《Linux基础》

Flink入门系列

《Flink入门》
《Flink DataSet&DataSteam API》
《Flink集群部署》
《Flink重启策略》
《Flink分布式缓存》
《Flink广播变量》
《Flink中的Time》
《Flink中的窗口》
《时间戳和水印》
《Broadcast广播变量》
《Flink-Kafka-Connector》
《Flink之Table-&-SQL》
《Flink实战项目之实时热销排行》
《Flink-Redis-Sink》
《Flink消费Kafka写入Mysql》

Flink高级进阶

《FaultTolerance》
《流表对偶(duality)性》
《持续查询(ContinuousQueries)》
《DataStream-Connectors之Kafka》
《SQL概览》
《JOIN 算子》
《TableAPI》
《JOIN-LATERAL》
《JOIN-LATERAL-Time Interval(Time-windowed)》
《Temporal-Table-JOIN》
《State》
《FlinkSQL中的回退更新-Retraction》
《Apache Flink结合Apache Kafka实现端到端的一致性语义》
《Flink1.8.0发布！新功能抢先看》
《Flink1.8.0重大更新-Flink中State的自动清除详解》
《Flink在滴滴出行的应用与实践》
《批流统一计算引擎的动力源泉—Flink Shuffle机制的重构与优化》
《HBase分享 | Flink+HBase场景化解决方案》
《腾讯基于Flink的实时流计算平台演进之路》
《Flink进阶-Flink CEP(复杂事件处理)》
《Flink基于EventTime和WaterMark处理乱序事件和晚到的数据》
《Flink 最锋利的武器：Flink SQL 入门和实战》
《Flink Back Pressure》
《使用Flink读取Kafka中的消息》
《Flink on YARN部署快速入门指南》
《Apache Flink状态管理和容错机制介绍》

Hadoop生态圈系列

《Hadoop极简入门》
《MapReduce编程模型和计算框架架构原理》
《分布式文件系统-HDFS》
《YARN》
《Hadoop机架感知》
《HDFS的一个重要知识点-HDFS的数据流》
《Hadoop分布式缓存(DistributedCache)》
《如何从根源上解决 HDFS 小文件问题》（https://dwz.cn/FqDPpRUc）
《Hadoop解决小文件存储思路》（https://dwz.cn/2oCdmCkw）
《Hadoop所支持的几种压缩格式》
《MapReduce Join》
《YARN Capacity Scheduler（容量调度器）》
《hadoop上搭建hive》
《基于Hadoop的数据仓库Hive基础知识》
《Hive使用必知必会系列》
《一个小知识点-Hive行转列实现Pivot》
《面试必备技能-HiveSQL优化》
《HBase和Hive的区别和各自适用的场景》
《一篇文章入门Hbase》
《敲黑板：HBase的RowKey设计》
《HBase读写优化》
《HBase在滴滴出行的应用场景和最佳实践》
《Phoenix=HBase+SQL,让HBase插上了翅膀》
《一个知识点将你拒之门外之Hbase的二级索引》（https://dwz.cn/umfBOZ5l）
《Phoenix重磅 | Phoenix核心功能原理及应用场景介绍》
《DB、DW、DM、ODS、OLAP、OLTP和BI的概念理解》
《Hive/HiveSQL常用优化方法全面总结》

实时计算系列(spark、kafka等)

《Spark Streaming消费Kafka数据的两种方案》
《Apache Kafka简单入门》
《你不得不知道的知识-零拷贝》
《Kafka在字节跳动的实践和灾备方案》
《万字长文干货 | Kafka 事务性之幂等性实现》
《Kafka最佳实践》
《Kafka Exactly-Once 之事务性实现》
《Kafka连接器深度解读之错误处理和死信队列》
《Spark之数据倾斜调优》
《Structured Streaming 实现思路与实现概述》
《Spark内存调优》
《广告点击数实时统计：Spark StructuredStreaming + Redis Streams》
《Spark Shuffle在网易的优化》
《SparkSQL极简入门》
《下一代分布式消息队列Apache Pulsar》
《Pulsar与Kafka消费模型对比》
《Spark SQL重点知识总结》
《Structured Streaming 之状态存储解析》
《周期性清除Spark Streaming流状态的方法》
《Spark Structured Streaming特性介绍》
《Spark Streaming 反压（Back Pressure）机制介绍》
《Spark 从 Kafka 读数设置子并发度问题》

规范和系统设计

《阿里云10 PB+／天的日志系统设计和实现》
《阿里云Redis开发规范》
《Java中多个ifelse语句的替代设计》
《面试系列：十个海量数据处理方法大总结》

杂谈

《作为面试官的一点点感悟，谈谈技术人的成长之路》
《成年人的世界没有容易二字》
《我最近在关注的事》
《真香》
《简单说说学习这件事》
《20多岁做什么，将来才不会后悔》
《2019-05-12最近的总结》
《我军新闻联播气势+9999》
《周末分享 | 高手的战略》
《周末分享 | 快速定位自己的缺点》
《周末分享 | 我见过最高级的聪明是靠谱》

遗失在梦里的那颗糖 0018 稻米鼠
从前，有一只小老鼠，还有一只小猪猪。小老鼠很爱很爱小猪猪，小猪猪很爱很爱欺负小老鼠。、那一夜，他们一起数月亮，那一夜，他们一起看星星……老鼠想着月亮像是柚子，星星像是玉米粒，全都搬回去，放在库房里。小猪想着，把老鼠搬回来的柚子和玉米粒全都吃掉，还有库房里的两罐糖，以及最近她嗅到老鼠趁她不备悄悄买起来的那罐蜂蜜……小猪流口水了，滴答滴答落在小耗子的身上。小耗子站起身来，从窝里拖出一块玉米饼，挖出蜂蜜
前端实现多文件下载功能的思路与代码分享好运仔dzl 技术开发 java 开发语言
73万字的Java面试题库【全网最详细-找工作/实习必备神器】：https://mp.weixin.qq.com/mp/appmsgalbum?__biz=MzE5MTY1NzczOA==&action=getalbum&album_id=4057608455186808839Java面试题库ps：网上面试题多而杂，自己整理了一套面试题，我靠这套面试题2年经验拿15k~前端实现多文件下载功能的思路
5minites Echarts 大地缸
title:"5minitesEcharts"date:2021-01-27T20:33:42+08:00draft:truetags:['echarts']author:"dadigang"author_cn:"大地缸"personal:"http://www.real007.cn"关于作者http://www.real007.cn/about获取ECharts你可以通过以下几种方式获取Apac
上白班南良大维
昨天晚上零点到家，略微吃了点东西，便上床睡觉。据说是今天公司进行安全卫生大检查。各自分管的设备门窗，以及地面现场卫生都要彻底清理干净。小区内从昨天开始，从东边开始，挖开楼道，更换暖气管道。自行车，电动车都被搬到外面。被盗去电瓶的车架子锁在楼梯扶手上，耽误了人家施工。遂打开锁，挪到了一边。下班回来一看，被挖开的中间单元的电动车都转移到没挖开的一单元了。上午，打扫卫生，擦玻璃。下午从十二点半开始，先磨
2023-01-03 小小树洞记录路程
-昨天真的和朋友玩得很开心，但同时昨晚上也是有点失眠，并且我觉得昨晚上做的梦好像触碰到了我内心最害怕、恐惧的地方所以我今天起床后始终就是觉得有点不得劲。还好一会儿有个心理咨询，我们可以好好整理和探讨下。与此同时，我其实很想就大概整理下我们2023的一个大致方向。首先的话，最重要的事情还是自我疗愈，与此同时，就是学习聆听我们的内心，多花时间在冥想打坐上。并且我觉得我想把自己的快乐和内心真实的感受放在
二年级的女孩（二）蓝梦玲灵
七八岁的孩子最讨人嫌。晚上睡觉，楚楚哭了，她说，“我害怕。”“为什么害怕？”如意想明白她心里怎么想的，而不是如以往那样安慰孩子——拥她入怀，并告诉她，“妈妈在你身边，谁也不能伤害到你，即使在梦里，妈妈都要去保护你。”“我书法作业还没写完。作业太多了，一页就有一百多字，两页呢？”楚楚难过地说。“没事，明天妈妈早点叫你起床，陪着你写作业。这点作业量不多，上三年级了作文都要有二三百字，半个多小时就得完成
如何在 Stimulsoft JavaScript 报表组件中，设置设计器与查看器主题风格 CodeCraft Studio 控件报表图表开发 javascript 开发语言 ecmascript Stimulsoft Dashboard Report 报表仪表盘工具
在现代软件开发中，图形用户界面（GUI）不仅仅是功能的承载体，更是用户体验的关键组成部分。一个美观、统一且具备高度可定制性的界面，能够显著提升系统的专业感和使用效率。Stimulsoft作为功能强大的报表和仪表板解决方案提供商，其JavaScript版本（StimulsoftReports.JS与StimulsoftDashboards.JS）为开发者提供了丰富的内置主题支持，助力快速构建符合品牌
怎么办！四大校花上门求负责(陈继来赵美媛)最新章节在线阅读_(怎么办！四大校花上门求负责)完整版免费在线阅读_陈继来赵美媛(怎么办！四大校花上门求负责)完整版免费在线阅读_《怎么办！四大校花上门... 笔趣阁官方小说
怎么办！四大校花上门求负责(陈继来赵美媛)最新章节在线阅读_(怎么办！四大校花上门求负责)完整版免费在线阅读_陈继来赵美媛(怎么办！四大校花上门求负责)完整版免费在线阅读_《怎么办！四大校花上门求负责》全集在线阅读_怎么办！四大校花上门求负责(陈继来赵美媛)最新章节在线阅读_(怎么办！四大校花上门求负责)完整版免费在线阅读主角配角：陈继来赵美媛简介：“陈继来，你不会又没钱交班费吧？”江州大学金融系
[Java实战]Spring Boot 整合 Freemarker (十一) 曼岛_ Java实战 java spring boot 开发语言
[Java实战]SpringBoot整合Freemarker(十一)引言ApacheFreeMarker作为一款高性能的模板引擎，凭借其简洁语法、卓越性能和灵活扩展性，在JavaWeb开发中占据重要地位。结合SpringBoot的自动化配置能力，开发者能快速构建动态页面、生成报表或定制代码。本文将系统讲解整合流程、实战技巧、性能优化方案，并针对企业级场景提供深度解决方案。一、Freemarker核
pnpm monorepo的技术选型临界点（Critical adoption）星野睡不醒 Web pnpm monorepo npm js yarn
前言直入正题。之所以要聊聊pnpm的技术选型临界点Criticaladoption，得益于一段时间以来在pnpm上的丰富实践和赋能落地积累的经验。讲道理从BDdouyin和infra团队相关开发者开始在国内推行和宣传，介入pnpm社区之后我也是对pnpm开始抱着探索的态度。当然经过一段时间的实践考究，发现pnpm只能是属于功大于过，下面我们简单聊聊。正文本文的主题是pnpmmonorepo实践，但
Blazor使用TXTextControl控件编辑报告落叶飞花_ javascript 开发语言
文章目录1环境2课程链接3学习使用（加载TextControl控件）3.1DocumentEditor3.2DocumentViewer4javascriptApi列表5加载文档（TextControl加载文档，JS互操作）6开启修改跟踪（word中的修订）7文档修改保存8文档编辑，拖拽展示图片9文档编辑，使用ApplicationField10模板设计11插入图片11.1拖拽插入图片11.2Me
弟弟的玩具一年级三班张铧予
今天爷爷给弟弟买了一把大手枪的玩具，手枪是蓝色的，一打开开关出不同的音乐，弟弟玩的可开心了，我和妹妹也替他高兴。
夸克网盘拉新项目实战教程，某社群付费课首次分享，零基础入门保姆级教学任推邦官方账号
夸克网盘拉新一个多少钱？揭秘夸克网盘推广最高佣金及服务商对接流程夸克网盘拉新项目作为一个长期热门的副业项目，因其稳定的收益吸引了大量推广者。为了获得最高的收益，选择对接一级服务商渠道至关重要。下面我将为你详细讲解夸克网盘拉新的价格及对接流程。一、夸克网盘拉新最高价格是多少？夸克网盘拉新项目由三个主要收益板块组成，这也是它长久以来备受欢迎的原因：拉新收益：每次新用户通过你的推广链接注册网盘，你会获得
Text Control 控件教程：使用 .NET C# 中的二维码和条形码增强文档慧都小妮子 .net c#服务器 TX Text Control
QR码和条形码非常适合为文档和PDF文件增加价值，因为它们提供轻松的信息访问、验证信息、跟踪项目和提高交互性。条形码可以弥补纸质或数字人类可读文档与网络门户或网络应用程序中的数字信息之间的差距。大多数用户都熟悉QR码和条形码，它们在许多过程中无处不在，例如：产品包装发票库存管理活动票务登机证支付系统在某些行业中，如果没有条形码，流程将无法进行。这包括医疗保健，可以通过扫描患者佩戴的腕带直接访问患者
人的行为读书笔记，2-3 夕颜剑主
第二章：人的行为学在认识论层次的一些问题第二节：先验和实在1.对先验的推理的错误指责先验的推理纯粹是概念的和演绎的。它只能提出一些同义反复语和分析判断，它产生不了别的东西。它的所有含义，都是逻辑的从其前推到而出，都已经蕴含在前提里面。故而，某个流行的反对意见认为，先验的推理对我们的知识无所增益。但事实上，并非如此。2.先验推理可以增进我们的知识几何学的所有定理包含在其公理（axioms）之中，几何
智囊•上智部•通简卷•0152郭子仪•谋身有术智囊智囊
原文汾阳王宅在亲仁里，大启其第，任人出入不问。麾下将吏出镇来辞，王夫人及爱女方临妆，令持巾兑汲水，役之不异仆隶。他日子弟列谏，不听，继之以泣，曰：“大人功业隆赫，而不自崇重，贵贱皆游卧内，某等以为虽伊、霍不当如此。”公笑谓曰：“尔曹固非所料。且吾马食官粟者五百匹，官饩者一千人，进无所往，退无所据。向使崇垣扃户，不通内外，一怨将起，构以不臣，其有贪功害能之徒成就其事，则九族齑粉，噬脐莫追。今荡荡无间
修的一颗平常心暗香疏影手笔
当一个人经历的是是非非越多，看到的形形色色的人越多，他的心理承受能力也就越强大。以前扔进一粒小石子可能就会发生大变动，现在扔进一块大石头都不会出现波澜。挤那天下午，我带着女儿回校，正赶上学生返校，一路上到处都是穿着校服的孩子在等公交。我和女儿也挤在公交车上和孩子们一同回校。公交车上挤的水泄不通，有的孩子沉默不语只看向窗外；有的孩子身背沉甸甸的书包，手提两袋零食；有的孩子嘴里叨着棒棒糖不停地说笑。我
bash-completion使linux下命令自动补全
有时我们会遇到较长的linux命令,难以记住例如centos8的nmcli命令,不同于centos7的systemd重启网卡即可,命令冗长.这时就轮到bash-completion登场了bash-completion这个包可以帮我们快速补全linux命令安装并生效[root@vm1~]#dnf-yinstallbash-completion#安装包[root@vm1~]#source/etc/pr
在Bash中如何提取子字符串
问题：对于形如someletters_12345_moreleters.ext的文件名，我想提取其中的5位数字并将它们放入一个变量中。明确一下细节，一个文件名的形式是若干个字符（不包含下划线），跟着一个五位的数字，数字两边都有一个下划线，最后跟着另一组若干个字符（不包含下划线）。我想要提取这个5位数字并将它存入一个变量中。我非常感兴趣于完成这一目标的不同方法。回答：使用cut命令number=$(
一代贤后马皇后是如何向朱元璋提建议的？老高聊历史
朱元璋晚上做了个怪梦，梦里有人告他：“你要想推行的纸币制度尽早成功，必.须取秀才的心肝。”“秀才心肝？”朱元璋顿时起了杀心。原来，朱元璋建立明朝以后，想推行纸币制度，可中途遭遇许多困难。这天，他就做了这个怪梦，梦中有人告诉他，要想此事成功，必.须取秀才的心肝。朱元璋醒了以后，就把这个怪梦告诉了马皇后。马皇后是坚决反对朱元璋滥杀无辜的。于是，她灵机一动，向朱元璋说道：“以臣妾的看法，所谓的心肝，就是
我是一位“花伯伯” 吴继红
我最喜欢的一本绘本故事是《花婆婆》，正是这本书让我产生了一个念头:我要像书中的花婆婆一样做一件让世界变得更美丽的事。我要做一位“花伯伯”，我要让自己成为一个“领读者”，一个“点灯人”，一个“播火者”，我要用自己的光和热温暖照亮身边的每一个人。从事教育工作30年，我对阅读真正产生兴趣却在当老师的第20年。这一年，我第一次走进新教育实验小学，我对阅读有了全新的理解:阅读是教育的核心。阅读是从听开始的，
自动化测试中，测试数据如何管理？鱼鱼说测试 java linux 服务器
今晚在某个测试群，看到有人问了一个问题：把测试数据放配置文件读取和放文件通过函数调用读取有什么区别？Python接口自动化测试零基础入门到精通（2025最新版）当时我下意识的这么回答：数据量越大，配置文件越臃肿，放在专门的数据文件（比如excel，csv），方便针对性的维护。乍看没毛病，但回头和人讨论这个问题的时候，就认真思考了一下这个问题，下面是我的一些思考和讨论的一些结果，仅供参考。。。自动化
基于selenium的pyse自动化测试框架鱼鱼说测试 selenium 测试工具
Python接口自动化测试零基础入门到精通（2025最新版）介绍：pyse基于selenium（webdriver）进行了简单的二次封装，比selenium所提供的方法操作更简洁。特点：默认使用CSS定位，同时支持多种定位方法（id\name\class\link_text\xpath\css）。本框架只是对selenium（webdriver）原生方法进行了简单的封装，精简为大约30个方法，这些
接口测试流程鱼鱼说测试 postman
大体流程：3天精通Postman接口测试，全套项目实战教程！！1、（阅读）测试接口文档检验接口文档的完整性、正确性、一致性、易理解性和易浏览性。这个一般在实际测试过程中，都会弱化测试，不注重。2、编写测试用例这个大家都熟，根据接口文档编写测试用例。用例编写方法可以按照黑盒测试的用例编写规则来编写，如：边界值、正交表等等设计方法。3、根据测试用例进行API的手工执行测试根据用例执行测试，注意验证预期
从社会变革视角，民国的短命原因与秦二世而亡一样（下） mamimima
我们教科书上都谈民国的三座大山即帝国主义、封建主义、官僚资本主义。事实就显示了当时基于中国近代历史现实而演化出的社会现实结构与历史大势的脱节。反皇帝不反地主，封建主义顽固存在。买办阶层与辛亥革命后军阀、民族资产阶级部分、前士大夫集团部分（所谓的知识分子阶层）结盟融合，形成的官僚资本主义。1860年近代史之后西方列强成功入侵并长期干预中国内政形成的帝国主义。顽固的控制了社会的各个层面。民国虽然消灭的
自动化测试准备鱼鱼说测试自动化测试
什么是自动化测？Python接口自动化测试零基础入门到精通（2025最新版）首先理清自动化测试的概念，广义上来讲，自动化包括一切通过工具（程序）的方式来代替或辅助手工测试的行为都可以看做自动化，包括性能测试工具（loadrunner、jmeter）,或自己所写的一段程序，用于生成1到100个测试数据。狭义上来讲，通工具记录或编写脚本的方式模拟手工测试的过程，通过回放或运行脚本来执行测试用例，从而代
2019-08-29 猫悟空
亲爱的陈皮：你好。昨晚，不，是今天凌晨三点，你翻来覆去睡不着哼哼唧唧，然后就醒了？！清醒地玩儿了好久、吃了好久，我迷迷糊糊想睡不敢睡，眯着眼睛装睡着，你自己玩儿腻了就爬过来拽我、摸我……一个多小时后才又睡着。知道吗？其实，你醒来那会儿我还没正式睡呢，看书正起劲……咱俩是什么神仙母子啊！上午连着中午和姥姥进城看家具，耗着你在车上米糊睡了好几小觉，下午回来又不睡了，不过快五点睡着直到八点姥姥回来才醒，
做自己命运的主人梦想飞翔的骆驼
希望电影《哪吒》里有一句话:我命由我不由天，哪吒也正是秉持这种理念，不断与命运抗争，才冲破命运的窒楛，最终得以修成正果。驴子的故事从前一头驴不小心掉到了枯井里，不断地哀嚎，主人非常心疼，想把它救上来，于是叫了好多邻居，尝试了许多方法都没有奏效。正在一筹莫展之际有人出了个主意:反正驴也老了，干脆就埋了吧。于是大家开始往枯井里填土，驴一开始很惊恐，逐渐明白了这些人的意图，于是他反而安静了下来，每当有泥
热门的小说单身派对，女友当着白月光的面说我是滴滴司机祁宴姜月_ 单身派对，女友当着白月光的面说我是滴滴司机(祁宴姜月)最新小说小富江呀
《单身派对，女友当着白月光的面说我是滴滴司机》主角：祁宴姜月简介：结婚前三天的单身派对，女友喝的烂醉如泥。我去接她，她却一脸抗拒，甚至和我保持距离。初恋将她送上车，她转头就抱着初恋解释：「你别多想哦，这个只是我找来的滴滴司机。」「我心里，只有你一个人。」她喝的两眼朦胧，月光下，我的心也凉了半截。后来，为了不妨碍她和初恋相爱，我选择了逃婚。结果，谁也没想到，一向高傲的女友竟然失去理智，哭着求我回来。
2020-03-17 eflorsuy
40《安家》好不好看，对于我来说至少可以学到点什么东西吧！我才看了3集，但是不急，慢慢来呗！房似锦，对于工作认真负责，这个学习，量身订做，在合适不过了！首先，她也会室内设计，装修，不是个含糊的领导者，明天继续加油！
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

你不知道的冷知识 | 指数退避思想及其在Flume/Hadoop中的应用

前言

计算机网络中的指数退避

Flume中的指数退避

Hadoop中的指数退避

你可能感兴趣的:(你不知道的冷知识 | 指数退避思想及其在Flume/Hadoop中的应用)