带状态论文粗读(四)[带状态故障检测相关]

  • 文章名称:KeySight: Troubleshooting Programmable Switches via Scalable High-coverage Behavior Tracking
  • 通过可扩展、高范围的行为跟踪对可编程交换机进行故障检测
  • 发表时间:2018
  • 期刊来源:---
  • 解决问题:
    • 一 可编程交换机和P4的出现为网络带来灵活性的同时也带来了许多bugs(比如P4程序bugs,不正确的策略,硬件故障)的风险。现在的工具通过postcards检测数据包的踪迹,现在的工具要么产生大量的postcard(扩展性有限),要么仅追踪一部分数据包(范围低)。
  • 所做贡献:
    • 一 提出了KeySight,一个可以高范围、高扩展性同时兼备的检测可编程交换机故障的平台。
    • 二 设计了analyzer,提取P4程序的PEC表示,设计了新的算法,RBF,用于在可编程交换机上实现PEC,另外实现了一系列APIs引导故障检测任务。
    • 三 在Tofino和SmartNIC上实现了KeySight的原型,并且在[22]中,发布了源码。对80个P4程序和超过5TB的数据进行跟踪进行评估。
  • 不足之处:
    • 一本文集中在设备级别进行故障检测任务,在全网中进行故障检测可能会导致问题。
    • 二 RBF的误报可能导致全网数据包历史的不完整性。
    • 三 无法支持要求持续监视数据包性能的测量,比如端到端的数据包级别延迟。
  • 实验对比:
    • RBF、BFQ、SBF、RSBF、BSBFSD算法对比实验。
    • NetSight与EverFlow,P4DB,KeyTracker产生数据包的速度对比。
    • 对NetSight,EverFlow,P4DB,KeyTracker的Coverage和Scability设计了对比实验。
  • 有帮助的点: 文章末尾提到Network Verification,
    很多工具基于网络状态快照对网络进行验证,SymNet[38]和 HSA[27]对全网配置执行静态验证。VeriFlow[17]和NetPlumber [39]通过不同的优化方法实现实时验证。但是这些方法大多假设交换机功能时静态的,从而不能够直接验证可编程交换机。

  • 文章名称:Testing Stateful and Dynamic Data Planes with FlowTest
  • 用FlowTest测试带状态的、动态的数据平面
  • 发表时间:2014
  • 期刊来源:--
  • 解决问题:
    • 一 两个真实存在的问题超出现有的测试框架范围之外,(1)真实世界数据平面复杂的本质(比如带状态防火墙,代理缓存的动态行为)(2)期待的网络策略的复杂性(不如服务链)
    • 二 如何追踪特定交错的数据包序列(不是单个数据包)触发数据平面的链式状态迁移。
  • 所做贡献:
    • 一 本文提出FlowTest,测试动态、带状态网络的策略。FlowTest可以系统地探索数据平面的状态空间以验证它的行为和策略目标。
    • 二 模拟DPFs为状态机,每个状态都代表DPF的一个状态(比如,每个会话的连接状态或者代理缓存的对象),展示利用AI planning tools帮助产生测试流量序列(第4,5节)
  • 不足之处:
    • 一 对于DPF状态机的模拟是基于人工的知识(是一个改进的方向,依据不同的中间盒或者源码[9]及blackbox traces[10])。
    • 二 不能够对大的网络状态、大量状态机进行测试(是个改进方向,识别相同行为的等价状态类,使状态空间探索更高效)
    • 三 测试效率不高
    • 四 测试的流量可能被非测试流量影响。第一,因为正常网络流量改变数据平面的状态,可能会影响测试场景的结果正确性。第二,我们需要确信测试流量不会改变网络状态因而对常规流量造成不利影响。
    • 五 本文很虚啊,各种实现找不到源码之类的。。。。
  • 实验对比:

    ------

  • 文章名称:Scalable Testing of Context-Dependent Policies over Stateful Data Planes with Armstrong
  • 发表时间:2015
  • 期刊来源:---
  • 解决问题:
    • 一 现在的验证框架不能够验证上下文相关的处理策略(就是带状态网络功能策略)。现在的网络验证机制无法满足新的表达性、扩展性挑战(表现如下三个方面)。
    • 二 定位数据包是笨重的,并且缺少关键的历史信息。
    • 三 转换功能缺少状态和上下文(之前的状态信息)
    • 四 探索数据平面的行为信息变得更加棘手。
  • 所做贡献:
    • 一 提出Armstrong系统,支持运营商测试网络数据平面元素是否正确实现了给出的上下文相关策略。
    • 二 提出ADU概念,作为网络模型处理流量的共同点(denomiinator)。
    • 三 为NFs提出FSMs-ensemble 模型,通过解耦合逻辑无关的任务和流量单元将复杂的NFs模拟成FSM集合。
    • 四 优化象征的执行工作流,用symbolic execution(SE)在ADU粒度上抽象出测试方案,再将测试方案翻译成具体的测试流。
  • 不足之处:
  • 实验对比:

  • 文章名称:BUZZ: Testing Context-Dependent Policies in Stateful Data Planes
  • 发表时间:2014
  • 期刊来源:---
  • 解决问题:
    • 一 现在的方法不能对带状态网络检查隔离策略和可达性。
  • 所做贡献:
    • 一 设计了BUZZ,解决的挑战如下:(1)模拟带状态数据平面元素(2)解决在生成测试场景时,状态空间爆炸问题
    • 二 证明了基于超过100个节点的网络中,BUZZ在定位策略违规的可扩展性。
    • 三 解决background traffic的干扰以及定位策略违规资源。
  • 不足之处:
  • 实验对比:

  • 文章名称:BUZZ: Testing Context-Dependent Policies in Stateful Networks
  • 发表时间:2016
  • 期刊来源:--
  • 解决问题:
    • 一 网络中现在验证的方法在解决与状态相关的场景时有基本的表达性和扩展性挑战。
    • 二 现在的抽象概念不能够铺货带状态行为或者表达上下文相关的策略。
    • 三 尝试推理带状态欣慰导致状态空间爆炸。
  • 所做贡献:
    • 一 提出BUZZ,一个基于模型的测试框架。BUZZ的贡献是:(1)利用新的高级流量单元概念(可以组合跨越多个协议层的不同NF的模型)和模拟复杂的网络功能为状态机集合,使数据平面模型可表达性和可扩展(2)符号执行的可扩展应用解决状态空间爆炸问题。
    • 二表明BUZZ在最近的SDN / NFV系统中发现了一系列新的和已知的政策违规行为
  • 不足之处:
  • 实验对比:

你可能感兴趣的:(带状态论文粗读(四)[带状态故障检测相关])