如果发生重大网络中断(例如由地震、洪水等大规模灾害),运营商必须通过一系列修复步骤来恢复其网络基础设施。优化这个序列以在恢复过程中最大化提供的服务数量的问题通常称为渐进式网络恢复(Progressive Network Recovery,PNR)。参考
文献 | 等级 | 年份 | 方法 | 研究对象 | 优化目标 | 简介 |
---|---|---|---|---|---|---|
ref1 | CCF-A ToN |
2021 | 确定性取整+列生成算法 | PSR | AWRSL | 提出了渐进切片恢复(PSR)问题,设计了八种恢复策略;采用两阶段PSR元启发算法,通过整数线性规划模型实现快速且可扩展的切片恢复,可提高最多50%的切片恢复数量。 |
ref2 | CCF-A JSAC |
2020 | 贪心启发RATIO+DQN | PNR | 总效用 | 研究了具有虚拟网络功能(VNFs)的网络中的渐进恢复问题,并引入基于深度强化学习的渐进恢复技术DeepPR来接近最优解。 |
ref3 | CCF-None | 2020 | 启发算法JPR | JPR | 累计加权内容可达性 | 提出了一种可扩展的启发式算法用于联合渐进恢复,该算法安排网络节点/链路和数据中心的顺序修复,以最大化内容可达性 |
ref4 | CCF-C TNSM |
2018 | 迭代随机恢复算法ISR | 信息不确定下PSR | 最小化预期恢复成本 | 探索了在不确定故障模式下进行网络恢复的问题,并提出了一种渐进的解决方法ISR,该方法通过逐步监测,以更少的修复成本来恢复网络。 |
ref5 | CCF-A INFOCOM |
2017 | 启发算法CeDAR | PDAR | 最大化累计需求流 | 提出了基于中心性的损害评估和恢复算法CeDAR,解决了网络损害评估和关键服务恢复的问题。 |
ref12 | CCF-A INFOCOM |
2011 | 整数线性规划:多阶段递归 | PNR | AWT | 提出了渐进网络恢复的新范式,针对大规模故障,在多个阶段使用有限修复资源最大化网络流,并提出了高效的启发式算法和扩展方法进行解决和评估 |
:CeDAR和ISR的作者是同一批人
PSR:progressive slice network recovery,渐进式切片恢复。在5G网络中,面对大规模灾难或有目的攻击导致的网络中断,运营商必须通过一系列恢复步骤来修复网络基础设施的问题。
“切片”(slice)是指网络中的一种虚拟网络(Virtual Network,VN),它是由网络资源在物理网络上的一部分进行分割或切分而成的。
JPR:joint progressive network联合渐进式恢复,找到最优的网络节点/链路和数据中心恢复顺序。
PDAR:progressive damage assessment and network recovery,渐进式损害评估和网络恢复。考虑了更现实的不完全损坏信息下的网络恢复问题,其中损坏评估和关键业务恢复是联合进行的。
AWRSL:accumulative weighted number of recovered slices and virtual links,累积加权已恢复切片和虚拟链路数量。
AWT:accumulative weighted total,累计加权总流量。
整数线性规划 (Integer Linear Programming,ILP)是一种优化问题求解方法,它是线性规划(Linear Programming,LP)的一种扩展。在ILP中,目标是通过找到整数值的变量,使得满足线性约束条件下的目标函数最大化或最小化。与线性规划不同,ILP要求变量的取值必须是整数,这增加了问题的复杂性,因为整数条件使问题成为NP-hard问题。
在ILP中,目标函数和约束条件都是线性的,这意味着目标函数和约束条件中的变量之间的关系可以用线性函数表示。ILP可以用于多种实际问题,如资源分配、生产调度、路径规划等。由于整数条件的引入,ILP通常需要使用特定的求解算法来找到最优解,其中一种常用的算法是分支定界法(Branch and Bound)。
ILP在计算机科学、运筹学、工程等领域都有广泛的应用,它提供了一种强大的方法来解决复杂的优化问题。然而,对于大规模问题,ILP可能变得非常复杂和耗时,因为整数条件导致了组合爆炸的可能性。在实践中,通常需要结合启发式算法或近似算法来处理大规模的ILP问题。
列生成算法 (Column Generation Algorithm)是一种优化算法,用于解决包含大量变量的线性规划问题。在某些线性规划问题中,变量的数量可能非常大,导致传统的线性规划方法效率低下,难以求解。列生成算法通过动态地生成和添加变量(列)来解决这个问题。
列生成算法的基本思想是,将大规模线性规划问题分解成一个主问题(Master Problem)和一个定价问题(Pricing Problem)。主问题是原始问题的一个子集,它只包含一部分变量,并且通常较容易求解。定价问题用于在每次迭代中生成新的变量,即列,以改进主问题的解。定价问题是一个子问题,其目标是找到一个新的变量(列)以增加主问题的目标函数值。
在每次迭代中,列生成算法首先求解主问题,然后求解定价问题以生成新的变量,并将新的变量添加到主问题中。然后再次求解主问题,直到找不到更多的改进变量为止。通过不断添加新的变量,列生成算法逐步扩展主问题,最终得到整个线性规划问题的最优解。
列生成算法的优点在于,它能够充分利用问题的结构和特性,避免了对所有变量进行穷举搜索,从而大大提高了求解效率。它通常用于解决大规模线性规划问题,特别是在运输、资源分配、路径规划等领域具有广泛的应用。
RATIO算法是一种基于贪心启发式(Heuristic)策略,并受到集合覆盖问题的近似算法启发的算法。集合覆盖问题是一个经典的组合优化问题,在该问题中,需要找到最小数量的集合,使得它们的并集包含了所有的元素。该启发式算法通过计算 u ( v ) d ( v ) \frac{u(v)}{d(v)} d(v)u(v)来为每个时间步中与功能节点相邻的节点中最具成本效益的节点分配资源。即利用效用/需求来进行贪心选择。RATIO的伪代码如下:
DQN代表深度强化学习(Deep Q-Network),它是一种强化学习算法,最初由DeepMind提出。DQN结合了深度学习和Q-learning算法,旨在通过神经网络来学习解决复杂的强化学习问题。
在DQN中,一个神经网络被用来近似Q值函数,该函数用于评估在给定状态下采取特定行动的预期累积奖励。DQN的核心思想是使用经验回放和目标网络来稳定和加速训练过程。
经验回放是一种记忆回放技术,用于随机抽取之前的经验样本来训练网络,从而减少样本之间的相关性,增加训练的稳定性。
目标网络是另一个神经网络,用于生成目标Q值来更新主网络的参数。通过使用目标网络,DQN可以减少更新过程中的估计误差,从而使得训练更加稳定。
DQN在解决诸如视频游戏等复杂任务中取得了显著的成功。它已经被广泛应用于图像处理、自然语言处理、自动驾驶等领域,并成为强化学习领域的重要里程碑之一。
迭代随机恢复算法ISR
ref1 Zhang Q, Ayoub O, Wu J, et al. Progressive slice recovery with guaranteed slice connectivity after massive failures[J]. IEEE/ACM Transactions on Networking, 2021, 30(2): 826-839.
ref2 Ishigaki G, Devic S, Gour R, et al. DeepPR: Progressive recovery for interdependent VNFs with deep reinforcement learning[J]. IEEE Journal on Selected Areas in Communications, 2020, 38(10): 2386-2399.
ref3 Ferdousi S, Tornatore M, Dikbiyik F, et al. Joint progressive network and datacenter recovery after large-scale disasters[J]. IEEE Transactions on Network and Service Management, 2020, 17(3): 1501-1514.
ref4 Tootaghaj D Z, Bartolini N, Khamfroush H, et al. On progressive network recovery from massive failures under uncertainty[J]. IEEE Transactions on Network and Service Management, 2018, 16(1): 113-126.
ref5 Ciavarella S, Bartolini N, Khamfroush H, et al. Progressive damage assessment and network recovery after massive failures[C]//IEEE INFOCOM 2017-IEEE conference on computer communications. IEEE, 2017: 1-9.
ref12Wang J, Qiao C, Yu H. On progressive network recovery after a major disruption[C]//2011 Proceedings IEEE INFOCOM. IEEE, 2011: 1925-1933.