Multistage distributionally robust optimization for integrated production and maintenance scheduling

摘要

在化学制造过程中,设备退化会对工艺性能产生重大影响,或导致装置故障,从而导致相当长的停机时间。因此,维护计划是一个重要的考虑因素,并且在联合调度生产和维护操作方面已经加大了力度。在此背景下,一个主要挑战是预测设备健康模型中固有的不确定性。特别是,与此类模型中的随机性相关的概率分布通常难以估计,因此不准确。在这项工作中,我们应用分布式鲁棒优化(DRO)方法来解决这个问题。具体而言,所提出的公式优化了关于瓦瑟斯坦模糊集的最坏情况下的预期结果,并且我们应用了允许多级混合整数追索的决策规则方法。进行了计算实验,包括一个真实世界的工业案例研究,其中的结果证明了二进制资源和DRO在解决方案质量方面的显著优势。
关键词 分布式鲁棒优化、设备退化、集成生产和维护、过程调度

1引言

近年来,化学工业在预测性维护领域显著增加了努力,在预测性维修领域,建立了数据驱动的设备健康模型,以预测设备退化程度并估计故障概率。1虽然预测性维护的概念并不新鲜,由于我们提高了收集和处理设备特定数据的能力,它再次受到关注。实时监测和预测设备健康状况的能力能够实现基于状态的维护,其中维护活动是基于实际设备状态执行的。2与传统预防性维护相比,这可以大幅降低成本,传统预防性维修通常以不必要的高频率安排维护任务,这仅在设备故障后执行。
工业制造过程的基于状态的维护必须考虑操作方面。在一个方面,设备退化是设备单元运行历史的函数,设备在生产效率和容量方面的性能通常取决于其健康状态。
另一方面,在进行维护时,机组可能必须关闭或以降低的负荷运行。生产、维护和设备退化之间的密切联系促使了同时优化生产和维护活动的计划和调度方法的发展。Dedopoulos和Shah3是第一个解决这个问题的人,他们专注于多用途工厂的短期调度。Jain和Grossmann 4考虑了乙烯装置熔炉系统中生产和清洁操作的最佳循环调度,他们明确地将性能随时间的指数衰减纳入其模型。Pistikopoulos等人5使用非递减分段常数函数来模拟退化,解决了集成生产和维护规划问题。类似的方法已应用于热交换器网络,6生物制药制造工艺、7个压缩机网络、8个建筑HVAC系统、9个等等。根据应用情况,需要在不同的时间范围内考虑维护。虽然早期的工作侧重于短期调度,但最近的贡献涉及长期周转10和涉及短期调度和长期规划的多尺度设置。11,12设备退化是一个固有的随机和复杂过程,受到许多因素的影响,包括运行条件、自然磨损和结垢。此外,我们通常没有所需的测量或足够的数据来建立准确的退化模型,这导致了显著的模型不确定性。事实上,大多数退化模型有两个组成部分:退化程度的点估计和相关的置信水平。13考虑这种不确定性很重要,否则我们可能会做出次优甚至不安全的运营决策。然而,尽管在处理不确定性的过程调度的一般领域有许多贡献,14但关于不确定性下具体生产和维护调度的文献相当稀少。Basciftci等人15应用于贞操编程,以解决使用基于条件的故障场景的发电机组调度问题,16 Wiebe等人17应用鲁棒优化方法来考虑随机设备退化,并使用贝叶斯优化来优化不确定性集的大小,以平衡预防性维护和纠正性维护的成本。
不确定性通常由不确定参数的概率分布来定义,这需要在大多数随机优化方法中指定(注意,即使是稳健优化也需要分布的支持)。然而,在我们对实际过程数据的分析中,我们注意到,描述退化相关不确定性的概率分布通常很难估计,并且随着时间的推移可能会发生相当大的变化(详见第2节)。因此,概率分布并不准确,这使得在这种不确定性下进行不确定性量化和优化成为一项具有挑战性的任务。这项工作的主要动机是这一特殊挑战。在这里,我们考虑了装备退化不确定性下的综合生产和维护调度,并提出了一种分布式鲁棒优化(DRO)方法,其中我们针对一组可能的概率分布(也称为模糊集)优化最坏情况下的预期性能。通过这样做,我们鲁棒地解决了概率分布本身的不确定性。在过去十年中,DRO领域取得了重大进展,主要由运营研究界贡献。18–21直到最近,DRO也开始引起过程系统工程(PSE)界的关注。22–24为了全面审查DRO,见Rahimian和Mehrotra。25在不确定性条件下,我们在生产和维护调度方面的贡献与之前的工作之间的另一个主要区别是纳入了多级混合整数追索权。与现有的静态和两阶段模型相比,多阶段公式更准确地捕捉了实际的顺序决策过程,因此可以提供改进的解决方案。为此,我们应用Georghiou和同事最初提出的决策规则方法26,27,最近由Feng等人改进。28基于决策规则的多阶段公式主要应用于可调鲁棒优化(ARO)的文本中,在过程调度中有几个成功的应用。29–34然而,这些工作中的绝大多数只考虑了连续追索。我们请读者参阅Yanıko glu等人35和Georghiou等人36,以了解关于ARO的评论,尤其是关于决策规则方法的评论。
本文的主要贡献如下:
•我们扩展了Biondi等人11提出的确定性综合生产和维护调度模型,以考虑负载相关退化和多种维护选项,包括离线和在线维护。此外,退化对工艺运行性能的影响以退化相关生产能力的形式考虑。
•我们提出了确定性模型的分布式鲁棒扩展,该模型捕捉了设备单元健康状态的不确定性。
应用随机设备健康模型,该模型涉及具有分布模糊性的随机变量,该模型使用Was-serstein模糊集进行描述。
•我们将提升不确定性的概念应用于设计多级混合整数决策规则,这允许我们制定DRO问题的可处理近似。
•综合计算案例研究,包括一个说明性示例和一个真实世界的熔炉系统调度案例,旨在证明所提出方法的有效性。
本文的其余部分组织如下。在第2节中,我们通过一个真实世界的例子进一步激励我们的工作。在第3节中,开发了确定性调度模型,而在第4节中推导了具有退化不确定性的分布式鲁棒模型。我们使用第5节中概述的决策规则方法来解决由此产生的问题。第6节介绍了我们计算案例研究的结果,最后,第7节提供了总结意见。
符号我们使用小写和大写粗体字母分别表示向量和矩阵,例如,x∈Rn和A∈Rm。标量用非粗体字母表示。向量x的第i个元素用xi表示。我们使用1()表示指示函数。
此外,0和e分别是零向量和全1向量,其维数可以从上下文中推断。

2 动机例子

虽然我们提出的方法可以应用于广泛的制造过程,但这项工作主要是由一个涉及工业乙烯装置的真实案例推动的。具体而言,我们考虑了裂解炉的操作和维护。
在这些炉的操作过程中,焦炭积聚在炉管的内表面上,这降低了裂解过程的效率。因此,熔炉需要定期除焦,焦炭厚度不得超过给定的限制。
焦炭厚度是设备等级的良好指标;然而,当炉子运行时很难直接测量。相反,通常使用其他可测量的量(如产品产量、压降和管壳温度)通过软测量方法来估计。
由于在预测性维护中很常见,我们使用剩余使用寿命(RUL)作为设备健康状态的度量。在乙烯裂解炉的情况下,RUL与焦炭厚度成反比。焦炭沉积主要取决于原料和加工材料的数量。给定原料i,我们使用以下形式的连续状态模型来预测rt,即时间t时熔炉的RUL:
(1)
其中rt 1是时间t1的RUL,Δt是时间段t的持续时间,时间段t是时间点t1和t之间的时间,xit表示时间段t中处理的材料i的量,μ是漂移参数,是xit的函数。与退化过程相关的不确定性被捕获在随机变量wt中。模型(1)表示基于随机过程(如常用的Wiener和Gamma过程)的一类流行的RUL模型。37在这项工作中,我们假设μ是xit的仿射函数,即
(2)
其中系数li和^li可以从历史数据中估计。
当试图从历史数据构建退化模型时,我们注意到wt的概率分布似乎随时间而变化,这使得难以获得准确的估计。
图1显示了从3个月的历史数据得出的两个不同熔炉的重量经验分布,Δt为6 h。对于每个熔炉,我们生成了两个直方图,一个使用前半部分的数据,另一个使用3个月后半部分的数据。对于炉1,如图1A所示,两个直方图有很大不同。这可以但只能部分解释为,在前一个半月,熔炉主要处理石脑油,而在后一个半月中,熔炉处理加氢裂化尾气油(HVGO)。相比之下,2号炉在整个3个月内处理石脑油。因此,图1B中的两个直方图更加相似,但差异仍然显著。
由于分布随时间而变化,我们只能使用最近的数据来估计它,这严重限制了有用数据的数量,从而限制了估计的质量。此外,在本示例中,我们假设不同时间段中的不确定参数是独立的且相同分布,这在现实中并不一定成立。在调度上下文中,我们考虑多个时间段,如果有理由相信不同时间段中的不确定性参数是相关的,则每个样本应该是一个时间序列,例如,w=(w1,…,wT),T是调度范围的长度,而不是仅是一个时段的观测值。这进一步限制了可用于估计的样本数量。总之,我们可以得出结论,与随机设备健康模型相关的概率分布通常是不准确的,并且只有少量的过去观察结果可以提供有关分布的信息。
图1 两个真实世界熔炉的形式(1)的退化模型的随机变量w的直方图,由3个月期间收集的设备监测数据生成。每个熔炉显示了两个直方图,一个用于前半部分,另一个用于3个月的后半部分[彩色图可在wileyonlinlibrary.com上查看]

3 确定性生产和维护计划

在本节中,我们扩展了Biondi等人11提出的集成离散时间生产和维护调度模型,以考虑多种类型的维护活动和退化相关的生产能力。注意,该模型中的所有连续变量都被约束为非负。调度范围被划分为相等长度的T个周期,并且标记为时间周期T从时间点t1开始并在时间点T结束;时间点集合由T≔0,1,…,T f g表示。补充材料中提供了模型的完整命名。
3.1 分配约束
对于二进制变量yijkt,如果设备单元j在操作模式k下执行的任务i在时间t开始,则等于1,分配约束被制定为使得不兼容的任务不能在同一时间段内分配给同一单元:
(3、4、5)
其中J是一组设备单元,Kij是可由单元J执行的任务i的一组模式,以及ℐPj,ℐMF j,和ℐMO j分别表示机组j可执行的生产、离线维护和在线维护任务集。约束(3)确保机组在给定时间段内只能执行生产和离线维护任务中的一项,τijk表示相应的处理时间。约束条件(4)规定,当一台机组正在进行离线或在线维护时,不能执行其他维护任务。然而,如约束条件(5)所暗示的,一些在线维护任务可以在机组运行时执行,但不能在机组不运行时执行在线维护。注意,在线维护任务的处理时间假定为1个时间段,这模拟了可以随时中止在线维护的常见设置。
根据维护所需的资源类型,我们将设备单元划分为一组G,使得J¼[G∈GJ G,其中J G是G组中的单元集合。以下约束限制了同一组中可以同时维护的单元数量:
(6)
其中,I MF g和I MO g分别表示g组中可同时离线和在线维护的最大单元数。如果明确地对维护任务所需的资源进行了建模,则不需要约束(6),而是通过以这种形式聚合资源约束来提供简化模型的方法。
3.2 生产约束
连续变量xijkt表示在任务i的模式k中由设备j执行并在时间t开始的材料处理量,其界限如下:
(7)
其中Cmin ijk和Cmax ijk分别是最小和最大生产量。注意,只有当yijkt=1时,xijkt才能为非零。
设备退化和在线维护通常会对生产能力产生负面影响;因此,xijkt上的实际上限通常低于Cmax ijk,其在以下约束中建模:
(8)
其中,参数Ci i 0 jk0是由于在模式k 0中执行在线维护任务i 0而导致的生产任务i的设备j的生产能力的减少,并且连续变量cijkt表示在不考虑在线维护活动的情况下在时间t的相应生产能力。我们假设cijkt取决于设备的健康状态,并遵循线性关系:
(9)
cijk和^cijk是预定义的参数,连续变量rjt表示单位j在时间t的RUL。
3.3确定性设备健康模型
如第2节所述,我们使用RUL来量化设备单元的健康状态。如下所述,非负RUL rjt在上方受r max j的限制,并且在机组执行生产和维护任务时发生变化:
(10)
其中rj0是初始RUL,参数lijk和^lijk分别表示在模式k下执行生产任务i导致的机组j的RUL的固定和可变下降。请注意,fjt由零和执行的维护任务可恢复的最大数量限制:
(11)
其中,参数δijk表示在模式k下运行的维护任务i最多可恢复的r max j的分数。
3.4物料平衡
我们用qst表示时间t时的状态s库存,其不得超过存储容量Vs:
(12)
其中S表示状态集合。现在,让我们ℐs是产生状态的一组生产任务,ℐs是消耗状态s的一组生产任务,ρijks和ρijks是相应的转换因子。材料平衡方程可公式化如下:
(13)
其中qs是初始库存水平,dst是需要在时间t交付的状态s的需求,J^i表示可以执行任务i的一组单位,连续变量pst(以Ms为界)表示在时间t从外部购买的状态s数量。
(14)
哪里ℐj¼ℐ第j页[ℐMF j型[ℐMO j和成本系数αijkt、βijkt、θst和κs分别与变量yijkt、xijkt、pst和qst相关。注意,将负成本分配给fjt,以激励在设备单元j寿命结束时安排维护活动。此外,还可以通过为fjt指定适当的值来控制同一组机组的维护优先级。

4具有退化不确定性的分布式鲁棒调度

我们现在扩展了确定性模型,以将不确定性纳入设备退化。所提出的分布式鲁棒公式考虑了多级连续和二进制追索权,确保了给定不确定性集的可行性,并最小化了瓦瑟斯坦模糊集的最坏情况预期成本。
4.1随机设备健康模型
根据第2节中介绍的随机设备健康模型,我们将随机变量wjt添加到RUL的定义中,该变量的真实值假设在时间t时显示。结果,对于每个j∈j和t∈t n 0f g,我们有:
(15)
我们假设w的概率分布是未知的,但它的支持度是已知的。因此,我们可以构造一个盒不确定性集
(16)
虽然真实分布是未知的,但我们假设我们可以构造一组受限的概率分布P,该概率分布P包含具有高置信度的真实分布。这被称为模糊集,我们将在第4.3节中更详细地描述如何构造合适的模糊集。
降级仅在设备单元执行生产任务时发生,这表明wjt是内生的,即依赖于决策的不确定参数。为了实现这一点,我们引入了一个辅助连续变量ujt,并为每个j∈j和t∈t n 0f g添加以下一组约束:
(17)
如果单元j在时间t1开始一些生产任务,则确保ujt=wjt;否则,ujt=0。我们假设,例如,如果单元j在时间t1开始某个生产任务,其处理时间为2个周期,则其RUL在时间t减少全部量,然后保持不变,直到时间t+1。相应地,我们假设该特定生产任务的相关退化不确定性由wjt而不是wj,t+1表示。因此,ujt¼wjtP i∈ℐP j P k∈Kij yijk,t 1,无论τijk有多长。我们现在可以通过将方程(15)替换为
(18)
4.2多级分布鲁棒公式
在下文中,我们描述了所提出的多级分布鲁棒公式。为了便于说明,我们以一般和紧凑的形式呈现它。请注意,从这一点开始应用的符号与前面章节中使用的符号不同。特别是,T¼1,…,T f g现在表示决策阶段的集合,它与先前使用的时间点集合密切相关,但并不完全相同。顺序决策过程是这样的,即在给定时间观察所有单位的不确定健康状态,并在观察之后立即做出下一时间段的操作决策。
多级分布式鲁棒集成调度问题可写成以下形式:
(19)
其中xt和yt分别是t阶段的连续决策和二进制决策。成本参数由ct∈RPt、dt∈RQt和f∈RK T½表示,而At 0∈RNt Pt0、Ht 0∈RNt Qt0和Bt∈RNt K T½表示与阶段t∈t中的约束相关的系数矩阵。阶段t的不确定参数向量由ξt∈RKt表示,我们用ξ[t]≔(ξ1,…,ξt)表示直到阶段t的所有不确定参数的集合,并且ξt½∈RK t½具有K t½¼Pt 0¼1Kt 0。设ξ≔ξ[T]定义在概率空间(ξT,F,P)上,其中ξT是ξ的支撑,F是ξT的σ-代数,P是ξ基本的真分布。ξ[t]的不确定度集(由ξt表示)具有以下多面体形式:
(20)
其中Wt∈RMt K t½。为了便于表示,我们假设ξ1=(ξ11),ξ11=1。注意,这是一个一般多面体形式的不确定性集合,它比长方体不确定性集合(16)更具表现力。因此,它还可以捕捉不确定参数之间的相关性。
在公式(19)中,决策变量表示为不确定参数的函数,这编码了非预期性,因为阶段t中的变量仅取决于该阶段之前实现的不确定参数。制定约束条件,使其必须适用于不确定性集定义的不确定性的每一种可能实现。目标是最小化与最坏情况分布相关的预期成本,如(19a)中的最大运算器所示,从给定的模糊集合P中选择。这里,我们关注需要整个不确定性集合上的可行性的情况,而所提出的方法可以容易地扩展到具有分布鲁棒机会约束的情况,尽管计算复杂性显著增加。
4.3wasserstein模糊集
一个关键的建模决策是模糊集P的选择,模糊集P应该尽可能小,但仍然包含具有高置信度的真实分布。文献中提出了各种类型的模糊集。38在这项工作中,我们使用了Wasserstein模糊集,21,39,这是一种流行的模糊集,具有直观的统计解释,可以以数据驱动的方式轻松构建,并具有理想的可处理性。可以表示如下:
(21)
其中,ℳ+是(ξT,F)上的一组概率测度,dW(Pξ,Pζ)表示分布Pξ和Pζ之间的所谓瓦瑟斯坦距离。因此,P是一组分布,其Wasserstein与给定标称分布Pζ的比值小于或等于指定的非负值。根据数据驱动方法,我们选择名义分布Pζ作为从S个不确定参数ξ的过去实现构建的经验分布,用{ζ1,…,ζS}表示。瓦瑟斯坦距离是两种分布差异程度的度量,定义为
(22)
其中ρ(ξ,ζ)是ξ和ζ的连续距离函数,π是ξ与ζ分别与边缘Pξ和Pζ的联合分布。注意,在现实中,Pξ可能取决于决策,特别是如果维护涉及设备单元的重大升级。然而,由于数据有限,人们无法准确地建模描述决策依赖性的关系。在某种程度上,模糊集的制定也防止了这方面的不确定性。
模糊集合P采用分布空间中的球的形式,也称为瓦瑟斯坦球,以Pζ为中心,半径为。包含真实分布的P的置信水平通常随着ε和S而增加。
40对于固定的样本集,ε指定了分布模糊性的水平,并且可以进行调整,以影响DRO问题解决方案中的保守度水平。
两种极端情况,即ε=0和ε=∞,构成了两个众所周知的公式。对于ε=0,P是单态的,并且只包含经验分布Pζ。在这种情况下,问题(19)的目标函数也可以写成
(23)
这是随机编程中常用的样本平均近似(SAA)。对于∈=∞,P包含不确定性集ξT上支持的所有分布,包括整个概率质量集中在ξT内最坏情况实现的分布。在这种情况下,目标函数也可以写成
(24)
这是通常用于鲁棒优化的最坏情况目标函数,它假设没有分布信息可用。因此,DRO可以被视为随机规划和鲁棒优化的推广。

5 决策规则的逼近与重构

在下文中,我们提出了一种解决DRO问题的决策规则方法(19)。所提出的框架将DRO的解除不确定性和基于对偶的重新表述的概念与Wasser-stein模糊集相结合。为了保持文章的独立性,我们概述了推导的主要步骤,但有时会让读者参考以前的作品或补充材料进行更详细的讨论。
5.1提升不确定度集
为了便于构建灵活的混合整数决策规则,我们使用了两个提升运算符Lt:RKt 7!R Kt和^Lt:RKt 7!0,1 f g ^Kt,至将原始不确定参数映射到更高维空间,这需要将rti 1断点放置在每个不确定参数ξti的原始支持内,如下所示:
()
其中ξmin ti和ξmax ti分别是ξti的下限和上限。
提升算子L将原始不确定参数ξt∈RKt转换为提升连续不确定参数的新向量ξt¼ξt1,…,ξtKt∈R Kt,其中Kt¼PKt i¼1rti。设ξj ti表示ξti的第j个元素。然后,对于每个t∈t,i=1,…,Kt,和j=1,…,rti,ξj ti,通过以下提升操作给出:
(25)
将第二个提升算子L应用于ξt会产生一个新的提升二元不确定参数矢量ξt¼ξt1,…,ξtKt∈0,1 f g Kt,其中Kt¼PKt i¼1gti,gti=max{1,rti 1}。对于每个t∈t,i=1,…,Kt,和j=1,…,gti,提升操作定义如下:’
(26)
ξt¼ξt、ξt,^ξt∈RKt与~Kt¼KtþKt \254; ^Kt,则提升不确定参数的不确定性集合ξt½¼ξ1,…,~ξt表示为
(27)
其中~K t½¼Pt t 0¼1Kt和ξ¼~ξt½。
由于^ξt0的不连续性,ξ0t是一个开集。为了允许进一步的公式化,我们考虑其闭包的一个外部近似值,用ξt表示(有关深入讨论,请参见Bertsimas和Georghiou27以及Feng等人28)。为此,在~ξt0 i的空间中,定义了以下几组顶点,分别为t0=1,…,t和i¼1,…Kt0:
(28)
式中,ξj t 0 i¼ξt 0 i∈R:pj 1 t 0 i≤ξt o i≤pj t 0 i n o和Vj t o i¼pj 1 t o i,pj t o 0 i n o。为了特别方便,我们设置了p0 t 0 i¼ξmin t 0 i和p rt0i t 0 i¼ζmax t 0 i。那么,~⑪t可公式如下:
(29)
5.2提升模糊集
利用提升的不确定参数~ξ,Wasserstein模糊集P被扩展到提升空间中的模糊集:
(30)
提升空间中的样本s为~ζs¼ζs、ζs和^ζs,s样本的经验分布可表示为
(31)
其中δζs是ζs处的狄拉克测度。用距离测度ρόÞ来估计ξ和~ζ之间的距离
(32)
根据总概率定律,(32b)成立,其中ms是事件ζ¼ζs的概率,Pξs是ξ的相应条件分布。然后,根据(31)中P~ζ的定义推导出(32c),这意味着当S=1,…,S时,ms¼1S。
此外,我们还得到了∈ξ∈∧T P~ξs dξ¼1和Pζ¼1S PS¼1Pξs。因此,我们得到了基于ξ的S个样本的提升模糊集P的以下表达式
(33)
注意,我们在(33)中省略了ξ和ζs之间的期望距离的下确界算子,因为对于一个可行的Pξs,涉及∈的不等式足以成立,因为这意味着实现最小期望距离的不等式也一定会满足不等式。
5.3决策规则
我们应用决策规则,将追索变量限制为提升的不确定参数的线性函数:
(34)
其中,Xt t 0 i∈RPt rt0i,^X t t 0 i∈RPt gt0i,且Y t t 0 Y∈1,0,1 f gQt gt0i。与仅对连续追索权建模的常用仿射决策规则相比,22,29,30形式(34)的决策规则在保持线性的同时考虑了连续追索权和二进制追索权。此外,(34a)中的决策规则结构允许连续追索决策遵循通常不连续的分段线性函数,这在混合整数ARO问题中通常至关重要。有关这类特定决策规则的更多细节和讨论,请参见Feng等人。28如Bertsimas和Georghiou,27所示,对于^Y t t 0 i的给定域,即使相应的完整性约束放宽到0≤yt(ξ[t])≤e,决策规则(34b)也保证产生二进制yt,我们将这些额外的线性不等式视为约束(19b)的一部分。
5.4 约束条件的重新设置
通过将决策规则(34)与提升的不确定参数ξt½代入(19b),并应用提升的不确定性集ξt,约束(19a)可重新表示如下:
(35)
通过应用标准的鲁棒对应重新制定技术,(35)可以重新制定为以下一组约束条件:
(36)
其中bt t 00 i是与ξt 00 i相对应的矩阵bt的列向量,wt t 00 i为与ξt 00 i相对的矩阵wt的列向量;λt t 00 i∈RNt和Φt∈RNt Mtþ是基于对偶的公式化产生的附加变量。有关详细推导,请参考Feng等人。28
5.5 目标函数的重构
我们首先用提升的不确定性参数和相应的提升的不确定度和模糊集以积分形式表达(19a)中的目标函数:
(37)
使用强大的对偶论证,可以将目标函数重新表述为以下表达式:
(38)
这一重新表述改编自赵和关39,补充材料中详细说明了其全部来源。
我们选择ℓ1-范数作为距离度量ρόÞ,即ρξ,ζs¼ξζs1。然后,(38)中的约束可以写成如下:
(39)
通过引用双重规范的定义ℓ(39)中的1-范数项可以重写为
(40)
带有辅助变量γs¼γs,γs,^γsěÞ∈RK T½。然后,通过将(40)和决策规则(34)代入(39),并交换ξ上的外部最大值和γs上的下确界,这是极大极小定理所允许的,我们得到(39)的以下公式:
(41)
最后,通过最后一次应用(41)中基于对偶的内部最大化问题的重新表述,我们得到了以下一组约束:
(42)
其中βs∈RK T½和αs∈RMTþ是对偶变量。注意,约束(42c)表示范数约束~γs k∞≤τ。总之,我们以MILP的形式获得了DRO问题(19)的基于决策规则的近似值,可以使用现成的求解器直接求解。
5.6追索权决定的信息基础
根据(34),制定决策规则,使得在给定阶段的追索决策取决于在该阶段之前观察到的所有不确定参数,这在具有大量阶段的问题中在计算上是困难的。缓解这一问题的一种常见方法是考虑涉及较少(和不同)不确定性参数的决策规则,这可以被视为追索权决策的信息基础。为此,我们定义了一个辅助的不确定参数_wjt,它表示从预测的RUL到时间t的累积偏差,即,
(43)
然后,我们将决策规则定义为w而不是w的函数。
其原理是_wjt包含的相关信息比wjt多。
因此,我们可能能够通过包含较少不确定参数的决策规则获得类似质量的解决方案,为此我们提出了以下两种策略。
5.6.1 策略1
让决策规则仅取决于在前Δt阶段和当前阶段观察到的不确定参数。因此,例如,对于t∈t n 0f g,我们有yijk,t 1¼yijk、t 1 _wmax 0,t 1Δt f g,…,_wt 1。
5.6.2 策略2
维护任务通常在装备单位的RUL接近零时触发。假设调度范围内的每个机组最多需要一次维护操作,我们定义了两个时间点tj和^tj,在这两个时间之间,机组j的RUL可以达到零:
(44)
结合策略I,我们考虑仅涉及t∈max 1,tjΔt,…,tj,j∈j的决策规则_wjt。tj和tj的选择可以很容易地进行调整,以考虑调度范围内每个机组的多个维护操作的情况。

6计算结果

在本节中,我们将所提出的分布式鲁棒调度模型应用于一个说明性示例和一个涉及乙烯裂解炉系统的真实案例研究。所有模型都在Julia v1.4.2中实现,JuMP v0.21.341包,并在2.10 GHz的Intel Xeon Silver 4110 CPU上使用Gurobi v9.0.3解决,64 GB RAM。
6.1 例子
我们考虑一个由三个间歇反应组成的过程,如图2所示,调度时间为120小时,离散为10个相同长度的时间段。有两个生产单元(反应器1和2),其可能的任务单元分配如表1所示。这两个反应堆都可以通过完全离线维护恢复到“如新”状态。此外,反应堆1可以部分在线恢复,而反应堆2可以接受部分离线维护,这比完全恢复所需的时间更短。这里,我们假设一个单元只能在一种操作模式下操作每个任务;因此,我们在下面的讨论中省略了模式索引k。
使用以下关系生成场景:
(45)
其中vjt是[0,1]上支持某种分布的随机变量。
本示例的所有数据都可以在补充材料中找到。
6.1.1 选择追索决定的信息基础
我们检查了用于追索决策的选定信息库对计算性能的影响。我们选择一个实例其中vjt遵循均值为0.5和方差为0.5的正态分布。我们以原始不确定参数w为基础,使用完全决策规则(34)来解决问题。然后,我们应用具有“累积”不确定参数_w的决策规则和第5.6节中提出的缩减策略(具有变化的Δt)。在所有情况下,一个断点位于每个不确定参数的边缘支撑的中心。计算结果如表2所示。
从表2可以看出,当考虑累积不确定参数时,使用Δt相当小的策略I可以获得高质量的解决方案。事实上,Δt为1时,与使用具有原始不确定参数的完全决策规则的情况相比,获得了改进的解决方案,同时计算时间减少了86%。Δt不同的实例的结果表明,解决方案质量和计算性能之间存在明显的权衡。然而,随着Δt的增加,收益会逐渐减少。在这种情况下,Δt=2和
图2 给定批处理过程的状态任务网络表示Δt=3获得相同的最佳值,但计算时间的相对差异几乎为350%。表2中的最后一个例子适用于Δt=1的策略I和策略II。它实现了与仅考虑Δt=1的策略I的情况相同的解决方案,但解决时间大大缩短。由于这种组合策略似乎在解决方案质量和计算性能之间提供了很好的平衡,因此它适用于本文中介绍的所有剩余模型实例。
6.1.2 混合整数追索权的好处
为了证明混合整数追索权的好处,我们首先在不考虑追索权的情况下解决一个实例,除了建模不确定性的内生性所需的状态变量u。同样的问题只考虑一次连续追索权,另一次同时考虑连续追索权和二元追索权即可解决。结果汇总在表3中。正如预期的那样与静态情况相比,考虑追索权的公式获得了更好的解。然而,只有持续的追索权,最佳值的下降幅度很小。相比之下,连续追索权和二元追索权的全部欠款将使最优值降低11.9%。
图3中所示的甘特图描绘了两个实例的最佳时间表。注意,例如,_w1,2和_p1,2分别表示反应堆1在时间2及其相应断点处的累积不确定参数_w。图3A表明,反应器1和反应器2始终在时间段5内进行维护,无论其实际退化程度如何;这是意料之中的,因为当只允许连续追索时,无法调整任务分配决策。相比之下,如果也允许二元追索权,则时间表变得更加现实和灵活,从而如图3B所示,每个反应器仅在必要时进行维护。例如,如果_w2,3≥_p2,3,我们在时间段5内对2号反应堆进行部分离线维护;否则,在给定的调度范围内,不对该反应堆进行维护。在补充材料中,我们提供了另一个示例,进一步说明了考虑多种维护选项的好处,而不是只考虑完全离线维护。
6.1.3 分布鲁棒性的好处
在下文中,我们研究了分布稳健公式的解如何取决于瓦瑟斯坦球~ε的半径、用于构建经验分布的样本数量、,以及真实概率分布的形式。为了证明所提出的DRO方法的好处,我们将这些解决方案与SAA和RO获得的解决方案进行了比较。
再次考虑从平均值为0.5和方差为0.5的正态分布中生成10个样本的情况,我们解决了变化ε的DRO问题。相应的最佳值和计算时间如图4所示,其中还包括SAA和RO的结果。正如预期的那样,最佳值随着ε单调增加,因为较大的~ε会导致较大的模糊集。
此外,DRO的最佳值与SAA和RO的最佳值相同,分别为¼0和¼100。这与前面提到的瓦瑟斯坦模糊集的性质一致,该性质表明,DRO可以被视为SAA和RO的推广。在这种特殊情况下,人们还可以观察到,计算时间通常随着~ε而增加。
我们现在评估各种模型的样本外性能,这是更相关的性能度量。我们通过从相同的正态分布中生成1000个额外的场景,并将每个模型的解决方案应用于这些场景。
图5显示了所得成本的平均值和标准偏差(SD)。可以看出,平均成本曲线是U形的,即,平均成本首先随着ε降低,并在某一点达到最小值,然后随着ε进一步增加而增加。与SAA相比,DRO的平均成本降低了0.9%,约为¼1;同时,SD降低了32.5%。这表明具有适当的ε的DRO产生了具有改进的预期性能和较低的风险水平。此外,请注意,DRO的解在相当宽的范围内(从1到50)不会发生变化,这是一个理想的特征,因为它简化了的调谐。当SD进一步降低时,DRO的样本外平均成本随着ε增加超过50而增加。特别是,与反渗透溶液相同,具有¼100的DRO溶液的SD几乎为零,但与~¼1的情况相比,平均成本相对增加8.4%。
为了分析用于构建经验分布的样本数量对模型性能的影响,我们分别生成了10个、50个和100个样本的另外三个实例。此外,为了检查不同概率分布下的结果,我们这次考虑了均值为0.5、方差为0.5的Gamma分布。计算结果如图6所示。
与前面的正态分布情况一样,可以观察到类似的趋势。此外,我们可以看到计算时间随着样本数量的增加而增加,这是因为约束和连续变量的数量随着样本数量线性增长。
在这里,我们还使用了1000个额外的场景,这些场景是从相同的Gamma分布中随机采样的,以评估各种模型的样本外性能,如图7A所示。大量样本通常会产生更接近真实基础分布的经验分布。结果,随着样本量的增加,SAA的样本外性能提高,DRO需要更小的ε才能获得最佳解决方案。A.在这三种情况下,每种情况下都可以确定导致最低平均成本的ε范围,但在100个样本的情况下,这个范围明显更小。还可以观察到,DRO的相对效益与SAA相比,当考虑更多的样本时。具体而言,在10、50和100个样本案例中,当~ε分别设置为1、0.5和0.1时,DRO实现的样本外平均成本比SAA低2.4%、1.7%和0.6%。
我们通过绘制图7B中每个实例的所有1000个示例场景的成本来进一步分析结果。这里,红线表示RO模型优化的最坏情况下的最小成本。绝大多数场景产生的成本远远低于最坏情况下的成本,可以看到成本较高的场景数量随着ε的增加而减少。因此,ε可作为保守程度的衡量标准,并可根据用户的风险承受能力进行调整。
6.2乙烯案例研究
我们现在回到第2节中的激励示例,并将所提出的模型应用于实际乙烯装置中三个裂解炉的联合调度,其整个过程在Feng等人中有更详细的描述。42感兴趣的炉标记为BA105、BA106和BA107。三种原料,即石脑油(NAP)、大气瓦斯油(AGO)和加氢裂化尾气油(HVGO)可以在给定的熔炉中进行处理。这里,只考虑离线维护,这是一个持续2天的除焦过程,并假设完全去除焦炭。
我们考虑将28天的调度范围离散为14个相同长度的时间段。在1年的过程中,收集了所有三个熔炉的资产监测和运行数据,这提供了足够的数据,以形成12个不确定参数w[T]的样本。我们解决了这个问题的一个特殊实例,其中从给定的初始条件,可以估计(通过应用(44))BA107可能需要在时间段8之后的某个时间进行除焦,而其他两个熔炉将不需要在调度范围内进行维护。
因此,我们使用Δt=1的策略I和对于每个_wjt使用一个等距放置的断点的策略II:我们使用具有不同~∞的SAA、RO和DRO来解决问题。DRO模型有大约300个二进制变量,120000个连续变量,以及经过Gurobi预处理后的117200个约束。所有模型实例的计算结果可在补充材料中找到。
我们比较了不同模型的样本外性能。由于我们不知道真实的概率分布,我们将核密度估计(KDE)43应用于可用的历史数据以生成随机场景的合成集合。为了考虑不同的分布,我们改变了控制估计平滑度的应用高斯核的带宽(用h表示)。
当h=0时,经验分布恢复而不平滑;相反,如果h!∞,则估计值被完全平滑,这导致以样本均值为中心的高斯分布。给定特定带宽,我们首先使用KDE获得w分布的相应估计,然后从该估计中随机抽样100个数据点(场景);最后,我们将每个模型的解应用于所有场景,以获得相应的成本。得出的平均成本如图8所示,其中考虑了四个不同的h值。在所有四种情况下,最佳的样本外性能都是通过DRO实现的,其值约为¼1。与SAA相比,DRO的优势在h值较大时更为明显,这是由于经验分布与KDE估计值之间的差异较大。特别是,当h=100时,与SAA相比,平均成本降低了1.0%。与RO相比,平均成本降低了5.2%。图9进一步显示了每种情况下所有100种场景的成本,图10、11和12中的甘特图分别描述了从RO、SAA和DRO获得的可调整时间表,其中~¼1。忽略历史数据提供的分布信息,RO侧重于每个不确定参数wjt达到其最大值wmax j的最坏情况。因此,如图10所示,无论实际的辐射度水平如何,都可以对BA107炉进行除焦。但实际上,除焦并不总是必要的;相反,它应该根据_wBA107,t的实现来确定,这在SAA和DRO¼1όÞ解决方案中被考虑,分别如图11和图12所示。从图9中可以看出,SAA和DRO(ε¼1)解决方案产生了两种不同的成本结果,一种需要去焦,另一种不需要去焦。还应注意,虽然RO和DRO(ε¼1)将除焦操作安排在时间段11,但SAA将其推迟到时间段12。SAA解决方案在不需要除焦的情况下成本最低;然而,当需要除焦时,产生的成本远远高于从RO和DRO(ε¼1ěÞ)解(见图9)。这个例子表明,DRO可以提供一种解决方案,有效地平衡SAA的过度乐观和RO的过度保守。

7结论

在这项工作中,我们讨论了装备退化中分布不确定性下的集成生产和维护调度问题。我们开发了一种DRO方法,该方法确保了给定多面体不确定性集上的可行性,并最小化了与模糊集相关的最坏情况下的预期成本。模糊集是根据以给定经验分布为中心的概率分布空间中的Wasserstein球来定义的。我们采用了一种决策规则方法来近似多级DRO模型,该模型结合了连续和二元追索权,允许将其重新表述为混合整数线性规划。将所提出的模型应用于一组计算机实验,证明了DRO与使用样本平均逼近和鲁棒优化的随机规划相比的优势,以及混合整数追索权的重要性。该模型还成功地应用于考虑工业试验乙烯装置的炉系统的真实案例研究。

你可能感兴趣的:(RL&OR,python)