概要
通过网络通讯,将大量计算任务从移动设备迁移到功能强大的云服务器上,这一种移动云计算迁移技术可以降低设备的硬件限制,从而提供更高的性能并且节约能源。不同的应用对耗时和能耗的关注度各不相同。如果一个对延迟可容忍的作业被推迟到给定的时限,或者一个高效节能的网络可用,传输时间都将延长。通讯信道可以变得更加节能、计算平台的资源受限越来越少,这些改变都可以节约能耗。但是,如果节省下来的时间无法弥补额外的等待时间,则此策略将不那么有效。在此篇论文中,我们研究了两种延迟迁移策略: 一种是部分迁移模型,其将计算任务从缓慢的迁移流程中释放,并且可以在本地执行;另一种是完整的迁移模型,可以通过蜂窝队列而非WiFi队列进行迁移。在这两种模型中,我们最小化能量响应时间加权乘积(ERWP)度量。我们发现当WiFi网络的可用性很低时,计算任务经常放弃排队。一般来说,对于延迟敏感的应用,在适当的退队策略下,我们优先选择部分迁移模型;而对于延迟容忍的应用,完整的迁移模型都有不错的效果,当选择较长的时限时,该模型优于其他的模型。完整迁移模型在能耗方面效果最好,即使任务截止日期很长。当耗时最关键时,部分迁移模型的最优截止时间和完整迁移模型的WiFi传输才有意义。如果是为了节约能耗,应该增长等待时间而不是进行本地计算或者使用蜂窝网络。
关键词: 移动云计算,移动任务卸载,异构网络,能耗-性能折中,队列模型
1 介绍
除去轻量级的互联网应用,移动用户对于移动设备上的计算密集型和耗能型应用的需求越来越多。然而,由于移动设备上资源受限,例如有限的计算容量、电池寿命和网络连接,在这些设备上运行复杂应用是极为困难的。通过无线网络将计算密集型任务从移动设备迁移到功能强大的云服务器上,可以有效缓解资源受限的移动设备和需要资源的移动应用之间的冲突,从而提升设备的性能。迁移还有一些潜在的好处,包括提升任务的响应速度以及减少处理任务的占用资源等。
对于那些需要在相当少量的数据上进行大量计算的应用而言,移动迁移技术是非常有效的。确切来说,该篇论文中我们只考虑那些上传比下载数据量大的应用程序。那些图像识别类的应用程序都是这样的例子,比如光学文本识别或者图像物体检测。
不同类型的应用通常对时耗和能耗的关注度也各不相同
- 对延迟容忍的应用:许多应用程序(比如,iCloud,社交网络,移动医疗保健和城市断层摄影等)处理视频、音频、传感数据或者通过网络请求大型数据库时都对网络延迟不敏感。参与式传感应用程序是数据密集型但对延迟容忍的应用程序中一个很好的例子。大量传感器节点获取的传感器数据,创建了关于诸如个人资源消耗,饮食习惯和城市文献等参数的知识体系[1]。数据通过蜂窝网络或WiFi网络从智能手机上传到后端的云服务器上。某些非实时性的传感器信息只有在设备进入节能网络后,才会提交到服务器上[2]。用户可以通过服务器端的网站浏览或搜索获得的档案。当在正常网络覆盖范围之外(例如在蜂窝协议不可用的国外)旅游时,会出现如下的生活场景:用户希望触发某个任务以免忘记,但仅在回到工作场所时才需要其结果。一般而言,对于延迟可以容忍的应用来说,响应时间不那么重要,优化能耗更关键。
- 对延迟敏感的应用:当在移动设备上运行对延迟敏感的应用时(比如,面部识别,视频会议,车辆通信,身份认证)时,移动用户需要与其正常认知能力相当的快速响应。因此,为了获得更好的用户体验,感知式应用应该控制其响应时间。通过计算节点的远程执行,任务迁移技术可以普遍地应用到感知式应用上。快速的响应对这些应用很重要,在较短的网络延迟(例如WiFi网络)后,云服务上的任务卸载方案可以为这些应用提供更好的方式并且降低响应时间。
由于移动性,移动用户很容易受到动态变化网络条件的影响,这使得在移动环境中[3]做出好的迁移决策相当困难。移动网络环境对迁移系统的性能有很大影响。因此,想要采取高效的迁移策略,我们通常需要对网络环境有一个很好的了解。
移动设备通常具有用于数据传输的多个无线接口,例如3G/4G或者WiFi,各个接口都有着不同的可用性、延迟和能耗。因此,将计算任务迁移到云服务器上有几种不同的方式,例如通过高开销的蜂窝连接,或者间歇可用的WiFi[4]。直到WiFi变得可用才进行迁移,这一举措可以以额外的等待时间为代价来减少传输时间。节省下来的传输时间在未来的某一刻将直接转变为节省移动设备的电池电量[5]。然而,延迟迁移仍然是一个有争议的话题,因为我们无法预知用户愿意为延迟传输等到什么程度[6]。在该篇论文中,我们尝试给出关于如何平衡不同场景(例如延迟容忍和延迟敏感应用)下的时耗和能耗的总体意见。我们开发了一个理论框架,通过使用队列模型来处理延迟敏感任务和服务终端,从而获得性能-能耗上的折中。这些模型可用于预测给定网络环境部署条件下的平均性能和能耗。
该篇论文的主要工作如下:
- 我们提出了两种用于延迟迁移云系统的分析队列模型:部分模型和完整模型。还引入了非延迟的迁移模型以供比较[7]。
- 我们开发了一个分析框架,用于分析具有服务中断的模型。从该框架中,我们获得了在延迟迁移系统中的关键性能指标的闭合公式,例如能量响应时间加权乘积(ERWP),它结合了其他先前研究的指标的优点。
- 我们旨在回答以下的一系列问题:
i 给定时限,作为网络参数和任务到达时间的函数,预期的响应时间和能耗是多少?
ii 如何选择最佳的时限,以便为特定应用实现特定的能量-延迟权衡?
iii 给定多个模型,哪一个模型最适合根据ERWP指标获得性能增益?
本文的剩余部分安排如下:第二节介绍了相关工作;第三节描述了延迟迁移模型的系统架构以及所考虑的指标;第四和五节展现了数学模型及其对部分和完整迁移模型的分析。基于ERWP指标的部分迁移模型分析在第四节中介绍。第五节提出并分析了完整的迁移模型。第六节基于移动网络中的实际数值评估了指标和模型。第七节进行总结。
2 相关工作
本节讨论了当前迁移系统的相关工作,包括如何缩短计算任务的完成时间、能耗以及两者的结合,每个话题对应一个部分。移动设备上的时耗和节能问题变得越来越重要。许多研究工作致力于将计算迁移到远程服务器上以便缩短执行时间或节能。
2.1 缩短任务的完成时间
移动云迁移有时可以分为两步:其中云通过近距离微云到达,而微云又连接到功能强大的云服务器上。Satyanarayanan[8]等人提出了一种基于虚拟机的移动计算云,智能手机通过WLAN连接到该云。假设到云的连接比到微云的连接具有更高的延迟和更低的带宽。实质上,微云将移动设备作为微客户端来访问本地资源,而不是直接使用移动设备的资源并仅在需要时才进行计算迁移。
一种动态迁移的随机模型[4]使用多种性能指标以及间断可用的访问连接进行工作。移动设备的移动特性和无线连接的不稳定性,影响了在迁移系统控制下运行的普遍服务的预测性能。Ou[9]等人分析了移动无线环境下迁移系统的性能,并考虑到了系统故障与恢复,却并未讨论该如何采取迁移策略。另一个框架中[10]研究了使用宽带预估技术进行迁移策略选取,该作者通过预测本地和远程系统的带宽,制定计算迁移的策略,该方案假设网络可靠性不成问题,然而实际上网络并不是一直可用。
2.2 节能
为了减少移动设备的能耗,移动迁移系统已经存在了很多年。MAUI[11]是一个能够使移动代码部署到基础设施上的能耗感知系统。通过权衡本地处理的能耗与远程执行的代码和数据传输能耗,该系统可以最大程度上优化设备能耗。该系统在运行时决定应该远程执行哪些方法,以便在移动设备网络连接受限时节能。
Kumar[12]等人认为计算迁移有可能为移动用户节约能耗,但并非所有应用在迁移到云服务器上后都能够高效节能。取决于计算迁移节省下来的计算开销是否由于额外的通信成本。对于那些大量通信、少量计算的任务而言,应该在移动设备上执行本地计算,对于那些少量通信、大量计算的任务而言,需要在远程计算。
一些作者在为将应用程序任务分配到移动设备本机还是云服务器上时,也考虑到了响应时间约束。时限对于大多数的交互式应用而言是很重要的。为了在节约能耗的同时满足应用程序给定的时限,动态的计算任务迁移策略被提出[13][14]。这些方案在解决策略选择问题上具有很低的复杂度(例如,确定哪些软件组件在移动网络环境下远程执行)
2.3 节时与节能结合
出于节约时间和能耗两方面的考虑,一些作者提出了相应的解决方案。CloneCloud[15]使用了静态分析和动态配置,在某指定计算和通信环境下,以细粒度自动划分应用程序以便优化执行时间和能耗。然而,静态的应用程序划分[16][17]并不适用于网络条件会发生重大变化的情况。由于异构的无线网络环境、设备的移动性、云资源的不可用性等问题,网络连接有时会变得断断续续。移动网络中不稳定的连接对迁移策略有很大影响。高通信延迟和能耗可能会使得本地执行在特定情况下更有优势。
在[18]这篇论文中提出了通过在集中传输技术中来回切换以实现迁移的无缝操作技术。他们研究了当WiFi网络仅间歇可用时,该如何权衡WiFi搜索的能耗与传输率。在[1][19]这两篇论文中提出了如何选择高效的延迟网络,来优化能耗与将数据传输拖延到移动设备处于高效网络环境下的延迟之间的权衡。此外,延迟迁移还被用在没有WiFi连接可用的情况下。某些连接会被堵塞,直到截止时间或者直到WiFi可用[20]。[21]中提出了延迟移动迁移的在线调度策略,使用WiFi传输的数据量尽可能最大化。高策略仅在数据传输超时的情况下使用蜂窝数据。
本文的工作是基于以上提到过的,对于移动云环境下间歇性可用网络连接问题的有趣研究,旨在平衡不同的目标,例如最小响应时间、最小能耗等。我们明确考虑了用户和应用程序的移动性,并研究了基于我们之前的工作[22][23][24],使用组合度量来解决这些异构问题。
3. 系统模型
这一节,我们基于网络可用性模型,定义了两种不同的延迟迁移模型,并且提出了一个全新的指标来获得能耗-性能的折中。
3.1 网络模型
图1展示了我们所做的假设。我们假设蜂窝接口比WiFi有着更高的可用性,并且能够为广域的移动设备提供近乎全面的覆盖,但是蜂窝接口比WiFi的数据传输率要低并且会消耗更多的传输能量。换句话说,我们假设WiFi在传输相同量的数据上要比蜂窝接口更快且更高效。为了便于分析移动迁移系统,我们假定对于移动用户来说,蜂窝网络任何时刻都可用,但是WiFi网络取决于地理位置。移动用户可以进出WiFi覆盖区域。这些假设看起来在很多情况下都符合现实,并且这些假设构成了本论文的基础。
我们通过ON-OFF交替更新过程[嵌入式1]来模拟WiFi连接状态的时间变化,如图2所示。On阶段表示WiFi连接可用,OFF阶段表示WiFi连接中断。在后一阶段,数据要么不被传输(由于接口空闲),要么只能通过蜂窝网络传输。每个ON周期的持续时间[嵌入式2],可以假定是随机变量的指数分布,并且与其他ON和OFF的持续时间无关。此外,WiFi可用率可以被定义成AR=[嵌入式3]。
3.2 延迟迁移模型
根据图2所示的网络可用性模型,我们定义了两种不同的计算任务迁移模型,即后面将要提到的部分模型和完整模型。在延迟迁移时,时限与数据传输相关联,并且移动设备只要到达有WiFi覆盖的范围,数据传输就会恢复,直到传输完成或者到达时限(以先到者为准)。如果时限到达时,传输任务仍未完成,剩余的任务将在本地执行(部分迁移模型)或者将使用蜂窝网络完成数据传输(完整迁移模型)。
部分迁移模型: 我们使用一个两阶段的队列(快速阶段:使用WiFi网络, 慢速阶段:使用蜂窝网络)来将计算任务迁移到云服务器上。当WiFi网络可用时,所有的可迁移任务都将通过WiFi网络进行传输;否则,他们将通过蜂窝网络进行传输,因为蜂窝网络总是可用。我们在蜂窝网络中重新设置了一个时限,如果任务在切换到某个WiFi AP之前到期,那么它将在本地继续执行,而不是在云服务器上远程执行。使用这种方案,我们将部分作业迁移到云服务器上,其余部分留在本地处理。
完整迁移模型: 当WiFi连接可用时,所有的可迁移任务都通过WiFi网络传输,否则,他们要么延迟到给定的时限,要么通过蜂窝网络进行迁移。通过这种方案,我们将所有的可迁移任务通过WiFi网络或者蜂窝网络进行迁移。
我们考虑延迟迁移中的队列系统。移动设备、云服务器和无线网络都可以当作是用来捕获资源占用和系统延迟的队列节点。移动设备执行应用中的可迁移任务,既可以使用移动设备的本地处理器执行,也可以通过计算任务迁移使用远程的云服务架构。移动设备、蜂窝连接和WiFi连接被建模成M/M/1-FCFS队列,远程云建模成M/M/∞队列,即作为一个延迟中心[26]。我们使用嵌入式4和嵌入式5对应到移动设备和云上的期望执行时间。通过蜂窝网络和WiFi将数据传输到云的预期速率分别是嵌入式6和嵌入式7。
延迟迁移模型包含了带退队和服务中断的排队现象。在排队时,退队意味着一个计算任务在过期后,将要离开该队列并加入到另一个队列中。服务中断字面意思是队列中服务有一些非自愿的不连续性,这模拟了移动设备与系统中WiFi网络的时断时续现象[27]。我们的延迟计算任务迁移模型和延迟数据迁移的最大区别在于,不仅仅只有数据被传输到云上,任务本身也会在远程的云服务器上执行。通常情况下,迁移的数据在显示前需要进一步分析或进行简单地处理。
3.3 度量
这一小节,我们定义了一种新的指标,用于评估和优化任务完成时间与能耗之间的权衡。
3.3.1 ERWS
能耗响应时间加权和(ERWS)指标是一个代价函数,定义为相应部分期望值的加权和。
公式1
E用来表示一个随机变量的期望值,E(T)和E(e)是耗时和能耗的期望值,相应的,w(值域为0-1)是用来表示移动设备对耗时和能耗侧重程度的权重参数。如果更关注性能,w应该小于0.5,如果更关注节能,w应该大于0.5,如果w恰好是0.5,说明既关注提高性能,又关注节约能耗。期望值取决于其估计值,即为平均值。
ERWS指标的优势在于分析上易于处理,因为期望随着时间而增加,因此可以通过马尔可夫决策过程来优化[28]。从最小化的角度考虑,该指标可以将任意的迁移策略与最优迁移策略相比较。然而,缺点在于该指标是两种不同比例的指标的线性组合。
3.3.2 ERP
能耗响应时间乘积(ERP)被广泛接受为获得能耗-性能权衡的合适度量。它被定义如下
公式2
最小化ERP指标可被视为最大化"每焦耳上的性能",性能被定义为每个时间单位上的作业量。
ERWS指标意味着,减少一个单位的平均响应时间与减少一个单位的平均能耗具有相同含义。相反的是,ERP指标是乘积,而不是将两个完全不同比例的指标进行线性组合。换句话说,ERP指标不会受到不同比例带来的比较上的影响。然而,由于ERP是两个均值的乘积,在分析处理上会比较困难。
3.3.3 ERWP
为了克服上述的缺点,我们提出了一种名为能耗响应时间加权乘积的新指标,结合了ERWS和ERP的优势,它能够很好地处理不同比例的指标,并且能够有效地进行分析处理。ERWP指标在[29][30]引入,其定义如下:
公式3
我们将(3)式重写如下嵌入式8,它继承了ERWS指标的特点,可以为能耗和耗时赋予不同的权重,并且由于对数期望是会随着时间的推移而增加的,因此该指标也易于分析。同样的,在w=0.5的条件下,均值能耗和均值耗时将具有等价的影响,并且此时嵌入式9意味着ERWP指标拥有ERP指标的优点,对不同的比例不敏感。
4 部分迁移模型
这一节,我们将分析具有服务退队的部分迁移模型,这意味着任务一旦过期就会结束生命周期。我们首先基于网络可用性模型制定分析模型,然后使用队列分析来推导ERWP指标。
4.1 模型
图3描绘了基于网络可用性模型的延迟迁移模型。我们在两阶段(快与慢)马尔可夫随机环境中考虑一个调制的M/M/1队列,并且处理延迟敏感性任务,即任务可能会中止迁移并在本地执行。这些任务通过蜂窝连接或者WiFi网络传输到云端。在两种阶段下振荡的单服务队列系统由Fon和Foff表示,意味着WiFi连接是可操作的。在该模型中,系统在任一阶段的持续性都由一个随机机制决定:如果系统当前在阶段Fon,那么它会在一个平均时长嵌入式10的随机时间内切换到阶段Foff,如果当前在阶段Foff,那么它会在平均时长嵌入式11的随机时间后切换到另一个阶段。我们假定到达系统的迁移任务服从参数为λ的泊松分布,那么调制过程嵌入式12决定了服务率
公式4
我们假定任务的平均大小是E(X),快速阶段(WiFi网络)的传输率是sw,服务率是嵌入式13,它在服务任务时的耗能时pw,空闲时为0。相似的,慢速阶段(蜂窝网络)的对应传输速率为sc,服务率为嵌入式14,耗能为pc。在慢速阶段,任务将变成延迟敏感类型。退队时限Td在该阶段与每项任务关联。这就是说,一旦到达,每个任务都将激活一个独立的计时器,该计时器服从退队率r的指数分布。如果系统在任务到期前没有将其环境从慢速阶段改为快速阶段,任务将从迁移队列中被移除,并且假定在移动设备本地执行,而不是迁移到云服务器上。
图3表明该延迟迁移模型有三个队列组成:迁移队列(有两个可交替的阶段,蜂窝连接和WiFi连接);表示移动设备上本地处理的本地队列;表示在云上远程处理的远程队列。
迁移队列根据WiFi的可用性来互相地重置阶段,从而更迭它的服务,WiFi由具有指数分布ON-OFF周期的可中断泊松过程(IPP)控制。我们将间歇可用的WiFi热点建模成一个偶尔服务器故障的FCFS队列,既可能出现在WiFi网络处理任务的On状态,也可能出现在蜂窝网络处理任务的OFF状态(蜂窝连接假定持续可用)。然而,如果任务在蜂窝网络中停留时间过长,那么它将退出迁移队列,并在移动设备的本地执行,如果一个任务在规定时限内完成了传输,该任务算是成功迁移。如果迁移失败,任务将退出迁移队列并加入本地队列,以供本地处理,我们称这样的事件为退队事件。
由于在进入服务之前没有等待时间,云上的M/M/∞队列有时被认为时延迟(有时是纯延迟)站,延迟的概率分布就是服务时间的概率分布。
特别地,如果我们将服务率um和ur设置为∞,图3的移动计算迁移模型将衰减为移动数据迁移,即对于到达的任务没有进一步的执行,所以,图三中的队列模型包括了移动计算迁移和移动数据迁移两部分。
4.2 队列分析
基于先前所做的假设,部分迁移模型可被建模成图4中的2D马尔科夫链。
具有蜂窝网络的状态表示为{c,i},具有WiFi连接的状态表示为{w,i}
参数i对应了系统中的任务数量(队列或者服务中)。在WiFi阶段,系统以uw的速率消耗,而在蜂窝阶段,系统以uc+i*r的速率服务,因为这i个队列任务中任一个都可能退出迁移队列[20]。蜂窝和WiFi阶段的平衡式如下
公式5a
公式5b
公式5c
公式5d
在某些WiFi不可用区域(仅有蜂窝连接),访问迁移系统的稳态概率是嵌入式15。相似的,WiFi可用阶段的稳态概率是嵌入式16,等于可用率AR。
蜂窝和WiFi状态的概率生成函数被定义为:
公式6
通过将((5C)和(5D))中i的每个表达式乘以z^n,并将这i个式子相应地求和并重新排列,我们可以得到
嵌入式17,其中嵌入式18。z1和z2是二次多项式嵌入式19,嵌入式20
4.2.1 一般情况
我们考虑图3中描述的部分迁移模型,并假定退队率r≠0.根据[32],我们可以得到
公式7
公式8
我们可以定义嵌入式21,相应地,k1(z)和k2(z)表示如下
嵌入式22
通过定义k1(z),k2(z)和β(z),得出T,U,V>0并且S<0。所以,Πc,0和Πw,0是正的。我们可以发现系统是可遍历的。直观上来讲,如果我们设置参数λ≥0,μc≥0,μw≥0,ε>0,η>0并且Γ>0,那么系统一直是稳定的。中止过程,其总体速率随着作业数量的增加而增加,防止了队列长度的爆炸增长。或者说,系统只有在Πc,0和Πω,0为正并且其他参数都设置如上时才稳定。
将μ定义如下μ=Πc·μc+Πω·μω,根据[32],我们可以得到
公式9
公式10
如图4所示,在慢速阶段和快速阶段每单位时间内的预期服务任务数量分别为嵌入式23和嵌入式24。因此,在慢速阶段,由于任务的延迟敏感性而引发的中断率可以给出
公式11
中断率与蜂窝阶段的退队率和任务的平均数量成正比。
任务在移动设备上本地执行的比率肯定等于中断率,即嵌入式25。到达迁移队列的任意任务离开并加入本地队列的概率,即它将在本地执行且不会被重新迁移的概率定义如下
公式12
Pr指的是概率操作符。
我们回想一下服务站的可用率表达如下:嵌入式26
4.2.2 一个极端的例子
当r->0时,图3中间部分迁移模型将退化成图5中的非延迟迁移模型。因为退队率为0,因此该模型中没有本地队列。当网络可用时,无论网络质量如何,所有的任务都将立即迁移。由于可能会使用较差的网络,该迁移模型会浪费能量[5],并且与延迟迁移模型相比它做了分析。
将r设置为0解(5)中的方程组我们可得嵌入式27,嵌入式28并且可以证明g(z)在(0,1)上只有一个根z0。
经过一些算术解析,我们可得
公式13
公式14
一旦πc,0和πw,0的值确定,概率生成函数就可以计算为:
公式15
公式16
假定嵌入式29,我们可以得到系统中的平均任务数量
公式17
4.3 基于指标分析
处理所有任务的能耗和耗时的总成本由远程成本(将可迁移任务发送到云服务器,等待云服务完成任务计算并将计算结果返还给移动设备)以及本地成本(在移动设备本地执行剩余的任务)。上行链路的传输引起的延迟通常主导了传输成本,因此我们忽略下行链路中的成本。
4.3.1 平均响应时间
根据Little定律,嵌入式30,平均响应时间可以计算如下
公式18
c,w,m,r分别代表了蜂窝网络阶段,WiFi传输阶段,移动设备和远程云服务。相应的,E[Nc]和E[Nw]分别是蜂窝网络和WiFi网络对应的平均任务数量,在(9)(10)中提到过。
由于本地队列的到达率等于迁移队列的中断率,对于本地执行而言,我们有嵌入式31。对于一个普通的M/M/1-FCFS队列,移动设备的平均任务数量计算公式如下
公式19
其中嵌入式32是利用率。
对于一个M/M/∞队列,由于进入云服务器上的远程服务无须等待,远程队列的平均任务数量可计算如下
公式20
其中嵌入式33是远程队列的到达率。
4.3.2 平均能耗
我们假定每个服务器运作时以恒定功率pi操作,即移动设备只在系统中有计算任务时才消耗能量。因为嵌入式34是平均功耗,我们可以计算部分迁移模型的平均能耗,表达式如下:
公式21
在云服务器上远程执行的应用任务不会消耗本地设备的CPU。
相应的平均功耗计算表达式如下:
公式22
由于队列的利用率是服务忙碌的概率,我们有嵌入式35,即能量消耗仅发生在服务器忙碌时。
由于本地执行而消耗的能量取决于移动设备的处理速度,由于移动设备总是可用的,我们有
公式23
通过蜂窝网络或WiFi网络进行任务迁移而产生的平均能耗取决于传输的功耗与速率,我们有:
公式24
公式25
其中,pc和pw是蜂窝网络和WiFi网络的利用率,等价于对应网络的繁忙率。根据图4,他们可以被分别计算如下:
公式26
公式27
4.3.3 ERWP指标
能耗-响应时间加权乘积结合了加权乘积后的能耗指标与性能指标。我们的目标是最小化平均能耗和平均响应时间。更进一步的,通过将(18)和(23)代入(3)中,我们可以为延迟迁移模型显式地制定ERWP指标:
公式28
我们的目标是寻找一个使得ERWP最小化的退队率r*。请记住,退队意味着延迟敏感任务放弃迁移并且切换到本地进行计算。
5. 完整迁移模型
这一小节我们将讨论迁移所有计算任务的完整迁移模型。可能的话任务通过WiFi进行迁移,否则通过蜂窝网络。
5.1 模型
如图6所示,完整迁移模型包括两个用于移动设备迁移的耦合队列,即WiFi队列和蜂窝队列。这两个队列都由FIFO(先进先出)规则提供服务。所有达到系统的任务都默认由WiFi接口进行迁移。当任务使用WiFi网络进行迁移时,由于WiFi链路的传输速度不稳定,存在排队现象。我们将WiFi热点的间歇可用性建模成一个偶尔有服务宕机的FCFS队列。服务器要么处于ON状态处理存留任务,要么处于OFF状态,不接收作业。我们假设在没有WiFi连接期间,作业将退出队列。
我们为每一项任务分配一个退队时限,该时限服从指数分布。任务根据它们距离时限的剩余时间(排队时或处于队首,但都在等待WiFi接口)以FCFS的顺序调度。当WiFi队列处于OFF状态,任务会变成延迟敏感的,也就是说,每个任务,一旦到达,就会激活一个独立的计时器,并且服从退队率为r的指数分布。如果任务到期时网络仍未将其环境由OFF状态切换到ON状态,该任务就将退出WiFi队列,并被分发到蜂窝网络上。如果WiFi队列中的某个任务在到期之前就通过WiFi网络传输完成,我们称该作业成功迁移。如果迁移失败,该任务将退出WiFi队列并加入蜂窝队列,以便通过蜂窝网络立即传输,我们称这种事件为一个退队事件。
当任务通过蜂窝网络传输到云服务器上时,由于蜂窝链路的传输速度不够充足,可能会存在排队现象。传输延迟(排队和实际传输时间)与传输能耗方面的成本增加。因为蜂窝网络总是存在,所以始终可以获得一定程度上的服务。
远程队列是一个纯延迟站,任务花费的时间服从均值为1/ur个单位时间的指数分布。
5.2 队列分析
WiFi队列是指通过WLAN网络,将任务从移动设备迁移到云服务器上,该网络被建模成一个提供间歇性可用服务的M/M/1-FCFS队列。当故障服务器恢复时,将继续为中断服务提供服务,即已完成的任务不会丢失(参见数据传输恢复)[4]。我们做了常规但不那么切实际的假设,服务有时会失败并且随机时段后会恢复。WiFi队列的马尔可夫链如图7所示,等价于在图4中假设uc=0,πON=πw并且πOFF=πc。
具有WiFi连接的状态表示为{ON, i},没有WiFi连接的状态表示为{OFF, i}。在ON状态下,系统以uw的速率服务,在OFF状态下,以i·r的速率服务,因为i个排队任务中任一个都有可能退出WiFi队列。为这个链式编写如下的平衡方程
嵌入式35
在将uc=0替换进k1(z)和k2(z),得到
嵌入式36
根据[25],我们可以得到
公式29
公式30
我们进一步有嵌入式37。将上述的表达式替换进(9)(10)中,可以得到WiFi队列的平均任务数量为
公式31
公式32
所以,WiFi队列的平均任务数量计算如下:
公式33
在图7中,WiFi队列的每单位时间内服务的预期任务量是嵌入式37。因此,在OFF期间由于延迟敏感而放弃的终止率为
公式34
其中终止率与OFF状态下队列中平均任务数量以及退队率成正比。
发送给蜂窝网络的任务比例必须等于终止率,即嵌入式38。到达WiFi队列的任一作业将退出WiFi队列的概率,即它将通过蜂窝网络进行迁移的概率可以定义为
公式35
5.3 基于指标分析
这一节我们将在完整的迁移模型中推导出我们感兴趣的指标,如平均响应时间、平均能耗以及两者的指标的折中,能耗响应时间加权乘积。
5.3.1 平均响应时间
根据Little定律,嵌入式39,平均响应时间计算如下
公式36
其中E[Nw]是WiFi队列中的平均任务数量(在(33)式中提到过)
蜂窝队列是指通过蜂窝网络将移动设备中的计算任务迁移到云服务器上,它被建模成一个M/M/1-FCFS队列。因为蜂窝队列的任务到达率等于WiFi队列的任务终止率,即嵌入式40。该队列中平均任务数量为:
公式37
其中嵌入式41是蜂窝队列忙碌的概率。
因为所有的任务都将迁移到远程的云服务器上,对于远程云服务器伤的M/M/∞队列而言,平均的任务数量可以计算如下
公式38
5.3.2 平均能耗
平均能耗计算如下
公式39
其中pw是可用WiFi处理任务的时间段,计算公式如下
公式40
如果覆盖率嵌入式42,WiFi的可用率嵌入式43趋向于1.
5.3.3 ERWP指标
在我们的分析中,我们希望优化ERWP指标,通过将(36)(39)代入到(3)中,我们可以将迁移分配的ERWP指标优化表达式定义如下嵌入式44。
6 性能评估
在本节中,我们根据实际的迁移场景,使用之前提到过的延迟迁移模型并且比较了其分析结果。为了获得真实的结果,我们从实验中估算出模型参数。迁移过程包括了通信模型和远程执行模型,我们将进行一系列的实验,以便在我们的模型中使用真实的通信参数。
6.1 移动网络追踪
实际无线网络中的数据传输速率大多会随时间而变化。它受信号质量变化以及其他用户的影响。我们通过网络和能量监控在移动环境中收集真实的网络记录,并将这些记录输入到迁移模型中。
6.1.1 网络监控器
网络监控器收集无线连接状态和可用带宽的相关信息。它度量初始化时的网络特性,并持续监控环境变化。如[15]中所述,通过度量发送一定数据量所需要的时间,可以得到网络的吞吐量。由于移动性质,无线连接的状态可能经常改变(例如,用户移动到其他位置)。对于优化器而言,获取到关于无线连接的最新信息,对作出正确的迁移决策至关重要。
监控器记录了WiFi和3G接口的一些参数,包括每秒传输和接收的包,以及数据接收和传输速率。这些度量可以更好地估计当前网络性能。
我们使用SpeedTest1来度量移动网络带宽。实际设备(参见表1)应用于具有各种移动通信网络的移动云环境中。这里,我们度量如图表2所示的具有代表性的场景下的无线带宽分析。特别的,在2015年五月的某一周,我们带着两部配备有WiFi和蜂窝网络接口的智能手机(小米红米2和三星GalaxyS6)呆在室内或偶尔在校园中走动。此时间段内的数据已被采样。
图8和图9绘制了度量过的移动网络记录。我们发现WiFi和蜂窝网络(3G和LTE)的带宽随时间变化波动很大,并且难以预测。室内WiFi覆盖情况良好,稳定而快速。但是即便在相同的物理环境下,不同的移动设备也会记录不同水平的传输速度。例如,三星S6在室内环境下的带宽要比小米红米2高得多。这是因为两款设备配备了不同的硬件和软件。用户的移动性也对网络连接的带宽和质量又很大的影响。室外WiFi无线网络信号强度很不稳定,并且经常出现间歇性连接,这使得它们有时可用有时不可用。相反,蜂窝网络更加稳定,并且提供了近乎全面覆盖的连接。此外,与WiFi相比,蜂窝网络可能会出现高延迟、高回传(RTT)响应、缓慢的数据传输等现象。我们注意到,在大多数设置下,下行链路的带宽都要高出不少,有时会高出一大截。
6.1.2 能量监控器
有两种估算能耗的方法,软件监控或者硬件监控。一些论文[11][36]使用了连接到智能手机电池上的功率计来建立能耗曲线。功能监控器(例如,Monsoon监控器)是一种,通过向移动设备提供一定程度的功率,来计量数据从移动设备传输到云服务器上的能耗监控装置。我们使用PowerTutor来计量应用的能耗。尽管PowerTutor不能像硬件能耗监控器那样提供准确的结果,但它提供的结果仍是合理的,并能为我们提供一些见解。PowerTutor为每个硬件组件都提供了详细的能耗信息。
在图10中我们可以看到能耗和传输时间都与传输文件的大小成比例地增加。传输等量的数据,WiFi要比3G耗能更少,此外,设备通过每个通信网络的能耗与其传输时间成比例。
6.2 数值分析
这本节中,我们将首先从实验预测结果中推导出所需的参数,然后我们将使用这些参数分析模型。
不同的无线网络接口在很多方面都有所不同,我们需要通过一些参数来简单的刻画这些不同。根据上文收集到的移动数据记录,我们考虑一个简单的场景,蜂窝网络的传输率低于WiFi的传输率,即sc
我们首先分析了两个延迟迁移模型的退队概率。[38]中的可用率为11%。图11显示了,随着WiFi网络可用率增长,放弃迁移队列(用于部分迁移模型,参见图11a)或WiFi队列(用于完整迁移模型,参见图11b)的任务比例迅速下降。然而,在相同的时限Td下,完整迁移模型有比部分迁移模型高得多的退队率(放弃迁移)。这可以用以下事实来解释:部分迁移模型可以使用蜂窝网络来传输数据,因此减少了迁移队列中等待的作业数量。另一方面,如果将退队时限延后1~2小时,任务更有可能通过WiFi网络传输,因此,在任务到达率较低的情况下,退队概率会越低。然而,在任务到达率较高的情况下,无论时限如何,退队的概率都将保持不变。
平均响应时间包含了排队时间以及服务时间。从图12a中我们可以看出,部分迁移模型具有最低的平均响应时间,因为它在WiFi不可用时充分利用了慢速阶段的蜂窝网络。在更低的时限(Td<40分钟)条件下,平均响应时间随着时限的增加而减少,因为具有更长时限的任务更有可能通过WiFi网络进行传输,从而导致了它较短的响应时间。然而在较高的时限条件下,平均响应时间会增加,因为具有较低时限的任务可以更快地李靠队列,导致了较小的排队延迟,从图12b中我们可以看出,当退队时限较小时,非延迟迁移模型在三者中的平均能耗最小,但随着时限增长,完全迁移模型效果越来越好。这是因为WiFi网络要比蜂窝网络更加的迅速且高效。节约下来的服务时间可用为移动设备降低能耗。
请注意,退队率的倒数对应于平均时限。因此在图12a中的最短时限(约40分钟)对应到了图13a中ERWP的最小值(0.025)。
不同的应用通常对能耗和性能的关注度不同。我们使用ERWP指标,根据能耗和性能的权衡来比较三种不同的迁移模型。从图13a中我们可以观察到,当w很小时,部分迁移模型可以通过选择最佳的退队率r来实现最小的ERWP值。这表明当考虑响应时间更多一点时,最好选用部分迁移模型,相反,当考虑能耗更多一点时,应该选择完整迁移模型。后者将从快速WiFi网络节省下来的传输时间转化为移动设备更低的电量消耗。如图13b所示,当权重参数w很小时,随着可迁移任务到达率的增长,三个迁移模型的效果都变差了。然而,非延迟迁移模型对任务到达率更加敏感。部分迁移模型总是可以达到最低的ERWP值。意味着当更加考虑响应时间时,最好用部分迁移模型,相反的,当更加考虑能耗是,应该在任务到达率较低时使用完整迁移模型。当任务到达率较高时,根据ERWP指标我们更应当使用非延迟迁移模型。
我们将退队时限设置成2个小时并比较平均响应时间和平均能耗在任务到达率不同条件下的表现。如图14a所示,由于排队影响,平均响应时间随着任务到达率的增长而增长。部分迁移模型的效果要比其他两个模型个好很多,因为它在WiFi不可用阶段充分使用了蜂窝网络来迁移计算任务,而这反过来导致了图14b中的高能耗。当任务到达率较低时,完整迁移模型要比非延迟迁移模型更加节能高效,而在任务到达率较高时,非延迟迁移模型更能节能。从图11b中可以看到,随着任务到达率的增长,更多的任务将终止WiFi队列的排队。这些任务随即通过蜂窝网络传输,导致了更多的能耗。
6.3 迁移实验
为了验证我们从上述模型分析中得出的见解,我们使用不同的时限以及不同的连接场景进行实验。在该实验中我们进行了如下的真实设置:一条预设置好的路径,在此期间我们遵循预定好文件大小的文件传输队列。我们在Google Nexus 5设备上进行了一系列实验,每轮实验都有不同的时限。目标是使用不同是时限,在不断变化的WiFi覆盖情况下测量大小的文件的上传性能和能耗使用状况。
步行路线可以在图15中看到,路段用不同的颜色标记WiFi可用性,其中绿色部分表示WiFi可用,红色部分表示没有WiFi可用。发生文件上传的位置在图中用数字标记。相应的计算文件大小如下:50MB, 1MB, 10MB, 1MB, 10MB, 50MB。路程为5km,步行的平均速度为5.5km/h,步行持续了55分钟。我们使用了几组不同的延迟进行实验:无延迟,30秒,30分钟。
图16展示了不同实验组里耗电量随时间的变化。这是主要的性能评估指标,因为延迟迁移的主要目标就是降低能耗。x轴显示了相对于测试开始的以秒为单位的时间。均一化的耗电量在y轴上以百分比表示。在图表顶部显示了上传的文件及其相应的文件大小以及WiFi可用性(蓝色=可用,红色=不可用)。这是一组不受干扰的实验,表明了增长时限会降低能耗。以30秒的时限为例,第一次上传10MB文件的30秒后电池容量明显下降,这清楚地展现了3G接口的高能耗。
7 总结
在该篇论文中,我们开发了用于延迟移动云迁移的分析型队列模型,通过选择用于迁移的异构无线接口来实现WiFi网络和蜂窝网络的优势互补。我们基于ERWP指标对移动云迁移系统的能耗-性能权衡问题进行了最优分析。该指标挖掘了能耗和性能的特征,我们的分析甚至包含了间歇性可用的访问链路。
我们发现,当WiFi网络的可用率(AR)相对较低时,放弃排队的作业比例非常高。我们通过优化ERWP指标来优选退队时限,以时限不同的能耗-性能权衡。对于延迟敏感的应用,当设置了一个适中的时限时,我们首选部分迁移模型,而对于延迟容忍应用而言,完全迁移模型效果更好,并且当时限较大时要优于其他迁移模型。大体上我们认为,部分迁移策略更快,完整迁移模型更节能。
在优化能耗时,完整迁移模型即使在时限非常长时效果也是最好的。只有当任务的响应时间高优时,才能获得ERWP指标权衡的合理结果。然后,可以在部分迁移模型中找到终止迁移的最佳时限,相应的,在完整迁移模型中找到终止WiFi传输的最佳时限。为了减少能耗,最好将等待时间放长,而不是在本地计算或者使用蜂窝网络。我们所提出的队列模型可用于描述复杂而逼真的迁移系统。
参考文献
[1] M.-R. Ra, J. Paek, A. B. Sharma, R. Govindan, M. H. Krieger, and M. J. Neely, “Energy-delay tradeoffs in smartphone applications,” in Proc. 8th Int. Conf. Mobile Syst. Appl. Services, 2010, pp. 255–270.
[2] M. H. Cheung and J. Huang, “Dawn: Delay-aware Wi-Fi offload- ing and network selection,” IEEE J. Sel. Areas Commun., vol. 33, no. 6, pp. 1214–1223, Jun. 2015.
[3] K. Lee and I. Shin, “User mobility-aware decision making for mobile computation offloading,” in Proc. IEEE 1st Int. Conf. Cyber- Phys. Syst. Netw. Appl., 2013, pp. 116–119.
[4] E. Hyyti€a, T. Spyropoulos, and J. Ott, “Offload (only) the right jobs: Robust offloading using the Markov decision processes,” in Proc. IEEE 16th Int. Symp. World Wireless Mobile Multimedia Netw., 2015, pp. 1–9.
[5] K. Lee, J. Lee, Y. Yi, I. Rhee, and S. Chong, “Mobile data offload- ing: How much can WiFi deliver?” IEEE/ACM Trans. Netw., vol. 21, no. 2, pp. 536–550, Apr. 2013.
[6] F. Mehmeti and T. Spyropoulos, “Performance analysis of “on- the-spot” mobile data offloading,” in Proc. IEEE Global Commun. Conf., 2013, pp. 1577–1583.
[7] F. Rebecchi, M. D. De Amorim, V. Conan, A. Passarella, R. Bruno, and M. Conti, “Data offloading techniques in cellular networks: A survey,” IEEE Commun. Soc. Commun. Surveys Tuts., vol. 17, no. 2, pp. 580–603, Apr.–Jun. 2015.
[8] M. Satyanarayanan, P. Bahl, R. Caceres, and N. Davies, “The case for VM-based cloudlets in mobile computing,” IEEE Pervasive Comput., vol. 8, no. 4, pp. 14–23, Oct.–Dec. 2009.
[9] S. Ou, K. Yang, A. Liotta, and L. Hu, “Performance analysis of off- loading systems in mobile wireless environments,” in Proc. IEEE Int. Conf. Commun., 2007, pp. 1821–1826.
[10] R. Wolski, S. Gurun, C. Krintz, and D. Nurmi, “Using bandwidth data to make computation offloading decisions,” in Proc. IEEE Int. Symp. Parallel Distrib. Process., 2008, pp. 1–8.
[11] E. Cuervo, et al., “MAUI: Making smartphones last longer with code offload,” in Proc. 8th Int. Conf. Mobile Syst. Appl. Services, 2010, pp. 49–62.
[12] K. Kumar and Y.-H. Lu, “Cloud computing for mobile users: Can offloading computation save energy?” Comput., vol. 43, no. 4, pp. 51–56, 2010.
[13] D. Huang, P. Wang, and D. Niyato, “A dynamic offloading algo- rithm for mobile computing,” IEEE Trans. Wireless Commun., vol. 11, no. 6, pp. 1991–1995, Jun. 2012.
[14] W. Zhang, Y. Wen, and D. O. Wu, “Energy-efficient scheduling policy for collaborative execution in mobile cloud computing,” in Proc. IEEE INFOCOM, 2013, pp. 190–194.
[15] B.-G. Chun, S. Ihm, P. Maniatis, M. Naik, and A. Patti, “Clonecloud: Elastic execution between mobile device and cloud,” in Proc. 6th Conf. Comput. Syst., 2011, pp. 301–314.
[16] L. Wang and M. Franz, “Automatic partitioning of object-oriented programs for resource-constrained mobile devices with multiple distribution objectives,” in Proc. 14th IEEE Int. Conf. Parallel Dis- trib. Syst., 2008, pp. 369–376.
[17] L. Lei, Z. Zhong, K. Zheng, J. Chen, and H. Meng, “Challenges on wireless heterogeneous networks for mobile cloud computing,” IEEE Wireless Commun., vol. 20, no. 3, pp. 34–44, Jun. 2013.
[18] A. Rahmati and L. Zhong, “Context-for-wireless: Context- sensitive energy-efficient wireless data transfer,” in Proc. 5th Int. Conf. Mobile Syst. Appl. Services, 2007, pp. 165–178.
[19] P. Shu, et al., “eTime: Energy-efficient transmission between cloud and mobile devices,” in Proc. IEEE INFOCOM, 2013, pp. 195–199.
[20] F. Mehmeti and T. Spyropoulos, “Is it worth to be patient? Analy- sis and optimization of delayed mobile data offloading,” in Proc. IEEE INFOCOM, 2014, pp. 2364–2372.
[21] H. Deng and I.-H. Hou, “Online scheduling for delayed mobile off- loading,” in Proc. IEEE Conf. Comput. Commun., 2015, pp. 1867–1875.
[22] H. Wu, Q. Wang, and K. Wolter, “Tradeoff between performance improvement and energy saving in mobile cloud offloading sys- tems,” in Proc. IEEE Int. Conf. Commun. Workshops, 2013, pp. 728–732.
[23] H. Wu and K. Wolter, “Dynamic transmission scheduling and link selection in mobile cloud computing,” in Analytical and Stochastic Modeling Techniques and Applications. Berlin, Germany: Springer, 2014, pp. 61–79.
[24] H. Wu and K. Wolter, “Tradeoff analysis for mobile cloud offload- ing based on an additive energy-performance metric,” in Proc. 8th Int. Conf. Perform. Eval. Methodologies Tools, 2014, pp. 90–97.
[25] F. Mehmeti and T. Spyropoulos, “Performance analysis of mobile data offloading in heterogeneous networks,” IEEE Trans. Mobile Comput., vol. 16, no. 2, pp. 482–497, Feb. 2017.
[26] V. Cardellini, et al., “A game-theoretic approach to computation offloading in mobile cloud computing,” Math. Program., vol. 157, no. 2, pp. 421–449, 2016.
[27] Y. Kim, K. Lee, and N. B. Shroff, “An analytical framework to characterize the efficiency and delay in a mobile data offloading system,” in Proc. 15th ACM Int. Symp. Mobile Ad Hoc Netw. Com- put., 2014, pp. 267–276.
[28] A. Gandhi, V. Gupta, M. Harchol-Balter, and M. A. Kozuch, “Optimality analysis of energy-performance trade-off for server farm management,” Perform. Eval., vol. 67, no. 11, pp. 1155–1171, 2010.
[29] H. Wu, W. Knottenbelt, and K. Wolter, “Analysis of the energy- response time tradeoff for mobile cloud offloading using combined metrics,” in Proc. 27th Int. Teletraffic Congr., 2015, pp. 134–142.
[30] H. Wu and K. Wolter, “Analysis of the energy-performance trade- off for delayed mobile offloading,” in Proc. 9th Int. Conf. Perform. Eval. Methodologies Tools, 2015, pp. 250–258.
[31] S. Balsamo, G.-L. dei Rossi, and A. Marin, “Queueing networks and conditional product-forms,” in Proc. 7th Int. Conf. Perform. Eval. Methodologies Tools, 2013, pp. 204–213.
[32] N. Perel and U. Yechiali, “Queues with slow servers and impatient customers,” Eur. J. Oper. Res., vol. 201, no. 1, pp. 247–258, 2010.
[33] U. Yechiali, “Queues with system disasters and impatient custom- ers when system is down,” Queueing Syst., vol. 56, no. 3–4, pp. 195–202, 2007.
[34] U. Yechiali and P. Naor, “Queuing problems with heterogeneous arrivals and service,” Operations Res., vol. 19, no. 3, pp. 722–734, 1971.
[35] S. Kosta, A. Aucinas, P. Hui, R. Mortier, and X. Zhang, “Thinkair: Dynamic resource allocation and parallel execution in the cloud for mobile code offloading,” in Proc. IEEE INFOCOM, 2012, pp. 945–953.
[36] J.-A. Hong, S. Seo, N. Kim, and B.-D. Lee, “A study of secure data transmissions in mobile cloud computing from the energy con- sumption side,” in Proc. Int. Conf. Inf. Netw., 2013, pp. 250–255.
[37] N. Balasubramanian, A. Balasubramanian, and A. Venkatara- mani, “Energy consumption in mobile phones: A measurement study and implications for network applications,” in Proc. 9th ACM SIGCOMM Conf. Internet Meas. Conf, 2009, pp. 280–293.
[38] A. Balasubramanian, R. Mahajan, and A. Venkataramani, “Augmenting mobile 3G using WiFi,” in Proc. 8th Int. Conf. Mobile Syst. Appl. Services, 2010, pp. 209–222.