从人机交互的角度来看,“任务”是人类活动的基本单位。虽然人类任务的定义并不明确,但任务负载的概念很容易定义。如果我们观察某人完成了任何类型的任务,我们就可以相当容易地决定他们的参与程度或负荷程度,是否打断他们,他们可能需要什么样的帮助,以及他们何时准备好下一个任务。计算系统可以很容易地对任务进度和实时计算任务的负载做出这些决定(例如,Windows中的任务管理器);但是,它们目前一般无法对人工任务做出这些决定。
可以说,最常见的任务负荷形式是精神负荷,这是人脑处理能力有限的假象。工作记忆是表达这种有限容量的一个重要概念,它被定义为一个提供存储信息的临时存储和维护的系统,并提供与感知、长期记忆和动作的接口。资源理论分享了注意力资源有限池的概念,注意力资源可以参与一个或多个任务,达到容量限制。与此相关的是认知负荷的更一般结构,广义上定义为特定任务对认知系统施加的负荷。文献中“心理负荷”一词的使用通常指或包括工作记忆负荷或认知负荷;然而,任务负荷也通常包括身体需求、时间压力、表现、努力、疲劳、挫折或知觉需求等等。
物理负载的概念在HCI中得到的关注较少,这可能是因为迄今为止应用程序的范围有限;然而,随着计算变得更加移动和辅助,物理负载可能变得越来越重要。尽管如此,对物理载荷及其测量的概念也进行了一段时间的研究。物理和心理负荷都可以用任务需求水平和对用户的影响来描述。
压力通常被认为是一种降低性能的反应,或是扰乱正常功能的反应。McGrath将压力反应解释为感知需求、感知应对能力和感知应对重要性之间的相互作用。在HCI中,任务负载和压力的概念通常与任务性能的概念显式或隐式地联系在一起,在许多应用程序中,后者是研究前者的关键动机。Hancock和Warm从相对稳定状态、向退化的过渡状态和向崩溃的退化状态来描述应力,也就是说,所有这些都是从任务性能的角度来描述的。根据压力的类型,压力和任务负荷之间可能有一些相似之处。例如,许多研究发现压力会损害工作记忆功能。
通过区分任务负荷和压力,Gaillard将高认知负荷解释为一种正常、健康的状态,在这种状态下,额外的精神努力和/或改进的策略被投入以适应任务的需求,同时将压力解释为一种以低效行为、过度反应和可能的不良生理影响。Hollien将压力称为对某种威胁的反应。在压力状态下,额外的精神努力和/或修改的策略在处理手头的任务或情况时可能无效。应对策略也有所不同:在认知负荷期间,实验观察到策略更注重任务,而在压力期间,策略可能更注重情感。
然而,重要的是,高工作量会导致压力症状的发展,特别是心理压力。Tepas 和 Price将压力与焦虑、疲劳、应对、疲劳、暴露、疲劳、耐用性、重复性、紧张、压力源和紧张以及精神负荷等概念联系起来。一些评估量表包括心理负荷和心理压力,例如主观负荷评估技术。
考虑到这些不同的概念和定义,很明显没有任务负载的通用定义。很明显,任务负载是一个多维概念,为了更全面地理解它,可能需要从人类任务的分类中寻求灵感。事实上,随着计算角色的变化,其他形式的任务负荷(精神和身体负荷除外)可能变得越来越重要。同样地,压力也不容易定义,但可以从其不利的生理和心理反应方面区别于高任务负荷。
为了使任务负荷和应力的概念适用于HCI,有必要描述它们及其强度。Borg解释了与缺乏测量感知强度的基本单位有关的问题。这种缺乏单位意味着,即使已经为任务载荷或应力强度提出了数值尺度,这些数字也有顺序而不是数值解释,例如,等级为“4”表示比等级为“2”的强度更大,但在某些应用中不一定是“2”强度的两倍。在一些应用中,研究人员采用了一种更为明确的分类方法,例如“低”、“中”和“高”负荷。关于任务负荷和压力是否应该按比例、间隔或顺序进行测量,还有一些问题。区间尺度足以用于参数统计,序数用于非参数统计。任务负荷和压力描述的两个要求应该是它们允许个体间的比较,并且它们是“有意义的”。许多描述任务负荷和压力的方法都没有尝试或实现前者,而且由于个人之间的根本差异,尺度或分类表示很可能主要在个人内部有意义。任务负荷或压力强度指的是一个特定的时间段,尽管一些文献对此方面并不精确,但广义上讲,时间单位通常是正在完成的任务的持续时间,通常假定有一个单一的任务,或至少有一个单一的主要任务。
主观工作负荷评估技术(SWAT)包括三个尺度:时间负荷、心理努力负荷和心理压力负荷。每个量表都有三个顺序级别,带有描述符,例如“需要非常少的有意识的精神努力或集中”到“需要广泛的精神努力和集中”,这有助于锚定用户在评估期间应用的评分。
通常使用的NASA任务负荷指数(TLX)包括六个尺度:心理需求、身体需求、时间需求、表现、努力和挫折。这些通常用高达21个等级表示,等级末尾的描述符为“非常低”和“非常高”。我们独创地提出了另外四个尺度,包括压力、疲劳、活动类型和任务难度。
SWAT和TLX(两者都是常用的尺度)是多维的,通过它们的不同维度至少反映了任务期间可能发生的不同类型负载的一些多样性。多重维度也提供了一些诊断,尽管其他方法,如工作负载配置文件,在这方面可能更有效。考虑到许多任务负载量表都是多维的,因此出现的一个问题是,如果只需要一个任务负载度量,如何将它们组合起来。Hendy、Hamilton和Landry对此进行了研究,他们发现,以未加权的方式组合单个尺度就足够了。
由这些量化的任务负荷或任务复杂性可能有不同的起源。Ruiz将这些分类为内容复杂性、代表性复杂性和用户或学习者特征。内容复杂性或内在负载指的是任务本身的内在需求,与必须完成的微小的起作用的子任务的数量以及满足整个任务所需的临时内存有关。表示复杂性或无关负载是指任务呈现的格式和任务必须完成的环境,可以解释为与计算接口的“设计良好”有关。用户或学习者特征,或德国负荷解释了这样一个事实:对于新手来说,一项任务很难完成,对于专家来说可能很简单。
SWAT量表中的 “心理压力”,它将低压力描述为“几乎没有困惑、风险、挫折、焦虑的存在,并且可以很容易地适应”,这与“困惑、挫折或焦虑导致的高到非常强烈的压力”形成对比。需要高度到极端的自决和自我控制”。感知压力量表(是一种替代性的主观调查问卷,广泛应用于HCI之外,但其问题是长期的,指“过去一个月”,可能还需要适合HCI任务的短期等效问卷。
为了研究任务负荷,许多研究者已经构建了以可控方式诱导不同水平负荷的实验。一些实验是在实际应用环境中进行的,或者是在现实但模拟的环境中进行的,而另一些则是在实验室环境中使用基本认知任务进行的。前者的优点是现实性更强,后者的优点包括对任务类型的控制更精确,更容易与相关文献进行比较。
在不同的诱导方法中,有两种任务方法和主要任务方法之间的选择。例如,O'Donnell和Eggemier使用的双任务方法要求参与者与主要任务(即正在研究的任务)并行执行次要任务,并且次要任务中的性能用作任务负载的指标,作为主要任务未使用的剩余资源的度量。在许多实际的实验环境中,将次要任务强加给参与者可能是不可行的,一些研究的轶事证据表明,很难让参与者参与这两项任务(次要任务可以被忽略),也许可以解释为什么许多研究只使用主要任务。
如果要在多个级别上改变任务负载强度,则感应方法应能够诱导潜在的大量不同负载级别,并且相邻感应级别之间的参数变化最少。例如,算术任务很好地满足这一标准,并已用于归纳多达七个不同的负载水平;但是,在相邻的负载水平之间,可能需要调整两个参数:要添加的位数(例如)和承载数。归纳法的另一个设计选择是视觉和口头任务呈现。
在任务负载归纳方法方面,许多研究者选择了记忆跨度任务。这些参与者有一系列的目标刺激(例如单词或数字)与一系列要求很高的次要任务(例如句子理解)交织在一起,目的是测量参与者在总结时从工作记忆中回忆目标刺激的程度。方法包括阅读跨度、单词跨度、非单词跨度、字母跨度、口语跨度、数字跨度、倒数跨度、听力跨度和计数跨度。另一种工作记忆诱导方法是n-back任务,它在认知神经科学中被广泛使用。在这项任务中,当目标刺激出现时,参与者必须做出反应,这与之前提出的n个试验相同,n通常被选为1、2或3。其他类型的任务负荷诱导方法可能不太注重记忆;例如stroop任务、驾驶任务、以视觉感知或认知速度为重点的基本认知任务或更具知觉要求的搜索任务。在压力诱导方法中,已经使用了社会威胁评估,或心理社会压力协议,其中要求参与者在听众面前做演讲,并被问到一个具有挑战性的长期心理算术问题。支持各种标准和自定义归纳法的在线社区最近开始出现,如心理学实验建筑语言。
许多设置可能对实验观察产生非常显著的影响。在设计任务时,重要的是要考虑参与者过载的可能性,因为这可能会产生意想不到的结果(见下文)。激励参与者在任何高负荷条件下保持参与状态可能会有所帮助。在高负荷情况下,参与者也会自然地采取减少负荷的策略,例如,书写或用手指计数,可能需要指示来防止这种情况发生。采用某种形式的二次验证诱导负荷水平是非常可取的,以确保它们是不同的,这是通过主观评级方法、响应时间和/或任务绩效实现的。如果引入时间压力,在某些情况下,这可能会导致参与者的反应或行为与任务负载不完全相关。与其他此类实验一样,通常建议使用平衡或其他形式的任务序列随机化。目前,对于任务负荷、压力和唤醒之间的关系还没有达成共识,但这方面的一些初步研究表明,情绪唤醒是任务负荷研究的一个潜在混杂因素。在涉及生理测量的方案中,通常允许参与者在开始任务前几分钟适应环境,建立基线。
在这种实证研究中,试点研究的重要性是不可夸大的。飞行员提供机会检查负荷诱导方法是否可行,验证其是否诱导预期负荷类型和负荷强度,观察参与者采用的策略,并引发参与者对任务的反馈。
随着任务负荷和压力研究的成熟,可以预期在同一方案和参与者队列中同时使用受限的、实验室风格的任务和更现实的任务。尽管这可能会涉及到参与者完成不同类型的任务,这就提出了一个问题,即是否可以在任务中一致地应用任何单一的测量方法,但需要回答以下问题:实验室式任务文献中的发现如何概括为更现实的任务合作。条件,以及实验室类型的任务是否可用于校准这些条件下的任务负载测量系统。由于任务负荷和应力仅与这些影响的测量值概率相关,因此最好记录尽可能多的测量值,实际上这是多模HCI的趋势。
可以说,任务负载和压力的概念与实际的HCI系统几乎没有关系,除非它们可以被测量。但是,为了有用,任务负载度量在理想情况下应该对任务需求敏感,具体到正在调查的任务需求维度的类型,有助于隔离任务需求的来源,而不妨碍用户任务的执行,并随着时间的推移保持这些属性的一致性以及不同的测量环境。在调查现有的任务负荷和应力测量方法的现状和局限性时,对许多人来说,估计而不是测量任务负荷可能更为正确。在下文讨论的不同类别中,有趣的是,只有一个(分析性的)与任务需求的内在水平直接相关;所有其他措施都与任务对用户的影响相关。此外,只有三种(生理、行为和某种程度上的性能)可以完全自动化。
对于非常特定类型的任务的有限范围,可以预先确定任务的内在负载是什么。提出了通过分析算术任务来分解和表征算术任务的方法,例如从元素交互性的角度,类似于分析计算算法复杂性的方式。
主观衡量包括对上述评分,通常由用户在完成任务后立即提供。已经观察到,在相同的负荷水平下,重复任务之间具有非常高的相关性,并且已证明具有高达9个等级的尺度在区分相邻负荷水平方面具有统计意义。因此,主观度量已被广泛使用,本质上是一种事实上的标准任务负载度量。尽管有许多量表,但最常见的可能是与心理需求TLX量表类似的一维量表。在Nygren对SWAT和TLX的调查中,他建议将TLX作为一般的预测方法,而SWAT作为任务负荷判断的简化心理模型是有用的。主观测量是对用户对任务负荷感知的直接测量,通常在任务完成后收集,这有三个限制:(a)评分可能受到个人偏见的限制;(b)一旦完成,用户可能无法很好地记住整个任务的负荷,以及(c)在那里。无法评估任务期间的即时工作负载。在不同类型的任务中,主观评价也很难解释或比较。Nygren提出了对缺乏交叉验证研究和多图表、主观测量的多方法研究以及未经严格验证或对单个用户的信息处理系统提供很少见解的研究的普遍性的担忧。其中许多问题可能仍然存在于今天,可能同样适用于生理和行为测量的研究。
任务负荷通常是在任务执行的背景下进行调查的,或者是考虑到这一点,可以追溯到实验工作,实验工作显示了唤醒和任务执行之间的关系,称为耶克斯-多德森定律或“倒U曲线”。尽管这条定律仍然是一些争论的主题,关于低负荷和超负荷的概念是为了精确地定义,在非常低或非常高的任务需求期间表现较低,在中等任务需求期间表现较高的一般特征一直持续到最近对该主题的回顾。这一特征是人机交互研究的一个根本性的重要动机,因为它确定了人类绩效的最佳区域。
De Waard将低任务需求称为需要基于状态的努力来保持参与,如果任务非常单调,则可能需要高水平的努力。这由图11.1最左边的部分表示,与该区域相关的示例任务可能与警戒和/或监控(例如远程驾驶或机器连续运行)有关。另一方面,图11.1的最右侧部分与基于任务的工作有关,这是许多实证研究中观察到的一个特征。
作为心理任务需求函数的绩效概念模型。在左侧,低任务需求可能与低性能有关,因为用户对任务的参与度较低(负载不足),而在右侧,随着任务需求的增加,性能降低反映了对用户受限的心理处理资源的需求增加。虽然定义不简单,但过载通常与曲线中较高的任务需求阶段相关,在该阶段,性能远低于最佳状态,并且可能发生任务分离。
Yeh和Wickens详细讨论了主观负荷测量和性能之间的分离来源。从测量的角度来看,图11.1所示的特征表明了两个重要的影响:(a)在相对低和相对高的负载条件下,可能存在特定的任务性能水平,即性能不能明确地指示备用容量的水平;以及(b)当高负载水平被诱导时,可能发生过载。
性能不能概括为不同的任务类型,在一般的计算系统中,当用户可能与多个计算应用程序交互并在它们之间切换时,即使每个计算应用程序都有相关的性能度量,也可能难以或不可能度量性能。作为一种度量,性能似乎最适合于非常特定的任务类型,这些任务始终是用户持续的主要关注源,并且允许经常相对于任务持续时间进行性能度量。
任务负荷的生理测量可以是不引人注目的,不需要用户的公开响应,通常是多维的,越来越便宜,并提供一定程度的客观性。生理测量也在HCI的其他部分得到关注,例如跟踪身体健康状况。然而,它们通常对非任务可变性和噪声敏感,需要持续正确地进行物理安装,并且必须仔细地单独校准才能发挥作用。此外,心理负荷对生理变化的基本依赖性还没有完全理解。
也许在任务负荷情况下最令人信服的生理信号是脑电图(EEG),它可以直接观察皮质活动,并且可以非常快速地取样,以潜在地允许观察负荷的快速变化。示例:表11.1显示了对任务负荷敏感的脑电图特征;所有特征都表明,随着任务负荷的增加,预期的皮质活动增加,通常在与较高认知功能相关的额叶区域。最近的初步结果表明,脑电图对任务负荷的敏感性可能高于主观评分。根据皮质活动的性质和电极的空间分布,脑电图依赖于任务,这既是一个限制(如果需要跨不同任务类型测量单个任务负荷),也是一个机会(定位任务类型)。脑电图需要时间和专业知识来操作,并且适合实验室环境,尽管无线脑电图耳机可能开始改变这一点。诱发电位(ERP)也与任务负荷一起进行了研究;然而,这也需要一个可控的同步刺激。
可以记录一些反映自主神经系统(ANS)功能的生理信号,包括瞳孔直径、眨眼、心率、呼吸、皮肤电活动和激素水平,如表11.1所示-这些信号可以很容易地测量,尽管需要与皮肤或身体良好的传感器接触。电皮肤反应(GSR)或电皮肤反应(EDA)作为一种精神活动和觉醒的指标,已被用于各种不同的任务环境中,许多研究表明,皮肤电导的增加与较高的精神负荷和/或压力有关;然而,它也与其他对症状的影响有关。动脉粥样硬化神经系统和环境因素。呼吸带在最近的研究中经常被用来观察随着精神负荷呼吸速率的增加。心率的优点是,与不同的生理控制机制相关的频率成分可以被分离出来,但除精神负荷外,还受体力活动和其他因素的影响。在一项研究中,热传递速率也显示出高任务负荷的可能性。
瞳孔直径在心理学研究中引起了极大的关注,自从它与记忆负荷建立了联系,它作为一种任务负荷的测量方法一直受到关注。瞳孔直径可在实验室环境中使用台式或头戴式红外眼睛跟踪设备进行测量,最近也采用了小型、低成本的红外眼睛跟踪设备。其使用的一个复杂的事实是瞳孔光反射比由于任务负荷的变化而产生的效果强得多。有关从视频中提取信息的方法概述,请参阅第21章。
任务负载的行为度量比生理度量更具推测性,因为它们是从任务的心理效果的来源进一步度量的,但对于集成到人机界面来说,它们是最不具侵入性、最具成本效益和最实用的度量之一。由于信号特征通常包含与任务负载无关的效果,并且这些效果通常比任务负载效果更强,因此它们与生理测量具有许多相同的优点和局限性,因此很难进行合作。陈等人比下面的简要总结更广泛地介绍了作为任务负载指标的行为方法。
除了瞳孔扩张以外的眼部活动特征,如眨眼、注视和眼跳,可能更具有生理或行为特征,这取决于所涉及的自愿控制的程度。眼睛眨眼可以被有力地检测到,Siegle、Ichikawa和Steinhauer表明眨眼主要发生在任务前后,受最近的工作支持。
当麦克风可以放在用户附近时,语音是一种可行的测量方法,尽管环境噪声和其他因素仍然是一个挑战,有迹象表明,可以可靠地区分两到三个任务负载级别。有趣的是,语言认知负荷的分类最近已成为国际数据中心评估工作的主题——比较挑战。压力下的言语也受到了重要的研究关注。
内置在计算设备中的传感器不断地为行为测量提供新的机会,通常是无处不在的规模。从笔传感器和鼠标压力传感器得出的测量方法吸引了研究兴趣。一项早期的基于头部的加速度测量研究表明,尽管活动识别在加速度测量研究中更为常见,但它有可能指示任务转换、精神任务负荷和身体任务负荷。
诸如可靠性、有效性和敏感性等心理测量学特性尚未被确定用于许多测量,特别是生理和行为测量。这包括评估复测可靠性,这在医学和心理学中很常见,但还没有针对这一领域的所有测量方法进行研究,尤其是对于较新的测量方法。
有人指出,不同形式的主观评分量表可能更适用于不同的任务类型。随着研究人员对生理和行为方法的研究越来越多,这些方法可以应用于自动的“始终开启”模式,似乎它们将应用于多种不同的任务类型。开展大规模研究,在不同的任务类型中应用多种不同的测量方法,了解这些方法在不同任务类型中的概括程度,并了解将它们应用于不同环境的局限性,这一点非常重要。这已经开始;例如,Reinerman‐Jones、Matthews、Barber和Abich发现,在四种不同的任务类型和六种不同的测量方法中,尽管几种方法对任务负荷敏感,但无法确定共同的潜在因素。
有效的计算机接口有许多标准,其中包括最小化用户内存负载的要求,即减少用户为完成特定任务而必须付出的努力,例如通过降低接口的表示复杂性(见上文)。一些研究人员将其作为一种评估方法,结合基于脑电图的负荷测量范式和一种有思想的方法或眼球运动,特别是固定。
一些研究人员指出,根据用户的瞬时负载水平,调整界面或人机系统的可能性,以便通过将负载转移到计算系统,或通过简化界面或任务,将用户任务负载调整为功能。负载水平意识也产生了认知辅助的概念,在这种概念中,可穿戴计算机在检测到高负载后,试图及时用卸载工具帮助用户。
尽管有许多论文是关于可以自动化的任务负载度量的,但是到目前为止,功能完备的任务负载和压力估计系统的数量很小,这些主要是研究原型。许多作者提到了连续测量的可能性;然而,到目前为止,几乎没有人证明测量是真正连续的(通常在每个任务的基础上报告,其中“任务”通常是几秒钟或几分钟),并且有效,可能是由于难以在很短的时间内确定令人信服的事实。卡尔。为实际的负荷估计系统提供有意义的地面真实性测量仍然是一个挑战;但是,在给定用户开始使用系统或定期使用系统时,很可能会使用初始“校准”任务来帮助基准负荷或压力水平。到目前为止,自动的方法主要集中在精神工作负荷和较小程度的压力上。任务负载的其他方面的自动评估,包括已建立的主观工作负载评估技术的量表,得到的关注要少得多。然而,任务的分类受到了极大的关注:物理的,例如基于加速度计的和精神的(例如基于脑电图的)。然而,在所有情况下,这项研究都是基于一组有限的、固定的预定义任务,除了在非常有限的应用程序环境中之外,这些任务的适用性一般都有限。从这个角度来看,任务分析似乎需要一个更通用的框架,也许需要考虑到人工任务的分类。
当前和未来计算设备中各种传感器的普遍存在强烈地表明,上述问题将得到及时解决。
关键环境:如图11.1所示,许多研究发现心理任务负荷与性能有关,这在历史上一直是研究在关注关键环境中操作的用户的任务负荷的关键动机。安全关键应用,如空中交通管制、应急响应、指挥和控制、驾驶和操作潜在危险的机械,历来是任务负荷研究的一个关键领域,Young等人最近对此进行了调查,提供了一个有用的概述。
人机交互:随着计算设备变得更具移动性和辅助性,越来越多的联合人机系统将出现在日常生活中。早期的例子是支持GPS的设备,广泛用于辅助驾驶员导航。Parasuraman、Sheridan和Wickens在其关于人类自动化交互的开创性论文中,将人类信息处理分解为四个阶段:感官处理、感知/工作记忆、决策和响应。他们的模型提供了一种结构来决定联合人机系统的哪些部分应该自动化;然而,可以说,模型依赖于机器能够了解用户的能力。从这个角度来看,估计用户的任务负载是人机系统的重要输入。自动卸载协助:就任务负载和压力而言,计算设备已经提供了卸载可能占用工作内存的项目的重要手段,例如,用户现在很容易设置提醒,而不是记住关键的截止日期或事件。然而,可以预料,这种支持在未来将变得更加丰富和即时,例如自动记录照片或视频的眼镜。如果他们的传感器检测到用户的负载快速增加。这符合Oviatt的愿景,即提供有助于人们思考的界面。
任务转换:任务之间的转换通常是由于某种类型的中断而发生的,随着电子邮件、固定电话/移动/互联网电话、即时消息、文本消息和社交媒体的普及,中断现在已成为任何专业人员生活中的主要部分。很容易猜测这种中断的影响,研究表明,当主要任务执行被中断时,用户完成任务所需的时间最多为27%,犯错误的次数是原来的两倍,烦恼的次数最多为106%,焦虑增加的次数是在边界处出现中断时的两倍。主要任务之间。人类知道这一点,并且能够在适当的时候中断,但是计算机系统没有。过载的概念,无论是信息过载还是与工作相关的压力,也对健康和福祉具有重要影响,但如果没有自动的任务分析方法,甚至很难开始设计有助于缓解这些问题并允许用户使用的系统。改变他们的工作习惯。也可以观察到,在数据分析时代,关于人工任务切换和任务负载的数据明显缺失,考虑切换和负载水平的自动连续任务分析方法仍在出现。
学习措施:通过讨论学习者的特征作为上述任务复杂性的一个组成部分,任务负荷在教育领域有着有趣的应用,手册和目标中提出了学习过程中基于计算机的负荷测量。R现在有一段时间。Martin注意到,由于任务负荷测量是相对的、瞬时的,并且受任务以外的其他因素的影响,因此它们可能更好地用于纵向环境。Ruiz等人研究了这种纵向背景。对于精英运动员的认知训练,并强调了任务负荷的一个有前景的应用领域:在任务能够被充分约束的情况下,当用户学习任务并制定策略以提高任务效率时,可以预期减少所经历的负荷,并且这种减少应以足够的精确的负荷测量方法,在任务类型不变的严格条件下。任务负载在教育界面的设计中起着重要作用,Hollender等人对此进行了更详细的讨论。
在机器学习产生巨大影响的时代,任务负载和压力的一般领域所面临的一个巨大挑战是如何以一种精确且对计算应用有意义的方式自动化任务负载和压力的测量。另一个迄今为止很少受到关注的挑战是在一般的移动计算环境中自动检测任务转换,承认任务加载在任务期间比在转换期间更有意义,并且该计算应用程序需要了解人类何时改变他们的主要任务,至少要知道何时中断它们。如果能够实现自动化,那么(a)考虑到更丰富的上下文,人类与计算系统之间可能会有更深入的合作关系;(b)任务负载和压力可以进入大数据时代,并且可以收集到大量有关人类行为的新见解。这也可能与新的计算应用程序很好地融合,这些新的计算应用程序旨在帮助人们卸载他们的工作记忆和其他类型的任务负载,随着移动计算每天越来越大的比例使信息处理任务越来越接近用户的注意,这一点有望得到蓬勃发展。