对“志愿计算”这篇论文的总结

Volunteer Computing: A Model of the Factors Determining Contribution to Community-based Scientific Research 

论文的英文网址:http://faculty.poly.edu/~onov/Nov%20Anderson%20Arazy%20Volunteer%20Computing%20WWW.pdf


1)、论文解决了什么问题

志愿计算是一种执行大任务需要分布式资源有效的方法,与其他的在线社区很类似。

志愿计算基于两种方式:第一是计算,分配和管理计算任务;第二是分担,让大量志愿者计算机提供资源为项目做贡献。因此在志愿计算中,志愿者的动机对整个项目的影响有着重要的作用。但是对于这些动机是如何影响志愿者计算?

在本篇论文中,作者研究了大量前辈们的工作,发现很多的研究并没有提出“将动机与确实的在线社区贡献联系起来,解释人的动机因素是如何决定一个志愿者在在线社区中的贡献率”。本论文的作者对该领域的主要贡献主要在这两个方面:

1、 从动机理论和社会分享的角度,提出一种在“志愿计算”中决定志愿者对社区贡献率的因素的一种框架。

2、 本文的作者测试了自己的模型,并且揭露出上述的因素与真实的贡献水平之间的关系。

然后由于志愿计算和普通的共享社区有很多的区别。适合在线共享社区的动机理论并不符合志愿计算。本文的作者试图提出一个理论框架,来解释志愿者在志愿计算项目中,是什么动机促使人们进行贡献出自己计算机的空闲资源?针对这一情况,作者以一种独特的角度对志愿者的动机影响在线共享社区发展的因素来进行建模,通过对社会心理学的研究,提出了一种新颖的动机框架。该框架包含了三个主要元素:

1、个体的动机

2、团队协作

3、占用

在该框架下,作者提出了7个基本假设。为了验证这7个基本假设是否正确,作者利用网上调查和SETI@home系统的数据用验证模型,采用回归数据分析的方式来检验这些变量因素是如何影响志愿者在志愿计算中真实贡献率。通过统计学进行分析,将假设1和假设2进行剔除,即内在动机不是影响志愿计算的主要因素,所起到的作用非常少。最后作者得出了一个结论:影响志愿计算的动机是提高自我,其他的因素都是次要的。

2) 为什么这个问题重要?

首先我们必须先了解到志愿计算的重要性,该重要性主要体现如下几个方面:

1、 由于世界上有数量极其庞大的个人电脑,比起其他形式,志愿计算能够(而且确实)为科学研究提供了更强大的运算能力。这种运算能力使通过其他方式无法完成的科学研究得以进行。这种优势会随着时间的增加而增加。因为根据经济学阐述的规律,消费型电子产品(个人电脑和游戏控制台)的增加速度是远远大于专业机器的。而且将更容易使用。

2、 志愿计算能力是买不来的,但必须要挤出来。一个研究项目往往被资金所限制,但是通过强烈的公开呼吁(例如SETI@home)可以凝聚强大的运算力量。相比而言,传统的超级计算机是极端昂贵的,而且只有负担得起费用才能利用它们(例如核武器设计和间谍活动)。

3、 志愿计算倡导科学领域的公共利益,提供讨论决定科学研究方向的公开场所。

由于志愿计算有着如此的重要性,所以发展志愿计算是当前计算大型的任务的一种很好的方法。然而是什么样子的动机让人们志愿将自己的计算机贡献出来,参与志愿计算?

这个问题就是本文作者试图想要解决的问题。 这个问题的重要性体现在于:因为个体对社区的持久的贡献是决定了共享社区的生存,贡献者的动机已经被视为成功管理和持续社区的关键因素。换句话说,就是直接影响着志愿计算的持续进行。只有了解到人们的志愿参与志愿计算的动机,认识到人们为何会志愿参与志愿计算的原因,才能有效地改进志愿计算的参与方式,从而提高整体项目的工作效率。

3)用何种方法解决的?

作者以一种独特的角度对志愿者的动机影响在线共享社区发展的因素来进行建模,通过对社会心理学的研究,提出了一种新颖的动机框架。该框架包含了三个主要元素:

1、个体的动机。包含了内在动机和外在动机。在志愿计算项目,表现为:自我表现和外在导向。其中动机共有四个因素,如下图所示

       

2、团队协作。

3、成员任期。

 如下图所示:

对“志愿计算”这篇论文的总结_第1张图片

在该框架下,作者提出了7个基本假设。

假设1:高昂的兴趣与提高项目的贡献率有关。

假设2:高级别的威望与提高项目的贡献率有关。

假设3:高水平的个人价值观念与提高项目的贡献率有关。

假设4:高水平的提高动机与提高项目的贡献率有关。

假设5:团队协作与提高项目的贡献率有关

假设6:在分布式计算项目中成员的任期与降低项目的贡献率有关

假设7:通过团队协作的温和作用,从而加强团队的贡献者之间的关系,弱化那些由于任期过长而不愿意参与团队的人。

为了验证这7个基本假设是否正确,作者利用“网上调查”和SETI@home系统的数据来验证模型。通过定义变量,将四个动机因素进行量化处理,同时增加了团队协作和任期作为独立变量。然后开始收集数据:向SETI@home系统的用户发送调查问卷,然后将接收回来的调查问卷进行分析。计算每个动机因素变量的平均值,方差。

采用回归数据分析的方式来检验这些变量因素是如何影响志愿者在志愿计算中真实贡献率。通过统计学进行分析,将假设1和假设2进行剔除,即内在动机不是影响志愿计算的主要因素,所起到的作用非常少。最后作者得出了一个结论:影响志愿计算的动机是提高自我,其他的因素都是次要的。

4)这种方法为什么是有效的?

在之前的测试假设,本文的作者确认了调查文书的使用。为了确认“动机”调查是否可靠,进行PCASPSS分析。该分析是为了验证采集的数据是否有效?下面则说明了数据的有效性:

四个动机因素出现在PCA分析中,直接对应激励因素的框架上。每个因素变量的负荷量都高于预期所设定的0.6的值,这说明这些因素变量都这较强的载荷拟变数,从而确认了测量的有效性。此外为了确认收敛和区别效度,计算了每个因素变量的平均值,并且构造了每个结构,AVE都超过了0.5,说明数据有良好的收敛效度。对于平方根的AVE都有超过其他结构的相关性,从而表现出高判别的有效性。以上就是对采集的数据进行有效性地检验,这是基于统计学的方法,统计学的内部机制保证了该采集的验证是有效的。然后再采用回归数据分析的方式进行数据的值分析与计算。

说明了数据的有效性之后,接下来说明方法的有效性。该方法的有效性关键在于统计学本身的方法的有效性。这里只能说明作者的使用该方法的思路:先假设模型,收集数据,进行验证,然后指出现实与模型的矛盾,剔除假设,最后得出结论。这样的方法本身的有效性在于数学方面的,在数学论证上,可以采用假设的方法进行证明。

该方法在本论文的具体运用是:作者先假设了一个模型,提出了7个假设,然后通过采集数据,对采集的数据的有效性进行验证,采用统计描述学的方法,对采集过来的数据进行统计分析,最后得出了结果数据,对结果数据进行分析,得出了假设1和假设2是不符合志愿计算项目的特征,并且解释了为什么不符合的原因。最后作者得出了结论:影响志愿计算的动机是“提高自我”,其他的因素都是次要的。

5)你对这篇文章有什么看法?

本文的作者通过阅读大量的前辈们的工作论文,结合社会心理学,社会工程学的知识,将社会学的知识与志愿计算结合起来,创造性地提出一种在“志愿计算”中决定志愿者对社区贡献率的因素的一种框架。

虽然在本篇论文中,并没有讲述志愿计算的技术实现,但是作者揭露出“动机的因素”与“志愿计算”中个人对项目真实的贡献水平之间的关系。这样可以有助于志愿项目设计的时候,如何吸引人们参与这样的项目,将全世界空闲的计算机利用起来,为科学做贡献。这就是这篇论文的意义所在。

很佩服本文的作者,能够将计算机与社会心理学结合在一起,利用这种独特的视觉来看待这个很高深的问题。从这个角度上说,跨学科所能够带来的学术创新确实值得让人思考。

通过问卷调查的方式和SETI@home系统的数据来进行分析,从而来说明在“志愿计算”中决定志愿者对社区项目贡献率的高低的问题。这样的数据收集方式是否具有普遍性,可否能够很好地说明这个问题?当然从作者所写的论文来,是很完美地解决了。不过在数据分析支撑这一方面,感觉略显单薄,没有很让人信服的感觉。

本文的最大的亮点,应该是它的创新性,而不在于它提出了多高深的理论。文中所涉及的社会学理论已经存在的,本文的作者只不过将这样的理论应用到“志愿计算”中来,并且解释了一些现象问题。这是将人文科学与计算机科学结合起来的一个很好的论文,让人开拓了写论文的思路。

读完了本论文之后,才渐渐发现了优秀的论文,有时候并不需要复杂的理论作为支撑,而在于论文是否有创新性,在于论文是否有条理?不知道自己这样理解是否正确?


你可能感兴趣的:(对“志愿计算”这篇论文的总结)