论文完整名称《How project description length and expected duration affect bidding and project success in crowdsourcing software development》
在众包软件开发网站上,供应商对非常短期的提案请求(中位数7天)进行投标,这些请求以简短的方式描述(中位数241字)。因为它的规模,因为买方有权拒绝接受交付的项目,而且因为所有合同都是固定价格的,这种类型的市场呈现出软件开发承包的独特背景。我们从反向代理问题的角度来审视这个市场。具体来说,我们检查预期的项目持续时间和描述长度如何影响供应商的投标金额和随后的项目成功(即买方同意在交货时支付)。结果表明,正如预期的那样,较长时间描述的项目或预期需要更多时间的项目要求更高的投标价格,并且更有可能获得成功。然而,对残差的审查表明,最终不成功的项目实际上是以比考虑其描述长度和预期持续时间时应该投标的价格更高的价格投标。事后分析表明,很明显,代理人对最终未中标项目的出价相对较高是正确的,因为这些项目大多较短,而买家对较短项目的工期评估也不准确。讨论了买方可能就项目向供应商发出错误信号的可能性所涉及的风险。
众包给公司带来了可观的经济前景。众包是通过在线市场发布请求(RFP)来向因特网上的许多潜在供应商提供工作的方法。事实上,众包软件开发市场(CSM)正日益成为更传统的软件外包市场的可行替代方案。近年来,专门管理此类承包业务的网站,尤其是小型项目的网站,确实出现了巨大的增长。尽管它们越来越受欢迎,但与更传统的IT软件和相关外包服务配置相比,这些市场在综合文献综述论文中几乎没有被发表过。这是一个重要的差距,因为考虑到CSM项目的数量级较小,从CSM而不是典型的软件外包项目得出结论可能没有那么简单。CSM项目通常只持续几天,而不是在更传统的软件开发和服务外包环境中持续数月或数年。此外,CSM只能在固定价格(FP)基础上进行外包,这使得此类市场的风险分配和控制不同于传统的外包合同。
软件开发市场是一个在线站点,潜在购买者发布RFP,包括软件项目或相关服务的开发和提供的细节,并估计其交付日期,并且潜在的编码者然后投标来竞争RFP。CSM站点通过创建交易环境和相关的托管服务来管理和监督流程。通常,在传统的外包合同中,项目的风险越大,作为时间和材料(T&M)合同而不是作为FP合同外包的可能性就越高。在传统的软件外包合同中,T&M而非FP的一些项目或项目的一部分的分配使得买方和供应商之间的风险更加平衡。CSM中不存在该选项,所有风险完全由供应商承担。事实上,在CSM中,如果没有追索权,买方可以拒绝接受和支付项目。与传统的软件外包相比,所有这些都使CSM变得相当独特。
在这项研究中,我们研究供应商投标价格与买方对项目的描述长度和项目持续时间的估计的相关性。正如预期的那样,供应商对更长的描述和更长的持续时间的项目平均出价更高。然而,在最终被证明是不成功的项目中,供应商实际上比他们本应根据描述和持续时间进行的出价更高。原因可能是,正如我们的事后分析所显示的那样,不成功的项目大多比成功的项目短,而买家对较短项目持续时间的估计也不准确。显然,供应商在相对较高的投标中反应相当合理,以在较短的工期内承担较高的工期风险,风险更高大的项目。供应商对短期项目的出价更高,因为这些项目更可能失败。
CSM在过去已经被研究过,但是很少的关于CSM的报道都集中在买家、他们的风险和他们的决策上。在本文中,我们从提供者的角度来研究CSM。因此,研究CSM中的提供者行为提供了一个几乎没有研究过但很重要的软件开发和服务环境的新环境。所应用的理论基础是基于代理理论,但又是相反的,它处理的是代理所面临的风险,而不是委托人所面临的风险。
代理理论将商业交易视为委托人和代理人之间的合同。“委托人”和“代理人”这两个术语分别是该理论对买方和供应商的命名。就CSM而言,买方,即发布征求建议书的人,是委托人,投标提供其要求服务的供应商是代理人。从委托人的角度看,信息不对称是中介理论研究的核心问题。准确地说,这与委托人面临的风险有关,因为每个代理人都知道自己以及自己在做什么,而委托人可能不知道。这些风险被放大,因为可以假定代理将合法地拥有他们自己的最大利益,因此将利用这种信息不对称。这种信息不对称在软件外包中也很常见。实际上,在外包环境中,几乎不可能验证软件测试和文档编制的质量。由于委托人不可能像每个代理人一样了解自己,委托人面临着被代理人不当利用的风险。代理理论将这些风险分为三大类:逆向选择、道德风险和突发事件。
1)逆向选择风险:这些是委托人在选择合适的代理人时面临的风险。委托人对招标代理机构的了解不够,不知道哪些机构真正胜任这项工作,哪些机构能够提供所需的质量,不会收取过高的费用。这是众包的核心风险。对于CSM中的委托人来说,选择一个不合适的代理人是有风险的,这个代理人可能伪装成合格的,或者仅仅是不能做需要做的事情。虽然SEI等机构的认证(见http://www.sei.cmu.edu/certification/)在提供此类保证方面有很大的作用,但显然,即使在传统的外包合同中,这仍然是一个风险。这在CSM的背景下尤其重要,因为市场上有数万个代理,通常有数十个代理在一个典型的RFP上竞争,而没有对代理可以做什么的认证。
2)道德风险:一旦选定了一个代理人并签订了合同,委托人将面临另一组风险,这些风险与不确切知道代理人实际上在做什么有关。这在软件开发和相关服务领域尤其重要,在这些领域中,几乎不可能验证开发人员是否在浪费时间、是否跳过或跳过测试,以及他们是否以合理有效的方式编写代码。
3)除了这两种风险,特别是在项目规模大、时间耗尽的情况下,也存在着未预见到的意外风险。例如,这些风险可能是由于需要作出不预期的改变而造成的。这可能是因为法律或技术环境发生了变化,现在需要新的软件方面,或者是因为买方意识到它需要更多或不同的规范。逆向选择和道德风险已被证明是大型软件外包项目的主要考虑因素。
从委托人的风险角度来看,代理理论在研究大型软件外包项目方面已被证明是非常有效的。代理理论也被应用于理解CSM中委托人的行为,但在CSM环境中对代理知之甚少,即开发软件或提供相关服务(如设计网站或网站的各个方面)的供应商。因此,本研究的目的是研究代理如何对委托人提供的有关项目的信息作出反应。这是CSM的一个重要方面,因为代理也面临着由另一方提供的不完整信息引起的风险。从理论上讲,这也是一个很重要的问题,因为以前的研究所提出的风险控制方法不容易应用于CSM,而从代理人的角度来看,更不容易应用于CSM。由于以往研究提出的方法也不容易适用于众包,因此本研究的结论也可能为其他众包环境提供洞察。
以这种方式应用代理理论表明,代理也面临信息不对称的风险,因为委托人可能过于简单地描述了项目,或者对项目持续时间过于乐观。委托人这样做可能是因为缺乏经验,或是因为委托人甚至不知道所需的详细描述水平。毕竟,CSM中的许多负责人都是新的购买者,其中可能只有极少数人是专业的规范编写者。代理人以面值接受委托人提供的项目信息,可能会出价过低,或者更糟的是,可能会对无法交付的项目进行投标。应用代理理论研究CSM,从代理的角度看,意味着软件开发中信息不对称风险的逆转方向。实际上,这可以被视为一个反向代理问题,以便它处理代理而不是委托人所看到的项目风险。在这种情况下,代理风险是在投标时,他们不可能衡量或投标不适当的数额,这是本研究所审查的。
在代理理论的原始版本中,假设由于代理人没有与委托人充分共享其所有相关信息,从而导致信息不对称。这可能是因为代理人寻求自己的目标,共享信息可能不符合其自身的最佳利益,也可能是因为代理人不知道委托人需要什么信息。由于这种信息不对称,代理理论建议委托人应该采取措施检查代理人及其活动。在传统软件开发或服务外包合同的情况下,这些步骤包括监控代理的活动、安排人员到现场、制定详细的交付时间表、创建报告系统、创建会议时间表、添加更多交付里程碑,甚至可能要求代理发布债券作为保证来保证他们会交货。显然,从代理的角度来看,这些选项并不容易应用于CSM上下文。这就是这项研究的贡献所在。代理人可能无法采取以往合同研究规定的许多步骤,甚至委托人也可能无法采取CSM背景下的许多步骤,但代理人可以根据提供得很少的信息采取一些步骤。该信息是项目的描述和可交付成果及其预计持续时间。代理商可以采取的主要步骤是在签订合同之前对他们的投标金额采取更大的安全宽裕度。正如经纪人所见,没有别的可以商量的了。
下一节将发展这种反向代理的观点,因为它适用于CSM代理。事后分析测试并支持模型中的隐含假设,即委托人所做的估计会增加代理人面临的风险,因此,代理人的出价与他们在可能最终失败的项目上应该的出价相比,会更高一些,这是合理的。
作为一个反向代理问题,我们从代理面临的逆向选择风险的角度来看待CSM。在这种情况下,道德风险不是一个问题,因为在合同签订后,委托人没有为代理人创造任何东西,因此,代理人无需担心,在合同签订后,它无法控制委托人所做的事情的质量。同样,项目太短,无法应对不可预见的意外风险,如变更规范,这是一个主要问题。
在CSM上寻找项目的代理可以看到许多他们可以选择的RFP。代理人在新项目开始时做的最重要的决定是决定是否出价以及出价多少。不用说,投标金额是承包和拍卖的一个核心方面。在逆向选择风险方面,代理商在根据现有信息选择要投标的报价时会评估许多报价请求。该信息由发布招标书的负责人提供。RFP之间的差异主要在于其描述、所需的可交付成果以及预期的项目工期。更长的持续时间可能意味着代理将需要投入更多的时间。这就引出了第一个假设。考虑到在CSM中交付一个项目的成本主要是代理人投入时间的函数,而且几乎所有项目都是由一个程序员编写的,因此,委托人估计的项目持续时间(以天为单位)应该是代理人出价多少的主要考虑因素。在传统的软件外包合同中,持续时间也是成本的主要决定因素。因此,假设代理人的投标金额会受到委托人对项目工期的期望的影响。
假设一
委托人公布的预计项目工期将影响代理人的投标金额。
投标金额还应取决于所需代码的预期数量。在传统的软件外包合同中,增加项目长度会增加成本。大概,发布该项目的征求建议书的负责人希望该项目取得成功,并且不试图故意误导代理,因此代理将标题、说明和可交付成果的组合长度视为需要编写多少代码的不完善指标是合理的。事实上,至少在大型外包合同中,文档长度(以页面为例)确实预测了投标价格。CSM中的项目描述长度也是如此。较长的描述表明可能需要编写更多的代码,而且由于编写更多的代码需要更多的时间,较长的描述项目应该要求更高的投标金额。即使在实际情况下,此类项目平均花费的时间不长,也有理由期望代理商在其投标价格中获得额外的安全利润,以防在特定项目中出现这种情况。或者,更详细描述的项目也给了代理一个很好的理由,让他们向可能是天真的委托人收取更多的费用,这个委托人暗示需要做更多的工作。如果这也适用于CSM,那么项目描述的长度应该影响代理投标的程度。
假设二
项目说明长度将影响代理商的投标金额。
模型的下一部分将讨论项目成功。如果委托人付款,CSM中的项目将被视为成功。委托人可以认为代理人在完成项目后发布的交付物不符合预期,因此拒绝支付。这也意味着CSM网站将获得佣金。因此,委托人的付款是所有相关方项目成功的一个指标。
有更长描述的项目可能会更全面地描述。当然,过于简单描述的项目可能会造成误解,并减少成功交付的机会。被更详细地描述的项目应该有更高的机会被编写代码的代理正确理解,从而最终被委托人接受和支付。更高的成功率也可能从代理理论的角度理解,因为它与代理面临的风险有关。以更大篇幅描述的项目应该更有助于减少代理所经历的信息不对称,或者至少向代理发出信号,表明委托人是认真的,知道自己想要什么。更好地理解委托人想要什么,并确信委托人能够描述自己想要什么,并且不隐瞒任何东西,这会鼓励代理人在可能出现误解和问题的情况下,对项目进行更多的投资。
假设三
有更详细描述的项目总体上会更成功。
考虑到CSM中的项目持续时间非常短,中位数仅为7天,较长的项目可能会更成功。这是因为在软件开发中经常会发生意外的问题。这些问题可能与规范、编写代码、无结论的测试、委托人和代理人之间的误解以及一系列相关问题有关。在软件故障这个话题上,一些主要的研究人员早就注意到了这些问题。如果项目只持续一天,占数据中的6.72%,或2两天,占另外9.00%,那么解决这些意想不到的问题的时间就很少了。相反,如果项目持续一到两周,那么代理人应该有足够的时间处理意外问题或与委托人核实问题。因此,由于CSM中的项目持续时间非常短,较长的项目应该具有较高的成功率。
假设四
更长时间的项目会更成功。
有助于项目成功的另一个可能考虑因素是其成本,或者更准确地说,是授予合同的代理人的投标金额。软件开发通常需要比预期更多的时间,有时开发人员会遇到需要额外时间的困难。合理地说,当这些问题出现时,可以预期至少一些代理可能会决定通过偷工减料来减少损失。偷工减料可能会导致质量较差的交付成果,从而降低成功率。然而,项目的价值和已经投资的金额越高,软件开发人员这样做的可能性就越小。在大型项目中,这被视为回收投资沉没成本的问题。将此引入CSM的上下文中,例如,如果价值200美元的CSM项目的完成时间比预期的要长,编写代码的代理可能仍然决定额外花费几个小时来完成它,以避免根本没有得到报酬。在CSM的案例中,收回投资的沉没成本是为了不失去得到支付的机会,即使金额不够。然而,如果这个项目的价值只有10美元,那么额外的投资就不太可能了。假设这适用于CSM中的代理,则表明下一个假设。
假设五
投标金额越高的项目就越成功。
下一个假设是处理代理在具有较高的安全风险的项目上采取安全边际的后果。假设代理大多能够识别此类潜在的风险更大的项目,那么数据中就会有证据表明,代理对未成功项目的出价确实高于预期。可以说,代理商在确定此类项目方面基本上是正确的,因为那些没有被淘汰的代理商最终将因其损失而退出市场。如果代理人对此类项目的平均出价更高,那么剩余部分,即实际出价金额与本应出价金额之间的差额(如果不是这样的话),应表明未成功项目的正残差。正残差意味着,平均而言,代理商在最终未能成功的项目上出价更高,从而获得了安全利润。正残差意味着在这种情况下,投标金额高于仅根据持续时间和描述长度估计的总平均金额。
假设六
未中标项目的投标金额将有较大的正残差。
研究模型如图1所示。买方以项目描述长度和持续时间的形式提供的信息,如图左侧所示,影响后续代理商在投标金额方面的响应,然后三者结合起来影响项目的成功。作为模型的一部分,该图表明,项目成功与实际投标金额的残差相关,因此在未成功的项目中,投标金额较大。
本研究的数据来自一个主要的CSM。这些数据包含了2005年和2006年的所有招标书和所有投标书。所有者允许作者发布基于此的论文,以交换对分析早期结果的预览。提供数据的公司以与其他主要CSM公司以同等的方式运营。这是一家位于美国的私营公司。在此期间,CSM共有10568名委托人。委托人主要来自美国17919人,英国3874人,加拿大1942人,澳大利亚1921人,德国611人,印度442人,荷兰317人,瑞典317人。他们发布了31276份征求建议书。在此期间,CSM共有31938名代理人。这些代理人大多来自美国6070、印度5632、罗马尼亚4968、巴基斯坦1670、俄罗斯1327、加拿大1241、英国1236和乌克兰1228。代理商对这些招标书进行了332637次投标。其他的个人资料没有和我们分享。在SAS中进行分析之前,使用SQL根据RFP ID加入RFP和投标。项目描述长度是根据标题、描述和可交付结果中的字数进行计算的。
这些项目涉及各种编程语言的编码、用户界面的设计、测试和其他与软件开发相关的任务。项目标题示例显示了CSM处理的项目类型。这些标题包括Website Development – HTML/CSS, Website Address Extractor, Logo, Background to be removed from 13 images, Design and code a movable type site, website content re-write, Bizarticle Links, Delphi 6 – web database, HTML scraping, PHP Scripts, website update, Package a DLL or ASP file into an exe, serial port sniffer, Stop spam on PHP forum, betting exchange interface, Web site newsletter template, Fix rotation tool, Skype API development, PHP pear expert, Website Design, Modify a J2ME application, Software Testing, Google search results parser, Visual Basic Homework Help, User Management System, microphone emulator, Analog Watch, Invisible Email Re-Submitted, Course Registration system, C++ questions, Install wiki on website, Inventory Management Application, Color Scheme Change, MetaTrader4 (MQL Language) Trading System, PHP/MySQL, Flash Text Chat with emoticons for FMS, Banner Ad needed (Small Project/Quick Cash), Payment Gateway Integration, Convert Delphi Code to C#, SIMPLE JAVA GUI, Search engine placement, Half-Life Master Server Query Tool, 4 Domain Name Status Scripts, Designing and evaluating an interactive system, trying to send hidden cookie value in form, Windows Port Monitor Application, Color change in .pdf, VNC ActiveX, Audio/Powerpoint Sync’ing and Publishing to Flash.(一大堆开发需求标题,不翻译了)
在这个特定的CSM成员在加入之前需要注册。加入CSM是免费的。成员可以选择他们的代码名,指定他们来自哪里,发布图片或图像,并上传一个简短的个人信息。成员可以在需要编写的项目上发布RFP,充当委托人,或者在其他人作为代理发布的RFP上投标。成员可以是某些RFP中的委托人,也可以是其他RFP上的代理。在这两种情况下,成员都可以看到委托人或招标代理机构的平均评级,并阅读其他成员就特定先前项目发表的评论。这些评级为1-10级,其中10级是最高的。重要的是,委托人决定项目描述和可交付成果。代理商按原样对整套说明和可交付成果进行投标。代理商唯一能影响的就是他们的出价。委托人看到每个招标代理是谁,他们的评级和过去的项目,以及投标金额。委托人没有义务必须选择一个招标代理机构,如果投标价格太高,或者代理人自我描述的资格和经验不符合委托人的预期,就可能发生这种情况,类似流拍。一旦委托人选择与某一个代理人签订合同,委托人就把钱存入由CSM网站管理的托管账户。只有当项目交付令委托人满意时,CSM现场才会向代理人支付款项。CSM网站对每一份已支付的招标书收取8.75%的服务费。
分析中使用的变量列表、描述和描述性统计如表1所示。Project Duration是委托人希望项目花费的天数。项目描述长度是项目标题、描述和可交付结果中的单词总数。金额投标是指代理投标的金额。项目成功是一个二元变量,根据CSM交易记录指示项目是否被委托人接受和支付。表1还包含一个名为residual的变量。残差由分析步骤1中的GLM计算。它表示实际投标金额与GLM模块根据报告的持续时间和描述长度预测的最佳拟合直线的金额之间的差异。该变量用于数据分析的第3步,以测试H6,未成功的项目在基于持续时间和描述长度的项目预期市场估值之上投标。分析的持续时间被作为多天或一天的一部分的日志输入。由于数据倾向于较短的项目(偏度=2.84),因此记录了一个日志。取对数是处理高偏态值的标准方法。
数据分析分几个阶段进行。在第一阶段,运行GLM测试h1和h2,并在此过程中创建最佳拟合线,根据持续时间和项目描述长度预测投标金额。持续时间和项目描述长度作为协变量输入。GLM还将RFP编号作为一个类变量,以说明同一RFP上所有投标金额之间存在共享差异。这个阶段的分析单位是单独投标。样本量N为332637份。在2005年和2006年的整个日历年中,这些投标是在31276份投标书上进行的。GLM的结果如表2所示。GLM产生了一个重要的模型(2自由度时f=37096.90,得出p值<0.0001),r2为18%。正如预期的那样,需要更长时间和更长时间描述的项目以更高的金额投标,分别支持h1和h2。这是合理的。时间是这些项目的主要开支,因此较长的项目和较长的描述,因此可能有更多的细节,应该花费更多。标准化测试结果表明,持续时间对确定投标金额的贡献几乎是项目描述长度的4倍。这意味着,与描述项目及其可交付成果的字数相比,委托人对投标期限的评估对代理商的投标金额产生的影响更大。GLM还记录了剩余量,即基于该函数的实际投标金额和预测金额之间的差额。在数据分析的第三阶段对残差进行了分析。
数据分析的第二个阶段研究了预测项目是否成功的因素。由于因变量是二元的,这部分分析采用逻辑回归进行。本阶段的分析单位是征求建议书。因为只有一部分项目不成功,我们采用了向下抽样,以便每个类别都有同等数量的病例)。样本量n为732个RFP。逻辑回归将70.2%的项目分为成功和不成功。这意味着r2相当于18%。Hosmer和Lemeshow拟合优度检验卡方为67.70,自由度为8,P值<0.0001。逻辑回归结果如表3所示。说明项目长度和工期影响项目是否成功,支持H3、H4,而投标金额不影响,不支持H5。
数据分析的第三阶段检查了H6。这是通过对数据分析第二阶段中使用的相同数据进行t测试来完成的。分析单位又是RPF。又有732个数据点。分析的数据如表4所示。成功和失败项目的所有变量都有显著差异:项目持续时间(t=4.77,p值<0.0001)、项目描述长度(t=7.43,p值<0.0001)、投标金额(t=2.65,p值=0.0082),重要的是,支持H6的变量还有残差(t=3.93,p值<0.0001)。这些结果意味着,委托人对未成功的项目进行了评估,要求较短的持续时间,用较少的文字描述,并相应地由代理人以较低的金额投标。残差分析显示,支持H6的模式可能更有趣:平均而言,未中标项目的投标金额残差更高。这意味着投标金额实际上高于其根据这些项目中项目的工期和项目描述长度确定的预估值。也就是说,考虑到预期工期和项目描述长度,未成功项目的投标金额更高。
在探索性的模式下,为了进一步研究投标金额与项目成功之间的关系,我们将表4中的残差映射为投标金额。目的是检查残差模式是否随着投标金额的增加而变化。该图是通过将特定项目的投标金额映射到为该投标生成的GLM残差量而创建的。在区分成功项目和不成功项目的颜色和形状的同时,创建了该图。图2中的残差显示了GLM分析中的因变量投标金额与GLM模型预测的基于项目持续时间和描述长度的投标金额之间的差额。图中的两条线是最合适的回归线,将投标金额与残差金额连接起来。这些线不是GLM最佳拟合线。图2中的回归线表明,在项目失败的情况下,回归线更陡。这意味着,在未中标项目中,随着投标金额的增加,投标金额与基于持续时间和描述长度(由GLM函数得出)的本应投标金额之间的差异以更大的速度增加。这是H6的另一个表示。如表4所示,未付款项目的平均残差不仅较大,而且随着投标金额的增加,未中标项目的残差也增加得更快。
具体来说,根据中标项目的投标金额预测残差的回归线是显著的(f=1338.71,p值<0.0001,r2=78.62),截距为−0.9491(t值−29.61,p值<0.0001),斜率为0.00982(t值=36.59,p值<0.0001,标准化=0.8867)。在未成功的项目中,回归线也很明显(f=1660.14,p值<0.0001,r2=82.02),截距为−0.4534(t值=−17.88,p值<0.0001),斜率为0.00799(t值=40.74,p值<0.0001,标准化=0.9056)。坡度差异显著(t值=105.3227,p值<0.0001)。
代理理论的核心是假设信息不对称会给委托人增加风险,而委托人又会采取行动降低风险。应用于代理人时,该理论意味着委托人产生的信息不对称,因为它增加了代理人的不确定性,会增加代理人面临的风险,代理人将相应地尽其所能降低该风险。事后分析的目的是验证委托人通过其行为向代理人引入不确定性这一基本假设是正确的。
事后分析通过比较征求建议书中估计的项目持续时间和项目交付前实际花费的天数,检查了委托人引入的不确定性。这两个值之间的差异代表了代理的实际风险。如果代理基于太短的时间估计来估计其成本,那么代理可能会赔钱,甚至可能无法按预期交付。支持这一观点,该图显示,在RFP中显示的预测持续时间与项目实际持续时间之间的差距在较短的项目中更大,这表明委托人在较短的持续时间项目中的预测不准确,因此对代理人的风险比在较长的项目中更大。
这一差异通过单独的GLM进行测试,预测作为RFP中估计持续时间函数的实际天数。正如预期的那样,委托人估计的更长的项目确实更长(斜率β=1.05,t=121.65,p值<0.0001,截距β=-6.08,t=-33.58,p值<0.0001,得出自由度为1度的f值为14798.5,p值<0.0001,r2为27.90%)。真实情况支持这一观点(韦尔奇的方差分析f=173.30,在99自由度下,得出p值<0.0001),在较长的项目中,这一预测的方差较小。也就是说,在较长的项目中,负责人更准确地估计项目持续时间。随着项目持续时间的增加,差异显著降低,从而显示出准确性的提高。这个结果可以解释为什么不成功的项目在表4中的持续时间较短:较短的项目在预测实际持续时间时引入了更多的不确定性(如其显著较高的方差所示),因此它们不成功的概率较高。
与项目持续时间相比,项目描述长度几乎没有预测到项目交付前的实际天数(线性回归f=257.17,p值<0.0001,r2=0.0067)。显然,较长时间描述的项目不会影响其实际持续时间。
对一家领先的众包软件开发网站进行为期两年的分析,得出了一些预期结果和一些意想不到但信息丰富的结果。基于合同理论的直接应用,较长时间的项目和较长长度的项目(因此可以假设为较大的项目)的投标金额较高(h1和h2)。这是代理对委托人给他们的信号的合理反应:如果委托人认为项目需要更长的时间并且需要描述更多的细节,那么开发可能需要更长的时间。正如事后分析所表明的,这不仅是代理的合理反应,而且至少与项目持续时间有关的数据也证明了这一点。考虑到图3中的坡度为1.05,委托人预测的项目持续时间是一个相当准确的预测因素。支持这些假设的是,更详细描述的项目和持续时间更长的项目平均更成功(H3和H4)。投标金额本身对项目成功没有贡献(不支持H5)。
基于合同理论和理性行为,可以预见到上述情况。然而,这并不是全部。在未成功的项目中,代理人明显比他们应该根据项目说明的长度和持续时间(H6)出价更高。这表明代理理论是故事的一部分。代理,可能意识到一些项目风险更大,采取措施降低风险。在这种情况下,代理商采取的唯一措施是控制投标金额。探索性分析和事后分析表明,代理人的过度竞标显然是由市场行为决定的。不成功的项目平均持续时间较短,描述更为简短,而正是代理商出价较高的项目(表4)。此外,显然,提供者在预测项目持续时间方面相当准确,但在较短持续时间的项目中(如特别分析所示),情况就不那么准确了,而那些较短持续时间的项目更有可能失败(表4)。从代理理论的角度看,在这种情况下,代理人的超额投标与代理理论的要点是一致的。当合同的一方(在这种情况下是委托人)向环境中引入不确定性时,就像委托人在估计较短工期的项目时可能无意中做的那样,另一方(在这种情况下是代理人)通过采取保护性行动作出回应。作为唯一的保护措施,代理商可以采取的是出价更高,这正是他们所做的。
从代理理论的角度看,但反过来关注代理方的互动,可能会对发生的事情提出一些理论线索。代理理论已成功地应用于解释委托人(即买方)在与代理(即服务提供商)的合同关系中的行为。这一理论的核心是委托人面临风险,因为代理人对自身的了解超过了委托人可能了解的范围,因此委托人相应地采取措施降低这种信息不对称所带来的风险。在这项研究中,我们采用了信息不对称的概念,并从CSM中小型项目的代理的角度来看待它。在这种情况下,一个买方,也被称为委托人,发布一个项目的征求建议书,比潜在的代理人对该项目的了解更多。有时,无论是因为没有经验或任何其他原因,买方都会将持续时间显示得比实际时间短,或者暗示持续时间比实际情况复杂。当这种虚假陈述发生时,它就是信息不对称的一个例子,但它的方向与代理理论所建议的相反。
代理可以通过一个很明显的方法在一定程度上解决这种信息对称性,即在项目中收取更多的费用,来应对他们可能因为不知道什么而支出更高。如果是这样的话,不成功的项目(即那些没有支付的项目,在委托人和代理人之间显然有更高的误会机会)应由代理人以更高的金额投标。代理人这样做是为了在一定程度上降低他们的信息不对称风险。数据确实如此。此外,如果信息不对称至少是导致项目失败的部分原因,那么这些项目可能会被更简单地描述。从逻辑上讲,如果对一个项目进行更简短的描述,那么代理可能没有得到足够的信息,从而导致信息不对称问题。数据再次表明,事实确实如此。
关于代理商在最终会失败的项目上实际出价高于预期的基于项目持续时间和描述长度的投标金额的问题,也表明了降低成本的一个有趣的转折点。低价竞标是指在拍卖中出价过低,以增加获得征求建议书的机会。这种做法在软件外包中很常见,因此可以预期CSM也会采用同样的做法。显然,情况并非如此。如果存在普遍的低价,那么不成功的项目将以更低的价格竞标。事实并非如此。
事后分析表明,代理理论在其最初的方向性可能也适用于这里。据推测,代理比一般的委托人更了解软件的开发,因此,基于代理理论,他们可以利用自己的优势信息。这可能就是事后分析所显示的。代理商对描述的项目的出价更高,即使这些项目平均不会花费更长的时间,因此显然不需要代理商投入更多的时间。这可能是代理理论所规定的委托人面临的信息不对称风险的一个例子:代理人利用他们对他们提供的服务的更好理解来收取比委托人需要的更多的费用。
在更广泛的层面上,该模型和事后分析可能会对众包行为提出一些见解。众包是将外包提升到另一个层次。在软件外包中,通常只有少数投标者在征求建议书上,委托人知道软件开发。至少在许多关于这个话题的研究中是这样的。相比之下,众包中有很多代理商,他们是小承包商,他们不能被起诉,他们做这项工作的资格不能被核实,而且委托人对外包合同的了解一点也不确定。也许更重要的是,这些项目太小,无法投资于对代理商进行监督,或创建一些其他类型的质量控制机制。尽管如此,研究结果证实了理论预测的定价和代理关系的预期相互作用。这些结果之所以重要,不仅是因为它们表明,代理理论的某些预测甚至适用于这种情况,而且因为结果表明,在这种相互作用中,成功的众包项目与失败的众包项目之间存在差异,而且考虑到预测项目时间的不确定性,这种相互作用实际上是合理的。也许更有趣的是,虽然代理理论暗示委托人和代理人利用信息不对称来获取自身利益,但本研究的结果可能暗示,与其保护自己不受合同另一方的影响,不如保护自己不受不确定性的影响。利用信息不对称的行为关系。准确地说,从数据来看,似乎不是委托人利用了他们对项目持续时间的乐观估计,而是他们真的不知道,尤其是在更短的项目更容易失败的情况下。
与其他合同市场一样,代理商的投标金额以及成功地向委托人交付招标书对所有相关方都至关重要。委托者显然需要这个项目成功,否则就不会发布它了。代理需要项目成功,否则将无法被支付。而且,市场需要项目成功,因为这是佣金的来源,而且太多的失败项目会损害CSM的声誉。在这项研究中,我们检查了委托人提供的信息,特别是项目描述长度和交付周转时间,代表了代理人估计的投资时间,是否影响供应商的投标价格和项目的最终成功。是的,但还有很多。
数据分析的结果似乎会导致主体发生冲突。说得太多,给编写代码的代理更多的时间,最终你会花更多的钱。另一方面,说得太少,缩短项目工期,代理商可能出价更低,但可能无法成功交付。从表面上看,这似乎使委托者陷入了困境。在这项研究中,我们证明事实并非如此。如果项目最终失败,那些说时间太少或缩短了的委托者实际上承担了支付了超过考虑到他们报告的时间和描述长度他们可能不得不支付的预期金额的风险,。事实上,当根据项目声明的持续时间和项目描述长度来计算项目的预测成本时,成功的项目实际上比不成功的项目以更低的价格投标。所以,实际上,支付更多意味着更高的成功率。
仔细观察图2可以发现,考虑到基于持续时间和描述长度的预期金额,未成功项目收取的较高金额的斜率明显大于成功项目。这表明,平均而言,随着投标金额的增加,未中标项目的残差增长速度要快于中标项目。也就是说,不成功的项目不仅存在定价过高的现象,而且在高出价的情况下,定价过高的影响更大。实际上,这意味着委托人应该知道这种暴露的代理行为,主要是在投标金额的上限范围内。当对非常小的项目进行投标时,在投标金额上获得安全裕度对委托人的损害比在投标金额较高的项目中要小。
从市场管理的角度来看,这些数据表明,如果能够得出一种机制来更好地预测项目长度,那么这将有助于减少实际持续时间的不确定性和代理商的超高出价。作为一个自动化机制,可能说起来容易做起来难,但教育委托者在预测项目持续时间时注意他们过去在个人层面上的错误可能是有益的。
本研究所分析之资料均为档案资料。作为档案数据,本研究具有典型的局限性,并提供了档案数据分析的典型优势。这造成的主要限制是数据已经存在,因此不能向其中添加感兴趣的新构造。研究人员必须利用现有的测量方法,即使它们只是故事的一部分,而且只是部分地测量正在测试的理论。实际上,这意味着其他可能对这类合同感兴趣的措施不可能成为模型的一部分。这些附加主题包括供应商行为、对软件复杂性的主观评估和对供应商的信任,所有这些都对大型软件外包很重要。
档案数据的另一个局限性是,研究人员可能在强制措施的意义。相比之下,在调查研究中,可以对研究进行规划,从而建立每个度量的结构和内容有效性。在档案数据中,情况并非如此。研究人员被迫将数据的含义归因于此。在我们的研究中,我们也不得不这样做。但是,不可能排除在较短的长度上描述的项目可能有更差或不充分的规格,因此,在较短的长度上平均描述不成功的项目可能还有其他原因。
从这些局限性的角度来看,归档数据也有其独特的优势。这些数据是客观数字,准确地反映了市场的表现。这些数据不是主观的,也没有实验者强加给他们的偏见。此外,时间优先级可以通过依赖时间戳毫无疑问地显示出来,而且,重要的是,这些是真实的设置,真实的参与者在程序中投资真实的金钱和实时。这些数据处理的是真实世界的事件,而不是游戏或模拟。
对于这些特定的数据,还有另一个限制,可能会限制结果对其他设置的适用性。所研究的CSM是一个公开拍卖市场,但它处理的是小型项目。在这些数据中,项目持续时间的中位数只有7天,描述的中位数只有239个字。这使得这些市场处于一个独特的位置,在这个位置上,它们不仅通过讨论一个新的上下文对理论作出贡献,而且限制了假设结果同样适用于其他类型的软件开发拍卖市场的能力。需要进行额外的研究来验证这些结果是否也适用于更长和更复杂的市场。另一个限制是这些数据大约有10年的历史。尽管如此,基本原理与当前市场相同:委托人仍然发布RFP,代理仍然对其投标,项目的持续时间有限,并用文字描述,只有一些项目是成功的。
CSM在软件开发众包中的重要性与日俱增。在很大程度上,这些市场表现按照合同理论所说明的进行表现。然而,它们独特的规模意味着这些市场的某些方面可能令人惊讶。从合同理论的角度来看,利益的一个方面似乎并不明显,即在最终将不成功的项目(尤其是在较高的定价范围内)中,代理人根据预期的持续时间和描述长度,对其投标金额采取安全裕度。理论上,高于预期的出价可能代表代理人在有利于委托人的背景下处理信息不对称的一种方法。