Ellen M. Voorhees, Paul Over, Ian Soboroff

通过度量查询质量构建更佳的搜索引擎

本文最先发表于IT Professional杂志，现由InfoQ & IEEE Computer Society在此为您呈现。

搜素引擎构建于对真实测试案例标准集的使用，该标准集允许开发人员度量其它替代方法的相对有效性。这篇文章讨论了NIST的文本检索会议（TREC）项目，该项目创建了用于度量查询结果质量的基础架构。

我们总是认为以母语进行的文本文件查询是有保障的，但是像Yahoo、Google和Bing这样的网页搜索引擎并非一天构成，而且网页内容也不是我们需要查询的唯一领域。随着数据变得越来越无处不在，搜索需求也相应地扩大了。人们为了不同的目的（比如：重新定位已知数据项、回答特定问题、学习特定问题、监测数据流、及浏览）在不同媒体（比如：文本、网页、Tweet、语音录音、静态图像和视频）中搜索所需内容。大多数情况下，用于支持这些不同搜索类型的技术还在不断完善中。可搜索技术是如何发展的？搜索引擎开发人员怎么知道哪些可行，又为什么可行呢？

来自大型、多元化搜索社区的参与者对标准的、真实测试中的搜索引擎性能的仔细度量已被证实是至关重要的；通过文本检索会议（TREC）项目，美国国家标准及技术研究所(NIST)在过去四分之一个世纪以来一直通过收集社区评估促进着搜索和与搜索相关技术的发展。

TREC的来源

搜索算法通常通过测试集，即在基准任务上对比各个替代方法而发展起来的。第一个测试集是20世纪60年代从Cranfield学院的一系列关于航空索引语言的实验中获取而来的¹。Cranfield测试集包含一组航空杂志文章摘要、一组针对这些摘要的查询以及每个查询的正确答案要点。从今天的标准看，它可能微不足道，但Cranfield集打破了当时的记录，为信息检索系统创建了第一个共享的度量工具。研究人员可以自己编写搜索引擎来查询所要的摘要，其返回值可以通过对比答案要点来度量。

其它研究组开始遵循由Cranfield测试提出的实验型研究法，生成了其它多个用于70和80年代的测试集。但到了90年代，大家开始对该方法越来越不满意。尽管有些研究组使用了相同的测试集，但在以下几方面却各持己见：是否使用相同数据，是否使用相同评估度量，是否跨查询系统对比结果。商业搜索引擎公司并未将从查询系统中取得的研究结果整合到他们的产品中，因为在当时他们觉得研究界所用的测试集太小了，并不值得借用。

面对这一不满，NIST被要求构建一个大型的用于评估文本检索技术的测试集，在当时该技术已发展为美国国防部高级研究计划局（DARPA）Tipster项目²的一部分。NIST同意以研讨会形式来构建大型测试集，同时也支持关于测试集使用方面等更大问题的检测。该研讨会就是1992年举行的第一次TREC会议，此后每年都举办一次TREC会议。TREC在早期就完成了构建大型测试集的最初目标；事实上到目前为止，TREC已经构建了几十个正被整个国际研究界使用的测试集。TREC更大的成就是对研究范例的建立和验证，并在此后的每年都继续将其拓展到新任务和应用程序的具体内容中去。

社区评估

该研究范例以基于社区的评估为中心，称为“合作竞争（coopetitions）”，这一新词强调了竞争者间的合作，从而创造出更大的利益。

该范式的主要元素是评估任务，通常情况下，它是一个用户任务抽象，明确定义了我们对系统的期望。与评估项目相关联的是一或多个度量，它们在反映了系统的响应质量的同时，也是所有基础架构用来计算可构建度量标准的手段。其评估方法揽括了任务、度量、以及对度量分数有效解释的声明。一个标准的评估方法允许横跨不同系统间进行结果比较，这就是检索竞赛无获奖者为什么这么重要了；相对于其他研究组所能解决的，它促进了更广泛类型研究成果的整合。

谈到范式的具体实例，我们可以考虑第一个TREC中的主要ad hoc项目，该项目拓展了当时的Cranfield方法。该ad hoc评估项目还检索了相关文档（更确切地说，创建了一个文档列表将所有相关文档罗列于无关文档之前），然后给出一个文档集和称为话题的对信息需求自然语言的声明。该检索输出以准确率（检索出的相关文档数与检索出的文档总数的比率）和召回率（检索出的相关文档数和文档库中所有相关文档数的比率）为指标，为每个已知话题（换句话说，就是答案要点）提供相关文档集。TREC的创新在于利用pooling³为大型文档集构建相关集合。

该pool是所有参与系统对给定话题的检索而查询出来的前X个文档的集合。只有来自话题pool中的文件才会被人工评审员采用并鉴定其相关性，其它的文档则与有效性评分的计算无关。尽管只参照了整个测试集中的一小部分，但是随后的测试证明在TREC中执行的pooling在文档集中所发现的文档绝大部分都是相关的。另外，该测试进一步验证了在通常情况下，这些在测试集上获得更高分数、构建于pooling上的检索系统往往比那些分数较低的系统在实际应用中更有效⁴。同时该测试也暴露了通过计算测试集所得分数只有有限的有效应用。因为分数的绝对值由多种因素决定，而非仅仅是检索系统（比如：使用不同人工评审员通常对分数会有一定的影响）。只有比较其它系统在完全相同测试集上计算出的分数才有效。这就意味着对比不同年度的TREC分数是无效的，因为每个TREC构建的测试集都是新的（不同的）。想让pooling成为有效的策略，在pool中拥有类型广泛的检索方法起着非常必要的作用。因此，TREC的社区因素 — 使用了多种检索方法用于检索不同文档集 — 是创建良好测试集的重要因素。社区因素同时也是TREC在其它方面成功的重要因素。TREC只有在所有检索方法都呈现时，才能检验当前的技术。一年一度的TREC会议不仅促进了不同研究组间，而且还促进不同研究开发组织间的技术交流。该年度会议还为解决方法论方面的问题提供了有效的机制。最后，社区成员往往是新项目数据和用例的来源。

在TREC开始之初，大家还怀疑这个构建于实验室的统计系统（相对于在手动索引集合上使用布尔搜索的操作系统）是否能真正有效地从大型集合中检索出文档来。TREC中的ad hoc项目证明了90年代初的搜索引擎不仅确实拓展到了大型集合范畴，也不断得到了改进。其有效性无论在TREC测试集实验室中，还是在当下集合了该技术的操作系统中都得到了证明。此外，该技术现在所应用的测试集要比当初在1992年设想的大得多。网页搜索引擎是统计技术能力最好的例子。搜索引擎为用户带来他们想要的查询信息的能力已经成为网站成功的基础。正如之前所说的，搜索有效性的改进并不能简单地由每年的TREC分数来判断。然而，SMART搜索系统开发人员会将每八个他们曾经使用过的TREC ad hoc项目冻结起来，并保存系统副本⁵。每个TREC后，他们会在每个系统上执行所有测试集。针对每个测试集，新版SMART系统总是比旧版的更有效，而且分数也比旧版的大概要高出一倍。尽管该证据只能证实一个系统，但在每个TREC中，SMART系统结果始终追踪其它系统的结果，因此SMART结果完全可以代表当前技术水平。

发展分支

尽管TREC的最初意图只是简单地为ad hoc检索构建一两个大型测试集，以及关于pooling方法论方面的问题的探索；但很快ad hoc项目就明显展露出可在多个方面调整发展的特性。从不同方向衍生出来的新项目都与经典项目息息相关，但又不同到足以要求评估方法论作出一定的变化。因此TREC引进了Track项目，从而每个给定的TREC都包含了多个检索子项目，每个子项目又是自身评估挑战的焦点。图1显示不同年度TREC所执行的Track项目，根据维度将Track项目分组从而将它们区分开来。Track项目位于下图的左边，展示了TREC所解决问题的宽度，而位于右边的单独Track项目则显示了项目在给定问题领域中的进展。

（点击图片放大）

图1. 文本检索会议（TREC）Track项目及它们的所属年份。Track项目名字位于右边，位于左边的则是Track项目关注的。空框所代表的Track项目是被分离出来成为一种评估方式用于运行当年的Track项目。颜色相同的Track项目则彼此密切相关。

现在，每个TREC会包含七或八个经常变换的track项目以保持新鲜度，及支持新的社区。多个TREC track项目已经是自己领域的首个大规模评估。在这种情况下，Track项目已经建立了相应的研究社区，并创建了首个用于支持其研究领域的特定测试集。有几个Track项目已经从TREC中分离出来，感兴趣的社区建立了自己的评估会议。比如：评估论坛会议和实验室（the Conference and Labs of the Evaluation Forum, CLEF）就于2000年从TREC中脱离出来，在欧洲拓展了关于跨语言检索的评估，此后它不断扩大，不仅包含了多语言，也涵盖了多模式（文本、图像和视频）信息。其它会议尽管没有从TREC中直接分离开来，却受到TREC的启发，将方法论拓展到其它领域。其中包括NII测试基地和信息访问研究社区（NII Testbeds and Community for Information Access Research）（NTCIR，research.nii.ac.jp/ntcir）关注了中文、日文和韩文文本；XML检索评估倡议（INEX, inex.mmci.uni-saarland.de）；以及信息检索评估论坛（Forum for Information Retrieval Evaluation，FIRE）关注了印度次大陆的语言。

由于空间上的局限性，我们无法为每个TREC Track项目展开哪怕是粗略的讨论。因此我们抽样强调以下一些Track项目 — 过滤、问题解答和法律电子取证 — 它们从某种程度上部分解决了这些特别紧迫的搜索问题，其中还有视频检索Track项目，由于数字视频日益普及，它已发展出自己的NIST研讨会系列：TRECVID。

过滤

TREC的最初几年仅有Ad hoc和routing两个项目。Routing项目用于模拟用户监控文件流、选择相关文档及忽略无关文档。在TREC-4中，routing演变为过滤 — 一个更为复杂，却更真实的场景。正如电子邮件过滤系统实时处理传入的邮件流以删除垃圾邮件和执行归档规则一样，信息过滤系统处理传入的文件流，然后根据用户对之前交付文档的回馈而建立的用户兴趣模型配置文件，决定是否要将这些信息发送给用户⁶。

鉴于routing评估项目允许系统以批处理的集合形式处理所有文件，该过滤评估项目要求系统在文档到达文件流时就处理，并采用在线用户模型。如果系统选择显示文档给用户，还附有对该文件相关度的评价，那么该系统就被赋予了评估（模拟实时用户的回馈）。系统就可以根据这些信息进行及时的自我调整。如果系统决定不将这些文档显示给用户，那就是缺失了相关信息。过滤系统的有效性通过使用实用模型，一个基于返回相关文件数、并根据其返回的不相关文档数而被减分的系统。

过滤Track项目让与会者更好地理解过滤项目的执行难度。在实用模型中，系统因返回不相关信息而受处罚。如同现实生活一样，在过滤track集合时，在数以百万计的文档流中往往只有一小部分文档是相关的。因此，一些精明的系统会因为从未返回任何文档而得分很高 — 换句话说，它们决定不冒风险去浪费使用者的时间。由于系统在数据流初期只有少量培训数据，其初始性能往往比较差。为了完善该用户模型，系统必须给用户提供很多有希望却最终无关的文档。

该系统必须能够从反馈的原始成本中恢复，这些反馈经历了从执行特别好很快到分数特别好这一过程。

问题解答

尽管主题相关的文档列表毫无疑问是有益的，其本身所提供的信息就多于用户想要检测的。TREC问题-解答Track项目于1999年引入，主要关注返回问题确切答案这一类问题。最初的问题解答Track项目关注事实型问题 — 即那些答案短且基于事实的问题，比如：“泰姬陵在哪里？”随后，Track项目又引入更为复杂的问题类型，如：列表问题（其答案是所请求类型实例的不同集合。比如：“有哪些演员曾在《屋顶上的小提琴手（Fiddler on the Roof）》这部电影中扮演过Tevye这一角色？”）；以及定义型或传记型问题（比如：“什么是黄金降落伞？”或“谁是弗拉德三世（Vlad the Impaler）？”）。

问题解答Track项目是开放域问题解答系统的首个大型评估，而且利用了从其它TREC观察而获得的测试集评估优势来处理问题解答项目。该Track为检索和自然语言处理研究社区建立了通用项目，带来了问题解答研究的复兴。由于研究人员将复杂语言处理结合到问题解答系统中，该研究潮流在自然语言自动理解上实现了显著的进步。比如：Watson，IBM的Jeopardy-playing电脑系统，TREC问题解答Track项目中就有该公司曾参与的原型⁷。

电子取证

法律Track项目始于2006年，专门关注电子取证问题，电子存储信息的有效生产是诉讼和监管设置的证据。当今组织更多地依赖电子记录，而非纸质记录。但相应数据量及其潜在的短暂本质已使传统司法发现流程和实践不堪重负。因此我们需要新的处理电子数据的发现实践。当该Track任务开始时，涉及的诉讼双方通常会讨论出一个布尔表达式用来定义发现结果集。然后再由人工检查每个检索文档，从而判定发现请求的响应能力。该Track的目的在于评估该基线方法和发现的其它查询技术的有效性。该Track使用了假设的投诉和相应的请求来生成由执业律师开发出作为主题的文档。指定的“主题权威”扮演了某案件中首席律师的角色，陈述关于具体是什么让文档响应请求的总体战略和指导方针。特定文档的相关性判断由法律专业人士来评估，他们会更根据自身的典型工作实践来审查文档。

该Track项目对法律社区有着重大的影响，其中包括司法意见中的引文（见en.wikipedia.org/wiki/Paul_W._Grimm）。它的主要成果就是引发实时对话，该对话通过对迭代流程的展示指出应该完成哪个电子发现，这个迭代查询会包含一个人工到查询循环中，其效力往往优于一次性检索。在信息检索这方面，Track在标准测试集评估方法上表现出了不足。为了方便稳定的评估，尤其当使用pooling中构建的测试集时，标准方法所依赖的平均有效性是从一组每个主题只有一小部分相关文档的主题中获取的。但是当返回文档数量很大时，电子发现中的真实案例则从单个响应集中衡量其有效性。

视频

虽然不属于TREC研讨会范畴，但依然属于NIST，TRECVID从它出现于TREC Track项目中以来，已经以多种形式发展起来（请看图2）。TRECVID创建于2001年，将TREC/Cranfield理念扩展到基于具体内容的视频分析和检索。两年后，TRECVID成立了独立的系列研讨会，并开始了使用电视广播新闻（英文、中文和阿拉伯语）及4年为一周期的循环，还将测试数据从50小时增加三倍到了150小时。系统任务包含使用多媒体主题的查询，高层次特征提取，拍摄和传记边界确定，和相机运动检测。

2007年开始了以3年为周期的循环，采用来自荷兰声音和视觉研究所（Netherlands Institute for Sound and Vision）的教育和文化节目。测试数据也在2009年增加到280小时。针对BBC工作样品（未经编辑的节目素材）添加了一个综述任务，针对由英国内政部（UK Home Office）提供的机场监控录像添加了事件监测任务。从2010年开始，TRECVID就开始关注不同的、通常非专业的网络视频，这些由不同社区捐献的视频在数量上从几百到几千小时不等，在拓展了研究和功能/时间检测任务的同时，也往评估中添加了已知事项和实例查询（见图2a）。

TRECVID研究人员已经为全球科学同行在对艺术状态的判断上做出了显著的贡献。2009年，由都柏林城市大学的图书馆学家进行的文献计量学研究发现TRECVID参与者在2003年和2009年间生成了310个（未经审阅的）研讨会文章，与此同时，还生成了2073篇同行评审期刊文章和会议论文⁸。

尽管测试数据的变化导致我们难以度量系统的改进，但阿姆斯特丹大学的MediaMill团队在2010年进行的实验证实了，过去三年里特征检测有了三倍的改善 — 这对一个系统来说，已经是TRECVID中表现最佳的执行者⁹。2010年和2011年的检测测试数据是相同的，但测试查询（11，256）却是随机创建的，这允许了系统间的比较。顶级团队在检测和定位上2011年的平均分数要比2010年好。

TRECVID研讨会系列汇集了来自多元化社区自我资助的研究人员，在多个领域激发起有趣工作的任务深深地吸引着他们。与此同时，研究人员也被数据和计分流程的可用性所吸引，因为这些允许他们关注研究任务，而非基础架构。与此同时，他们还被科学比较的开放论坛所吸引。来自世界各地能参与到竞赛项目中的团队数量也在增长，新的顶级执行者也不断出现。越来越多的知识分子将注意力放到了持久性问题上，比如：从视频中提取有意义的信息，只能从长远角度才有增加进展的可能性。

（点击图片放大）

图2. TRECVID在（a）数据、项目和（b）参与者方面的演变。TRECVID中使用的数字视频包括广播新闻报道、未经编辑的电视节目素材、监控录像和非专业互联网视频。不同数据类型支持不同的项目，比如：传统的ad hoc查询，复制检测和视频序列中特定活动模式的识别。TRECVID程序中文档的作者数量是TRECVID参与宽度的一个度量。

在其作为独立研讨会系列的头三年，TRECVID社区发展迅速，申请量从20组增加三倍到了60组，其中有40组至少完成了一个项目。从2007到2009，申请增加到100组左右，其中有60组已组队完成，社区参与还以该水平持续发展到现在。对研讨会文档合著者的粗略计算显示了大概有400名研究人员参与到每年的TRECVID实验中（见图2b）。虽然学术团队占据了主导地位，商业研究实验室却一直是组合的一部分。欧洲和亚洲的地区参与者最多，北美则紧随其后。

TRECVID社区所贡献的不仅限于研究。他们还为评估基础架构贡献了各种关键部分，其中包括地面实况注释系统和判断、镜头分割、自动语音识别、评估软件、数据托管和训练有素的的探测器。如果没有这种合作，TRECVID是无法实现的。

以下是从2009年信息检索中基础和趋势¹⁰（Foundations and Trends in Information Retrieval）的一篇评论文章中找到的结论：

由于TRECVID在领域中广泛的接受度，从而获得了大量国际团队的参与，他们来自大学、研究机构和企业研究实验室。TRECVID基准可作为实际标准用来评估基于概念的视频搜索研究的性能。实际上该基准已经在视频搜索社区产生了巨大的影响，生成了大量的视频检索系统和出版物汇报了TRECVID中进行的实验。

包括利用多媒体搜索主题的创新自动决定将镜头作为检索的基本单元（允许有效地判断系统的输出），将平均精度应用程序作为视频查询和概念检测有效性的度量，采用基于成本的度量用于拷贝检测，及使用实用方法评估简单总结。

跨研究团队技术转换发生于TRECVID和更广泛的视频分析社区内。用于某年某系统中的方法通常会在下一年被其它系统做出一定修改后采用。由于实验室是通过原型系统练习的，因此TRECVID结果往往具有指导性，而非结论性。随着算法反复证明自己可以是多种系统的一部分，并能解决不断变化的测试数据，特定方法的可信证据逐步增多。相当数量的工程在某种情况下，需要做可用性测试以将实验室内的成功实例应用到现实世界的应用程序中。

荷兰声音和视觉研究所，是TRECVID主要的数据和用例捐赠者之一，是TRECVID记录在案、允许其加入大范围的研究者社区以低成本在他们自己的数据上探索他们所感兴趣的项目。与附近另一个TRECVID参与者（阿姆斯特丹大学）在所需的工程设计和用户测试从原型到可运行系统的转换上有更密切的合作，使得有前景的技术得到了更进一步的探讨¹¹。

过渡到现实世界运用的一个具体例子是荷兰一个公司对功能/概念探测器的开发和授权，它们将被集成到软件工具中允许警方搜索非法材料中应被没收的视频¹²。

向前迈进

TREC在常见问题集上所采用的评估竞争技术方法已被证明是提高当前技术及加速技术转移的一种强有力的方式。Google的首席经济学家Hal Varian曾在其Google博客2008年的一篇博文¹³中这样描述TREC的影响：

TREC在信息检索上对数据恢复的研究所具有的标准性、广泛可用性和精心构建的数据集为本领域进一步创新奠定了基础。一年一度的TREC会议促进了合作、创新和程度可控的竞争（当然还有吹牛的权利），从而引导了更好的信息检索。

NIST委员会RTI国际展开了对TREC影响更详细的研究¹⁴。在数量方面，该研究估算出在TREC上所投资的每一美元，信息检索研究人员能得到的累积回报利润在3到5美元之间。该项研究还列举了各种定性收益，总结起来其中一部分包括以下这些：

TREC活动同时还有其它好处，只是并不属于经济范畴。TREC帮助教育研究生和本科生，其中有一些还去领导IR公司，其它一些留在学术界教书和进行研究。TREC使得IR产品质量和可用性得到了提升 — 我们的研究显示TREC促进了IR研究大范围的拓展，从而带来了高质量的应用程序，比如：网页搜索，企业搜索和领域特定搜索产品和服务（例如：基因组分析）。更具体地说，该研究估算出从1999年到2009年间所观察到的网页搜索产品超过200%的提升中大约有三分之一是由于TREC的存在而带来的。

尽管有了这样的成功，我们依然有很多工作需要去做。虽然内容存储变得越来越大了，电脑依然无法真正理解由人类运用而产生的内容。

在可预见的将来TREC和TRECVID研讨会还会继续，关注于搜索研究社区和更广泛用户社区上具有重大影响的问题的搜索研究。

TREC网页1和2有关于TREC的丰富资料，其中包括每个研讨会的完整流程和关于如何获取测试集的详情。每个冬季想要参与的组织可以通过响应号召邀请参与到TREC中。

声明

某些商业实体、设备或材料可能会在本文中被识别出用于充分描述实验型流程或概念。这种识别的目的并不在于暗示他们被美国国家标准及技术研究所推荐或认可，也不在于暗示某些实体、材料或设备是解决问题的最好工具。

参考资料

C.W. Cleverdon, “The Cranfield Tests on Index Language Devices,” Aslib Proc., vol. 19, no. 6, 1967, pp. 173–192. (Reprinted in Readings in Information Re trieval, K. Spärck-Jones and P. Willett, eds., Morgan Kaufmann, 1997.)
D. Harman, “The DARPA TIPSTER Project,” ACM SIGIR Forum, vol. 26, no. 2, 1992, pp. 26–28.
K. Spärck Jones and C. van Rijsbergen, Report on the Need for and Provision of an “Ideal” Information Retrieval Test Collection, report 5266, British Library Research and Development, Computer Laboratory, Univ. of Cambridge, 1975.
C. Buckley and E.M. Voorhees, “Retrieval System Evaluation,” TREC: Experiment and Evaluation in Infor mation Retrieval, E.M. Voorhees and D.K. Harman, eds., MIT Press, 2005, chap. 3, pp. 53–75.
C. Buckley and J. Walz, “SMART at TREC-8,” Proc.8th Text Retrieval Conf. (TREC 99), 1999, pp. 577–582.
S. Robertson and J. Callan, “Routing and Filtering,” TREC: Experiment and Evaluation in Information Re trieval, E.M. Voorhees and D.K. Harman, eds., MIT Press, chap. 5, 2005, pp. 99–122.
D. Ferrucci et al., “Building Watson: An Overview of the DeepQA Project,” AI Magazine, vol. 31, no. 3, 2010, pp. 59–79.
C.V. Thornley et al., “The Scholarly Impact of TRECVID (2003–2009),” J. Am. Soc. of Information Sci ence and Technolog y, vol. 62, no. 4, 2011, pp. 613–627.
C.G.M. Snoek et al., “Any Hope for Cross-Domain Concept Detection in Internet Video,” MediaMill TRECVID 2010, www-nlpir.nist.gov/projects/tvpubs/ tv10.slides/mediamill.tv10.slides.pdf.
C.G.M. Snoek and M. Worring, “Concept-based Video Retrieval,” Foundations and Trends in Information Retrieval, vol. 2, no. 4, 2009, pp. 215–322.
J. Oomen et al., “Symbiosis Between the TRECVID Benchmark and Video Libraries at the Netherlands Institute for Sound and Vision,” Int’l J. Digital Libraries, vol. 13, no. 2, 2013, pp. 91–104.
P. Over, “Instance Search, Copy Detection, Semantic Indexing @ TRECVID,” US Nat’l Inst. Standards and Technology, Nov. 2012, www.nist.gov/oles/upload/8-Over_Paul-TRECVID.pdf.
H. Varian, “Why Data Matters,” blog, 4 Mar. 2008, http://googleblog.blogspot.com/2008/03/why-data-matters.html.
RTI Int’l, Economic Impact Assessment of NIST’s Text Retrieval Conf. (TREC) program, 2010, www.nist.gov/director/planning/impact_assessment.cfm.

关于作者

Ellen Voorhees是美国国家标准及技术研究所的一名计算机科学家，她的主要工作职责在于管理TREC项目。她的研究关注于开发和验证合理的评估模式用于度量不同用户研究项目和自然语言处理项目的系统有效性。Voorhees从美国康奈尔大学获得了计算机科学博士学位，她在信息访问上的工作曾获得三个专利；于此同时，她还是西门子公司研究机构（Siemens Corporate Research）的技术成员之一。可以通过以下邮箱联系到Ellen：[email protected]。

Paul Over是美国国家标准及技术研究所的一名计算机科学家，TREC视频检索（TREC VID）的项目领导人。他曾经在NIST中负责过文本检索评估（TREC）中交互文本检索系统的评估，也是文本摘要技术评估中自然语言处理的研究人员。总的说来，他曾发布过多篇关于视频片段、摘要和研究不同话题的文章。他在2011年获得了美国商务部颁发的杰出联邦服务的铜牌。可以通过以下邮箱联系到Paul：[email protected]。

Ian Soboroff是美国国家标准及技术研究所（NIST）检索组的一名计算机科学家和经理。他当前的研究兴趣包括为社会媒体环境和非传统检索项目构建测试集。Soboroff已为大范围的数据和用户任务开发了评估方法和测试集。可以通过以下邮件联系到Ian：[email protected]。

本文最先发布于IT Professional杂志。IT Professional提供了关于当今战略技术问题可靠的、并由同行审评的信息。为了满足运行可靠且灵活企业所面临的挑战，IT经理和技术管理者依赖IT Pro获取最先进的解决方案。

查看英文原文：Building Better Search Engines by Measuring Search Quality

你可能感兴趣的:(通过度量查询质量构建更佳的搜索引擎)

java nonematch_Java 使用anyMatch、allMatch与noneMatch方法 weixin_39680208 java nonematch
Java使用anyMatch、allMatch与noneMatch方法，用户希望确定流中是否有元素匹配Predicate，或全部元素匹配Predicate，或没有元素匹配Predicate。使用java.util.stream.Stream接口定义的anyMatch、allMatch与noneMatch方法，每种方法返回一个布尔值。Java使用anyMatch、allMatch与noneMatch
数据结构学习——KMP算法 uwvwko 算法数据结构学习 c++kmp
//KMP算法#include#include#include#includeusingnamespacestd;//next数组值的推导voidgetNext(string&str,vector&next){intstrlong=str.size();//next数组的0位为0next[0]=0;//i为当前字符的位置，从1位（第2个开始）inti=1;//length为当前字符之前的最长匹配子
数据结构学习——树的储存结构 uwvwko 数据库学习算法树
三种表示法：双亲表示法，孩子表示法，孩子兄弟表示法双亲表示法//树结构——双亲表示法#includeusingnamespacestd;structTree{stringdata;Tree*parent;//双亲指针Tree*firstchild;//第一个孩子指针Tree*nextsibling;//下一个兄弟指针};voidCreateTree(Tree*&root,stringdata,Tr
npm run dev报错突然暴富的我 || 比较富的我 npm 前端 node.js
1.引言1.1什么是npmrundevnpmrundev是一个在Node.js项目中常用的命令，它允许开发者运行一个预定义的脚本，通常用于启动开发服务器或者执行开发环境的构建任务。这个命令是通过package.json文件中的scripts部分定义的，例如："scripts":{"dev":"nodemonapp.js"}在这个例子中，dev脚本使用nodemon工具来监控app.js文件的更改，
前端vue2 报错不是一个函数怎么解决？突然暴富的我 || 比较富的我 vue.js 前端 javascript
检查函数定义确保报错的函数确实在对应的组件或模块中正确定义。函数需要在methods对象中声明，或在混合（mixins）、插件中正确引入。例如：methods:{myFunction(){//函数逻辑}}检查函数调用方式确认函数调用时没有拼写错误，且调用方式正确。在模板中调用需使用@click="myFunction"，在脚本中调用需使用this.myFunction()。注意避免直接调用未绑定的
JavaScript性能优化代码示例突然暴富的我 || 比较富的我 javascript
JavaScript性能优化实战大纲性能优化的核心目标减少加载时间、提升渲染效率、降低内存占用、优化交互响应代码层面的优化实践避免全局变量污染，使用局部变量和模块化开发减少DOM操作频率，批量处理DOM更新使用事件委托替代大量事件监听器优化循环结构，减少不必要的计算使用WebWorkers处理密集型计算任务内存管理策略及时清除不再使用的对象引用避免内存泄漏，注意闭包使用场景使用弱引用（WeakMa
疏通经脉: Bridge 联通逻辑层和渲染层风铃喵游从零搭建小程序框架架构前端小程序架构
本节概述经过前面两节的开发，我们已经完成了小程序逻辑线程和UI线程的启动引擎准备，这节开始，我们将完善nativebridge层的搭建，构建起逻辑线程和UI线程之间的桥梁。开始之前我们先来回顾一下逻辑引擎小节相关的流程图:一次小程序的启动过程，我们在创建好小程序的逻辑引擎worker和绘制引擎webview之后，从启动到渲染依次会经过:通知webview加载小程序资源，如果是首次启动，还需要通知逻
逻辑引擎：执行小程序JS代码风铃喵游从零搭建小程序框架架构小程序前端架构
本节概述上小节我们完成了基础的小程序双线程架构的搭建，我们通过Worker启动了一个逻辑线程用于执行小程序JS代码，使用iFrame创建了一个UI线程，用于渲染小程序的页面；这节开始我们将分别针对双线程的具体逻辑进行实现，本节我们先从逻辑线程入手，看看JS代码是如何在Worker线程内运行的；开始之前，我们先通过一个图来看看小程序启动过程，双线程之间的通信流程:从图上可以看到，小程序的启动分别由逻
基于django+Spark+大数据+爬虫技术的国漫推荐与可视化平台设计和实现(源码+论文+部署讲解等) 阿勇学长大数据项目实战案例 Java精品毕业设计实例 Python数据可视化项目案例大数据 django spark 国漫推荐与可视化平台毕业设计 Java
博主介绍：✌全网粉丝50W+,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等
大模型之提示词工程十指令——结合认知科学与高效学习法的AI协作指南 SEVEN-YEARS 学习人工智能
1.费曼学习法：用“教学”倒逼模型理解复杂概念原理：通过模拟教学场景，迫使模型深入理解知识本质。指令示例：“请用‘小学数学老师’的身份，向孩子解释区块链的基本原理。”输出：“区块链就像一个透明的记账本，每个人都可以看到上面的记录。比如你和同学一起买零食，大家轮流在本子上记录谁买了什么，这样没有人能偷偷修改记录。”应用场景：技术概念简化、跨领域知识迁移、科普内容生成。2.帕累托法则：聚焦关键20%的
无铅压电陶瓷研究进展：技术突破与产业升级路径莱歌数字数字化转型 #职场经验 #结构热设计科技热设计 CAE 散热能源
作者简介：科技自媒体优质创作者个人主页：莱歌数字-CSDN博客公众号：莱歌数字个人微信：yanshanYH211、985硕士，职场15年+从事结构设计、热设计、售前、产品设计、项目管理等工作，涉足消费电子、新能源、医疗设备、制药信息化、核工业等领域涵盖新能源车载与非车载系统、医疗设备软硬件、智能工厂等业务，带领团队进行多个0-1的产品开发，并推广到多个企业客户现场落地实施。专题课程Flotherm
文本生成新纪元：解锁大模型的企业级应用密码
数字化浪潮席卷各行业的当下，文本生成技术正经历着翻天覆地的变革，这场变革的幕后功臣正是大模型。今天，咱们就来深入探讨大模型在文本生成领域的奥秘，看看它如何赋能企业，又该怎样规避风险，实现价值最大化。技术跃迁：从笨拙规则到智能生成回首往昔，文本生成依靠规则模板与关键字替换，虽能实现基础自动化，却如机械舞者，动作生硬、缺乏灵动。业务稍有变动，规则需全面重构，耗时费力。随着N-gram等统计机器学习方法
邮科千兆2光8电工业级交换机在高温环境中的可靠性实践邮科工业交换机定制网络安全
工业物联网场景里，网络设备稳定性关乎生产系统连续性，冶金、能源、交通等高温作业环境，工业交换机需经受75℃以上高温考验。本文以邮科千兆2光8电工业交换机为例，结合测试数据与应用案例，解析其高温环境下技术适配性与可靠性保障机制。一、高温对工业交换机的技术挑战工业现场高温对交换机影响多维。钢铁企业冷轧车间实测，环境温度超60℃，普通商用交换机散热不足，芯片温度飙升至95℃，数据包丢失率从0.03%增至
邮科ODM摄像头高温生存法则
在钢铁冶炼等高温工业场景，监控设备面临光学性能衰减、电子元件失效、材料形变等多重挑战。经过实测，环境温度超60℃，普通摄像头图像噪点激增300%、焦点偏移。本文以邮科ODM摄像头为例，揭示其突破环境限制的逻辑。一、高温对监控设备的复合挑战工业高温环境对监控设备影响呈链式反应。测试中，75℃时摄像头图像传感器暗电流噪声增4倍，夜视画面出现大量绿色噪点，镜头组材料热膨胀系数差异致光学失焦，关键设备读数
软件外包：行业现状、挑战与机遇 MicroTeamers kafka 科技数据分析
在数字化浪潮席卷全球的今天，软件外包已成为企业在信息技术领域发展的重要战略选择。软件外包是指企业将软件项目中的部分或全部工作委托给专业的外部软件服务提供商完成的一种业务模式。这种模式在过去几十年间得到了迅猛发展，其背后有着深刻的经济和技术动因。从行业现状来看，全球软件外包市场规模持续扩大。一方面，对于许多企业，尤其是中小型企业而言，自行组建完整的软件开发团队面临着高昂的人力成本、设备成本以及管理成
领域驱动设计核心解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Dubbo与Zookeeper核心解析 Java开发廖志伟 Java场景面试宝典 Dubbo Service Discovery Distributed Systems
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
【有源码】基于爬虫+python的美食数据分析与可视化flask热门美食推荐系统的设计与实现 Q2643365023 Python 大数据 python 爬虫计算机毕设选题毕业设计源码计算机毕设项目数据分析美食推荐系统
注意：该项目只展示部分功能，如需了解，文末咨询即可。本文目录1.开发环境2系统设计2.1设计背景2.2设计内容3系统展示3.1功能展示视频3.2系统页面4更多推荐5部分功能代码1.开发环境开发语言：Python采用技术：flask、爬虫数据库：MySQL开发环境：PyCharm2系统设计2.1设计背景在现代社会中，人们对美食的兴趣和需求日益增长。互联网和社交媒体的普及使得各种美食信息、评论和推荐变
小程序领域开发语言的基础教程小程序开发2020 小程序开发语言 ai
小程序领域开发语言的基础教程：从0到1轻松入门关键词：小程序开发、WXML、WXSS、JavaScript、双线程模型、生命周期、组件化摘要：本文是针对小程序开发语言的零基础入门指南，通过生活类比、代码示例和实战案例，详细讲解小程序核心开发语言（WXML/WXSS/JavaScript）的原理、协作方式及实际应用。无论你是前端新手还是想转行小程序开发的小白，都能通过本文掌握小程序开发的“三板斧”，
小程序领域H5的性能监控与分析小程序开发2020 CS 小程序 apache 服务器 ai
小程序领域H5的性能监控与分析：让你的"小快灵"跑得更稳更快关键词：小程序H5、性能监控、首屏时间、双线程模型、用户体验优化摘要：当我们在小程序里刷新闻、逛商品详情页时，这些看似"丝滑"的H5页面背后，可能隐藏着白屏卡顿、加载缓慢等"暗礁"。本文将从生活场景出发，用"奶茶店运营"的类比拆解小程序H5性能监控的核心逻辑，带你掌握从指标定义到实战落地的全流程方法，助你成为小程序H5的"性能管家"。背景
利用H5为小程序领域增添新活力小程序开发2020 小程序开发宝典小程序 ai
利用H5为小程序领域增添新活力关键词：H5技术、小程序开发、跨平台架构、WebView通信、动态内容渲染、性能优化、全栈开发摘要：本文深入探讨如何通过HTML5（H5）技术提升小程序开发效率与用户体验。从技术架构对比到核心通信机制，结合具体代码案例解析H5与小程序的深度融合方案。通过WebView嵌入、JSSDK扩展、动态模板渲染等技术手段，实现跨平台代码复用、复杂交互组件开发和实时内容更新。同时
LOGO SEO优化码哥DFS 前端 html css
1.logo里面首先放一个h1标签，目的是为了提权，告诉搜索引擎，这个地方很重要。2.h1里面再放一个链接，可以返回首页的，把logo的背景图片给链接即可。3.为了搜索引擎收录我们，我们链接里面要放文字(网站名称)，但是文字不要显示出来。方法1:text-indent移到盒子外面(text-indent:-9999px),然后overflow:hidden。方法2:直接给font-size:0;就
【C++】— c++入门基础孙同学_ C++c++
1.C++的第一个程序首先C++兼容C语言的大多数语法，所以用C语言实现Helloworld！同样也可以运行。用C语言实现Helloworld！#includeintmain(){printf("Helloworld！\n");return0;}用C++实现Helloworld！#includeusingnamespacestd;intmain(){coutnamespace的作用namespac
HTML5的新特性码哥DFS html5 前端 html
1.视频video支持MP4、ogg、webm格式src:url视频播放地址autoplay:autoplay视频就绪自动播放，谷歌浏览器需要添加muted来解决自动播放问题controls：controls向用户显示播放插件loop：loop循环播放poster:imgural加载等待的画面图片muted:muted静音播放2.音频audio支持MP3、Wav、Ogg格式autoplay:aut
ShardingSphere 架构解析 Java开发廖志伟 Java场景面试宝典 ShardingSphere Distributed Database Database Middleware
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
【零基础学AI】第10讲：线性回归 1989 0基础学AI 人工智能线性回归算法 python 回归 numpy 开源
本节课你将学到理解线性回归的原理和应用场景掌握最小二乘法的基本思想使用Python构建房价预测模型学会评估回归模型的性能指标开始之前环境要求Python3.8+JupyterNotebook或任何PythonIDE需要安装的包pipinstallscikit-learnpandasmatplotlibseabornnumpy前置知识第9讲：机器学习概述基本的Python和数据处理能力核心概念什么是
【零基础学AI】第9讲：机器学习概述 1989 0基础学AI 人工智能机器学习 python numpy devops 开源
本节课你将学到理解什么是机器学习，以及它与传统编程的区别掌握监督学习、无监督学习的基本概念使用scikit-learn完成你的第一个机器学习项目构建一个完整的iris花朵分类器开始之前环境要求Python3.8+JupyterNotebook或任何PythonIDE需要安装的包pipinstallscikit-learnpandasmatplotlibseaborn前置知识基本的Python语法（
YOLOv11: AN OVERVIEW OF THE KEY ARCHITECTURAL ENHANCEMENTS目标检测论文精读（逐段解析）昵称是6硬币 (持续更新)YOLO 深度学习计算机视觉人工智能目标检测图像处理
YOLOv11:ANOVERVIEWOFTHEKEYARCHITECTURALENHANCEMENTS目标检测论文精读（逐段解析）论文地址：https://www.arxiv.org/abs/2410.17725RahimaKhanamandMuhammadHussainUltralytics公司发布CVPR2024论文写的比较简单，比较核心的改进包括：C3K2高效特征提取机制。对C2f模块的改进
python递归实现乘法_算法-递归 weixin_39817012 python递归实现乘法
我们在前面学习过递归函数，递归函数采用的就是递归算法，前面我们通过最常见的菲波那切数列去学习了递归函数，这一节我们再来详细了解一下递归算法。1.递归算法递归算法(英语：recursionalgorithm)在计算机科学中是指一种通过重复将问题分解为同类的子问题而解决问题的方法。递归式方法可以被用于解决很多的计算机科学问题，因此它是计算机科学中十分重要的一个概念，递归算法有三个特点：1)递归的过程一
自然语言处理(NLP)中的文本生成控制技术 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据自然语言处理 easyui 人工智能 ai
自然语言处理(NLP)中的文本生成控制技术关键词：文本生成、可控生成、语言模型、Prompt工程、解码策略、条件控制、评估指标摘要：本文深入探讨自然语言处理中文本生成控制技术的最新进展。我们将从基础概念出发，系统分析各种控制方法的原理和实现，包括Prompt设计、解码策略优化、条件控制机制等核心内容。文章将结合数学模型、算法实现和实际案例，全面展示如何实现高质量、可控的文本生成，并探讨该领域面临的
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交