Ellen M. Voorhees, Paul Over, Ian Soboroff

通过度量查询质量构建更佳的搜索引擎

本文最先发表于IT Professional杂志，现由InfoQ & IEEE Computer Society在此为您呈现。

搜素引擎构建于对真实测试案例标准集的使用，该标准集允许开发人员度量其它替代方法的相对有效性。这篇文章讨论了NIST的文本检索会议（TREC）项目，该项目创建了用于度量查询结果质量的基础架构。

我们总是认为以母语进行的文本文件查询是有保障的，但是像Yahoo、Google和Bing这样的网页搜索引擎并非一天构成，而且网页内容也不是我们需要查询的唯一领域。随着数据变得越来越无处不在，搜索需求也相应地扩大了。人们为了不同的目的（比如：重新定位已知数据项、回答特定问题、学习特定问题、监测数据流、及浏览）在不同媒体（比如：文本、网页、Tweet、语音录音、静态图像和视频）中搜索所需内容。大多数情况下，用于支持这些不同搜索类型的技术还在不断完善中。可搜索技术是如何发展的？搜索引擎开发人员怎么知道哪些可行，又为什么可行呢？

来自大型、多元化搜索社区的参与者对标准的、真实测试中的搜索引擎性能的仔细度量已被证实是至关重要的；通过文本检索会议（TREC）项目，美国国家标准及技术研究所(NIST)在过去四分之一个世纪以来一直通过收集社区评估促进着搜索和与搜索相关技术的发展。

TREC的来源

搜索算法通常通过测试集，即在基准任务上对比各个替代方法而发展起来的。第一个测试集是20世纪60年代从Cranfield学院的一系列关于航空索引语言的实验中获取而来的¹。Cranfield测试集包含一组航空杂志文章摘要、一组针对这些摘要的查询以及每个查询的正确答案要点。从今天的标准看，它可能微不足道，但Cranfield集打破了当时的记录，为信息检索系统创建了第一个共享的度量工具。研究人员可以自己编写搜索引擎来查询所要的摘要，其返回值可以通过对比答案要点来度量。

其它研究组开始遵循由Cranfield测试提出的实验型研究法，生成了其它多个用于70和80年代的测试集。但到了90年代，大家开始对该方法越来越不满意。尽管有些研究组使用了相同的测试集，但在以下几方面却各持己见：是否使用相同数据，是否使用相同评估度量，是否跨查询系统对比结果。商业搜索引擎公司并未将从查询系统中取得的研究结果整合到他们的产品中，因为在当时他们觉得研究界所用的测试集太小了，并不值得借用。

面对这一不满，NIST被要求构建一个大型的用于评估文本检索技术的测试集，在当时该技术已发展为美国国防部高级研究计划局（DARPA）Tipster项目²的一部分。NIST同意以研讨会形式来构建大型测试集，同时也支持关于测试集使用方面等更大问题的检测。该研讨会就是1992年举行的第一次TREC会议，此后每年都举办一次TREC会议。TREC在早期就完成了构建大型测试集的最初目标；事实上到目前为止，TREC已经构建了几十个正被整个国际研究界使用的测试集。TREC更大的成就是对研究范例的建立和验证，并在此后的每年都继续将其拓展到新任务和应用程序的具体内容中去。

社区评估

该研究范例以基于社区的评估为中心，称为“合作竞争（coopetitions）”，这一新词强调了竞争者间的合作，从而创造出更大的利益。

该范式的主要元素是评估任务，通常情况下，它是一个用户任务抽象，明确定义了我们对系统的期望。与评估项目相关联的是一或多个度量，它们在反映了系统的响应质量的同时，也是所有基础架构用来计算可构建度量标准的手段。其评估方法揽括了任务、度量、以及对度量分数有效解释的声明。一个标准的评估方法允许横跨不同系统间进行结果比较，这就是检索竞赛无获奖者为什么这么重要了；相对于其他研究组所能解决的，它促进了更广泛类型研究成果的整合。

谈到范式的具体实例，我们可以考虑第一个TREC中的主要ad hoc项目，该项目拓展了当时的Cranfield方法。该ad hoc评估项目还检索了相关文档（更确切地说，创建了一个文档列表将所有相关文档罗列于无关文档之前），然后给出一个文档集和称为话题的对信息需求自然语言的声明。该检索输出以准确率（检索出的相关文档数与检索出的文档总数的比率）和召回率（检索出的相关文档数和文档库中所有相关文档数的比率）为指标，为每个已知话题（换句话说，就是答案要点）提供相关文档集。TREC的创新在于利用pooling³为大型文档集构建相关集合。

该pool是所有参与系统对给定话题的检索而查询出来的前X个文档的集合。只有来自话题pool中的文件才会被人工评审员采用并鉴定其相关性，其它的文档则与有效性评分的计算无关。尽管只参照了整个测试集中的一小部分，但是随后的测试证明在TREC中执行的pooling在文档集中所发现的文档绝大部分都是相关的。另外，该测试进一步验证了在通常情况下，这些在测试集上获得更高分数、构建于pooling上的检索系统往往比那些分数较低的系统在实际应用中更有效⁴。同时该测试也暴露了通过计算测试集所得分数只有有限的有效应用。因为分数的绝对值由多种因素决定，而非仅仅是检索系统（比如：使用不同人工评审员通常对分数会有一定的影响）。只有比较其它系统在完全相同测试集上计算出的分数才有效。这就意味着对比不同年度的TREC分数是无效的，因为每个TREC构建的测试集都是新的（不同的）。想让pooling成为有效的策略，在pool中拥有类型广泛的检索方法起着非常必要的作用。因此，TREC的社区因素 — 使用了多种检索方法用于检索不同文档集 — 是创建良好测试集的重要因素。社区因素同时也是TREC在其它方面成功的重要因素。TREC只有在所有检索方法都呈现时，才能检验当前的技术。一年一度的TREC会议不仅促进了不同研究组间，而且还促进不同研究开发组织间的技术交流。该年度会议还为解决方法论方面的问题提供了有效的机制。最后，社区成员往往是新项目数据和用例的来源。

在TREC开始之初，大家还怀疑这个构建于实验室的统计系统（相对于在手动索引集合上使用布尔搜索的操作系统）是否能真正有效地从大型集合中检索出文档来。TREC中的ad hoc项目证明了90年代初的搜索引擎不仅确实拓展到了大型集合范畴，也不断得到了改进。其有效性无论在TREC测试集实验室中，还是在当下集合了该技术的操作系统中都得到了证明。此外，该技术现在所应用的测试集要比当初在1992年设想的大得多。网页搜索引擎是统计技术能力最好的例子。搜索引擎为用户带来他们想要的查询信息的能力已经成为网站成功的基础。正如之前所说的，搜索有效性的改进并不能简单地由每年的TREC分数来判断。然而，SMART搜索系统开发人员会将每八个他们曾经使用过的TREC ad hoc项目冻结起来，并保存系统副本⁵。每个TREC后，他们会在每个系统上执行所有测试集。针对每个测试集，新版SMART系统总是比旧版的更有效，而且分数也比旧版的大概要高出一倍。尽管该证据只能证实一个系统，但在每个TREC中，SMART系统结果始终追踪其它系统的结果，因此SMART结果完全可以代表当前技术水平。

发展分支

尽管TREC的最初意图只是简单地为ad hoc检索构建一两个大型测试集，以及关于pooling方法论方面的问题的探索；但很快ad hoc项目就明显展露出可在多个方面调整发展的特性。从不同方向衍生出来的新项目都与经典项目息息相关，但又不同到足以要求评估方法论作出一定的变化。因此TREC引进了Track项目，从而每个给定的TREC都包含了多个检索子项目，每个子项目又是自身评估挑战的焦点。图1显示不同年度TREC所执行的Track项目，根据维度将Track项目分组从而将它们区分开来。Track项目位于下图的左边，展示了TREC所解决问题的宽度，而位于右边的单独Track项目则显示了项目在给定问题领域中的进展。

（点击图片放大）

图1. 文本检索会议（TREC）Track项目及它们的所属年份。Track项目名字位于右边，位于左边的则是Track项目关注的。空框所代表的Track项目是被分离出来成为一种评估方式用于运行当年的Track项目。颜色相同的Track项目则彼此密切相关。

现在，每个TREC会包含七或八个经常变换的track项目以保持新鲜度，及支持新的社区。多个TREC track项目已经是自己领域的首个大规模评估。在这种情况下，Track项目已经建立了相应的研究社区，并创建了首个用于支持其研究领域的特定测试集。有几个Track项目已经从TREC中分离出来，感兴趣的社区建立了自己的评估会议。比如：评估论坛会议和实验室（the Conference and Labs of the Evaluation Forum, CLEF）就于2000年从TREC中脱离出来，在欧洲拓展了关于跨语言检索的评估，此后它不断扩大，不仅包含了多语言，也涵盖了多模式（文本、图像和视频）信息。其它会议尽管没有从TREC中直接分离开来，却受到TREC的启发，将方法论拓展到其它领域。其中包括NII测试基地和信息访问研究社区（NII Testbeds and Community for Information Access Research）（NTCIR，research.nii.ac.jp/ntcir）关注了中文、日文和韩文文本；XML检索评估倡议（INEX, inex.mmci.uni-saarland.de）；以及信息检索评估论坛（Forum for Information Retrieval Evaluation，FIRE）关注了印度次大陆的语言。

由于空间上的局限性，我们无法为每个TREC Track项目展开哪怕是粗略的讨论。因此我们抽样强调以下一些Track项目 — 过滤、问题解答和法律电子取证 — 它们从某种程度上部分解决了这些特别紧迫的搜索问题，其中还有视频检索Track项目，由于数字视频日益普及，它已发展出自己的NIST研讨会系列：TRECVID。

过滤

TREC的最初几年仅有Ad hoc和routing两个项目。Routing项目用于模拟用户监控文件流、选择相关文档及忽略无关文档。在TREC-4中，routing演变为过滤 — 一个更为复杂，却更真实的场景。正如电子邮件过滤系统实时处理传入的邮件流以删除垃圾邮件和执行归档规则一样，信息过滤系统处理传入的文件流，然后根据用户对之前交付文档的回馈而建立的用户兴趣模型配置文件，决定是否要将这些信息发送给用户⁶。

鉴于routing评估项目允许系统以批处理的集合形式处理所有文件，该过滤评估项目要求系统在文档到达文件流时就处理，并采用在线用户模型。如果系统选择显示文档给用户，还附有对该文件相关度的评价，那么该系统就被赋予了评估（模拟实时用户的回馈）。系统就可以根据这些信息进行及时的自我调整。如果系统决定不将这些文档显示给用户，那就是缺失了相关信息。过滤系统的有效性通过使用实用模型，一个基于返回相关文件数、并根据其返回的不相关文档数而被减分的系统。

过滤Track项目让与会者更好地理解过滤项目的执行难度。在实用模型中，系统因返回不相关信息而受处罚。如同现实生活一样，在过滤track集合时，在数以百万计的文档流中往往只有一小部分文档是相关的。因此，一些精明的系统会因为从未返回任何文档而得分很高 — 换句话说，它们决定不冒风险去浪费使用者的时间。由于系统在数据流初期只有少量培训数据，其初始性能往往比较差。为了完善该用户模型，系统必须给用户提供很多有希望却最终无关的文档。

该系统必须能够从反馈的原始成本中恢复，这些反馈经历了从执行特别好很快到分数特别好这一过程。

问题解答

尽管主题相关的文档列表毫无疑问是有益的，其本身所提供的信息就多于用户想要检测的。TREC问题-解答Track项目于1999年引入，主要关注返回问题确切答案这一类问题。最初的问题解答Track项目关注事实型问题 — 即那些答案短且基于事实的问题，比如：“泰姬陵在哪里？”随后，Track项目又引入更为复杂的问题类型，如：列表问题（其答案是所请求类型实例的不同集合。比如：“有哪些演员曾在《屋顶上的小提琴手（Fiddler on the Roof）》这部电影中扮演过Tevye这一角色？”）；以及定义型或传记型问题（比如：“什么是黄金降落伞？”或“谁是弗拉德三世（Vlad the Impaler）？”）。

问题解答Track项目是开放域问题解答系统的首个大型评估，而且利用了从其它TREC观察而获得的测试集评估优势来处理问题解答项目。该Track为检索和自然语言处理研究社区建立了通用项目，带来了问题解答研究的复兴。由于研究人员将复杂语言处理结合到问题解答系统中，该研究潮流在自然语言自动理解上实现了显著的进步。比如：Watson，IBM的Jeopardy-playing电脑系统，TREC问题解答Track项目中就有该公司曾参与的原型⁷。

电子取证

法律Track项目始于2006年，专门关注电子取证问题，电子存储信息的有效生产是诉讼和监管设置的证据。当今组织更多地依赖电子记录，而非纸质记录。但相应数据量及其潜在的短暂本质已使传统司法发现流程和实践不堪重负。因此我们需要新的处理电子数据的发现实践。当该Track任务开始时，涉及的诉讼双方通常会讨论出一个布尔表达式用来定义发现结果集。然后再由人工检查每个检索文档，从而判定发现请求的响应能力。该Track的目的在于评估该基线方法和发现的其它查询技术的有效性。该Track使用了假设的投诉和相应的请求来生成由执业律师开发出作为主题的文档。指定的“主题权威”扮演了某案件中首席律师的角色，陈述关于具体是什么让文档响应请求的总体战略和指导方针。特定文档的相关性判断由法律专业人士来评估，他们会更根据自身的典型工作实践来审查文档。

该Track项目对法律社区有着重大的影响，其中包括司法意见中的引文（见en.wikipedia.org/wiki/Paul_W._Grimm）。它的主要成果就是引发实时对话，该对话通过对迭代流程的展示指出应该完成哪个电子发现，这个迭代查询会包含一个人工到查询循环中，其效力往往优于一次性检索。在信息检索这方面，Track在标准测试集评估方法上表现出了不足。为了方便稳定的评估，尤其当使用pooling中构建的测试集时，标准方法所依赖的平均有效性是从一组每个主题只有一小部分相关文档的主题中获取的。但是当返回文档数量很大时，电子发现中的真实案例则从单个响应集中衡量其有效性。

视频

虽然不属于TREC研讨会范畴，但依然属于NIST，TRECVID从它出现于TREC Track项目中以来，已经以多种形式发展起来（请看图2）。TRECVID创建于2001年，将TREC/Cranfield理念扩展到基于具体内容的视频分析和检索。两年后，TRECVID成立了独立的系列研讨会，并开始了使用电视广播新闻（英文、中文和阿拉伯语）及4年为一周期的循环，还将测试数据从50小时增加三倍到了150小时。系统任务包含使用多媒体主题的查询，高层次特征提取，拍摄和传记边界确定，和相机运动检测。

2007年开始了以3年为周期的循环，采用来自荷兰声音和视觉研究所（Netherlands Institute for Sound and Vision）的教育和文化节目。测试数据也在2009年增加到280小时。针对BBC工作样品（未经编辑的节目素材）添加了一个综述任务，针对由英国内政部（UK Home Office）提供的机场监控录像添加了事件监测任务。从2010年开始，TRECVID就开始关注不同的、通常非专业的网络视频，这些由不同社区捐献的视频在数量上从几百到几千小时不等，在拓展了研究和功能/时间检测任务的同时，也往评估中添加了已知事项和实例查询（见图2a）。

TRECVID研究人员已经为全球科学同行在对艺术状态的判断上做出了显著的贡献。2009年，由都柏林城市大学的图书馆学家进行的文献计量学研究发现TRECVID参与者在2003年和2009年间生成了310个（未经审阅的）研讨会文章，与此同时，还生成了2073篇同行评审期刊文章和会议论文⁸。

尽管测试数据的变化导致我们难以度量系统的改进，但阿姆斯特丹大学的MediaMill团队在2010年进行的实验证实了，过去三年里特征检测有了三倍的改善 — 这对一个系统来说，已经是TRECVID中表现最佳的执行者⁹。2010年和2011年的检测测试数据是相同的，但测试查询（11，256）却是随机创建的，这允许了系统间的比较。顶级团队在检测和定位上2011年的平均分数要比2010年好。

TRECVID研讨会系列汇集了来自多元化社区自我资助的研究人员，在多个领域激发起有趣工作的任务深深地吸引着他们。与此同时，研究人员也被数据和计分流程的可用性所吸引，因为这些允许他们关注研究任务，而非基础架构。与此同时，他们还被科学比较的开放论坛所吸引。来自世界各地能参与到竞赛项目中的团队数量也在增长，新的顶级执行者也不断出现。越来越多的知识分子将注意力放到了持久性问题上，比如：从视频中提取有意义的信息，只能从长远角度才有增加进展的可能性。

（点击图片放大）

图2. TRECVID在（a）数据、项目和（b）参与者方面的演变。TRECVID中使用的数字视频包括广播新闻报道、未经编辑的电视节目素材、监控录像和非专业互联网视频。不同数据类型支持不同的项目，比如：传统的ad hoc查询，复制检测和视频序列中特定活动模式的识别。TRECVID程序中文档的作者数量是TRECVID参与宽度的一个度量。

在其作为独立研讨会系列的头三年，TRECVID社区发展迅速，申请量从20组增加三倍到了60组，其中有40组至少完成了一个项目。从2007到2009，申请增加到100组左右，其中有60组已组队完成，社区参与还以该水平持续发展到现在。对研讨会文档合著者的粗略计算显示了大概有400名研究人员参与到每年的TRECVID实验中（见图2b）。虽然学术团队占据了主导地位，商业研究实验室却一直是组合的一部分。欧洲和亚洲的地区参与者最多，北美则紧随其后。

TRECVID社区所贡献的不仅限于研究。他们还为评估基础架构贡献了各种关键部分，其中包括地面实况注释系统和判断、镜头分割、自动语音识别、评估软件、数据托管和训练有素的的探测器。如果没有这种合作，TRECVID是无法实现的。

以下是从2009年信息检索中基础和趋势¹⁰（Foundations and Trends in Information Retrieval）的一篇评论文章中找到的结论：

由于TRECVID在领域中广泛的接受度，从而获得了大量国际团队的参与，他们来自大学、研究机构和企业研究实验室。TRECVID基准可作为实际标准用来评估基于概念的视频搜索研究的性能。实际上该基准已经在视频搜索社区产生了巨大的影响，生成了大量的视频检索系统和出版物汇报了TRECVID中进行的实验。

包括利用多媒体搜索主题的创新自动决定将镜头作为检索的基本单元（允许有效地判断系统的输出），将平均精度应用程序作为视频查询和概念检测有效性的度量，采用基于成本的度量用于拷贝检测，及使用实用方法评估简单总结。

跨研究团队技术转换发生于TRECVID和更广泛的视频分析社区内。用于某年某系统中的方法通常会在下一年被其它系统做出一定修改后采用。由于实验室是通过原型系统练习的，因此TRECVID结果往往具有指导性，而非结论性。随着算法反复证明自己可以是多种系统的一部分，并能解决不断变化的测试数据，特定方法的可信证据逐步增多。相当数量的工程在某种情况下，需要做可用性测试以将实验室内的成功实例应用到现实世界的应用程序中。

荷兰声音和视觉研究所，是TRECVID主要的数据和用例捐赠者之一，是TRECVID记录在案、允许其加入大范围的研究者社区以低成本在他们自己的数据上探索他们所感兴趣的项目。与附近另一个TRECVID参与者（阿姆斯特丹大学）在所需的工程设计和用户测试从原型到可运行系统的转换上有更密切的合作，使得有前景的技术得到了更进一步的探讨¹¹。

过渡到现实世界运用的一个具体例子是荷兰一个公司对功能/概念探测器的开发和授权，它们将被集成到软件工具中允许警方搜索非法材料中应被没收的视频¹²。

向前迈进

TREC在常见问题集上所采用的评估竞争技术方法已被证明是提高当前技术及加速技术转移的一种强有力的方式。Google的首席经济学家Hal Varian曾在其Google博客2008年的一篇博文¹³中这样描述TREC的影响：

TREC在信息检索上对数据恢复的研究所具有的标准性、广泛可用性和精心构建的数据集为本领域进一步创新奠定了基础。一年一度的TREC会议促进了合作、创新和程度可控的竞争（当然还有吹牛的权利），从而引导了更好的信息检索。

NIST委员会RTI国际展开了对TREC影响更详细的研究¹⁴。在数量方面，该研究估算出在TREC上所投资的每一美元，信息检索研究人员能得到的累积回报利润在3到5美元之间。该项研究还列举了各种定性收益，总结起来其中一部分包括以下这些：

TREC活动同时还有其它好处，只是并不属于经济范畴。TREC帮助教育研究生和本科生，其中有一些还去领导IR公司，其它一些留在学术界教书和进行研究。TREC使得IR产品质量和可用性得到了提升 — 我们的研究显示TREC促进了IR研究大范围的拓展，从而带来了高质量的应用程序，比如：网页搜索，企业搜索和领域特定搜索产品和服务（例如：基因组分析）。更具体地说，该研究估算出从1999年到2009年间所观察到的网页搜索产品超过200%的提升中大约有三分之一是由于TREC的存在而带来的。

尽管有了这样的成功，我们依然有很多工作需要去做。虽然内容存储变得越来越大了，电脑依然无法真正理解由人类运用而产生的内容。

在可预见的将来TREC和TRECVID研讨会还会继续，关注于搜索研究社区和更广泛用户社区上具有重大影响的问题的搜索研究。

TREC网页1和2有关于TREC的丰富资料，其中包括每个研讨会的完整流程和关于如何获取测试集的详情。每个冬季想要参与的组织可以通过响应号召邀请参与到TREC中。

声明

某些商业实体、设备或材料可能会在本文中被识别出用于充分描述实验型流程或概念。这种识别的目的并不在于暗示他们被美国国家标准及技术研究所推荐或认可，也不在于暗示某些实体、材料或设备是解决问题的最好工具。

参考资料

C.W. Cleverdon, “The Cranfield Tests on Index Language Devices,” Aslib Proc., vol. 19, no. 6, 1967, pp. 173–192. (Reprinted in Readings in Information Re trieval, K. Spärck-Jones and P. Willett, eds., Morgan Kaufmann, 1997.)
D. Harman, “The DARPA TIPSTER Project,” ACM SIGIR Forum, vol. 26, no. 2, 1992, pp. 26–28.
K. Spärck Jones and C. van Rijsbergen, Report on the Need for and Provision of an “Ideal” Information Retrieval Test Collection, report 5266, British Library Research and Development, Computer Laboratory, Univ. of Cambridge, 1975.
C. Buckley and E.M. Voorhees, “Retrieval System Evaluation,” TREC: Experiment and Evaluation in Infor mation Retrieval, E.M. Voorhees and D.K. Harman, eds., MIT Press, 2005, chap. 3, pp. 53–75.
C. Buckley and J. Walz, “SMART at TREC-8,” Proc.8th Text Retrieval Conf. (TREC 99), 1999, pp. 577–582.
S. Robertson and J. Callan, “Routing and Filtering,” TREC: Experiment and Evaluation in Information Re trieval, E.M. Voorhees and D.K. Harman, eds., MIT Press, chap. 5, 2005, pp. 99–122.
D. Ferrucci et al., “Building Watson: An Overview of the DeepQA Project,” AI Magazine, vol. 31, no. 3, 2010, pp. 59–79.
C.V. Thornley et al., “The Scholarly Impact of TRECVID (2003–2009),” J. Am. Soc. of Information Sci ence and Technolog y, vol. 62, no. 4, 2011, pp. 613–627.
C.G.M. Snoek et al., “Any Hope for Cross-Domain Concept Detection in Internet Video,” MediaMill TRECVID 2010, www-nlpir.nist.gov/projects/tvpubs/ tv10.slides/mediamill.tv10.slides.pdf.
C.G.M. Snoek and M. Worring, “Concept-based Video Retrieval,” Foundations and Trends in Information Retrieval, vol. 2, no. 4, 2009, pp. 215–322.
J. Oomen et al., “Symbiosis Between the TRECVID Benchmark and Video Libraries at the Netherlands Institute for Sound and Vision,” Int’l J. Digital Libraries, vol. 13, no. 2, 2013, pp. 91–104.
P. Over, “Instance Search, Copy Detection, Semantic Indexing @ TRECVID,” US Nat’l Inst. Standards and Technology, Nov. 2012, www.nist.gov/oles/upload/8-Over_Paul-TRECVID.pdf.
H. Varian, “Why Data Matters,” blog, 4 Mar. 2008, http://googleblog.blogspot.com/2008/03/why-data-matters.html.
RTI Int’l, Economic Impact Assessment of NIST’s Text Retrieval Conf. (TREC) program, 2010, www.nist.gov/director/planning/impact_assessment.cfm.

关于作者

Ellen Voorhees是美国国家标准及技术研究所的一名计算机科学家，她的主要工作职责在于管理TREC项目。她的研究关注于开发和验证合理的评估模式用于度量不同用户研究项目和自然语言处理项目的系统有效性。Voorhees从美国康奈尔大学获得了计算机科学博士学位，她在信息访问上的工作曾获得三个专利；于此同时，她还是西门子公司研究机构（Siemens Corporate Research）的技术成员之一。可以通过以下邮箱联系到Ellen：ellen.voorhees@nist.gov。

Paul Over是美国国家标准及技术研究所的一名计算机科学家，TREC视频检索（TREC VID）的项目领导人。他曾经在NIST中负责过文本检索评估（TREC）中交互文本检索系统的评估，也是文本摘要技术评估中自然语言处理的研究人员。总的说来，他曾发布过多篇关于视频片段、摘要和研究不同话题的文章。他在2011年获得了美国商务部颁发的杰出联邦服务的铜牌。可以通过以下邮箱联系到Paul：over@nist.gov。

Ian Soboroff是美国国家标准及技术研究所（NIST）检索组的一名计算机科学家和经理。他当前的研究兴趣包括为社会媒体环境和非传统检索项目构建测试集。Soboroff已为大范围的数据和用户任务开发了评估方法和测试集。可以通过以下邮件联系到Ian：ian.soboroff@nist.gov。

本文最先发布于IT Professional杂志。IT Professional提供了关于当今战略技术问题可靠的、并由同行审评的信息。为了满足运行可靠且灵活企业所面临的挑战，IT经理和技术管理者依赖IT Pro获取最先进的解决方案。

查看英文原文：Building Better Search Engines by Measuring Search Quality

你可能感兴趣的:(通过度量查询质量构建更佳的搜索引擎)

代码的蝴蝶效应：库博代码变更影响分析工具实战审计侠库博变更影响分析工具安全 Java java 开发语言
“你刚才提交的代码炸了我们整个系统！”当你信心满满地改了几行底层逻辑，推送上线之后，运维同事满脸问号、测试同事直接报警、老板也在群里问：“谁动了生产环境？”如果你经历过类似场景，那你一定知道——代码变更的影响，远比你想象得要大得多。为什么你需要代码变更影响分析工具？在当前敏捷开发与高频部署的模式下，我们面对着：频繁的版本迭代复杂的跨模块依赖关系多人协作带来的修改交叉重构与技术债还款并行一处API签
[王阳明代数讲义]语言模型核心代码调研花间流风明明德数域王船山熵群与王阳明代数琴语言学习编程实战100讲语言模型矩阵模型情感分析几何学
语言模型核心代码调研基于Consciciteation‌的才气张量持续思考综述将文本生成建模为才气张量网络扩散过程，实现非自回归推理通过才气张量的群-拓扑流形交叉注意力实现多模态推理，将输入压缩到低维空间持续迭代提出「条件计算提前终止」机制，允许模型在不同维度才气张量标架深度输出基于Conscicritsis发展才气孢子动态计算架构综述引入循环深度机制，突破传统Transformer的固定层数限制
平衡二叉搜索树的全面指南：AVL树、红黑树及其扩展一键难忘算法数据结构数据库架构
平衡二叉搜索树（BST）的实现及其应用引言在计算机科学中，数据结构的选择对算法的效率和程序的性能有着直接的影响。二叉搜索树（BST）是一种常用的数据结构，用于动态存储数据和实现高效的查找操作。然而，普通的二叉搜索树在插入和删除操作后可能会变得不平衡，从而导致最坏情况下的操作时间复杂度退化到O(n)。为了解决这个问题，平衡二叉搜索树应运而生。本文将介绍几种常见的平衡二叉搜索树的实现，包括AVL树和红
告别混乱与重装烦恼，一款Windows 软件管理神器！一只会飞的旺旺经验分享
这篇文章写给谁看？✍️•所有Windows用户，特别是：•经常需要安装、配置开发工具的开发者、程序员‍。•厌倦了每次重装系统都要手动下载、安装、点“下一步”的每一个人。•希望电脑保持干净整洁，告别混乱的安装目录和注册表残留的效率追求者✨。•无论是电脑小白还是老司机，都能轻松上手！•为了方便复制代码,可以前往https://www.wangwangit.com预计阅读+实践时间：⏱️30-60分钟(
电子书搜索全攻略一只会飞的旺旺 ai 人工智能 gpt-3
在这个信息爆炸的时代,电子书已经成为了我们学习和娱乐的重要来源。但是,如何找到心仪的电子书呢?今天,我就为大家带来一份电子书搜索的宝藏清单,这里有你想要的一切!1.共享计划(镜像.导航站)https://zlib.pro/(Zlibray助手.镜像检测.共享账号)https://tool.ssdown.org/(zhelpersearch配置小工具)https://ssdown.org/(易书计划
Django类视图CBV 遮天华月 django
类视图（Class-BasedViews，简称CBV）是Django中构建视图的一种强大且灵活的方式。相比于函数视图（Function-BasedViews，FBV），类视图提供了更好的可复用性和可扩展性，尤其在处理复杂逻辑和大型项目时尤为有用。本文将详细讲解Django中的类视图，包括内置类视图、自定义类视图的设计，以及如何在DjangoRESTframework中使用类视图。文章目录1.类视图
Django类视图天主极乐大帝 Django
在之前的学习当中，我们使用函数作为处理请求的视图，直接、明了。但是，django只给GET和POST提供了快速的请求数据接收的方法，对于其他方法没有详细的介绍，于是在后来引进了视图类的概念。1、导入视图类的父类，编写视图类fromdjango.viewsimportView#导入视图类的父类，编写视图类classUserView(View):defget(self,request):returnH
【BZOJ】1419 Red is good weixin_34129696
【算法】期望DP【题解】其实把状态表示出来就是很简单的期望DP。f[i][j]表示i张红牌，j张黑牌的期望。i=0时，f[0][j]=0。j=0时，f[i][0]=i。f[i][j]=max(0,i/(i+j)*(f[i-1][j]+1)+j/(i+j)*(f[i][j-1]-1))。直接使用期望定义式E(X)=Σpi*xi不四舍五入就是在后一位-5。空间限制必须用递推+滚动数组。#include
Win10 C盘空间不足清理方法 topfine windows
当Windows10系统的C盘空间不足时，可以采取以下方法进行清理：1.清理临时文件打开“设置”>“系统”>“存储”。点击“临时文件”，勾选要删除的临时文件、系统缓存等，然后点击“删除文件”。2.使用磁盘清理工具右键点击C盘，选择“属性”。点击“磁盘清理”，选择要清理的文件类型（如临时文件、回收站等），点击“确定”并确认删除。3.卸载不常用的程序打开“控制面板”>“程序”>“程序和功能”。卸载不再
还在困惑机器学习怎么学？这几条超实用学习路径和技巧速来掌握小焱写作机器学习
还在困惑机器学习怎么学？这几条超实用学习路径和技巧速来掌握在科技浪潮汹涌澎湃的当下，机器学习宛如一颗璀璨的明星，照亮了众多领域的发展道路。从智能医疗中精准的疾病诊断，到金融领域里精细的风险评估；从自动驾驶汽车对复杂路况的巧妙应对，到电商平台上个性化的商品推荐，机器学习的身影无处不在。然而，对于许多渴望踏入这一领域的学习者来说，机器学习那复杂的理论和繁多的算法就像一座难以翻越的大山，让他们感到困惑和
《用 Python 和 Turtle 库实现 2048 游戏的代码》 shi_muzi Python 前端 python python游戏游戏2048
《用Python和Turtle库实现2048游戏的代码》一、引言2048游戏是一款广受欢迎的益智游戏，玩家通过滑动方块，将相同数字的方块合并，目标是合成2048这个数字。本文将对使用Python的Turtle库实现2048游戏的代码进行详细解读。二、代码总体结构代码主要分为三个类：BackGround、Block和Game，分别负责游戏背景的绘制、方块的表示和游戏逻辑的实现。同时，在if__nam
基于大语言模型的自动化单元测试生成系统及测试套件评估方法行动π技术博客语言模型自动化单元测试
ASystemforAutomatedUnitTestGenerationUsingLargeLanguageModelsandAssessmentofGeneratedTestSuites翻译于上述论文基于大语言模型的自动化单元测试生成系统及测试套件评估方法摘要单元测试是软件测试生命周期中最基础的测试层级，对确保软件正确性至关重要。设计和创建单元测试是一个成本高昂且劳动密集型的过程，非常适合进行
C++ 多线程：std::promise 丁金金_chihiro_修行 C++多线程 c++开发语言
C++多线程09：std::promise文章目录C++多线程09：std::promise概念默认构造函数带分配器的构造函数移动构造函数移动赋值操作符swap成员函数析构函数get_future成员函数set_value成员函数set_value_at_thread_exit成员函数set_exception成员函数set_exception_at_thread_exit成员函数从未设值存储自定
条件数学期望是数学系的小孩儿控制数学概率论
条件数学期望是概率论中的一个重要概念，它描述了在给定某些信息（即一个或多个其他随机变量的值）的条件下，一个随机变量的期望值。以下是条件数学期望的一些关键点：定义：设(Ω,F,P)(\Omega,\mathscr{F},P)(Ω,F,P)是概率空间，ξ\xiξ是定义在此概率空间上的随机变量，C\mathscr{C}C是F\mathscr{F}F的一个子σ−σ-σ−代数。ξ\xiξ关于C\mathsc
Python--Django--说明 Missing Sunshine Python-Django python django
Django是基于python的Web开发框架.&nsbp; Web开发指的是开发基于B/S架构,通过前后端的配合,将后台服务器上的数据在浏览器上展现给前台用户的应用.&nsbp; 在早期,没有Web框架的时候,使用PythonCGI脚本显示数据库中的数据. Web框架致力于解决一些共同的问题,为Web应用提供通用的架构,让用户专注于网站应用业务逻辑的开发,而无需处理网络应用底层的协议,线程
Django--admin 后台管理站点 Missing Sunshine Python-Django django 后台管理站点
Django最大的优点之一，就是体贴的提供了一个基于项目model创建的一个后台管理站点admin。这个界面只给站点管理员使用，并不对大众开放。虽然admin的界面可能不是那么美观，功能不是那么强大，内容不一定符合你的要求，但是它是免费的、现成的，并且还是可定制的，有完善的帮助文档.如果对admin的界面美观有切实需求，可以尝试使用simpleui库，不要用xadmin.创建管理员用户首先，我们需
华为OD机试 2025A卷 - 农场施肥(100分) 无限码力华为OD机考真题刷题笔记华为od 华为OD机考2025A卷真题华为OD2025A卷真题华为OD机试2025A卷真题算法
农场施肥真题目录:点击去查看2025A卷100分题型题目描述某农场主管理了一大片果园，fields[i]表示不同果林的面积，单位：m^2，现在要为所有的果林施肥且必须在n天之内完成，否则影响收成。小布是果林的工作人员，他每次选择一片果林进行施肥，且一片果林施肥完后当天不再进行施肥作业。假设施肥机的能效为k，单位：m^2/day，请问至少租赁能效k为多少的施肥机才能确保不影响收成？如果无法完成施肥任
重构之去除多余的if-else DKPT #Java面试题 java 学习笔记开发语言面试
一、提前返回（GuardClauses）适用场景：当else块仅用于处理异常或边界条件时。优化前：if(isValid){doSomething();}else{return;}优化后：if(!isValid)return;//提前处理异常，主流程保持简洁doSomething();优势：减少嵌套层级，逻辑更线性化。二、使用枚举（Enum）适用场景：多分支状态映射（如状态码、配置值）。示例：//优
FastAPI：现代高性能Python Web框架的技术解析与实践指南源滚滚编程 python fastapi python 前端
一、FastAPI的诞生背景与技术定位在数字化转型的浪潮中，API（应用程序接口）作为连接服务与数据的核心枢纽，其性能与开发效率直接影响业务迭代速度。传统Python框架如Django和Flask虽功能丰富，但在高并发场景下面临性能瓶颈，且缺乏对异步编程的原生支持。FastAPI应运而生，融合了Python类型提示、Starlette异步框架与Pydantic数据模型验证，成为构建现代化API的首
Day10 【基于LSTM实现自回归语言模型文本续写任务】 Mechanotrooper 自然语言处理 #文本生成 lstm 语言模型
基于LSTM实现文本续写任务目标数据准备程序说明定义模型结构前向传播构建词表加载语料构建训练样本构建数据集训练模型文本续写困惑度计算训练过程展示目标本文基于给定的词表，将输入的文本以字符分割为若干个词，然后基于词表将词初步序列化作为训练网络的输入序列，将词后面一个词在词表中的序号作为输入标签，取连续序列文本片段长度作为输入序列的长度。之后经过Embedding、LSTM等网络层。因为生成的词是词表
极限压测第3小时：手撕红黑树卡壳，P7考官追问CAS底层实现搞Java的小码农 Java面试场景题 Java面试高并发红黑树 CAS 线程安全
面试场景：互联网大厂Java面试场景设定在一个昏暗的会议室里，面试官李工端坐在桌子后面，面前放着一台笔记本电脑和一张白纸。他穿着一身休闲西装，看起来既严肃又不失亲和力。对面坐着的是应届生小兰，她穿着简单的牛仔裤和白T恤，手里拿着一支马克笔，表情紧张但带着一丝自信。第一轮提问（基础能力）李工（面试官）：小兰同学，你之前提到你的项目中使用了SpringBoot，能简单介绍一下SpringBoot的核心
Django类视图和函数视图 python_136 Django从入门到精通 django python 后端
在Django框架中，视图是负责生成响应给Web请求的函数或类。Django提供了两种主要的视图实现方式：基于函数的视图（也称为视图函数）和基于类的视图（类视图）。以下是它们之间的主要区别：视图函数（Function-BasedViews）定义：视图函数是普通的Python函数，它们接收一个HttpRequest对象作为第一个参数，并返回一个HttpResponse对象。简洁性：对于简单的逻辑，视
智能语音备忘录：SpeechRecognition与gTTS的奇妙融合 Tech Synapse AI 人工智能 gTTS
引言：智能语音备忘录的时代已经到来在这个信息爆炸的时代，我们每天需要处理大量的事务和信息。传统的文字记录方式虽然可靠，但在效率上往往难以满足快节奏生活的需求。想象一下，如果你能在驾车、散步或是灵感突现的任何时刻，仅需通过语音就能快速记录想法、设置提醒或是保存重要信息，这将极大提升我们的生活和工作效率。智能语音备忘录，正是这样一款能够解放双手、提高记录效率的神器。本文将带领你一步步探索如何利用Pyt
CF148D Bag of mice syzyc 动态规划概率与期望题解动态规划概率与期望
题目传送门思路状态设计设dpi,jdp_{i,j}dpi,j表示袋中有iii个白鼠和jjj个黑鼠时，AAA能赢的概率。状态转移现在考虑抓鼠情况：AAA抓到白鼠：直接判AAA赢，概率是ii+j\frac{i}{i+j}i+ji；A,BA,BA,B都抓到一只黑鼠，并且跑出来一只黑鼠：概率为ji+j×j−1i+j−1×j−2i+j−2\frac{j}{i+j}\times\frac{j-1}{i+j-1
字符串哈希 syzyc 字符串哈希算法
注意（Warning）本文章内所有有关字符串下标的，统一都从111开始算起。定义字符串哈希其实就是把一段字符串转化成一个数字。在进行字符串匹配时不需要再O(strlen(s))O(strlen(s))O(strlen(s))匹配字符串本身，而只需要匹配两个字符串的哈希值就好了。字符串哈希值计算对于一个字符串sss，定义它的哈希值为：f(s)=∑i=1ls[i]∗pl−if(s)=\sum^{l}_
延长电池寿命的充电及AI拓展亚图跨际数学材料物理人工智能
电动汽车革命对于交通运输的脱碳至关重要，但也带来了一个日益严峻的挑战：这些电池在其汽车生命周期结束后会怎样？将这些强大的能源仅仅视为废弃物是一种错失的机会。相反，一个新兴的领域正专注于“延长充电周期”——寻找可持续的策略来重新构想电池的生命周期。AI拓展最初的重点是通过材料、制造工艺和先进管理系统的进步，最大限度地延长这些电池的第一生命周期。然而，即使在最佳的保养条件下，电池也会发生衰减。这时，第
OOM 未触发 JVM 崩溃的可能原因 ansenXia jvm
1.OOM未触发JVM崩溃的可能原因‌(1)未配置JVM参数强制崩溃‌关键参数缺失‌：若未添加-XX:+CrashOnOutOfMemoryError，JVM在OOM时可能仅抛出异常并正常退出，而非崩溃，因此不会生成hs_err_pid.log。#正确配置示例（需添加CrashOnOutOfMemoryError）java-Xmx10m-XX:+CrashOnOutOfMemoryError-XX
std::thread线程命名土豆西瓜大芝麻 linux C语言 c++开发语言
也可以参考我另外一篇文章，另外一篇更详细些。为线程设置名字的最大的好处是在程序出错时，它会出现在GDB的出错信息里，可以更快地定位问题。有两种方法可以给线程设置名字：一种在线程的调用函数内部设置，还有一种是在外部对指定线程变量做设置。#include#includeintmain(){std::thread_([](){std::stringname="abccccccccccccc";//注意设
2023年信息素养大赛 C++小学组初赛算法创意实践挑战赛真题详细解析小兔子编程信息素养大赛c++题目 c++算法挑战赛真题信息素养大赛真题c++C++信息素养大赛真题信息素养大赛c++编程 c++智能算法挑战赛 c++算法比赛题
2023年信息素养大赛初赛C++真题解析一、选择题（共15题，每题5分，共75分）1、以下关于数组说法错误的是A、字符串也是数组B、二维数组中下标的第一项表示行，第二项表示列C、字符串总是以'/0'做结尾D、多维数组的维度不可以无限善加答案：D考点分析：考察数组相关知识，多维数组的维度理论上可以无限增加，但实际编程中会受到编译器限制和内存限制；答案D2、以下说法错误的是A、C++是面向对象的编程语
赛普拉斯EZ-USB FX3开发环境安装指南水熠芝Dark-Haired
赛普拉斯EZ-USBFX3开发环境安装指南一赛普拉斯EZ-USBFX3开发环境安装项目地址:https://gitcode.com/Resource-Bundle-Collection/bdf24本资源文件提供了赛普拉斯EZ-USBFX3开发环境的安装指南，帮助开发者快速搭建开发环境并开始使用FX3芯片进行开发。内容概述简介赛普拉斯EZ-USBFX3（简称FX3）是一个功能强大的USB3.0外设控
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running]root@192.168.9.136:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发