夕小瑶

发现一篇专门吐槽 NLP 内卷现状的 ACL 论文 ...

文 | Severus
编 | 小轶

随着大模型的发展，NLP领域的榜单可说是内卷到了无以复加，现在去浏览各大公开榜单，以至于各个比赛，随处可见BERT、RoBERTa的身影，甚至榜单中见到各大large模型的集成版也并非偶然。在发论文的时候，又要不断地去内卷SOTA，今天的SOTA在明天就有可能被打败，成为了过眼云烟。极端情况下，某一篇论文正在撰写，ArXiv上就突然刷新了SOTA，又足以让研究者们头疼应该怎样应对。

同时，参数规模的内卷，在去年GPT-3发布之后，上升到了百亿、千亿甚至万亿，参数规模的急剧上升自然也将榜单的分数提升了一大截，而这种大模型无论算力消耗、实验成本还是优化难度，都足以让广大研究者们望而却步。

一直以来，NLP的这种发展方式都存在一些指责的声音，而内卷程度达到了今天这种程度之后，自然也会有更多的工作停了下来，他们去自省：现在的热门工作的意义在哪里？过度以SOTA为标准来评审工作对这个专业是否是有利的？军备竞赛做出来这么多目前根本没法用的大模型意义何在？

今天要介绍的这篇 ACL'21 的文章，就是总结了当前NLP领域的一些问题，以及给出了相应的解决思路。文章作者总结列举了当前NLP领域研究的5个问题，分别为：

过早地应用了未经充分分析理解的方法
偏好计算方法，却不考虑其局限性带来的风险
论文发表的偏好
因实验成本而导致不可能复现实验
模型的不可解释性

以下是文章作者对这5个问题的详细阐述，以及分别提出了自己的解决方案，笔者也会逐条发散一下自己的看法。

论文标题：
On the Gap between Adoption and Understanding in NLP

论文链接:
https://aclanthology.org/2021.findings-acl.340.pdf

网址访问慢的小伙伴也可以在【夕小瑶的卖萌屋】订阅号后台回复关键词【0823】下载论文PDF~

过早的应用

BERT发表之后，迅速席卷了NLP领域，将NLP研究的范式改变为Pretrain+fine-tune模式，但是作者认为，BERT（及在它之后的所有类似工作，如ERNIE、RoBERTa等）的应用未免太快，我们还没有充分理解它到底学到了什么，它就已经成为了几乎所有工作的基座模型，因为它在当时的理解榜单上迅速以压倒性的优势刷新了SOTA。而同时很多对BERT的分析工作表明，我们对预训练语言模型的能力有了过高的估计，例如BERT对否定的概念不敏感，例如在BERT上可以构造各种对抗样本去使其结果变差等等。也就是说，作者认为现在的方法中存在使用和理解的差距（gap between adoption and understanding，GAU）。

这种未对成果进行充分分析及研究，就过早地将成功应用起来，所造成的危害在其他的科学研究领域，已经造成了一些危害。例如文章中举出的例子，用于治疗孕妇失眠的药物康特甘，后来被证明有严重的副作用，甚至可能导致流产。在医药学领域，类似的例子还有许多，例如海洛因，最初研究目的是作为一种镇痛效力比吗啡更强，有不具备吗啡的成瘾性的药物，但是在实验阶段，忽略了动物的异常反应，而这个以“英雄”之意冠名的药物却成为了恶魔。类似的还有甲基苯丙胺。

NLP领域当然不会有这种风险（虽然我认为如果将现有的模型当成AGI滥用的话，其危害不会很小，好在现在大家都很清醒），过拟合也不会给人造成身体上的伤害。但是，考虑如果研究者A，发表了一个最好的方法X，那么方法X就会变成一个标靶，后来者的方法都会去参考它，试图打败它，对抗它，从而去刷新分数。但如果之后，方法X被证明是错误的，研究者A撤回了他的结果，那么对于X之后的相关研究可能就是毁灭性的。想象一下，如果BERT被证明是错误的，那么对于NLP领域造成的毁灭将会是什么样的？

又或许，研究者A发表了方法X，且方法X成为了一个经典方法之后，他也就满足了，也就不再继续推进研究，那么对于新的更好的工作，也造成了障碍，因为错误的方法没有被识别出来，变革性的方法反倒又导致了该领域的停滞不前。

作者认为，需要创造一个可以去探索NLP方法缺点，及负向的发现的环境，而不是做事后诸葛亮。其中关于负向结果的workshop[1]以及带有对抗性质任务的workshop[2]（build-it，break-it）是比较正确的方向。

笔者的看法

实际上，我想经典预训练语言模型（BERT、RoBERTa等）的作者们是应该是相当清醒的，实际上我们可以看到，无论是自回归还是自编码的语言模型，其预训练任务及方法都已经是经过多年实践的方法，且其理论依据也经过了充分的研究，而且大家都是可以充分理解这些语言模型，或者说是统计模型的局限。而在统计模型上，过度的苛求其在语料之外的人类知识类问题上的性能。当然，关于BERT通过统计共现，可能已经记忆到了什么语言学知识的相关研究，我认为是相当有意义的，它可以让我们更清楚地看到统计语言模型具备什么样的非凡能力，以及它局限在哪，或者可以有什么其他的用法。

除此之外，文章作者所提到的这个观点我是完全认同的。同时，我认为，提出了错误的方法，却得到了高分的结果，则更加有可能是任务不可靠，或者数据不可靠，导致过拟合形成了高分。在我与研究者们的交流中，研究者们往往也会指出数据上的问题，导致他们无法判定在固定任务场景之下，他们做出来的模型到底有什么意义。

所以，构建更加可靠的数据，提出更加可靠的任务，以及[2]中所提到的对抗模式，可能一定程度上能够缓解这个问题。当然也需要广大研究者们对统计模型的认识足够清楚。

计算类论文

NLP领域是方法驱动的，自然也会不断地去探索新的技术。然而这也使得论文数量失衡，对领域自省或其语言学上的动机的研究变少。这种发展起源于上世纪九十年代的统计革命，统计模型大幅占据了优势，方法导向的论文优于理论导向的论文。到现在，深度学习模型的统治地位仍未被撼动，这种思潮也就根深蒂固，那么自然提出新的模型，比单纯的语言学理论研究要受欢迎得多。不过，纯方法论的论文也更加容易客观评价，这也是事实（因为更加注重结果）。那么就引出了两个问题：

模型的结果比它语言学上的理解更加重要吗？
计算类的论文是否应该以不同的方法评估？

这也就是理性主义和经验主义的分歧，理性主义希望模型能够被理解，而经验主义则希望模型有用[3]。两种方向结合，才能够取得真正的进展。

每年都有无数的论文提出了新的模型，声称自己取得了新的结果，但现在却没有一种方式去认证这些结果，多数时间我们不了解这些论文的评估是否是合理、正确的。这其中最大的问题是很多发表出来的论文，却没有高质量的开源代码。很多论文中开源的代码可能是残缺的，可能仅仅是一个Jupyter，而没有环境参数、任务参数等等必要信息，甚至代码逻辑都是残缺的，也就无法将它复用在其他的任务上去验证效果。毕竟DNN模型是非常敏感的，batch大小、CUDA版本的变化、随机种子的变化等都可能大幅影响模型的效果。

同时，当一篇新的论文发表，代码开源了之后，评审员们可能也会要求比较，然而在GitHub上还是可以经常看到很多问题是没有回答的。

毋庸置疑，方法论的错误会导致延缓研究的进度，而文档健全的方法及代码可以让我们更加容易找到方法上的错误或者实验上的问题，所以作者认为应该类似[4]，发布开源代码的声明，明确约定发表论文的同时，应该发表什么样的代码，至少应该是易于使用且文档完备的代码。因为与使用实验来证明假设一样，代码也是科学研究中重要的组成部分。例如HuggingFace等机构，SentenceBERT等工作就做了相当好的示范。

发表偏好

由于多数教职职称或学生毕业会以论文发表数量作为硬性指标，绝大多数研究者会倾向于在A+类会议或Q1期刊上发表论文。所以发表论文数量和论文的引用量相比于其他方面，就更加重要。

所以，一些研究者们就会去抨击这种现象，认为不应当以论文数量为唯一的评价标准，他们主张“慢科学（slow science）”。但虽然这种想法理论上值得称赞，但致力于慢速，却并不符合多数研究者的需求。并且，实际上以论文数量来作为评价依据，或许是目前能找到的最为公平的一种方式了，毕竟这还是一个明确公共的指标，论文能否发表至少还是由第三方审稿人给出意见，并且是双盲评审，而如果不以上述为硬指标，则初级研究者就更难有出头之日。

然而现在每年A+区投稿的论文越来越多（网传斐波那契投稿法），审稿人也就有越来越少的时间去评审一篇论文，这也自然导致了很多优秀的论文却没有得以发表。

所以研究者们就只能要么让论文更加易于阅读，从而易于评判（适用于前文提到的描述方法的论文），或者找别的地方发表论文。所以很多研究者选择在ArXiv上先发表论文，以建立发表的记录。也多亏ArXiv的存在，研究者们可以在线分享自己的成果。但也由于ArXiv上未经审核，以现在NLP领域的研究步伐，早晚有一天，ArXiv上NLP领域也会被大量有偏置的模型淹没，GAU仍然会占据着整个领域。

所以，短期来看，一个比较可能的解决方式是加强审核的标准，发表真正有价值的工作。

算力不可获取

这一切还是要归于以GPT及BERT为起始的transformer系列的预训练语言模型。从GPT，到BERT，到GPT-2，到T5，到GPT-3，模型参数越来越大，打榜、比赛都进入了军备竞赛的时代，好像正如Sutton教授所说，大力真的出了奇迹。可是，BERT系列的模型（包括BERT、RoBERTa、ERNIE1/2等）都还可以进行科研实验，fine-tune做任务的代价并不是那么大，但是已经很难应用到实际的应用中，尤其是由高吞吐需求的线上应用。但到了T5-11B这种模型上，虽然分最高，但应用起来已经很吃力了。到了以GPT-3为首的千亿/万亿模型上，别说用起来了，找到一个硬盘去存储这个模型都很难。所以在EurNLP 2019的一次小组讨论中，Phil Blunsom提出：未来的NLP不在于更大的模型，而在于更大的想法。

在比赛战场上，CCKS2020的workshop中，我们可以看到，榜一和榜二几乎没有做任何算法上的优化，用着大数据、大模型加上集成，就大幅超越了其他的工作。榜一使用了25个RoBERTa-large集成，榜二使用了15个base和large模型集成，而榜三没有用任何的预训练模型和集成技术，生生用算法做出了榜单第三。那么相比来讲，是不是榜三才应该是更加有价值的工作呢？

这种Pretrain+fine-tune的范式，自然也决定了，只有豪横的公司、学校等研究机构，才有财力去支持庞大的算力，参与这个内卷的战场，而财力相对不足的机构，则因算力紧缺难以快速做出来实验。同时这也就导致了大模型实验在其他的地方难以复现。实验不可复现对于任何领域的科学研究都是具有风险的，例如社会心理学就因为实验不可复现而导致整个学科的声誉被玷污。

NLP领域的研究者们是希望看到的论文是可复现的，然而，[4]统计了506篇工作，发现其中只有15.61%的工作是可以复现的，与NLP领域相当高的数据共享比例形成了鲜明对比，而高共享的数据本该导向更高的可复现比例的。

笔者的看法

如前文所说，我们也不应该一味批评大模型所带来的资源浪费，以及给后来人所带来复现实验上的困难。大模型本身给我们展示了统计模型+海量数据能够展现出什么样的能力，研究者们对BERT进行的各种分析实验，包括延续着BERT诞生的RoBERTa，也表明了BERT类统计模型能够捕捉到的多元特征。的确BERT本体很难在各类线上应用使用，但并不代表它没有任何的应用价值。例如模型蒸馏，大模型就是非常卓越的teacher model，它带来的丰富特征可以大幅提升线上应用的小模型的使用。

GPT-3的出现，则是回应了另一个问题，当统计模型的参数继续上升，使用的数据量级持续扩大，统计模型又将是什么表现？它让我们看到了，凭借着记忆力，统计模型可以做到什么神奇的事情，同时也向我们暴露了统计模型的局限性在哪里（仅仅是记忆而不是理解，只能在语料内泛化，但泛化不可控，而事实不能泛化）。我认为，GPT-3所引起的后续一系列讨论才让大家冷静了下来，真正去反思大规模统计模型的局限性。还是如前文所说，我认为GPT-3的开发者们，LeCunn等大佬为首的讨论者们对此认知都相当清醒，但是如果没有GPT-3这样一个模型出现，又怎么样能够实实在在地去说服大家呢？

我在工作环境中发表看法的时候，对于使用集成模型来打比赛刷分的确是深恶痛绝的，一方面因为我的训练资源被挤占了，一方面我认为这对于个人参赛者，学界参赛者就是不公平的。可是，如果仅仅是从应用角度上，多个集成模型都作为teacher model，用来蒸馏一个应用模型，我认为也是相当可行的思路。

不可解释的方法

模型的可解释性在深度学习兴起之后，就一直是老生常谈的问题了。尤其GPT-3出现了之后，其在自然语言生成的表现相当抓眼球，一时间也让人们认为这种大模型已经能够当一个可以乱真的作者。而实际上，GPT-3生成的文章也是经过其大量输出编辑而成的最终结果，看上去一致性比较好，如果读者去试用它，则会很容易发现它的不可控泛化的case。研究者们对GPT-3模型生成的假新闻的担忧，以及模型生成结果对性别、种族上的偏见在去年也有广泛讨论。

我们说DNN模型结果的解释，也仅仅能说它反映了模型的训练样本中有什么现象，但完全没有办法去说明模型的结果到底是怎么来的。那也就是说，统计模型的可解释性本身就是个难以解决的问题，尽管有各种各样的研究去试图解释DNN模型，但那些工作给出的也更像是实验给出了一定的关联，没有得到明确的解释（实际上DNN模型的参数几乎是没有办法解释的，因为它始于随机，每一步训练进行的纠错究竟是在纠正哪些部分，或者模型学习到了样本的哪些关联或偏置，都是不清楚，且可能是多变的）。实际上我们也仅仅能够通过干预训练样本的分布去干预模型的表示，如我写的上一篇推文我删了这些训练数据…模型反而表现更好了！？，通过去除重复的训练样本，解决语言模型复读的问题。

现有的模型存在所谓的种族偏见、性别偏见之类的，反倒是最好解释的一种：训练样本中本来就存在这种偏差。

这种不可解释性，也注定无法将模型应用到需依赖于过程解释结果的领域，如法学和医疗领域。

然而，研究者们知道这一点，但到了PR工作上，又往往会对模型的能力有“报喜不报忧”的现象，最终使得公众对DNN模型的能力有了过高的估计。例如几年前某对话模型在机器多轮对话中出现了无意义的乱码，媒体的标题是机器发明了新的语言；例如AlphaGo Zero出现的时候，媒体的标题是无监督学习的胜利；例如ERNIE-3.0/GPT-3在PR的时候，使用了千挑万选的好结果，让大家认为大规模DNN模型就是无所不能。

所以最终笔者完全认同本文作者的观点，我们要更好地与媒体和公众接触，以确保来自这个领域的消息不仅仅是关于惊人的可能性的重大新闻，虽然让公众去理解我们的工作的局限性很困难，这些不够抓眼球，对于公众来讲很无聊，但这是确保公众去理解无法解释的模型的所有可能的结果的唯一方法。

有鉴于此，我在做我的开源项目宣传的时候，就喜欢极力避免读者有过高的估计，被认为有了我们的项目之后就可以直接端到端做到一些事情，以免起到反效果。

萌屋作者：Severus

Severus，在某厂工作的老程序员，主要从事自然语言理解方向，资深死宅，日常愤青，对个人觉得难以理解的同行工作都采取直接吐槽的态度。笔名取自哈利波特系列的斯内普教授，觉得自己也像他那么自闭、刻薄、阴阳怪气，也向往他为爱而伟大。

作品推荐

深度学习，路在何方？

数据还是模型？人类知识在深度学习里还有用武之地吗？

在错误的数据上，刷到 SOTA 又有什么意义？

后台回复关键词【入群】

加入卖萌屋NLP/IR/Rec与求职讨论群

后台回复关键词【顶会】

获取ACL、CIKM等各大顶会论文集！

[1].Rogers A, Sedoc J, Rumshisky A. Proceedings of the First Workshop on Insights from Negative Results in NLP[C]//Proceedings of the First Workshop on Insights from Negative Results in NLP. 2020.

[2].Ettinger A, Rao S, Daumé III H, et al. Towards linguistically generalizable NLP systems: A workshop and shared task[J]. arXiv preprint arXiv:1711.01505, 2017.

[3].Norvig P. On Chomsky and the two cultures of statistical learning[M]//Berechenbarkeit der Welt?. Springer VS, Wiesbaden, 2017: 61-83.

[4].Belz A, Agarwal S, Shimorina A, et al. A systematic review of reproducibility research in natural language processing[J]. arXiv preprint arXiv:2103.07929, 2021.

面经总结系列（十六）：元象科技大模型推理优化工程师 GoAI AI面经总结机器学习算法人工智能大模型机器学习深度学习
‍作者简介：CSDN、阿里云人工智能领域博客专家，新星计划计算机视觉导师，百度飞桨PPDE，专注大数据与AI知识分享。✨公众号：GoAI的学习小屋，免费分享书籍、简历、导图等，更有交流群分享宝藏资料，关注公众号回复“加群”或➡️点击链接加群。AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的
《深入浅出多模态》(四)：多模态经典模型CLIP GoAI 深入浅出多模态多模态大模型 LLM 人工智能
AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关（简历撰写技巧、面经资料与心得）多方面综合学习平台，强烈推荐AI小白及AI爱好者学习，性价比非常高！加入星球➡️点击链接✨专栏介
大学专业科普 | 物联网、自动化和人工智能
在选择大学专业时，可以先从自身兴趣、能力和职业规划出发，初步确定几个感兴趣的领域。然后结合外部环境因素，如专业前景、教育资源和就业情况等，对这些专业进行深入的分析和比较。物联网专业课程设置基础课程：包括物联网概论、电子电工基础、计算机网络技术、数据库应用基础、C语言程序设计等。专业核心课程：传感器与传感网技术、自动识别技术与应用、单片机基础、物联网通信技术、嵌入式系统设计、无线传感器网络等。实践课
深入浅出多模态》（十一）之多模态经典模型：Flamingo系列 GoAI 机器学习多模态大模型人工智能 LLM 机器学习
AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关（简历撰写技巧、面经资料与心得）多方面综合学习平台，强烈推荐AI小白及AI爱好者学习，性价比非常高！加入星球➡️点击链接✨专栏介绍：本作
大学专业科普 | 云计算、大数据鸭鸭鸭进京赶烤云计算大数据
大数据专业是近年来随着信息技术发展而兴起的热门学科，专注于从海量、多样化的数据中提取有价值信息，为各行业提供数据驱动的决策支持。专业定义大数据专业旨在培养掌握大数据采集、存储、管理、分析和应用等核心技术的人才。该专业融合了计算机科学、数学、统计学、数据科学和领域知识，重点解决大数据环境下的数据处理和分析问题。课程设置大数据专业的课程体系包括基础课程、专业核心课程和实践课程。（一）基础课程基础课程涵
招标专家随机抽选——抽取结果打印模板设计—未来之窗智能编程——仙盟创梦IDE 未来之窗软件服务招标专家仙盟创梦IDE 东方仙盟
打印代码function未来之窗_人工智能_打印指定区域(魔都id){varmode="iframe";varclose=false;varextraCss=`.cyberwinqrimg{display:inline-block!important;}`;varkeepAttr=[];keepAttr.push($("#"+魔都id).html());varheadElements=',';va
C++从入门到精通专栏简介 xiaoheshang_123 C++从入门到精通专栏开发语言 c++
目录C++从入门到精通专栏简介专栏概述专栏特色适用人群学习目标专栏结构第1章：C++语言基础第2章：面向过程编程第3章：面向对象编程(OOP)入门第4章：标准模板库(STL)初探第5章：高级特性第6章：现代C++第7章：实践项目第8章：性能优化与调试第9章：职业发展专栏优势期待与收获C++从入门到精通专栏简介专栏概述本专栏旨在为C++编程语言的学习者提供一个全面而系统的指南，帮助他们从零基础逐步成
深度学习目标检测之YOLOv3实战（二）训练自己的图像数据郎郎不会飞深度学习目标识别 python 深度学习
深度学习目标检测之YOLOv3实战（二）训练自己的图像数据数据集准备数据集预处理原demo修改数据集训练目标检测补充二零二零年的大年初一，给大家拜个年，祝大家鼠年吉祥，万事如意，趁着喜气，把Yolov3训练自己的数据过程，记录一下，共勉共进。同样，无人机搭载山狗拍摄的视频，目标检测的种类是模型tank和airplane，部分效果图镇贴：数据集准备首先需要将自己的数据集准备好，不同场景下的目标数据尽
Python批量下载网易云音乐飙升榜所有音乐文件 Python_小屋 graphviz netty gpu ai webgl
Python小屋刷题神器最近升级的新功能介绍推荐教材：《Python程序设计基础与应用》（ISBN：9787111606178），董付国，机械工业出版社，2018.8出版，2021.3第11次印刷作者荣誉：机械工业出版社计算机分社成立20周年本科教材”金牌作者“，机械工业出版社高等教育教材专家咨询委员会委员，机械工业出版社”面向新工科高等院校大数据专业系列教材“编审委员会委员，全国高等院校计算机基
什么是WebAssembly（WASM） MonkeyKing.sun wasm 区块链
WebAssembly（WASM）是一种高性能的低级编程语言字节码格式，可在网页和非网页环境中运行，支持多语言编译，运行速度接近原生代码。它在区块链中的作用是：作为智能合约的执行引擎，被多条非以太坊链（如Polkadot、EOS、CosmWasm）采用。Polkadot和EOS是使用WebAssembly的两个代表性区块链平台，它们与Solidity+EVM（以太坊生态）形成鲜明对比。一、什么是W
为什么Move将超越Solidity成为主流编程语言？初晓链研究员智能合约区块链区块链智能合约
最近Aptos、Sui的新热潮带火了Move相关的生态概念。我们团队从事Move相关的工作一年多，算是全球最经验最多、踩坑最多的开发者团队之一，借此分享一下对Move的看法与理解。最近Aptos、Sui的新热潮带火了Move相关的生态概念。我们团队从事Move相关的工作一年多，算是全球最经验最多、踩坑最多的开发者团队之一，借此分享一下对Move的看法与理解。我们团队过往在Ethereum、Sola
JavaScript深入理解与实战：作业6详解红廉骑士兽
本文还有配套的精品资源，点击获取简介：本次作业深入探讨了JavaScript编程语言的基础语法、函数与闭包、对象与原型链、事件与DOM操作、异步编程、ES6新特性、框架与库的使用、性能优化以及调试与测试。JavaScript在Web开发中扮演关键角色，通过学习上述知识点，学生将能够提升Web应用开发技能，优化代码性能，并进行有效的代码调试与测试。1.JavaScript基础语法介绍与实战1.1Ja
【EI会议征稿】东北大学主办第三届机器视觉、图像处理与影像技术国际会议（MVIPIT 2025）诗远Yolanda 图像处理计算机视觉考研视频机器学习论文阅读
一、会议信息大会官网：www.mvipit.org官方邮箱：[email protected]会议地点：辽宁沈阳主办单位：东北大学会议时间：2025年9月27日-9月29日二、征稿主题集中但不限于“机器视觉、图像处理与影像技术”等其他相关主题。机器视觉：视觉中的统计机器学习；立体视觉标定；几何建模与处理；人脸识别与手势识别；早期视觉和生物学启发的视觉；光流法和运动追踪；图像分割和图像分类；基于模型的视觉
MCP模型上下文协议：AI人工智能模型训练的自动化调参 AI天才研究院 AI人工智能与大数据人工智能自动化运维 ai
MCP模型上下文协议：AI人工智能模型训练的自动化调参关键词：MCP模型、自动化调参、AI训练、超参数优化、上下文协议、机器学习、深度学习摘要：本文深入探讨MCP模型上下文协议在AI模型训练自动化调参中的应用。MCP(ModelContextProtocol)是一种创新的自动化调参框架，通过上下文感知和动态参数调整机制，显著提升模型训练效率和性能。文章将从理论基础、算法实现、数学原理到实际应用进行
AI--提升效率、驱动创新的核心引擎保持学习ing AI编程自动化低代码
自动化代码生成、低代码/无代码开发、算法优化实践等新兴技术在软件开发领域正逐渐崭露头角。这些技术为开发者提供了更高效、更便捷的开发方式，大大提升了软件开发的效率和质量。本文重点探讨的是这些技术在实际应用中的价值和优势。1、自动化代码生成1.1优势自动化代码生成是利用机器学习和人工智能技术，通过分析需求和已有代码，生成可用的代码片段或完整的程序。这种技术可以极大地减少开发人员的工作量，提高开发效率。
[Python] -基础篇5-玩转Python内置数据结构：列表、元组、字典与集合踏雪无痕老爷子 Python python 开发语言
Python是一门以简洁优雅著称的编程语言，其中内置的数据结构为日常编程提供了强大支持。本文将系统介绍Python中四大核心数据结构：列表（list）、元组（tuple）、字典（dict）与集合（set），并配以实用示例，帮助读者全面掌握其用法及适用场景。一、列表（List）：可变序列的代表列表是最常用的Python数据结构之一，支持动态增删改查。1.1基本操作fruits=['apple','b
大数据ETL工具比较：Sqoop vs Flume vs Kafka AI天才研究院 AI人工智能与大数据大数据 etl sqoop ai
大数据ETL工具比较：SqoopvsFlumevsKafka关键词：大数据ETL、Sqoop、Flume、Kafka、数据迁移、日志采集、消息队列摘要：在大数据生态中，ETL（抽取-转换-加载）是数据价值挖掘的关键环节。不同业务场景对数据传输的实时性、可靠性、数据类型有差异化需求，催生了Sqoop、Flume、Kafka等特色鲜明的ETL工具。本文从核心架构、工作原理、性能指标、实战案例四个维度，
中小团队零成本搭建PHP任务管理系统：4大核心工具实测推荐 php
引言在现代软件开发和团队协作中，高效的任务管理系统是提升生产力的核心要素。PHP作为全球最受欢迎的服务器端编程语言之一，凭借其成熟的生态系统、丰富的框架选择和强大的社区支持，成为构建任务管理系统的理想选择。一个优秀的PHP任务管理系统不仅能够实现任务的全生命周期管理，还能通过智能化的功能提升团队协作效率，降低项目管理成本。构建这样一个系统需要考虑多个层面：从底层的数据库设计到前端的用户体验，从安全
YOLOv11革命性升级：基于MobileNetv4的UIB和ExtraDW模块重构C3k2架构，实现移动端推理性能飞跃博导ai君深度学习教学-附源码 YOLO 重构
引言与背景概述在当今人工智能飞速发展的时代，目标检测技术已成为计算机视觉领域的核心技术之一。从自动驾驶汽车到智能安防系统，从移动端AR应用到工业质检，目标检测无处不在。然而，随着应用场景的多样化，特别是移动端和边缘设备的普及，对模型的计算效率提出了更为严苛的要求。YOLO（YouOnlyLookOnce）系列算法作为目标检测领域的领军者，一直在精度与速度之间寻求最佳平衡。从YOLOv1到最新的YO
从零开始：Python实现语音识别的完整教程_副本 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 python 语音识别开发语言 ai
从零开始：Python实现语音识别的完整教程关键词：Python、语音识别、语音转文本、音频处理、机器学习、深度学习、自然语言处理摘要：本文将带你从零开始学习如何使用Python实现语音识别功能。我们将从基础概念讲起，逐步深入到实际代码实现，涵盖音频处理、特征提取、模型训练等关键环节，最终构建一个完整的语音识别系统。无论你是初学者还是有一定经验的开发者，都能从本教程中获得实用的知识和技能。背景介绍
七天学完十大机器学习经典算法-05.从投票到分类：K近邻(KNN)算法完全指南
接上一篇《七天学完十大机器学习经典算法-04.随机森林：群众智慧的机器学习实践》想象一下，你搬进了一个新小区。想知道这个小区整体氛围如何？最直接的方法就是看看你最近的几家邻居是什么样的人——如果邻居们都很安静、整洁，小区大概率不错；如果邻居们深夜喧哗、环境杂乱，你可能就得重新考虑了。K近邻（K-NearestNeighbors,KNN）算法的核心思想，就如同这个观察邻居的过程。它是机器学习中最直观
分类预测 | MATLAB实现BP神经网络多特征分类预测 matlab科研社分类 matlab 神经网络
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍近年来，随着大数据时代的到来以及计算能力的显著提升，人工智能技术得到了飞速发展。在众多人工智能算法中，反向传播神经网络（BackPropagationNeuralNetwork,BP神经网络）凭借其强大的非
信息抽取数据集全景分析：分类体系、技术演进与挑战_DEEPSEEK 致Great 分类数据挖掘人工智能
信息抽取数据集全景分析：分类体系、技术演进与挑战摘要信息抽取（IE）作为自然语言处理的核心任务，是构建知识图谱、支持智能问答等应用的基础。近年来，随着深度学习技术的发展和大规模预训练模型的兴起，IE数据集呈现爆发式增长，其分析与评估对模型研发和领域迁移至关重要。本文基于对158个主流IE数据集的系统性梳理，首次提出“信息提取与命名实体识别数据集分类体系”。该体系涵盖8大类别（命名实体识别、关系提取
自然语言处理之文本生成：Recurrent Neural Networks (RNN)：序列模型与语言模型 zhubeibei168 自然语言处理自然语言处理 rnn 语言模型人工智能机器翻译生成对抗网络
自然语言处理之文本生成：RecurrentNeuralNetworks(RNN)：序列模型与语言模型自然语言处理简介NLP的基本概念自然语言处理（NaturalLanguageProcessing，简称NLP）是人工智能领域的一个重要分支&#
GDB调试程序：使用方法和编程技巧程序员拓荒编程
在软件开发过程中，调试是一个至关重要的环节。GDB（GNU调试器）是一个功能强大的调试工具，可以帮助开发人员诊断和修复程序中的错误。本文将介绍GDB的基本用法和一些编程技巧，并提供一些示例源代码供参考。什么是GDB？GDB是一个用于调试程序的命令行工具。它可以帮助开发人员在程序执行过程中定位错误、追踪程序状态以及查看变量的值。GDB支持多种编程语言，包括C、C++、Objective-C、Fort
2025年 UI 自动化框架使用排行 Thomas Kant 自动化测试 ui 自动化运维
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】</
使用Ultralytics YOLO进行数据增强 alpszero YOLO计算机视觉应用 YOLO 人工智能机器学习
概述数据增强是计算机视觉领域的一项重要技术，它通过对现有图像进行各种转换，人为地扩展训练数据集。在训练深度学习模型时，数据增强有助于提高模型的鲁棒性，减少过拟合，并增强对真实世界场景的泛化。在训练计算机视觉模型的过程中，数据增强具有多种重要作用：扩展数据集：通过创建现有图像的变体，可以有效增加训练数据集的规模，而无需收集新数据。提高泛化能力：模型学会在各种条件下识别物体，使其在实际应用中更加稳健。
Python 数据分析与可视化 Day 11 - 特征工程基础蓝婷儿 python python 数据分析人工智能
✅今日目标理解特征工程在数据分析和机器学习中的意义掌握常见特征类型的处理方式：数值型、类别型、时间型学习特征提取、转换、标准化、独热编码（One-HotEncoding）等核心操作为后续建模任务做好特征准备工作一、什么是特征工程？特征工程是将原始数据转换为模型可学习的“特征向量”的过程，是机器学习效果好坏的核心因素之一。常见任务包括：缺失值处理（已学）异常值处理（已学）数值归一化、标准化类别变量编
使用 Vue3-Ace-Editor 在 Vue3 项目中集成代码编辑器 bigHead- 工具插件编辑器 vue.js 前端 ace.js vue3-ace-editor
在现代Web开发中，集成一个功能强大的代码编辑器能够大大提高应用的互动性和用户体验。AceEditor是一个流行的开源代码编辑器，支持多种编程语言的语法高亮、代码自动补全等功能。而vue3-ace-editor是一个基于AceEditor的Vue组件，方便在Vue3项目中使用AceEditor。下面将介绍如何在Vue3项目中集成和使用vue3-ace-editor。一、安装vue3-ace-edi
LeetCode算法解析：全面掌握编程挑战与面试技能黄浴
本文还有配套的精品资源，点击获取简介：LeetCode作为一个在线编程平台，提供了丰富的算法问题，帮助程序员提升编程技能和面试准备。内容覆盖了多种计算机科学领域，包括数据结构和算法，以及各类编程难题。解决这些问题有助于深化对编程语言、数据结构和算法的理解，并提高系统设计和软件开发能力。本解析可能会包含一个名为“leetcode-master”的开源项目，该项目包含了不同编程语言的LeetCode问
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

发现一篇专门吐槽 NLP 内卷现状的 ACL 论文 ...

过早的应用

笔者的看法

计算类论文

发表偏好

算力不可获取

笔者的看法

不可解释的方法

[1].Rogers A, Sedoc J, Rumshisky A. Proceedings of the First Workshop on Insights from Negative Results in NLP[C]//Proceedings of the First Workshop on Insights from Negative Results in NLP. 2020.

[2].Ettinger A, Rao S, Daumé III H, et al. Towards linguistically generalizable NLP systems: A workshop and shared task[J]. arXiv preprint arXiv:1711.01505, 2017.

[3].Norvig P. On Chomsky and the two cultures of statistical learning[M]//Berechenbarkeit der Welt?. Springer VS, Wiesbaden, 2017: 61-83.

[4].Belz A, Agarwal S, Shimorina A, et al. A systematic review of reproducibility research in natural language processing[J]. arXiv preprint arXiv:2103.07929, 2021.

你可能感兴趣的:(大数据,编程语言,机器学习,人工智能,深度学习)