深度学习技术前沿

归纳偏置多余了？靠“数据堆砌”火拼Transformer，MLP架构可有胜算？

作者：琰琰

前段时间，一场关于MLP与Transformer的较量在学术圈闹得沸沸扬扬。

起因是，谷歌在《MLP-Mixer: An all-MLP Architecture for Vision》论文中提出，无需卷积模块和注意力机制，纯MLP架构也可以达到与Transformer与CNN相媲美的图像分类性能。

此文一出学术界一片哗然，MLP is all you Need的时代要来了？

Transformer在2017年谷歌发表的《Attention is All You Need》论文中首次被提出，基于自注意力机制，近几年已经横跨NLP和CV领域，不断刷新各项任务的SOTA，而MLP是NLP领域最早且结构最简单的神经网络。为了处理更复杂的任务，神经网络的主流架构经历了MLP-CNN、RNN-Transformer的演变过程。

此事在社交平台引起了专家、网友的广泛讨论，有人认为，MLP-Mxier只是偷换概念，与Trasformer没有本质区别；有人认为，工业界的研究顶多算是Technical Report，不足以支撑学术结论；还有人认为，Transformer不是万能的，确实应该在架构设计方面挖掘一些新思路。

一波未平一波又起，时隔几天之后，清华大学、牛津大学、Facebook AI，还有Google又相继发表了多篇论文，试图证明Tranformer在多项任务中并不是必要条件。一时间，关于Trasformer和模型架构的讨论再次被推向高潮，大家的观点不一，质疑声不断。

我们应该如何看待这一系列研究成果？MLP、CNN、Transformer等主流架构谁强谁弱？各自有哪些特点？当前AI学术研究面临什么现状？下一阶段将如何发展？

针对这些问题，AI科技评论联系了来自业界和学术界的7位专家、学者以及资深从业者进行了深入交流，试图找出一些答案。他们分别是：

马毅：加州大学伯克利分校计算机系教授

何晓冬：京东副总裁，京东AI研究院常务副院长

林宙辰：北京大学智能科学系教授

朱军：清华大学计算机科学系长聘教授

尤洋：新加坡国立大学NUS计算机系青年教授

吴琦：阿德莱德大学高级讲师，ARC DECRA Fellow

苏剑林：90后机器学习从业者，「科学空间」博客知名博主，曾获得第四届“泰迪杯”全国大学生数据挖掘竞赛特等奖和企业冠名奖。

1

MLP比肩Transformer，归纳偏置多余了？

多层感知机MLP(Multilayer Perceptron)，也叫前馈神经网络（feedforward neuarl network）是最早发明的人工神经网络之一，其结构设计简单，仅由输入层、隐藏层（中间层）和输出层组成。

它最大的特点是信息只进行单向传输，没有循环或回路，即从输入层开始前向移动，经过隐藏层，再到输出层。如果信息从输出层反馈到输入层，则被称为循环神经网络（recurrent neural network，RNN）。

随着图像复杂程度和数据集类别数目的增涨，MLP越来越难以高效地提取特征。为了避免特征提取的参数过于冗余，卷积/Attention等高效操作相继被提出。

1998年，图灵奖得主Yann LeCun在手写数字识别任务中提出首个卷积神经网络LeNet，基本确定了CNN的整体结构——由卷积层、池化层、全连接层组成；Transformer架构最早采用Attention机制，并在机器翻译任务中达到SOTA。后来随着BERT的问世，Transformer开始席卷整个NLP领域，甚至跨界到CV领域。

然而，谷歌最近推出的MLP-Mixer模型表明，在不使用卷积和自注意力的情况下，仅基于多层感知机，也能在图像分类任务中达到了与Transformer和CNN相当的性能。

难道inductive bias反而成了束缚？

清华大学教授朱军告诉AI科技评论，相比于有inductive bias的架构，全连接架构的学习效率很低，这一点在机器学习实验中早已被证实。效率低，意味着需要更多的训练数据，才能使性能达到一定的阶段。

从工程角度来讲，很多应用场景无法提供足够的数据支撑，这时要解决问题还需要引入假设来提高有限数据的利用效率。所以说，全连接架构或者MLP-Mixer应用场景有限，而且还可能存在可解释性差和鲁棒性差的问题。

尤洋也表示，MLP-Mixer接近Transformers性能的前提条件是数据量要足够大。谷歌提供的数据显示，MLP-Mixer的性能随着数据量的增加而增长。在超大数据集JFT-300M上，它在更小的计算量上取得了接近ViT的精度。

数据量和算力在一定程度上限制了MLP-Mixer的应用范围。JFT-300M等大数据集的训练是大部分高校或中等规模的公司无法轻易完成的。但MLP-Mixer的计算模式和方法很简单。只要有足够多的机器，大多数研究人员应该容易复现和使用。

同时他也表示，目前人们在超大数据集上对inductive bias的模型探索还很有限，谷歌也只是展示了基于几个特定人造数据集的实验结果，inductive bias在其中发挥的价值还有待观察。

关于MLP-Mixer，目前学术界普遍认为，它与Transformer架构并没有本质的区别。

MLP-Mixer模型的核心思路是把图片分成很多的patch，每个patch就相当于Transformers的一个token，然后用MLP结合矩阵转置去处理数据。它的每层都包含token-mixing MLP block 和channel-mixing MLP block两个部分。前者是把不同的channel当成不同的计算单元，后者是把不同的token当成不同的计算单元。

马毅教授认为，从理论角度看，MLP与Transformer、卷积在数学概念上几乎完全等价，二者架构类似，只是在优化和实现细节上有差而已。何晓冬也表达了相似的看法。同时他表示，MLP-Mixer的出现也让我们不得不思考，在算力主导AI的当下，哪些模型的训练方法和架构设计才真正有助于性能提升？

此外，尤洋表示，逐个patch的MLP类似于一个具有16x16 kernels和16x16 stride的卷积层，换言之，MLP-Mixer本身并不是纯粹的MLP，它同样具有归纳偏置。此前，Yann LeCun也发文批评过这一点。“如果真的是标准MLP，应该将输入展平为一个一维向量，然后再接变换矩阵。”

苏剑林认为，MLP-Mxier，其实就是Synthesizer的Random模式并去掉了softmax激活。Synthesizer是去年5月Google在《Synthesizer: Rethinking Self-Attention in Transformer Models》论文中提出的模型。他认为，二者最大的区别仅在于MLP-Mxier做CV任务，而Synthesizer是做NLP任务的。

“在Random模式下，‘token-mixing MLP’相当于可训练的Attention矩阵，只是名字不同而已，将Attention换成MLP的改进，速度虽然有所提升，但理论复杂度不变，MLP-Mxier仍没有本质上的进步。”

事实上，将Transformer直接减少一两层同样可以达到提速的效果，而没必要换成MLP。另外，Transformer自适应生成的Attention具有更好的适应能力，而MLP-Mxier将Attention矩阵参数化的做法，使其在“预训练+微调”方面的性能有所下降。

相比于Transformer和CNN，尤洋认为，MLP-Mixer的概念更简单，或许可以在降低工程团队实现复杂度，以及降低神经网络搜索开销方面发挥更多价值。

2

7篇论文重拳出击，Transformer扛不住了？

谷歌之后，多家科研机构相继发表7篇相关论文，试图从多个维度打击Transformer。

《Beyond Self-attention: External Attention using Two Linear Layers for Visual Tasks》 - 清华大学
《RepMLP: Re-parameterizing Convolutions into Fully-connected Layers for Image Recognition》清华大学软件学院
《Do You Even Need Attention? A Stack of Feed-Forward Layers Does Surprisingly Well on ImageNet》 - 牛津大学
《ResMLP: Feedforward networks for image classification with data-efficient training》 - Facebook AI
《Are Pre-trained Convolutions Better than Pre-trained Transformers?》 - Google Research
《FNet: Mixing Tokens with Fourier Transforms》 - Google Research
《Pay Attention to MLPs》 - Google Research

MLP篇

其中，第一篇论文提出的External Attention表明，只用两个级联的线性层和归一化层就可以取代“Self-attention”。

苏剑林认为：从实验描述来看，External Attention有很多说法禁不住推敲：（1）两个线性层其实是Attention的变式；（2）没有与LinFormer进行比较，以证明其实现了线性的复杂度。（3）独立编码的External Attention在NLP任务中不work，却在CV中work。

牛津大学提出用Feed forward取代ViT模型中的注意力层，同样可以在ImageNet上达到接近ViT的top-1准确率——基于ViT / DeiT的模型，可达到74.9％的top-1精度，而ViT和DeiT分别为77.9％和79.9％。关于这项研究，不少学者认为它是MLP-Mixer架构的简易版。由于这篇论文全文只有4页（正文2.5页），不少学者猜测，可能作者原本也想在这个方向深挖一下，但没想被Googel抢先了一步。

受 ViT 的启发，Facebook AI提出了结构更简单、更稳定的ResMLP架构——它不采用任何形式的注意力机制，仅仅包含线性层与 GELU 非线性激活函数。

苏剑林认为，虽然ResMLP在ImageNet上达到了不错的准确率，但它与MLP-Mixer和Stack of FFN没有本质的区别，尤其是Stack of FFN。如果忽略细微的细节差异，甚至可以认为它们三个是同一个模型。

谷歌则接连发表了三篇相关论文，对 ViT 模型中自注意力层的必要性提出了质疑，而学者们普遍认为，FNet模型在某种意义上同样是MLP-Mixer的一个特例；gMLP也属于常规的结构炼丹工作，只要算力足够都可以实现，二者都没有足够的创新性或者为模型发展带来任何新的启示。

不过，其发表的《Are Pre-trained Convolutions Better than Pre-trained Transformers?》论文，则为学术圈普遍存在的“Transformer能否取代CNN”的讨论扩展了新思路。目前，这篇论文已被ACL2021接收。

CNN篇

近几年，Transformer从Vision Transformer到层出不穷的变种，不断地刷新着各项任务榜单，大有取代CNN之势。而谷歌在这篇论文验证了“CNN+预训练”的有效性。论文中表明，不管是直接用下游数据监督训练，还是先预训练然后微调，基于膨胀卷积或动态卷积的CNN模型都略优于Transformer模型，并且在速度上CNN模型还更加快。

苏剑林认为，这篇工作带给我们的启发是：预训练改进与模型改进不应该混为一谈，预训练技术本身往往能给各种模型都带来提升，不应该一提到预训练就想到Transformer，也不应该只把预训练跟Transformer结合。

那么，我们该如何看待Transformer与CNN模型？研究者有必要转向CNN吗？苏剑林表示，我们不能否定CNN的价值，但如果当前已经比较专注Transformer了，就没必要分出太多精力去转向CNN了。对此，他提供了三点看法：

1、理论上来说，CNN无法捕捉足够远的长程依赖，这是根本缺陷，虽然通过膨胀卷积等方式，可以快速增大CNN的感受野，但也只是比较大，不是Transformer理论上的一步到位；

2、如果单纯看提高效率角度，Transformer本身也有很多优化空间，如果只是为了执行效率而转向CNN，那这个理由似乎不那么有说服力；

3、Transformer的O(n^2)的复杂度本身也带来更多的折腾空间（比如像UniLM），可以玩出更多的花样（比如像K-BERT）。

3

反映了哪些研究问题？

综上所述，MLP-Mixer主要依靠大数据来维持其性能，其在结构设计上没有带来理论上的创新，甚至会牺牲模型可解释性和鲁棒性。这种简单粗暴的研究模式，是否存在灌水的嫌疑？全连接架构为什么被重新提起，它适合哪些研究领域和应用场景？

另外，透过MLP、CNN、Trasformer等主流架构的发展历程，我们可以看到，模型跨界的已经逐渐成为科研领域的必然趋势，这背后除了谷歌等科技巨头的主导外，大数据、大算力的时代背景产生了哪些推动作用？

而基于此，在限定领域研究特定算法的增量改进是否还有意义？从当前来看，哪些问题才应该成为学术研究的重点？围绕这些问题，林宙辰、朱军、吴琦、尤洋等人给出了如下解答:

问题1：近年不断出现模型跨界现象，从Transformer进入CV，到MLP开始用于大规模图像识别，再到CNN用于NLP预训练。这是反映了算力提升、数据量增加的行业整体发展，还是一种科技巨头主导媒体传播带来的错觉？

林宙辰：当前的MLP复兴只是为了理解注意力机制的作用，发现用MLP可以替代注意力机制。实际上用MLP的性能也只能接近，而不是超越用注意力机制时的性能，但它的计算成本要低很多，所以性价比很高，这在实际应用中还是有一定意义的。当然，MLP重新获得关注，跟谷歌的宣传关系是很大的。

吴琦：媒体传播有一定的助推作用，但并不能说是错觉，这其实正是科研领域的一个必然趋势— 模型的统一性。

我认为，所谓的模型跨界并没有什么惊奇的。无论CV还是NLP，本质都是机器学习。机器学习是对数据分布规律的分析，它不在乎数据本身是来源于图像还是语言。因此，二者本质上是相通的，只是不同应用的表现形式。当一个模型（比如Transformer）在某一个领域里被证明有效之后，必然会被迁移到另一个领域，而这个过程中，那些拥有大量计算资源，足够数据支撑，且工程能力过硬的科技巨头往往会占据先机。

我不认为这类研究有什么问题，恰恰相反，它对整个community是有益的。从学术界角度来看，高校科研人员发paper会变得更难——难以超过产业界大模型的performance。但换一个角度，如何合理、高效的使用并解释预训练模型，也是学术界没有大GPU，大数据的研究者值得思考和探索的问题。

朱军：媒体传播确实在“模型跨界”方面起到了一定的助推作用。过去一个机器学习模型需要三到五年，才逐渐被应用端使用，或者扩展到自然语言领域。现在大家获取信息的渠道更快更丰富，加上很多技术是开源的，这些都在一定程度上增加了模型跨界应用的可能。但这一过程中，大数据也起到了关键性作用。因为很多模型本身所用的数据来自不同的领域，自然语言里有，计算机视觉里也有，大家在范式上逐渐趋于同质化，这为加快模型迁移速度创造了条件。

问题2：之后是否会有更多MLP、CNN跨界的新研究？MLP会像预训练Transformer和视觉 Transformer成为AI社区的主流吗？存在哪些应用局限？

林宙辰：MLP应当只是昙花一现，它的性能并没有超越现有的最新方法，只是在“性价比”上超越了Transformer，而工业界并不在乎通过堆砌算力达到更高的性能。那些需要低计算复杂度的应用，如手机、边缘计算，它们对性价比更敏感，可能是MLP研究能获得较多应用的唯一场景。”

朱军：MLP本身有一定的价值，大家肯定会沿着这条路不断深挖，类似工作还会有很多。但是不能期待MLP可以解决所有问题，它可能在benckmark数据集或者其他性能指标上有所提高，但同时损失东西也可能更严重，比如可解释性、鲁棒性。它的价值应该是分场景的，如果更关心可解释性，比如医疗诊断，那么它可能不适合。

问题3：在跨界渐成趋势的背景下，研究人员在限定领域开展特定算法优化，模型改进的意义是什么？为什么要做跨界研究？

吴琦：类似的跨界研究会越来越多，效果也不会差，但不能因此否定在限定领域中研究特定算法架构的意义，一方面，很多实际应用是集中于某一个特定领域的——实际应用更注重结果和效率，模型是否统一并不重要。另一方面是有效性，特定的算法架构也具有一定的可迁移性。

尤洋：模型跨界在机器学习领域一直在发生，这是一个自发的过程。很多年前，人们就用LSTM在视觉数据集MNIST上取得不错的效果。我们设计任何一种方法，都是希望它具有通用性，而不是局限于NLP或者CV。虽然最开始有些研究是关于特定算法架构的增量、改进的，但是日后有可能在其它应用上也会产生好的效果。

问题4：有人指出，MLP-Mixer、预训练CNN的出现，是因为没有意识到任务本身（图像分类）设置的局限性，才导致学术社区在狭窄的领域上做一些无意义的灌水，真正应该做的是不断去扩展对智能本身的理解，探索全新的任务。您怎么看？

吴琦：我相信图像理解（分类，检测）的提高，对‘智能’的提高是很有作用的，因为‘智能’的输入是由‘感知’来获取的，而感知的一部分就是对视觉信息的理解，这个理解无论是向量化的，还是结构化的，对后续的‘认知’和‘推理’都至关重要。

无论任务怎么‘新’，感知一定是一个非常重要前提条件。以VQA为例，当我们去使用ground-truth的图像信息（比如物体类别，属性，关系等）来作为后面回答问题推理模型的输入时，会发现结果很好。但是换成由模型识别出的图像信息之后，问答的准确率会大幅下降。所以某种意义上，‘视觉’能力是这个任务的瓶颈。而所谓‘智能’、‘推理’，在获取完美的视觉感知信息之后，就没有那么困难了。所以我认为，不管是MLP，CNN还是transformer，只要能够提高视觉感知的能力，就一定是在推进对‘智能’的理解。

尤洋：我认为，每个成熟的研究人员都有自己的判断。对智能本身的理解非常重要，但并不能说其它研究工作是是“无意义的灌水”。一般重大科研成果的发布往往会超出所有人的预料，这意味着科研本身需要一定的自由度，所以我认为，学术社区只要能做到数据真实，有足够高的自由度就好。

问题5：有人指出，借助于算力和数据的发展确实可以在一定程度上忽视算法的改进。但机器学习理论的研究也不能荒废。理论和实验是科学的两条腿，我们也需要不断从理论角度去探索能直接发挥作用的算法归纳偏置。在CNN和 Transformer的关系探讨中，有人指出，CNN偏重等变性，Transformer偏重关联性，而一个好的架构应该两者兼顾。对于以上观点，您怎么看？

尤洋：我认为，理论研究是非常重要的，如果我们希望能将AI用到一些未来的高危或重要的任务中，就需要坚实的理论依据。同时，我也认为，理论研究到一定程度是能指导我们获得更好的使用方法的。关于等变性和关联性的结合，这可能取决于具体的应用。如果未来能有模型能自动根据具体的应用去动态调整两者的比重，应该会很有意思。

问题6：您认为目前AI社区应该更加关注哪些研究方向，不应该过多关注哪些研究方向？

尤洋：我认为两个研究方向非常重要：(1) 自监督学习; (2) AI模型的能耗；

过去10年，大规模数据集的创建和以GPU算力的大幅提升，使得监督学习 (supervised learning)方法在大规模应用中取得了非常好的效果。按照当前的技术趋势，未来人工智能技术的优化与应用需要更大的数据。然而，创建一个具有干净、准确标签的数据集非常昂贵和缓慢。

与此同时，无标签数据正在以前所未有的速度生成，为了充分利用这些数据，设置一个合适的学习目标并从数据本身获得监督信息是一种潜在的有效解决方案。不同于依赖人工标注的方法，自监督学习 (self-supervised learning)通过探索数据点之间的关系而生成标签，使得研究人员能够无限地去探索数据中免费的标签信息。此外，由于标注人员的认知能力有限，人造标签可能会限制AI模型学习能力的上限。

另外，由于能耗的原因，芯片产业在多年前已经从主频时代转向了多核时代。同样，AI模型训练的能耗可能会是未来人工智能发展的重要瓶颈。根据Emma Strubell等人的研究，从纽约到旧金山每位旅客乘坐飞机产生二氧化碳排放量是1,984 lbs。然而，两年前训练一个Transformer模型却需要626,155 lbs (现在应该更高)。所以，要想让人工智能未来广泛应用，研究人员应该尝试设计一些低能耗的方法。

参考链接：https://kexue.fm/archives/8431

推荐阅读

【重磅】斯坦福李飞飞《注意力与Transformer》总结，84页ppt开放下载！
【ICML2021】计算机视觉中的自注意力机制教程，谷歌&伯克利出品
你在读博士期间明白的最深刻的道理是什么？
【重磅】CV大佬Szeliski-新书《计算机视觉：算法与应用(第二版)》
分层级联Transformer！苏黎世联邦提出TransCNN: 显著降低了计算/空间复杂度！
清华姚班教师劝退文：读博，你真的想好了吗？
2021李宏毅老师最新40节机器学习课程！附课件+视频资料
最强通道注意力来啦！金字塔分割注意力模块，即插即用，效果显著，已开源！
登上更高峰！颜水成、程明明团队开源ViP，引入三维信息编码机制，无需卷积与注意力
常用 Normalization 方法的总结与思考：BN、LN、IN、GN
注意力可以使MLP完全替代CNN吗？未来有哪些研究方向？
清华鲁继文团队提出DynamicViT：一种高效的动态稀疏化Token的ViT
并非所有图像都值16x16个词--- 清华&华为提出一种自适应序列长度的动态ViT

重磅！DLer-计算机视觉&Transformer群已成立！

大家好，这是计算机视觉&Transformer论文分享群里，群里会第一时间发布最新的Transformer前沿论文解读及交流分享会，主要设计方向有：图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、视频超分、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注：研究方向+学校/公司+昵称（如Transformer+上交+小明）

???? 长按识别，邀请您进群！

C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
被动降噪的概念及编程实现 CodeByte 人工智能算法 javascript 编程
被动降噪是指通过编程技术和算法，对输入的数据进行处理，以减少或消除其中的噪声。噪声可以是各种形式的干扰，例如来自传感器、通信信号或其他外部源的干扰。在本文中，我们将探讨被动降噪的意义以及如何使用编程来实现这一目标。被动降噪的意义：噪声对数据的准确性和可靠性产生负面影响。在许多应用领域，例如图像处理、音频处理和信号处理中，噪声的存在可能导致数据质量下降，使得后续的分析和处理变得困难。因此，被动降噪技
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
matlab卷积矩阵绝对值,MATLAB矩阵分析和计算 weixin_39928736 matlab卷积矩阵绝对值
MATLAB矩阵分析和计算编辑锁定讨论上传视频本词条缺少概述图，补充相关内容使词条更完整，还能快速升级，赶紧来编辑吧！《MATLAB矩阵分析和计算》是清华大学出版社出版的一本图书。[1]书名MATLAB矩阵分析和计算作者杜树春出版社清华大学出版社出版时间2019年6月1日定价59元ISBN9787302524816印次1-1印刷日期2019.04.23MATLAB矩阵分析和计算图书内容编辑本书侧重
【GESP】C++三级真题 luogu-B4359 [GESP202506 三级] 分糖果 CoderCodingNo GESP c++java 开发语言
GESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较简单。题目题解详见：【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoder【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoderGESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较
盲超分的核心概念小冷爱读书数学建模盲超分超分重建
一、盲超分的本质与数学建模1.退化过程的数学表达低分辨率图像（LR）可看作高分辨率图像（HR）经过退化模型后的结果：：观测到的低分辨率图像：待恢复的高分辨率图像：模糊核（BlurKernel）⊗：卷积操作↓：下采样（步长为）：加性噪声（如高斯噪声、泊松噪声等）盲超分的核心问题：在未知、、的情况下，从估计。2.为什么传统超分方法会失效？传统方法（如SRCNN、EDSR）假设退化是固定的（如双三次下采
【华为机试】HJ61 放苹果不爱熬夜的Coder 算法华为机试 golang 华为 golang 算法面试
文章目录HJ61放苹果描述输入描述输出描述示例1示例2解题思路算法分析问题本质分析状态定义与转移递推关系详解动态规划表构建算法流程图示例推导过程代码实现思路时间复杂度分析关键优化点边界情况处理递归解法对比实际应用场景测试用例分析算法特点数学原理完整题解代码HJ61放苹果描述我们需要将m个相同的苹果放入n个相同的盘子中，允许有的盘子空着不放。求解有多少种不同的分法。输入描述输入两个整数m,n(0B[
.NET中的安全性之数字签名、数字证书、强签名程序集、反编译 hezudao25 NET .net assembly 加密算法 reference header
本文将探讨数字签名、数字证书、强签名程序集、反编译等以及它们在.NET中的运用（一些概念并不局限于.NET在其它技术、平台中也存在）。1.数字签名数字签名又称为公钥数字签名，或者电子签章等，它借助公钥加密技术实现。数字签名技术主要涉及公钥、私钥、非对称加密算法。1.1公钥与私钥公钥是公开的钥匙，私钥则是与公钥匹配的严格保护的私有密钥；私钥加密的信息只有公钥可以解开，反之亦然。在VisualStud
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
Tomcat：Java Web应用的幕后英雄互联网动态分析 tomcat
在当今数字化浪潮中，Java作为一门成熟且广泛应用的编程语言，支撑着无数企业级应用和互联网服务的稳定运行。而在JavaWeb开发领域，Tomcat无疑是一个举足轻重的存在，它宛如一位默默耕耘的幕后英雄，为众多Web应用提供了可靠的运行环境。Tomcat的起源与发展Tomcat的故事始于1999年，当时SunMicrosystems（后被Oracle收购）与Apache软件基金会合作，旨在为Java
数据结构：导论梁辰兴数据结构学习笔记数据结构导论算法时间复杂度空间复杂度
目录一，数据结构的研究内容二，基本概念与术语（一）数据、数据元素、数据项与数据对象（二）数据结构（三）数据类型与抽象数据类型️三，抽象数据类型的表示与实现⚙️四，算法与算法分析⚖️（一）算法的定义及特性（二）评价算法优劣的基本标准⏱️（三）算法的时间复杂度（四）算法的空间复杂度章结一，数据结构的研究内容数据结构是计算机科学的核心基础，其研究内容可概括为三大维度：数据组织形式：探索如何将现实世界中的
C++ 标准库＜numeric＞
以下对C++标准库中头文件所提供的数值算法与工具做一次系统、深入的梳理，包括算法功能、示例代码、复杂度分析及实践建议。一、概述中定义了一组对数值序列进行累加、内积、差分、扫描等操作的算法，以及部分辅助工具（如std::iota、std::gcd/std::lcm等）。所有算法均作用于迭代器区间，符合STL风格，可与任意容器或原始数组配合使用。从C++17、20起，又陆续加入了并行友好的std::r
具身语义导航算法总揽 Shilong Wang 具身导航算法算法
端到端方法小脑大脑GNMNavDPNaVILAViNTNomadNavidStreamVLNMapNavNavGPTUni-NavidOctoNavNavGPT2模仿学习行为克隆BCDAgger模块化方法GOATVLFMSayPlanLM-NavETPNavVoroNavEmbodiedRAGVL-NavStairwaytoSuccess业内大佬北大王鹤NavidUni-NavidOctoNav吴
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
android去除gps漂移代码,GPS漂移过滤算法扇贝君
GPS漂移过滤算法基本思想：逐点过滤，再经过基础过滤后，进行判断运动状态，静止状态和运动中。如果静止，则使用电子围栏；如果运动，则先过滤大速度，再过滤加速度，然后过滤距离(包括超大距离，和速度相关距离)。对于要过滤的点，采用之前最近的可靠点，进行替换，同时，无效次数+1，如果后面是有效点，则无效次数-1，如果无效次数归0，认为这个点才是真正可靠点(无效次数为正时，都为要被替换的点)。如果遇到不定点
项目开发日记
框架整理学习UIMgr：一、数据结构与算法1.1关键数据结构成员变量类型说明m_CtrlsList当前正在显示的所有UI页面m_CachesList已打开过、但现在不显示的页面（缓存池）1.2算法逻辑查找缓存页面：从m_Caches中倒序查找是否已有对应ePageType页面，找到则重用。页面加载：从资源管理器ResMgr加载prefab并绑定控制器/视图组件。页面关闭：从m_Ctrls移除，添加
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement

归纳偏置多余了？靠“数据堆砌”火拼Transformer，MLP架构可有胜算？

1

2

谷歌之后，多家科研机构相继发表7篇相关论文，试图从多个维度打击Transformer。

CNN篇

3

推荐阅读

你可能感兴趣的:(卷积,算法,大数据,编程语言,计算机视觉)