Sky_codes

Hard Patches Mining for Masked Image Modeling

摘要

蒙面图像建模（MIM）因其在学习可伸缩视觉表示方面的潜力而引起了广泛的研究关注。在典型的方法中，模型通常侧重于预测掩码补丁的特定内容，并且它们的性能与预定义的掩码策略高度相关。直观地说，这个过程可以被看作是训练一个学生（模型）来解决给定的问题（预测掩蔽补丁）。然而，我们认为，该模型不仅应该关注解决特定的问题，而且应该站在教师的立场上，以产生一个更具挑战性的问题本身。为此，我们提出了硬补丁挖掘Hard Patches Mining（HPM），一个全新的MIM预训练框架。我们观察到，重建损失自然可以成为预训练任务难度的度量标准。因此，我们引入了一个辅助损失预测器，首先预测补丁损失，并决定下一步掩盖在哪里。它采用相对关系学习策略，以防止对精确重建损失值的过拟合。在不同设置下的实验证明了HPM在构建掩蔽图像方面的有效性。此外，我们通过经验发现，仅仅引入损失预测目标就会导致强大的表示，验证了感知哪里难以重建的能力的有效性。

介绍

自监督学习的目标是从没有任何注释的大规模数据集中学习可扩展的特征表示，一直是计算机视觉（CV）的研究热点。受自然语言处理（NLP）中的掩蔽语言建模（MLM）的启发，该模型被敦促预测句子中的掩蔽词，CV中的掩蔽图像建模（MIM）引起了许多研究者的极大兴趣。图1a显示了MIM预训练的传统方法的范例。在这些典型的解决方案中，模型通常侧重于预测掩蔽补丁的特定内容。直观地说，这个过程可以被看作是训练一个学生（即模型）来解决给定的问题（即预测掩蔽补丁）。

为了缓解CV中的空间冗余，产生具有挑战性的借口任务，掩蔽策略变得非常关键，这些策略通常是在预定义的方式下生成的，如随机掩蔽、块级掩蔽和统一掩蔽。然而，我们认为，一个困难的借口任务并不是我们所需要的全部，不仅学习解决MIM问题是很重要的，而且学习产生具有挑战性的任务也是至关重要的。换句话说，如图1b所示，通过学习创建具有挑战性的问题和解决它们，模型可以站在学生和老师的鞋子，被迫举行更全面的理解图像内容，从而导致自己通过生成一个更理想的任务。

为此，我们提出了硬补丁挖掘（HPM），一种新的MIM训练范式。具体来说**，给定一个输入图像，我们不是在手动设计的标准下生成一个二进制掩模，而是首先让模型作为教师生成一个要求很高的掩模，然后像传统方法一样训练模型作为学生预测掩模补丁。**通过这种方式，我们敦促模型学习在哪里值得被掩盖，以及如何同时解决问题。然后，问题就变成了如何设计辅助任务，使模型知道硬补丁在哪里。

直观地说，我们观察到重建损失可以自然地衡量MIM任务的难度，这可以通过图2中每个元组的前两个元素来验证，其中由MAE [24]预先训练的1600个时期的主干2用于可视化。正如预期的那样，我们发现图像的那些鉴别部分（例如，物体）通常很难重建，导致更大的损失。因此，通过简单地敦促模型预测每个斑块的重建损失，然后掩盖那些预测损失较高的斑块，我们可以获得一个更强大的MIM任务。为了实现这一点，我们引入了一个辅助损失预测器，首先预测斑块损失，并根据其输出决定下一步屏蔽哪里。为了防止它被重建损失的精确值所淹没，并使其集中于斑块之间的相对关系，我们设计了一种新的基于二元交叉熵的相对损失作为目标。在图2中，我们使用在200个epoch的预训练所使用的ViT-B进一步评估了损失预测器的有效性。正如图2中每个元组的最后两个元素所示，预测损失较大的斑块往往具有区别性，因此掩盖这些斑块带来了一个具有挑战性的情况，即对象几乎被掩盖。同时，考虑到训练的演变，我们提出了一个简单到困难的mask生成策略，在早期阶段提供了一些合理的提示。

根据经验，我们观察到在各种设置下，比监督基线和香草MIM预训练有显著和一致的改善。具体来说，由于预训练只有800个epoch，HPM使用ViT-B和ViTL在ImageNet-1K [58]上达到了84.2%和85.8%的前1准确率，分别比1600个时代预训练的MAE [24]高出+0.6%和+0.7%。

方法

在本节中，我们首先在Sec中概述我们提出的HPM。3.1.然后，在第二秒中介绍了HPM中的两个目标，即重建损失和预测损失。3.2和3.3，分别。最后，在第二节中。3.4，描述了易于实现的掩模生成方式，以及整个训练过程的伪代码。

3.1 概述

如图1和第二节所介绍。1、传统的MIM预训练解决方案可以看作是训练学生解决给定的问题，而我们认为让模型站在教师的立场上，产生具有挑战性的借口任务是至关重要的。为此，我们引入了一个辅助解码器来预测每个掩蔽补丁的重建损失，并仔细设计了其目标。图3给出了我们提出的HPM的概述。

HPM由一个学生（fθs、dφs和dψs）和一个教师（fθt、dφt和dψt）组成。fθ（·）、dφ（·）和dψ（·）分别是编码器、图像重建器和重建损失预测器，分别由θ、φ和ψ参数化。下标t代表老师，s代表学生。为了产生一致的预测（特别是对于重建损失预测器），动量更新被应用于教师：其中，θt =（θt，φt，ψt）、θs =（θs，φs，ψs）、m为动量系数。

在每次训练迭代中，一个输入图像I被重塑为一系列二维补丁x∈RH×W×C∈RN×（P2C）。（H，W）为原始图像的分辨率，C为通道数，P为patch大小（例如，16），因此为N = HW/P2。然后，将x输入教师，得到章节中描述的补丁预测重建损失模型（Lˆt=dψt，fθt(x)）。3.2.基于预测的重建损失Lˆt和训练状态，以一种简单到困难的方式生成了一个二进制掩码M∈{0,1} N。3.4.学生的训练基于两个目标，即重建损失(3.2)和预测损失(3.3)

这两个目标以一种交替的方式工作，并通过逐渐敦促学生重建图像中的硬补丁来相互强化以提取更好的表示。

3.2 Image Reconstructor

掩蔽图像建模的目的是训练一个自动编码器（即图像重建器）根据预定义的目标，如原始RGB像素和特定特征。

其中，对于传统的方法，二进制掩模M∈{0,1} $^N$ 是通过预先定义的方式生成的。 $\odot$ 表示元素级的点积，因此x $\odot$ M表示未屏蔽的（即可见的）补丁，反之亦然。T（·）是变换函数，生成重构的目标。M（·，·）表示相似性度量，如l2-距离、平滑的l1-距离、知识蒸馏和交叉熵。

3.3 Hard Patches Mining with a Loss Predictor

众所周知，在NLP中，句子中的每个单词都是高度语义的。在理解语言时，训练一个模型来只预测少数缺失的单词往往是一项具有挑战性的任务。而在CV中，图像具有较重的空间冗余，因此提出了大量的掩模策略来处理这个问题。

除了通过先验知识设计一个具有挑战性的情况外，我们认为，产生高要求的场景的能力对MIM的预训练也是至关重要的。直观地说，我们考虑了在等式中定义的具有高重建损失的补丁(3)作为硬斑块，它隐含地表示了图像中最具鉴别性的部分，这在图2中得到了验证。因此，如果该模型具有预测每个补丁的重建损失的能力，那么简单地掩盖这些硬补丁就会成为一项更具挑战性的借口任务。

为此，我们使用了一个额外的损失预测器（即图3中的dψ）来在训练过程中挖掘硬斑块。接下来，我们将介绍如何设计具有两种变量的损失预测器的目标： 1)绝对损失和2)相对损失。

Absolute loss

最简单和最直接的方法是以MSE的方式来定义目标。

其中dψs是由ψs参数化的学生的辅助解码器，这里的Lrec与梯度分离，是损失预测的ground-truth。然而，请回想一下，我们的目标是确定图像中的硬补丁，因此我们需要学习补丁之间的相对关系。在这样的设置下，MSE并不是最合适的选择，因为Lrec的量表随着训练的进行而减小，因此损失预测器可能会被Lrec的量表和确切值所淹没。为此，我们提出了一种基于二值交叉熵的相对损失作为替代方案。

Relative loss.

给定一系列重建损失的Lrec∈RN，我们的目标是利用相对损失来预测目标排序（Lrec）。这是因为，在一个图像中，重建任务的拼块难度可以通过精射排序（Lrec）来测量。然而，由于目标排序（·）操作是不可微的，因此很难直接最小化目标排序(dψs（fθs（xM））和目标排序（Lrec）之间的一些自定义距离。

因此，我们将这个问题转化为一个等价的问题：密集关系比较。具体来说，对于每一对补丁（i，j），其中i，j = 1、2、···、N和i ≠ j，我们可以通过预测Lrec (i)和Lrec (j)的相对关系来隐式地学习目标排序（Lrec），即哪个更大。其目标的定义如下：

其中，Mi = Mj = 0表示补丁i和j在训练期间都被屏蔽。

3.4 Easy-to-Hard Mask Generation

有了重建损失预测器，我们能够定义一个更具挑战性的借口任务，即掩盖输入图像的硬/鉴别部分。具体地说，我们从教师网络中获得预测的重建损失，即fθt=dψt（Lˆt=）)后，对Lˆt降序进行目标排序（·）操作，以获得图像内的相对重建难度。然而，在早期的训练阶段，学习到的特征表征还没有准备好进行重建，而是被丰富的纹理所淹没，这意味着较大的重建损失可能不等同于鉴别。

然而，在早期的训练阶段，学习到的特征表征还没有准备好进行重建，而是被丰富的纹理所淹没，这意味着较大的重建损失可能不等同于鉴别。为此，我们提出了一种易于硬实现的掩模生成方法，提供了一些合理的提示，指导模型逐步重建掩模硬补丁。

如图3所示，对于每个训练阶段t，由Lˆt生成掩模补丁的αt，并随机选择其余1个−αt。具体来说，αt = α0 + t/T（αT−α0），其中T是总的训练时期，而α0，αT∈[0,1]是两个可调的超参数。我们过滤了Lˆt最高的αt·γN补丁，其余的（1个−αt）·γN补丁被随机屏蔽。αt的比例从α0以线性方式逐渐增加到αT，而没有进一步调整简单，有助于一个易于难操作的训练过程。

算法1总结了训练过程，以及计算训练重建损失预测器的目标的伪代码。由于易于硬的掩模生成的简单实现，请参考补充材料的伪代码。

实验

消融

总结

在本文中，我们发现有必要让模型站在教师的立场上进行MIM预训练，并验证补丁重建损失可以自然地作为重建难度的度量。为此，我们提出了HPM，它引入了一个辅助的重建损失预测任务，从而以生成-求解的方式迭代地指导训练过程。在实验上，HPM引导了跨各种下游任务的掩蔽图像建模的性能。跨不同学习目标的消融表明，HPM作为一个即插即用的模块，可以毫不费力地集成到现有的框架中（例如，像素回归[24,78]和特征预测[17,72,86]）中，并带来一致的性能改进。
挖掘硬例子的技术被广泛应用于对象检测[34,39,60]。损失预测可以是一种全新的选择。此外，它还可以作为一种在标签高效学习[19,70,71]中过滤高质量伪标签的技术。同时，如图2和图4所示，显著性区域倾向于有较高的预测损失，因此HPM也可以用于显著性检测[67]和无监督分割[63,64]。我们希望这些观点能启发未来的工作。讨论作为MIM的一个常见问题，线性探测和k-NN分类的性能不如对比学习替代方案[24]相似。此外，由于额外的解码器，HPM需要更多的计算成本。用ViTL [18]对抗MAE [24]基线训练我们的HPM需要∼1.1×的时间。如何在没有额外的辅助解码器的情况下设计一个损失预测任务有待进一步研究。

python模块triton安装教程 2401_85863780 1024程序员节 triton whl
Triton是一个用于高性能计算的开源库，特别适用于深度学习和科学计算。通过预编译的whl文件安装Triton可以简化安装过程，尤其是在编译时可能会遇到依赖问题的情况下。以下是详细的安装步骤：安装前准备：Python环境：确保已经安装了Python，并且Python版本与whl文件兼容。pip：确保已经安装了pip，这是Python的包管理器，用来安装外部库。下载whl文件：从可靠的来源下载适用于
【prompt示例】智能客服+智能质检业务模版姚瑞南 prompt实战应用案例 prompt 前端
本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。（转载需经授权）整体结构说明：序号结构说明备注1prompt主体提示词主体主要包含定义角色+背景描述+目标+输出内容2变量变量主要提取知识库文档流程里涉及的⼀些判断项，需要接口的部分3注意事项常规注
【机器学习】逻辑回归(LogisticRegression)原理与实战 GentleCP 机器学习(深度学习)逻辑回归 logistic regression 原理与实战机器学习
文章目录前言一、什么是逻辑回归1.1逻辑回归基础概念1.2逻辑回归核心概念二、逻辑回归Demo2.1数据准备2.2创建逻辑回归分类器2.3分类器预测三、逻辑回归实战3.1数据准备3.2数据划分与模型创建3.3预测数据评估模型四、参数选择五、总结六、参考资料本文属于我的机器学习/深度学习系列文章，点此查看系列文章目录前言本文主要通过文字和代码样例讲述逻辑回归的原理（包含逻辑回归的基础概念与推导）和实
Transformer AI专题精讲深度学习 transformer 深度学习自然语言处理
1.TransformerTransformer是一种新的、基于attention机制来实现的特征提取器，可用于代替CNN和RNN来提取序列的特征。Transformer首次由论文《AttentionIsAllYouNeed》提出，在该论文中Transformer用于encoder-decoder架构。事实上Transformer可以单独应用于encoder或者单独应用于decoder。Trans
《深度Q网络优化：突破高维连续状态空间的束缚》人工智能深度学习
在人工智能的发展历程中，深度Q网络（DQN）作为强化学习与深度学习融合的关键成果，为解决复杂决策问题开辟了新路径。但当面对高维连续状态空间时，DQN会出现训练不稳定、收敛速度慢等问题，严重限制了其应用范围。如何优化DQN以适应高维连续状态空间，成为当下研究的热点。深度Q网络基础回顾深度Q网络结合了深度学习强大的特征提取能力与Q学习的决策优化思想。在传统强化学习中，Q学习通过Q表记录每个状态-动作对
智享AI直播三代系统，开启「机器人比人更会带货」时代！缘分开始t621238 人工智能机器人
智享AI直播三代系统，开启「机器人比人更会带货」时代！在当今数字化浪潮汹涌的时代，直播行业作为电商领域的重要驱动力，正经历着前所未有的变革。近日，智享AI直播三代系统的横空出世，宛如一颗重磅炸弹，在直播行业掀起了惊涛骇浪，正式开启了「机器人比人更会带货」的全新时代。一、技术革新，颠覆传统直播模式智享AI直播三代系统的诞生，标志着直播行业进入了智能化的新纪元。它融合了先进的人工智能技术，包括深度学习
Transformer以及BERT阅读参考博文 mumukehao 文本属性图文本属性图
Transformer以及BERT阅读参考博文Transformer学习：已有博主的讲解特别好了：李沐：Transformer论文逐段精读【论文精读】_哔哩哔哩_bilibili知乎：Transformer模型详解（图解最完整版）-知乎个人杂想：QKT∗VQK^{T}*VQKT∗V中，QKTQK^TQKT其实可以理解为相似性矩阵S，那么S∗VS*VS∗V其实就相当于相似性矩阵对原始的嵌入加权求和。
ZCC6507: A Superior Isolated Power Solution Outperforming SN6507 zhichengwei 其他
Inthefieldofisolatedpowerdesign,engineersareconstantlyseekingmoreefficient,flexible,andcost-effectivesolutions.TheZCC6507,ahigh-performancepush-pulltransformerdriver,standsoutwithitsuniquedesignandsig
自学黑客（网络安全），一般人我劝你还是算了吧网安周星星 web安全安全 windows 网络网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包文章讲述了自学网络安全时常见的误区，如先学编程、过度追求深度学习以及收集过多资料，并提供了前期学习的硬件、软件选择建议，强调了基础编程知识和英文能力的重要性。文中给出了详细的学习路线，包括基础操作入门、实战操作以及参加CTF和HVV等竞赛来提升技能，并推荐了一系列相关书籍和学习资源。一、自学网络安全学习的误区和陷阱1.不要试图先成为一
Python在DevOps中的应用：自动化CI/CD管道的实现蒙娜丽宁 Python杂谈 python javascript 开发语言
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在现代软件开发中，DevOps理念的引入极大地提升了开发与运维的协作效率，而持续集成（CI）与持续部署（CD）则是其核心实践之一。Python作为一种简洁高效的编程语言，凭借其丰富的库和灵活性，成为实现自动化CI/CD管道的理想选择。本文深入探讨了如何利
DQN的原理和代码实现 SmallerFL NLP&机器学习 DQN 强化学习深度学习
文章目录1.概述2.DQN的训练步骤2.1初始化2.2训练循环2.3终止条件2.4评估3.代码示例1.概述深度Q网络（DeepQ-Network,DQN）是强化学习中的一种重要算法，由GoogleDeepMind于2013年提出。DQN结合了Q学习和深度学习，通过使用神经网络来近似Q值函数，解决了传统Q学习在高维状态空间中的问题。2.DQN的训练步骤2.1初始化环境：定义环境（例如，Atari游戏
深度学习基础知识 namelijink 深度学习人工智能
cuda简介：CUDA（ComputeUnifiedDeviceArchitecture）是由NVIDIA开发的一种并行计算平台和应用程序编程接口（API）。它允许开发人员利用NVIDIA的GPU（图形处理器）来加速各种计算任务，包括科学计算、机器学习、深度学习、数据分析等。NVIDIA是一个全球领先的计算技术公司，专注于设计和制造高性能计算设备。除了生产强大的GPU，NVIDIA还提供与其GPU
【python语言应用】最新全流程Python编程、机器学习与深度学习实践技术应用（帮助你快速了解和入门 Python）赵钰老师 python 机器学习深度学习 python 机器学习深度学习数据分析人工智能
近年来，人工智能领域的飞速发展极大地改变了各个行业的面貌。当前最新的技术动态，如大型语言模型和深度学习技术的发展，展示了深度学习和机器学习技术的强大潜力，成为推动创新和提升竞争力的关键。特别是PyTorch，凭借其灵活性和高效性，成为科研人员和工程师的首选工具。理解和掌握深度学习的基础知识，深入了解其与经典机器学习算法的区别与联系，并系统掌握包括迁移学习、循环神经网络（RNN）、长短时记忆网络（L
【Python深入浅出㊸】解锁Python3中的TensorFlow：开启深度学习之旅奔跑吧邓邓子 Python深入浅出 python 深度学习 tensorflow
目录一、TensorFlow简介1.1定义与背景1.2特点二、Python3与TensorFlow的关系2.1版本对应2.2为何选择Python3三、安装TensorFlow3.1安装步骤3.2验证安装四、TensorFlow基本概念与使用方法4.1计算图（Graph）4.2会话（Session）4.3张量（Tensor）4.4变量（Variable）4.5占位符（Placeholder）五、Te
人工智能爆火下，关于软件技术专业的发展思考 yzx991013 人工智能
软件技术专业作为信息技术领域的核心学科，其发展方向始终与技术进步和社会需求紧密相关。以下是软件技术专业未来发展的关键方向及学习建议：一、技术方向与前沿领域1.云原生与分布式架构方向：云原生技术（Kubernetes、Docker、Serverless）、微服务架构、分布式系统设计。原因：企业全面上云已成趋势，需要高效、弹性的云原生解决方案。学习建议：掌握AWS/Azure/GCP等云平台，学习服务
数字化转型三大核心要素：数据、技术、人才千千标寻大数据云计算人工智能 ai
数字化转型的三大核心要素——数据、技术和人才，是推动企业在数字经济时代取得成功的关键。数据数据是数字化转型的基础。高质量的数据能够为企业提供深刻的市场洞察和客户行为分析，帮助做出更明智的决策。通过有效管理和利用数据，企业可以优化运营流程，提升产品和服务质量，从而实现更高的效率和客户满意度。技术先进的技术支持是实现数字化转型的关键驱动力。无论是云计算、人工智能、大数据分析还是物联网，这些前沿技术的应
【Java】已解决：java.util.concurrent.ExecutionException 屿小夏 java 开发语言 android
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
数字人技术在短视频中的应用 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
数字人、短视频、人工智能、计算机视觉、自然语言处理、虚拟主播、内容创作1.背景介绍短视频作为一种新兴的传播媒介，其内容形式丰富、传播速度快、用户粘性强，已成为当今互联网领域最热门的应用之一。随着技术的不断发展，数字人技术逐渐成熟，并开始在短视频领域得到广泛应用。数字人是指利用计算机技术模拟真实人类形象和行为的虚拟角色，其具备逼真的外形、流畅的肢体动作和自然的语言表达能力。数字人技术在短视频领域的应
强化学习在机器人控制中的应用：从理论到实践 Echo_Wish 前沿技术人工智能机器人
强化学习在机器人控制中的应用：从理论到实践大家好，我是你们熟悉的人工智能与Python领域自媒体创作者Echo_Wish。今天我们来聊聊一个炙手可热的话题——强化学习在机器人控制中的应用。近年来，随着人工智能技术的飞速发展，机器人在各个领域的应用越来越广泛。而强化学习作为一种重要的机器学习方法，为机器人控制提供了强有力的技术支持。接下来，让我们一起探讨强化学习在机器人控制中的原理和实践，并通过具体
探索工业物联网平台：智能制造的未来 Echo_Wish Python进阶物联网制造
探索工业物联网平台：智能制造的未来大家好，我是你们熟悉的人工智能与Python领域自媒体创作者Echo_Wish。今天我们来聊聊一个热门话题：工业物联网平台（IndustrialInternetofThings,IIoT）。工业物联网平台在智能制造中的应用正日益广泛，帮助企业实现数据驱动的生产、优化运营效率，并推动工业4.0的发展。那么，工业物联网平台到底是什么，又该如何实现呢？今天就让我们一探究
c++加载TensorRT调用深度学习模型方法 feibaoqq 深度学习深度学习 YOLO
使用TensorRT来调用训练好的模型并输出结果是一个高效的推理过程，特别是在需要低延迟和高吞吐量的应用场景中。以下是一个基本的步骤指南，展示了如何在C++中使用TensorRT进行推理。步骤1：准备环境安装TensorRT：确保你已经安装了NVIDIATensorRT库。准备模型：确保你的训练好的模型已经转换为TensorRT支持的格式，通常是一个.engine文件。你可以使用onnx-tens
本地部署的DeepSeek-R1-32B与DeepSeek-R1-7B模型效果对比 MaxCode-1 搭建本地gpt Deepseek
本地部署的DeepSeek-R1-32B与DeepSeek-R1-7B模型效果对比在当今人工智能快速发展的时代，大语言模型（LargeLanguageModel,LLM）的应用场景日益广泛。无论是企业级应用还是个人开发，本地部署大语言模型已经成为一种趋势。DeepSeek-R1-32B和DeepSeek-R1-7B作为DeepSeek系列中的两个重要版本，分别代表了不同规模和性能的模型。本文将从多
Apache Iceberg 与 Apache Hudi：数据湖领域的双雄对决夜里慢慢行456 大数据大数据
在数据存储和处理不断发展的领域中，数据湖仓的概念已经崭露头角，成为了一种变革性的力量。数据湖仓结合了数据仓库和数据湖的最佳元素，提供了一个统一的平台，支持数据科学、商业智能、人工智能/机器学习以及临时报告等多种关键功能。这种创新的方法不仅促进了实时分析，还显著降低了平台成本，增强了数据治理，并加速了用例的实现。数据存储和处理的演变催生了被称为数据湖仓的现代分析平台。这些平台旨在解决传统架构的局限性
23. AI-大语言模型真上帝的左手 23.AI 人工智能语言模型自然语言处理
文章目录前言一、LLM1.简介2.工作原理和结构3.应用场景4.最新研究进展5.比较二、Transformer架构1.简介2.基本原理和结构3.应用场景4.最新进展三、开源1.开源概念2.开源模式3.模型权重四、再谈DeepSeek前言AI‌一、LLMLLM（LargeLanguageModel，大语言模型）‌1.简介 LLM（LargeLanguageModel，大语言模型）‌是指使用大量文本
点云从入门到精通技术详解100篇-基于 CBCT 与口内扫描数据的牙齿点云配准格图素书深度学习计算机视觉数学建模人工智能
目录前言国内外研究现状传统牙齿配准点云配准2牙齿数据的深度学习点云配准基础2.1牙齿数据获取方法2.1.1口腔印模2.1.2辐射成像2.1.3口内扫描2.2深度学习网络2.2.1全连接神经网络2.2.2卷积神经网络2.2.3孪生神经网络2.3点云数据配准基础2.3.1点云数据格式2.3.2点云旋转表达2.3.3传统点云配准方法3基于PCRNet的PCR-SA牙齿点云配准3.1CBCT-IOS牙齿配
deep seek m0_69576880 前端 ai
1.介绍:DeepSeek是一款由国内人工智能公司研发的大型语言模型，拥有强大的自然语言处理能力，能够理解并回答问题，还能辅助写代码、整理资料和解决复杂的数学问题。免费开源，媲美ChatGPT最近最火爆的AI对话程序。www.deepseek.com这是deepseek官网2.这是deepseek注册页面3.国产语言对话ai，大家有兴趣的可以去试试。不过chatgpt也进行了改变，大家也可以免费使
RWKV Runner：让RNN-LLM模型触手可及步子哥 rnn 人工智能深度学习
在这个信息爆炸的时代，人工智能（AI）已经成为我们生活中不可或缺的一部分，尤其是大语言模型（LLM）在自然语言处理中的广泛应用。然而，尽管这些技术的潜力巨大，许多用户仍然面临着使用门槛高、配置复杂等问题。为了解决这一困境，RWKVRunner应运而生。它不仅提供了一个简便的接口，还让用户能够轻松地使用大语言模型。本文将深入探讨RWKVRunner的功能、安装步骤以及如何利用它来实现各种应用。RWK
标贝科技参编国内首个AIGC大模型功能测试标准标贝科技科技 AIGC 功能测试
近日，由山东省人工智能协会、青岛市人工智能产业协会携手发布了国内首个针对生成式人工智能（AIGC）大模型测试的团体标准——《生成式人工智能（AIGC）大模型功能测试指标体系》。标贝科技作为行业领先的AI技术创新及大模型应用企业受邀参与了标准的编制。该标准的发布对于规范大模型的研发和应用具有重要意义，为人工智能产业的健康、快速发展注入了新的活力。AIGC大模型作为人工智能从专业智能走向通用智能的关键
计算机视觉——SIFT特征提取与检索算法 -shiba- 计算机视觉算法 sift算法
计算机视觉——SIFT特征提取与检索算法1.基本介绍1.1算法特点1.2检测步骤2.基本原理2.1关键点2.2尺度空间2.3高斯模糊2.3.1高斯函数2.3.2高斯模糊2.3.3高斯金字塔2.4DOG函数2.4.1DOG函数的2.5关键点描述及匹配3.实验以及总结3.1实验数据集3.2提取图片SIFT特征，并展示特征点3.2.1代码3.2.2结果展示(选取)3.3计算两张图片SIFT特征匹配结果3
Python深度学习代做目标检测NLP计算机视觉强化学习 matlabgoodboy 计算机视觉 python 深度学习
了解您的需求，您似乎在寻找关于Python深度学习领域的代做服务，特别是在目标检测、自然语言处理（NLP）、计算机视觉以及强化学习方面。以下是一些关于这些领域的概述以及寻找相关服务的建议。1.Python深度学习代做概述目标检测：目标检测是计算机视觉中的一个重要任务，旨在识别图像或视频中的特定对象，并确定它们的位置。Python中的深度学习框架（如TensorFlow、PyTorch）和计算机视觉
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要

Hard Patches Mining for Masked Image Modeling

摘要

介绍

相关工作

方法

3.1 概述

3.2 Image Reconstructor

3.3 Hard Patches Mining with a Loss Predictor

3.4 Easy-to-Hard Mask Generation

实验

消融

总结

你可能感兴趣的:(论文阅读,计算机视觉,人工智能,深度学习,transformer,VIT)