Amusi（CVer）

重磅！腾讯优图20篇论文入选CVPR 2021

点击下方卡片，关注“CVer”公众号

AI/CV重磅干货，第一时间送达

来源：腾讯优图

计算机视觉世界三大顶会之一的CVPR 2021论文接收结果出炉！本次大会收到来自全球共7015篇有效投稿，最终有1663篇突出重围被录取，录用率约为23.7%。本次，腾讯优图实验室共有20篇论文被收录，其中Oral论文4篇，涵盖人脸识别、对抗攻击、时序动作定位、视频动作分割、无监督人脸质量评估等前沿领域。

点击 | CVPR优图播报小视频

以下为腾讯优图本次大会入选论文：

基于超球流形置信度学习的人脸识别

Spherical Confidence Learning for

Face Recognition

本论文已被CVPR 2021接收为Oral论文。最新的研究发现，球形空间可以更好地匹配人脸图像的基本几何形状，这一点已经在目前最先进的人脸识别方法中得到证实。然而，这些方法依赖于确定性的特征表达，因此会遇到特征歧义性的表达难题。PFE是解决这一难题的首次尝试。为了进一步解决PFE应用时的不足，我们提出了一种用于球形空间中人脸置信度学习的新颖框架。在数学上，我们将von Mises Fisher密度推广到其r半径对应项，并导出优化目标的闭式解。我们从理论上表明，所提出的框架具有更好的可解释性，进一步推导出了特征融合与特征比对的数学表达式。在多个具有挑战性的基准上广泛的实验结果证实了我们的假设和理论，并展示了我们的框架在风险控制的识别任务以及人脸验证和识别任务中相对于先前的概率方法和常规球形确定性嵌入的优越性能。

在开放的人像集合中学习3D人脸的聚合与特异化重建

Learning to Aggregate and Personalize 3D Face from In-the-Wild Photo Collection

本论文已被CVPR 2021接收为Oral论文。非参数化的人脸建模旨在不依赖几何假设的情况下从图像中重建3D人脸。尽管这类方法能够预测一定的细节，但其倾向于过度依赖局部颜色表观，且易受到噪声的干扰。为处理该问题，本文提出一种新的聚合与特异化学习框架（LAP) 以实现无监督的3D人脸建模。该方法从无约束的人像集合中隐式的解耦ID一致和场景特异的人脸。具体地，为学习ID一致人脸，LAP基于一种新的带有松弛一致性损失的课程学习方法，自适应地聚合同一身份的本征人脸元素。为了使人脸适应于某一特异的场景，我们提出了一个新的属性调整网络以使用目标属性和细节修改ID一致人脸。基于本文的方法，使得无监督的3D人脸受益于有意义的人脸结构信息和更高的分辨率。在公开数据库上的大量实验表明，与当前最优方法相比，LAP可以重建更好的或有竞争力的人脸几何和纹理。

在图像到图像翻译上实现层次风格解耦

Image-to-image Translation via Hierarchical Style Disentanglement

本论文已被CVPR2021接收为Oral论文。近年来，图像到图像翻译在实现多标签（以不同标签作为条件）和多风格（生成多种样式的输出）任务中都取得了重大进展。但是，由于未开发标签中的独立性和排他性导致的翻译结果不可控导致了这些方法的失败。在本文中，我们提出了层次风格解耦（HiSD）来解决此问题。具体来说，将标签重新排列成分层的树状结构，从上到下依次是独立的标签，互斥的属性和解耦的风格。相应地，我们设计了一种新的翻译过程来适应上述结构，将风格与特定标签或属性对应起来，实现可控的翻译。CelebA-HQ数据集上的定性和定量结果都证明了HiSD的能力。我们希望我们的方法将作为层次风格解耦的基准，帮助未来的图像到图像翻译的研究。

基于特征校准的表征批规范化方法

Representative Batch Normalization with Feature Calibration

本论文已被CVPR2021接收为Oral论文。批规范（BatchNorm，简称BN）已经被视为神经网络训练的默认组件之一，尽管BN是有益于稳定模型训练以及模型的整体表征能力，但是也不可避免地忽视了训练数据个体之间的特征差异。我们提出了一个简单有效的特征校准策略用来增强数据个体的特征表达能力，并几乎不增加额外的耗时。我们提出的这个中心校准方法可以增强有效的特征信息，而减少噪声特征。缩放校准方面，则能够通过约束特征强度以学习得到一个更加稳定的特征分布。我们将上述提出的BN变种方法，命名为Representative BN，这一方法能够帮助提升多种计算机视觉任务的效果，如分类、检测和分割等。

基于对比学习的紧凑图像去雾方法

Contrastive Learning for

Compact Single Image Dehazing

本文提出了一种基于对比学习的新颖对比正则化（CR）技术，以利用模糊图像和清晰图像的信息分别作为负样本和正样本。CR确保在表示空间中将还原后的图像拉到更接近清晰图像，并推到远离朦胧图像的位置。

此外，考虑到性能和内存存储之间的权衡，开发了一个基于类自动编码器（AE）框架的紧凑型除雾网络，可分别受益于自适应地保存信息流和扩展接收域以提高网络的转换能力。将具有自动编码器和对比正则化功能的除雾网络称为AECR-Net，在合成和真实数据集上进行的广泛实验表明，我们的AECR-Net超越了最新技术。

基于相似度分布距离的无监督人脸质量评估

SDD-FIQA: Unsupervised Face Image Quality Assessment with Similarity Distribution Distance

近年来为了确保非受限场景的稳定性和可靠性，人脸质量评估(Face Image Quality Assessment, FIQA)已经成为人脸识别系统不可或缺的一部分。这种方式只使用了类内信息，而忽略了类间信息。在本工作中，我们认为高质量的人脸应该与其类内样本相似并与其他样本不相似，因此提出了一种新的无监督FIQA方法，该方法结合了相似分布距离进行人脸图像质量评估（SDD-FIQA）。我们通过计算正负样本相似度分布间的Wasserstein距离生成高质量的伪标签，并以此训练用于质量预测的回归网络。实验结果表明，我们提出的SDD-FIQA显著超过了SOTA方法。同时，我们的方法在不同的识别系统上显示出良好的泛化性。后续我们将开源该工作。

基于实例误报一致性的人脸识别公平性提升方法

Consistent Instance False Positive Improves Fairness in Face Recognition

人群偏差是实际人脸识别系统中的重大挑战。现有方法严重依赖准确的人群标签，还不够通用。于是，我们提出了基于误报率惩罚的损失函数，它通过增加实例误报率（FPR）的一致性来减轻人脸识别偏差。具体来说，我们首先将实例FPR定义为高于统一阈值的非目标相似度数量与非目标相似度总数之间的比率。通过给定总FPR，可以估计出统一阈值，然后将实例FPR与总FPR的比例惩罚项引入基于softmax的损失函数分母中。实例FPR越大，惩罚越大。利用这种不平等性的惩罚，使得实例FPR具有一致性。该方法不需要人群标签，并可减轻群体之间因各种属性划分的偏差，而这些属性在训练中无需预先定义，在主流实验基准上的广泛测试结果表明，此方法已达到了SOTA。

基于高效训练替代模型的黑盒攻击方法

Delving into Data: Effectively Substitute Training for Black-box Attack

在处理对抗样本时，深度神经网络显得非常敏感，容易输出错误的预测结果。而在黑盒攻击中，攻击者并不知道被攻击目标模型的内部结构和权重，因此训练一个替代模型去模拟目标模型内部结构就是一种非常高效的方法。

在本文，我们提出了一个全新的替代模型训练方法，即在替代模型训练过程中引入更好的数据分布。首先是提出的多样性，更加多样性的训练数据分布可以获取更加丰富的特征表述；其次，提出一个对抗替换模型训练框架，将分布在分界面的对抗样本引入到替代模型训练过程中。通过结合两种思路，可以进一步提升替代模型和目标模型之间的相似性，从而提升黑盒攻击的成功率。实验结果表明，我们的方法达到了SOTA，相关的可视化结果也证明了所提出方法的优势。

学习复原有雾视频：一种新的真实数据集及算法

Learning to Restore Hazy Video:

A New Real-World Dataset and A New Method

现有的深度学习去雾方法多采用单帧去雾数据集进行训练和评测，从而使得去雾网络只能利用当前有雾图像的信息恢复清晰图像。另外一方面，理想中的视频去雾算法却可以使用相邻的有雾帧来获取更多的时空冗余信息，从而得到更好的去雾效果，但由于视频去雾数据集的缺失，视频去雾算法鲜有研究。

为了实现视频去雾算法的监督训练，我们首次提出了一组真实的视频去雾数据集（REVIDE）。使用精心设计的视频采集系统，成功地在同一场景进行两次采集，从而同时记录下真实世界中成对且完美对齐的有雾和无雾视频。考虑到获取有雾视频帧间时空冗余信息的挑战性，我们还设计了一个由置信度引导的改进型可变形卷积网络（CG-IDN）来处理有雾视频。实验证明，REVIDE数据集中采集的有雾场景远比合成雾更为贴近真实场景，并且我们提出的方法也优于现有的各种去雾算法。

基于显著边界特征学习的无锚框时序动作定位

Learning Salient Boundary Feature for Anchor-free Temporal Action Localization

时序动作定位在视频理解中仍然是一个备受挑战的任务。该任务的目的是在一个未剪辑且较长的视频中找到每个动作的起始与结束时间，以及改动作的分类结果。和预设锚框或者枚举分数的方式对比，无锚框的方法无需依赖一些冗余的超参数，显得更轻量。

因此，我们提出了第一个高效高性能且完全无锚框的时序动作定位方法。模型包括：(1) 端到端可训练的基础预测器；(2) 基于显著性优化的模块，该模块通过一种新颖的边界池化方法去为每个时序动作提名获取更有价值的边界特征；(3) 使用边界一致性约束来保证我们的模型能够找到精准的边界信息。另外，在THUMOS14数据集上，该方法相比于之前基于锚框或运动分数指导的方法在性能上有显著的提升，在ActivityNet v1.3数据集上也取得了最好的结果。

通过添加背景来去除背景影响：背景鲁棒的自监督视频表征学习

Removing the Background by Adding the Background: Towards a Background Robust Self-supervised Video Representation Learning

自监督学习通过从数据本身来获取监督信号，在视频表征学习领域展现出了巨大潜力。由于一些主流的方法容易受到背景信息的欺骗和影响，为了减轻模型对背景信息的依赖，我们提出通过添加背景来去除背景影响。具体而言，给定一个视频，我们从中随机选择一个静态帧，并将其添加到其它的每一帧中，以构建一个分散注意力的视频样本，然后要求模型拉近分散注意力的视频样本与原始视频样本之间的特征距离，如此使得模型能够更好地抵抗背景的影响，而更多地关注运动变化。我们的方法命名为背景消除（Background Erasing，BE）。值得注意的是，我们的方法可以便捷地添加到大多数SOTA方法中。BE在MoCo的基础上，对具有严重背景偏见的数据集UCF101和HMDB51，分别带来了16.4%和19.1%的提升，而对具有较小背景偏见的数据集Diving48数据集带来了14.5%的提升。

基于自监督三维重建和重投影的纹理不敏感行人重识别

Self-supervised 3D Reconstruction and Re-Projection for Texture Insensitive Person Re-identification

众所周知，行人重识别(Person ReID)高度依赖于服装纹理等视觉信息。但是，实际应用中存在多种纹理混淆的情况，这超出了大多数现有ReID方法的能力范围。因此，我们提出利用人的三维形状和身材信息来提高ReID对纹理混淆的鲁棒性，而不仅依赖于图像纹理信息。现有的person ReID使用的形状学习模型要么忽略了人的真实三维信息，要么需要额外的物理设备来采集三维源数据。在本文中，我们提出了一种新颖的学习框架，即结合三维形状学习(3DSL)模型: 加入三维人体重建作为正则化，直接从二维图像中提取纹理不敏感的3D模型编码信息。基于正则化的三维重建迫使ReID模型将三维形状信息从视觉纹理中解耦，获得具有判别性的三维形状ReID特征。为了解决缺乏三维ground truth的问题，我们提出了一种对抗式自我监督投影(ASSP)方法以拟合不需要ground truth监督训练的三维重建模块。在通用ReID数据集和纹理混淆数据集上的大量实验验证了我们模型的有效性。

基于结构信息保持的弱监督目标定位

Unveiling the Potential of Structure-Preserving for Weakly Supervised Object Localization

由于仅使用分类任务对目标进行定位的不足，弱监督目标定位（WSOL）仍然存在一些挑战。已有的工作通常利用空间正则化策略提高目标定位精度，但往往忽略了如何从训练好的分类网络中提取目标结构信息。

本文提出了一种两阶段的方法，称为结构保持激活（SPA），以充分利用WSOL卷积特征中包含的结构信息。在第一阶段，设计了受限激活模块（RAM）来缓解由分类网络引起的结构缺失问题。该模块基于观察：无约束的分类激活图和全局平均池化层导致网络仅关注目标的局部区域。在第二阶段，提出了一种称为自相关图生成（SCG）模块的后处理方法，基于第一阶段获取的激活图获得结构保持的定位图。具体地，我们利用高阶自相关（HSC）提取保留在模型中的固有结构信息，之后聚合多个位置的HSC得到精确的目标定位结果。在包括CUB-200-2011和ILSVRC在内的两个公开基准上进行的大量实验表明，与基准方法相比，本文提出的SPA方法取得了显著的性能提升。

RSTNet: 基于可区分视觉词和非视觉词的自适应注意力机制的图像描述生成模型

RSTNet: Captioning with Adaptive Attention on Visual and Non-Visual Words

本文提出了一个视觉信息增强和多模态信息敏感的Transformer结构，利用网格与网格之间相对位置的几何关系解决了特征展平操作造成的空间信息损失的问题，并且利用一个额外的注意力层度量视觉特征与语义特征的贡献，从而充分引导图像描述中视觉词和非视觉词的生成，在该任务的线上线下公开数据集上均证明了此模型的优势。

联合物体和物质挖掘的弱监督全景分割

Toward Joint Thing-and-Stuff Mining for Weakly Supervised Panoptic Segmentation

全景分割旨在将图像分别分割为物体类别的目标实例和物质类别的语义内容。这种复杂的全场景解析任务需要昂贵的实例级和像素级注释来进行模型训练。迄今为止，仅用图像级标签学习的基于弱监督学习的全景分割（WSPS）仍未被探索。

本文为弱监督全景分割提出了一个有效的联合物体与物质挖掘（Jointly Thing-and-Stuff Mining, JTSM）框架，明确地推理了目标前景和物质背景之间的语义和共现关系。为此，算法设计了一种新颖的感兴趣掩模池化（Mask of Interest Pooling, MoIPool），用于提取任意形状分割的固定尺寸的像素精确特征图。MoIPool使全景挖掘分支能够利用多实例学习（Multiple Instance Learning, MIL），并以统一的方式识别物体和物质。算法引入并行实例和语义分割分支，通过自训练进一步修正的分割掩模，其让从全景挖掘中挖掘的掩模和以自底向上的目标线索协作生成伪真实标签，以提高空间一致性和轮廓定位。

基于Transformers 从序列到序列的角度重新思考语义分割

Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformers

我们希望为语义分割方法提供另一种思路，将语义分割转变为序列到序列的预测任务。在本文中，我们使用transformer（不使用卷积和降低分辨率）将图像编码为一系列patch序列。transformer的每一层都进行了全局的上下文建模，结合常规的Decoder模块，我们得到了一个强大的语义分割模型，称之为Segmentation transformer（SETR）。大量实验表明，SETR在ADE20K（50.28％mIoU），Pascal Context（55.83％mIoU）上达到SOTA，并在Cityscapes上取得了较好结果。

通过元卷积核实现基于动态对齐的小样本学习

Learning Dynamic Alignment via Meta-filter for Few-shot Learning

小样本学习（FSL）旨在通过利用极为有限的支持集样本来适应所学知识，从而识别新的样本，是计算机视觉中的一个重要开放问题。小样本学习中用于特征对齐的大多数现有方法仅考虑图像级或空间级对齐，而忽略了通道差异。

在本文，我们提出了一种动态对齐方式，可根据不同的本地支持信息有效地突出显示查询区域和渠道。具体而言，这是通过首先动态采样以输入的少量镜头为条件的特征位置的邻域来实现的，基于此，我们可以进一步预测依赖于位置和依赖于通道的动态元滤波器用于将查询功能与特定于位置和特定于通道的知识对齐。此外，我们采用神经网络常微分方程（Neural ODE）来实现更精确的对齐控制。通过上述方法，我们的模型能够更好地捕获支持集样本的的细粒度上下文语义。

基于时空特征可控插值的视频超分辨率网络

Temporal Modulation Network for Controllable Space-Time Video Super-Resolution

在本文，我们提出了一种称之为TMNet的时间建模网络，该模型能够对视频中间帧任意插值高分辨率帧。具体而言，我们提出了TMB模块用以调节可变形卷积作用在可控特征插值中。为了更好的挖掘时间信息，我们还提出了一个基于局部特征比对的LFC模块，该模块与双向可变形ConvLSTM模块一同作用，用以提取视频中的短时和长时运动信息。在3个权威标准数据集上我们提出的方法都比过去STVSR方法在效率和效果上都要更加好，文中的消融实验比对进一步验证了我们创新点的贡献

从全局到局部：面向视频动作分割的高效网络结构搜索

Global2Local: Efficient Structure Search for Video Action Segmentation

为了回答“是否可以通过高效地搜索不同感受野的之间的组合来替代手工设计的模式呢？”的问题，在本文中，我们提出一种基于从全局到局部的搜索策略来寻找更合适的感受野组合。具体而言，我们的搜索策略将利用全局搜索的优势来找到粗粒度的参数组合，而后在利用局部搜索来精细化感受野的组合模式。值得指出的是，全局搜索并非是通过手工设计模式来寻找潜在的粗粒度参数组合。在全局搜索的基础上，我们将会使用一种基于期望引导迭代的方式来有效地精修参数组合。最后，我们的这一结果可以即插即用地使用在当前动作分割的模型中，并取得了SOTA的效果。很快我们也将开源我们的代码实现。

基于特征间高阶关系挖掘的细粒度识别方法

Graph-based High-Order Relation Discovery for Fine-grained Recognition

细粒度识别的主要目的是通过学习类别间区分性特征表达来分辨表观高度相似对象，但一般情况下，现有的大多数工作在背景复杂下效果不稳定，且忽略了不同语义特征之间的内在联系。对此，我们提出一种高效的基于图的关系挖掘方法来构建高阶关系间的上下文理解。该方法首先通过特征间语义和位置感知来构建高维特征库（feature bank），同时进行正则化约束。其次本文提出一种基于图的语义分组方法(graph grouping)，将高维特征映射到低维空间中，保留其中高区分性特征。在训练过程中，本文还提出一种分组学习策略(group-wise learning)，对特征聚类中心进行约束。通过以上三个模块的协作，该方法可学习到细粒度类别间更丰富的区分性信息。实验结果表明，该方法在4个细粒度数据集上均超过SOTA。

CVPR 作为计算机视觉领域的顶会之一，每年录取的论文几乎都代表了本年度计算机视觉领域最新、最高科研水平以及未来发展趋势。

此次入选了20篇论文，也是对腾讯优图实验室现阶段科研及创新能力的一种认可。未来，优图将继续努力，为大家带来更多可能的“视”界。

CV资源下载

后台回复：CVPR2021，即可下载代码开源的论文合集

后台回复：Transformer综述，即可下载两个最新的视觉Transformer综述PDF，肝起来！

重磅！CVer-论文写作与投稿交流群成立

扫码添加CVer助手，可申请加入CVer-论文写作与投稿 微信交流群，目前已满2400+人，旨在交流顶会（CVPR/ICCV/ECCV/NIPS/ICML/ICLR/AAAI等）、顶刊（IJCV/TPAMI/TIP等）、SCI、EI、中文核心等写作与投稿事宜。

同时也可申请加入CVer大群和细分方向技术群，细分方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。

一定要备注：研究方向+地点+学校/公司+昵称（如论文写作+上海+上交+卡卡），根据格式备注，可更快被通过且邀请进群

▲长按加小助手微信，进交流群

▲点击上方卡片，关注CVer公众号

整理不易，请给CVer点赞和在看！

你可能感兴趣的:(定位,python,计算机视觉,机器学习,人工智能)

力扣网C语言编程题：快慢指针来解决 “寻找重复数” 魏劭 C语言逻辑编程题算法 c语言 leetcode
一.简介上一篇文章解决力扣网上"查找重复数"的题目，提供了两种思路：哈希表和二分法。文章如下：力扣网C语言编程题：寻找重复数-CSDN博客本文提供另外两种解决思路：快慢指针和位运算。二.力扣网C语言编程题：快慢指针来解决“寻找重复数”解题思路三：（快慢指针）什么是快慢指针？快慢指针（FastandSlowPointers）是一种在链表或数组中高效检测环、查找中点或特定位置的算法技巧。其核心思想是使
边缘人工智能与医疗AI融合发展路径：技术融合与应用前景（下） Allen_Lyb 数智化医院2025 人工智能健康医疗数据库矩阵
医疗边缘AI的市场趋势医疗边缘AI市场正经历着显著的增长，根据市场研究公司的数据，2024年的边缘AI市场价值为125亿美元，估计在2025至2034年之间，由于各部门越来越多地采用边缘装置，CAGR为24.8%。保健、制造业、零售业和汽车业的企业拥有综合边缘计算解决方案[36]。这一增长趋势表明，边缘AI技术正在各行各业得到广泛应用，其中医疗保健是一个重要的应用领域。2023年全球边缘人工智能市
AI 编程对决：Gemini CLI vs Claude Code，谁是最佳 AI 编码工具？ charieli-fh 人工智能大模型
1.引言：AI编码工具的崛起在软件开发的快节奏世界中，人工智能（AI）工具正迅速从辅助角色转变为不可或缺的伙伴。它们不再仅仅是提供代码补全，而是能够理解复杂上下文、执行多步骤任务，甚至自动化整个工作流的智能代理。这种转变正在重塑开发者的日常工作，提高生产力，并加速创新。在众多涌现的AI编码工具中，Google的GeminiCLI和Anthropic的ClaudeCode脱颖而出，各自代表了AI辅助
全平台QQ聊天数据库解密项目常见问题解决方案管旭韶
全平台QQ聊天数据库解密项目常见问题解决方案qq-win-db-keyQQNT/WindowsQQ聊天数据库解密项目地址:https://gitcode.com/gh_mirrors/qq/qq-win-db-key项目基础介绍本项目是一个开源项目，旨在为用户提供全平台QQ聊天数据库的解密方法。项目主要使用Python、JavaScript和C++等编程语言实现。新手常见问题及解决步骤问题一：如何
量子算法：微算法科技用于定位未知哈希图的量子算法，网络安全中的哈希映射突破 MicroTech2025 量子计算哈希算法
近年来，量子计算的飞速发展使其成为各个领域的变革力量。特别是在网络安全领域，量子算法展示了加速并增强威胁检测（如恶意软件识别）方法的巨大潜力。微算法科技（NASDAQ:MLGO）用于定位未知哈希图的量子算法，是针对未知哈希图定位而设计的量子算法。这项技术可能会彻底改变在数据处理中利用哈希值的方式，特别是在恶意软件模式识别中。传统网络安全框架通常依赖哈希函数来生成不同数据结构的唯一标识符，或称之为“
百度颠覆了自己，飞算JavaAI造福了中国程序员！飞算JavaAI开发助手百度
在当今这个科技日新月异的时代，企业纷纷寻求技术突破，以期在激烈的市场竞争中脱颖而出。百度，作为中国互联网行业的领军企业之一，凭借其强大的科技实力和创新能力，在人工智能等多个领域取得了显著成就，并正在逐步颠覆自身的传统形象。百度自成立之初，就将技术创新视为企业的生命线。从最初的搜索引擎技术，到如今的深度学习、自然语言处理、计算机视觉等前沿领域，百度始终走在技术革新的前沿。其自主研发的飞桨深度学习平台
Java AI 开发智能体：从入门到实践培风图南以星河揽胜 java java 人工智能开发语言
在人工智能（AI）技术蓬勃发展的今天，智能体作为AI领域的核心概念之一，正逐渐渗透到各个行业与应用场景。而Java凭借其跨平台性、丰富的类库和强大的生态系统，成为开发智能体的热门选择。本文将深入探讨如何使用Java进行AI开发智能体，从基础概念到实践应用，解答常见问题，为你揭开JavaAI开发智能体的神秘面纱。一、Java在AI开发中的优势1.跨平台性Java的“一次编写，到处运行”特性，使得基于
ollama v0.9.4 详解：联网功能、模型目录自定义及macOS性能优化全面升级
近年来，随着人工智能技术的快速发展，模型管理与调用变得尤为重要。作为一款备受关注的本地AI模型管理工具，Ollama在最新发布的v0.9.4版本中带来了多项重磅改进和全新功能，提升了用户体验和应用场景的灵活性。本文将深入解析Ollamav0.9.4版本的功能亮点、技术改进以及实用操作指南，帮助广大开发者和AI爱好者全面掌握这款工具的最新动态。一、版本概述Ollamav0.9.4版本于2025年7月
用鸿蒙打造真正的跨设备数据库：从零实现分布式存储网罗开发 HarmonyOS 实战源码实战 harmonyos 数据库分布式
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
【V5.0 - 视觉篇】AI的“火眼金睛”：用OpenCV量化“第一眼缘”，并用SHAP验证它的“审美” 爱分享的飘哥 AI 人工智能 opencv 计算机视觉
系列回顾：在上一篇《给AI装上“写轮眼”：用SHAP看穿模型决策的每一个细节》中，我们成功地为AI装上了“透视眼镜”，看穿了它基于数字决策的内心世界。但一个巨大的问题暴露了：它的世界里，还只有数字。它能理解“时长60秒”，却无法感受画面的震撼。它是一个强大的“盲人数学家”。计算机视觉我们没有必要为每个视频进行切帧，可以针对开头的视频或者中间关键点视频进行切帧，让计算机识别。承上启下：“现在，我们来
计算机视觉 OpenCV Android | Mat像素操作（图像像素的读写、均值方差、算术、逻辑等运算、权重叠加、归一化等操作）... 凌川江雪
本文目录1.像素读写2.图像通道与均值方差计算3.算术操作与调整图像的亮度和对比度4.基于权重的图像叠加5.Mat的其他各种像素操作1.像素读写Mat作为图像容器，其数据部分存储了图像的像素数据，我们可以通过相关的API来获取图像数据部分；在获取图像数据的时候，知道Mat的类型与通道数目关重要，根据Mat的类型与通道数目，开辟适当大小的内存空间，然后通过get方法就可以循环实现每个像素点值的读取、
Python Day58 别勉. python机器学习 python 信息可视化数据分析
Task：1.时序建模的流程2.时序任务经典单变量数据集3.ARIMA（p，d，q）模型实战4.SARIMA摘要图的理解5.处理不平稳的2种差分a.n阶差分—处理趋势b.季节性差分—处理季节性建立一个ARIMA模型，通常遵循以下步骤：数据可视化：观察原始时间序列图，判断是否存在趋势或季节性。平稳性检验：对原始序列进行ADF检验。如果p值>0.05，说明序列非平稳，需要进行差分。确定差分次数d:进行
Python Day56 别勉. python机器学习 python 开发语言
Task：1.假设检验基础知识a.原假设与备择假设b.P值、统计量、显著水平、置信区间2.白噪声a.白噪声的定义b.自相关性检验：ACF检验和Ljung-Box检验c.偏自相关性检验：PACF检验3.平稳性a.平稳性的定义b.单位根检验4.季节性检验a.ACF检验b.序列分解：趋势+季节性+残差记忆口诀：p越小，落在置信区间外，越拒绝原假设。1.假设检验基础知识a.原假设与备择假设原假设(Null
Python Day57 别勉. python机器学习 python 开发语言
Task：1.序列数据的处理：a.处理非平稳性：n阶差分b.处理季节性：季节性差分c.自回归性无需处理2.模型的选择a.AR§自回归模型：当前值受到过去p个值的影响b.MA(q)移动平均模型：当前值收到短期冲击的影响，且冲击影响随时间衰减c.ARMA(p,q)自回归滑动平均模型：同时存在自回归和冲击影响时间序列分析：ARIMA/SARIMA模型构建流程时间序列分析的核心目标是理解序列的过去行为，并
Python Day44 别勉. python机器学习 python 开发语言
Task：1.预训练的概念2.常见的分类预训练模型3.图像预训练模型的发展史4.预训练的策略5.预训练代码实战：resnet181.预训练的概念预训练（Pre-training）是指在大规模数据集上，先训练模型以学习通用的特征表示，然后将其用于特定任务的微调。这种方法可以显著提高模型在目标任务上的性能，减少训练时间和所需数据量。核心思想：在大规模、通用的数据（如ImageNet）上训练模型，学习丰
Python Day42 别勉. python机器学习 python 开发语言
Task：Grad-CAM与Hook函数1.回调函数2.lambda函数3.hook函数的模块钩子和张量钩子4.Grad-CAM的示例1.回调函数定义：回调函数是作为参数传入到其他函数中的函数，在特定事件发生时被调用。特点：便于扩展和自定义程序行为。常用于训练过程中的监控、日志记录、模型保存等场景。示例：defcallback_function():print("Epochcompleted!")
Python-什么是集合難釋懷 python 开发语言数据库
一、前言在Python中，除了我们常用的列表（list）、元组（tuple）和字典（dict），还有一种非常实用的数据结构——集合（set）。集合是一种无序且不重复的元素集合，常用于去重、交并差运算等场景。本文将带你全面了解Python中集合的基本用法、操作方法及其适用场景，并通过大量代码示例帮助你掌握这一重要数据类型。二、什么是集合（set）？✅定义：集合是Python中的一种可变数据类型，它存
Python Day53 别勉. python机器学习 python 开发语言
Task：1.对抗生成网络的思想：关注损失从何而来2.生成器、判别器3.nn.sequential容器：适合于按顺序运算的情况，简化前向传播写法4.leakyReLU介绍：避免relu的神经元失活现象1.对抗生成网络的思想：关注损失从何而来这是理解GANs的关键！传统的神经网络训练中，我们通常会直接定义一个损失函数（如均方误差MSE、交叉熵CE），然后通过反向传播来优化这个损失。这个损失的“来源”
〖Python零基础入门篇⑮〗- Python中的字典哈哥撩编程 #① -零基础入门篇 Python全栈白宝书 python 开发语言后端 python中的字典
>【易编橙·终身成长社群，相遇已是上上签！】-点击跳转～<作者：哈哥撩编程（视频号同名）图书作者：程序员职场效能宝典博客专家：全国博客之星第四名超级个体：COC上海社区主理人特约讲师：谷歌亚马逊分享嘉宾科技博主：极星会首批签约作者文章目录⭐️什么是字典？⭐️字典的结构与创建方法⭐️字典支持的数据类型⭐️在列表与元组中如何定义字典
python换行输出字典_Python基础入门：字符串和字典 weixin_39959236 python换行输出字典
10、字符串常用转义字符转义字符描述\\反斜杠符号\'单引号\"双引号\n换行\t横向制表符(TAB)\r回车三引号允许一个字符串跨多行，字符串中可以包含换行符、制表符以及其他特殊字符para_str="""这是一个多行字符串的实例多行字符串可以使用制表符TAB(\t)。也可以使用换行符[\n]。"""print(para_str)#这是一个多行字符串的实例#多行字符串可以使用制表符#TAB()。
Python----Python中的集合及其常用方法 redrose2100 Python python 开发语言后端
【原文链接】1集合的定义和特点（1）集合是用花括号括起来的，集合的特点是元素没有顺序，元素具有唯一性，不能重复>>>a={1,2,3,4}>>>type(a)>>>a={1,2,3,1,2,3}>>>a{1,2,3}2集合的常用运算（1）集合元素没有顺序，所以不能像列表和元组那样用下标取值>>>a={1,2,3}>>>a[0]Traceback(mostrecentcalllast):File""
langchain+langserver+langfuse整合streamlit构建基础智能体中心 Messi^ 人工智能-大模型应用 langchain 人工智能
ServerApi******#!/usr/bin/python--coding:UTF-8--importuvicornfromfastapiimportFastAPIfrombaseimportFaissEnginefromlangserve.serverimportadd_routesfromlangchain_core.promptsimportPromptTemplatefromlang
pycharm两种运行py之路径问题 hellopbc software #pycharm python pycahrm path
文章目录pycharm两种运行py之路径问题pycharm两种运行py之路径问题运行python代码在pycharm中有两种方式：一种是直接鼠标点击runxxx运行，还有一种是使用#In[]:点击该行左边的绿色三角形按钮运行有可能在pythonconsole窗口运行有可能在你当前运行文件的窗口（就是run之后产生的那个窗口）**问题：**你会发现，涉及到路径问题时（使用相对路径），可能在这两种运行
Python元组的遍历難釋懷 python 前端 linux
一、前言在Python中，元组（tuple）是一种非常基础且常用的数据结构，它与列表类似，都是有序的序列，但不同的是，元组是不可变的（immutable），一旦创建就不能修改。虽然元组不能被修改，但它支持高效的遍历操作，非常适合用于存储不会变化的数据集合。本文将系统性地介绍Python中元组的多种遍历方式，包括基本遍历、索引访问、元素解包、结合函数等，并结合大量代码示例帮助你掌握这一重要技能。二、
Python集合生成式
一、前言在Python中，我们已经熟悉了列表生成式（ListComprehension），它为我们提供了一种简洁高效的方式来创建列表。而除了列表之外，Python还支持一种类似的语法结构来创建集合——集合生成式（SetComprehension）。集合生成式不仅可以帮助我们快速构造一个无序且不重复的集合，还能有效提升代码的可读性和执行效率。本文将带你全面了解：✅什么是集合生成式✅集合生成式的语法结
Python开发从新手到专家：第三章列表、元组和集合 caifox菜狐狸 Python开发从新手到专家 python 元素集合列表元组数据结构字典
在Python开发的旅程中，数据结构是每一位开发者必须掌握的核心知识。它们是构建程序的基石，决定了代码的效率、可读性和可维护性。本章将深入探讨Python中的三种基本数据结构：列表、元组和集合。这三种数据结构在实际开发中有着广泛的应用，从简单的数据存储到复杂的算法实现，它们都扮演着不可或缺的角色。无论你是刚刚接触Python的新手，还是希望进一步提升编程技能的开发者，本章都将是你的宝贵指南。我们将
python入门之字典二十四桥_ python入门 python
文章目录一、字典定义二、字典插入三、字典删除四、字典修改五、字典查找六、字典遍历七、字典拆包一、字典定义#{}键值对各个键值对之间用逗号隔开#1.有数据的字典dict1={'name':'zmz','age':20,'gender':'boy'}print(dict1)#2.创建空字典dict2={}print(dict2)dict3=dict()print(dict3)二、字典插入dict1={
大模型智能运维详解：技术架构、落地挑战与行业实践 FreeTools FreeAiGuard 运维架构人工智能运维开发科技
大模型智能运维详解：技术架构、落地挑战与行业实践作者：开源大模型智能运维FreeAiOps在数字化转型加速的背景下，企业IT系统复杂度呈指数级增长，传统运维模式面临效率低下、故障定位困难、成本高昂等瓶颈。大模型技术的出现为智能运维提供了突破性解决方案，其通过自然语言处理、多模态数据分析与自动化决策能力，正在重塑运维工作的底层逻辑。本文将从技术原理、落地挑战、行业实践三个维度，系统解析大模型智能运维
python类的定义与使用菜鸟驿站2020 python
class01.py代码如下classTicket():#类的名称首字母大写#在类里定义的变量称为属性,第一个属性必须是selfdef__init__(self,checi,fstation,tstation,fdate,ftime,ttime,notes):self.checi=checiself.fstation=fstationself.tstation=tstationself.fdate
Python爬虫设置代理IP 菜鸟驿站2020 python
配置代理ipfrombs4importBeautifulSoupimportrequestsimportrandom#从ip代理网站获取ip列表defget_ip_list(url,headers):web_data=requests.get(url,headers=headers)soup=BeautifulSoup(web_data.text,'lxml')ips=soup.find_all(
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发