我爱计算机视觉

CVPR 2022 | 旷视研究院入选论文亮点解读

关注公众号，发现CV技术之美

本文转载自旷视研究院

日前，CVPR 2022 论文接收情况正式出炉（CVPR 2022 接收论文公布！总计2067篇！）。此次旷视研究院表现出色，共有 17 篇论文成功入选。

作为计算机视觉世界三大顶会之一，CVPR 每年都会吸引大量研究机构和高校参会。近年来，CVPR 的论文投稿量持续增加，据官方消息，本届大会大约 2067 篇论文被接收，相比去年，今年的接收率上升 24%。

学术成果来袭，一起先睹为快吧

FS6D: Few-Shot 6D Pose Estimation of Novel Objects

FS6D：用于新物体的少样本 6D 位姿估计

本文提出一个少样本开集 6D 位姿估计问题：对于没见过的新物品，已训练的网络模型只需依据几张 RGBD 图像就能在新测试场景中估算出该物品的 6D 位姿，而无需依赖物品的高精度 CAD 模型以及额外的训练。为了提高模型的泛化性，我们提出一个具有丰富纹理和形态多样性的大型仿真数据集用于网络预训练。同时，我们讨论求解该问题的可行算法并提出一个稠密原型匹配网络用于 6D 位姿估计。在公开数据集上，我们的方法大幅领先于其他可行算法。

关键词：6D位姿估计，少样本学习，数据集和基准

https://fs6d.github.io/

Voxel Field Fusion for 3D Object Detection

体素场融合的三维物体检测方法

本文提出了一种名为体素场融合的用于跨模态 3D 检测的方法。为了保持跨模态信息的一致性，其通过使用光束的方式来表示并在体素场中融合图像特征。因此，我们首先使用可学习的采样器来在图像平面采集重要区域的信息，并使用光束的方式将其投影至体素场中。这一操作在保证了特征空间表示的同时增强了三维空间中上下文交互。接着我们提出使用光束方式的融合来进行跨模态的特征增强，用于在体素场中融合上下文信息。我们所提出的方法在 KITTI 和 nuScenes 数据集上均取得了领先的结果。

关键词：体素场，跨模态特征融合，物体检测

Real-time Object Detection for Streaming Perception

用于流感知的实时物体检测

本文证明了使用实时检测模型相比非实时模型在自动驾驶的流感知问题上能够最小的避免算法检测结果和周围环境不一致而带来的决策误差问题。然后进一步分析与证明了在使用实时模型的情况下诸多后处理方法将不再起作用，然后得出实时模型还存在所有的决策误差全都由模型不能感知未来周围环境所导致的。基于以上发现，本文提出一套非常简洁的方法去赋能传统检测器，使其具备感知未来的能力。

具体来说，本文提出一个双流感知模块用于捕捉静态信息和动态信息以及一个趋势感知损失为周围物体产生自适应关注权重。基于本文提出的范式，模型的训练和未来预测都是端到端的，并且在推理的时候不会带来额外的时间延迟。本文的架构能够在静止和任何速度的车辆行驶情况下表现鲁棒。该方法在Argoverse-HD数据集上取得精度的最佳结果并且击败了该比赛的最佳成绩。

关键词：object detection, streaming perception, video prediction

Tree Energy Loss: Towards Sparsely Annotated Semantic Segmentation

树状能量损失函数：解决稀疏标注语义分割问题

语义分割任务往往需要精细的像素级别标注，标注花费昂贵，因此面向稀疏标注的语义分割（仅标注一部分点、线、区域）有着极大的应用需求。为解决这一问题，本文提出了树状能量损失函数。该损失函数将图像表示为一个最小生成树，并对图像低级先验、高级语义的隶属度进行建模，为未标注区域提供语义引导。

串联地将低级、高级的隶属度作用到语义分割网络的预测结果上，能够为未标注区域生成伪标签，在线地实现网络自我训练。树状能量损失函数十分高效，能够直接地部署到任意一个语义分割网络中。在PASCAL VOC、Cityscapes和ADE20k等数据集上的实验表明，和已有方法相比，我们的方法在各类稀疏标注场景下，均能够实现先进的语义分割性能，无需多阶段训练策略、交替优化步骤、额外的监督数据以及耗时的后处理步骤。

关键词：树状滤波器，稀疏标注，语义分割，损失函数

Progressive End-to-End Object Detection in Crowded Scenes

一种适用于密集场景的渐进式端到端目标检测器

在遮挡场景中，端到端的物体检测框架容易重复检测图像中的物体，由此产生冗余检测框影响性能。为了解决这一问题,本文从 Sparse RCNN 这一端到端物体检测框架入手,通过分析发现其检测结果中:高分检测框中存在的假阳性结果非常少。

基于此，本文依据 Sparse RCNN 的原生结构设计了渐进式的端到端物体检测器。该方法的原理是在在优化过程中仅选择低分检测框进行后续的渐进式优化。该方法在遮挡场景数据集 CrowdHuman 上性能 SOTA,在 CityPersons 和 MSCOCO 等数据集上也有显著的性能提升。

关键词：遮挡物体检测,端到端物体检测

Focal Sparse Convolutional Networks for 3D Object Detection

用于 3D 目标检测的焦点稀疏卷积神经网络

在 3D 检测任务中，点云/体素数据不均匀地分布在3维空间中，不同位置的数据对任务本身起着截然不同的作用。然而，主流的 3D 检测主干网络，稀疏卷积网络，却在使用同样的方式处理所有的数据。不管是常规的稀疏卷积，还是流形稀疏卷积 (Submanifold Sparse Conv)。在本文中，我们提出了一种可以让网络聚焦到重要信息的稀疏卷积，焦点稀疏卷积 (Focal Sparse Conv)。该卷积可适用于纯雷达网络和多模态融合网络。该卷积可以直接用于现有的稀疏卷积网络，并首次验证了自适应的稀疏程度学习对 3D 检测任务的重要性。

我们通过大量的实验在 KITTI, nuScenes, 以及 Waymo 数据集上验证了 Focal Sparse Conv 的有效性。我们的方法在 nuScenes test 榜单上取得了单模型 70.1% mAP 的精度，超过了此前公开发表的方法。

关键词：焦点稀疏卷积，可学习稀疏程度

Relieving Long-tailed Instance Segmentation via Pairwise Class Balance

通过成对的类别平衡策略解决长尾实例分割问题

长尾问题的根源是占比不多的头部类的样本数远多于占比不小的尾部类们。直接在这种数据集上训练的模型，其分类预测会有偏差。易把尾部类样本错分成头部类样本. 现有技术提出一些指标去简单指示偏差, 并进行相应建模，达到某种平衡从而提升效果。要么局限于静态的训练集类别分布，不灵活。要么即使考虑了动态统计量，也只是每个类本身的分类情况，没有考虑到类间错分。

我们的 PCB 方法使用混淆矩阵维护训练时类间预测偏差信息。对于训练样本，除基本交叉熵损失外，据其类别从混淆矩阵中取得对抗软类标，施以该软类标的交叉熵损失进行纠偏。我们的方法可无缝插入到前沿的长尾实例分割模型中，均取得不俗提升，部分可达领域最佳效果。

关键词：长尾，实例分割，混淆矩阵，类间平衡

https://arxiv.org/abs/2201.02784

Scaling Up Your Kernels to 31x31: Revisiting Large Kernel Design in CNNs

将卷积核加大到 31x31：重新探索采用大卷积核设计的卷积神经网络

我们重新探索了现代卷积神经网络中的大卷积核设计，表明 kernel size 是一个非常重要的设计维度。在现代结构设计的作用下，超大卷积核既涨点又高效，越大越涨点，甚至大到 31x31 都非常有效。通过一系列探索实验，归纳了在现代模型中应用大卷积的五条准则，如使用 shortcut、采用 depth-wise 卷积和针对性的优化、用小卷积核进行重参数化等。在此之上提出了一种新的架构 RepLKNet，大量使用超大 kernel size，大到 27x27 和 31x31，在大模型和下游任务上取得了亮眼的结果，比 Swin 更好或相当，挑战了诸多行业内的传统认知，远超传统小 kernel 的 CNN。

关键词：卷积，架构设计，kernel size，transformer，结构重参数化

https://arxiv.org/pdf/2203.06717.pdf

RepMLPNet: Hierarchical Vision MLP with Re-parameterized Locality

RepMLPNet：一种采用重参数化技术引入局部性的分层 MLP 网络

视觉 MLP 模型的一大本质缺陷是缺少 inductive bais，如局部先验和平移不变性，所以难以训练，需要特殊的训练方法或较大的训练开销。这一工作用结构重参数化在 MLP 的全连接层中引入 inductive bias，大大提升精度和训练效率。

训练时的模型包括与全连接层并行的卷积，这一卷积可以通过一系列代数变换等价合并到全连接层中去，从而最终得到的模型既不再包含卷积又具有了局部先验和平移不变性。在此之上，提出一种分层设计的 MLP 网络，超过 ResMLP、gMLP 等模型，而且是第一个可用于语义分割的 MLP 模型。

关键词：MLP、inductive bias、结构重参数化

https://arxiv.org/pdf/2112.11081.pdf

Practical Stereo Matching via Cascaded Recurrent Network with Adaptive Correlation

基于自适应相关级联递归网络的实用双目匹配

随着神经网络的不断演进，基于深度学习的立体匹配算法也得到了十分广泛的关注和应用。然而，面对从诸如手机等消费级设备获取的双摄图，要恢复出精确且细节完美的视差图并不容易；对于实际应用中的困难场景例如细小物体、非理想行对齐和主副摄不一致等，现有立体匹配算法的效果往往大打折扣。

因此，我们针对立体匹配算法在真实场景的应用进行了深入研究。本文介绍了我们提出的一个新的立体匹配框架 CREStereo，本算法不仅在主流的公开数据集上取得了优异的结果（Middlebury 和 ETH3D 排名第一），并且在真实场景的应用中也有出色的表现。

关键词：立体匹配，自适应，真实场景

TransMVSNet: Global Context-aware Multi-view Stereo Network with Transformers

TransMVSNet：使用 transformer 捕捉全局上下文信息的多视图立体视觉网络

我们在本文中提出了 TransMVSNet，基于我们对多视图立体视觉任务 (MVS) 中的特征匹配的探索。我们将 MVS 类比回其特征匹配任务的本质，提出了一个强大的特征匹配转换器 (FMT) 来利用内部（自身）和外部（交叉）注意力来聚合图像内和图像之间的上下文信息。为了促进 FMT 更好地工作，我们利用自适应感受野 (ARF) 模块来确保特征范围的平稳过渡，并通过特征传播桥接不同阶段的特征，以跨不同尺度传递转换后的特征和梯度。此外，我们应用特征相关性来衡量特征之间的相似性，并采用减少歧义的 focal loss 来加强监督。我们的方法在 DTU 数据集、Tanks and Temples benchmark 和 BlendedMVS 数据集上实现了最先进的性能。

关键词：MVS、3D resconstruction、transformer

https://arxiv.org/abs/2111.14600

Decoupled Knowledge Distillation

解耦知识蒸馏

知识蒸馏是一种广泛应用的模型压缩方法，但主流方法都是 feature-based的，KD 这样的 logit-based 方法被忽视了。本文提出了一种新的视角来分析 KD。我们将 KD 的损失函数解耦为两个部分：TCKD 和 NCKD，并通过实验发现：TCKD 在传递“样本难度”相关的知识，而 NCKD 是蒸馏涨点的主要原因。更重要的是，本文发现 KD 的“耦合性”限制了1)NCKD 的有效性和2)平衡两部分损失的灵活性。为解决这两个问题我们提出了解耦知识蒸馏(DKD)，相比 feature-based 的复杂方法，DKD 可以达到相同甚至更优的性能，并且拥有更高的训练效率。

关键词：知识蒸馏、解耦

Dynamic MLP for Fine-Grained Image Classification by Leveraging Geographical and Temporal Information

一种使用动态多层感知机融合时空信息的细粒度图像分类方法

细粒度图像分类是一项具有挑战性的计算机视觉任务，在图像的视觉外观十分相似的情况下，利用其附带信息，如数据拍摄的位置和日期可以帮助分类。本文探索了一个更加高效的融合图像和地理时间特征的方法——Dynamic MLP。它的权重是由地理时间信息的特征动态提供的，满足多模态特征的不同元素之间可以交叉交互。图像特征经过这种投影后可以展现更好的可辩别性，提升分类准确度，并在 iNaturalist 的各个数据集上达到 SOTA。

关键词：细粒度，多模态，动态感知机

https://arxiv.org/abs/2203.03253

Learning Optical Flow with Kernel Patch Attention

基于块注意力的光流估计

现有方法主要将光流估计视为特征匹配任务，即学习在特征空间中将相似度高的像素进行匹配。然而，运动理解相关任务的另一个重要组成部分--空间相似性（平滑度约束）被忽视了。本文提出了基于块注意力的光流估计方法(Kernel Patch Attention, KPA)，对特征图的每个局部块进行操作，通过显式地利用局部场景内容和空间关系信息来缓解由像素特征匹配困难造成的误差。通过实验验证该方法可以充分利用局部特征关联性进行更准确的运动分析，在标准光流估计数据集上达到 SOTA 效果。

关键词：Optical flow, kernel patch attention, spatial affinity, context relation

Unsupervised Homography Estimation with Coplanarity-Aware GAN

基于平面感知对抗学习的无监督单应性矩阵估计

单应性估计是许多应用中的基本图像对齐方法。然而，现有的方法并没有显式地考虑平面诱导视差问题，导致估计的单应性矩阵容易受到多个平面的干扰。对此，本文提出了一种平面感知生成对抗网络 Coplanarity-Aware GAN，通过引导单应性估计网络关注图像对中的主导平面来提高对齐效果。此外，本文还设计了一种由粗到细的单应性估计 Transformer 网络，以更好地捕捉图像对之间的对应关系。在公开数据集上的 SOTA 表现证明了本方法的有效性。

关键词：单应性估计 GAN Transformer

Semi-Supervised Wide-Angle Portraits Correction by Multi-Scale Transformer

基于半监督策略的超广角人像畸变矫正

近年来，越来越多的智能手机配备了超广角镜头，用来拍摄更大 FOV 的场景影像。但该镜头会造成严重的透视畸变，使得场景中的线性结构弯曲，靠近边缘的人脸拉伸不自然。相比传统的人像矫正算法，现有深度学习方案能更好的解决上述问题，但却需要大量高精度的标记数据，制作流程复杂且成本昂贵。为此，我们提出一种适用于人像畸变矫正的半监督学习方案，并结合高效的端到端 MS-Unet，使我们能够同时使用标记和未标记数据来提高畸变校正效果。

关键词：畸变矫正半监督学习 transformer

Deep Constrained Least Squares for Blind Image Super-Resolution

基于最小二乘约束的盲超分

本文提出先推导了一种新的降质模型以及对应的模糊核，将去模糊和图像恢复过程拆解开来。针对模糊核估计，提出了一种动态深度线性核网络，使用多层线性网络作为模糊核。之后则推导了一种深度最小二乘滤波方法，可以在图像的高层特征中利用估计的模糊核进行去模糊操作的到清晰的图像。最后再使用双分支结构对图像进行恢复。本方法在多个盲超分数据集上均达到了 SOTA，可以得到边缘清晰，去模糊效果显著的高清图像。

关键词：盲超分模糊核最小二乘滤波

https://arxiv.org/pdf/2202.07508

END

欢迎加入「CVPR」交流群备注：CVPR

我的搬砖工具由 VS Code 变成 Cursor 了老余捞鱼人工智能 AI编程 cursor
作者：老余捞鱼原创不易，转载请标明出处及原作者。写在前面的话：本文介绍了我从VSCode转向Cursor的原因，强调了Cursor的人工智能交互流畅性以及其他一些优于VSCode的特性。VSCode是免费的，而且运行起来非常出色。我一直很喜欢VSCode，不过，它与GitHubCopilot等编码助手扩展的交互并不比使用ChatGPT好多少，而且肯定不如Claude。在寻找其他替代方案时，我偶然发
2024年AI发展的感知回顾八角Z 人工智能机器学习计算机视觉大数据
2024年，人工智能（AI）的发展呈现出诸多引人注目的关键词，深刻地塑造着技术格局、经济模式以及人类社会的方方面面。混合无疑成为这一年AI创新历程中最为显著的特征之一。多模态生成技术在这一年里取得了令人瞩目的不断进步，使得AI能够巧妙地将文本、图像、音频、视频等多种模态的信息进行深度融合与再创造。例如：AI内容创作：AI可以将作者的文字描述转换为生动的图像、视频和配乐，为创作提供更多可能性，让创意
拉曼光谱增强技术，农药“指纹图谱“数据库？百态老人数据库
构建拉曼光谱增强技术与农药"指纹图谱"数据库是农药成分快速检测领域的前沿方向，其核心在于通过纳米材料增强效应和人工智能算法解析，实现对农药分子的高灵敏度、高特异性识别。以下从技术原理、数据库构建、应用场景及挑战四方面深入解析：一、拉曼光谱增强技术原理1.表面增强拉曼散射（SERS）电磁增强机制：利用金/银纳米结构（纳米颗粒、纳米棒、纳米星）的局域表面等离子体共振效应（LSPR），在激光激发下产生"
制造业汽车业数字化转型新方案——飞速创软低代码平台人工智能
2023年7月20日-2023年7月21日2023汽车业数字化大会&制造业数字化大会在佛山顺德盛大开幕！深圳飞速创软科技有限公司如邀参加展会。本次大会聚焦于数字化转型新场景中企业承压，IT行业可以扮演怎样的角色。如今AGI时代来临，AGI将是第四次工业革命的核心驱动力。人工智能作为最先进生产力，在不断冲击着各个行业，一定程度上要求行业的现有业务结构重构，以实现当今复杂多变、极速发展的时代。在面对多
SpringAI 搭建智能体（二）：搭建客服系统智能体 drebander AI 编程 springAI Agent
在现代人工智能应用中，智能体（Agent）是一个重要的概念，它的核心能力是自主性与灵活性。一个智能体不仅能够理解用户的需求，还能拆解任务、调用工具完成具体操作，并在复杂场景中高效运行。在本篇博客中，我们将围绕一个基于SpringAI的智能体实现，深入探讨智能体的概念、构建流程以及实际应用场景。1.什么是智能体？智能体是一种能够根据目标自主执行任务的系统。与传统的AI模型生成内容的模式不同，智能体通
代码随想录算法训练营第三十六天-动态规划-474.一和零 taoyong001 算法动态规划 c++leetcode
背包问题本身就已经够反思维的了，竟然物品会有两个维度的情况，这是闹哪样？题目要求是最大子集的个数题目中的mmm和nnn可以类比为容器，要装潢这个容器，最多要多少个元素的个数，就是结果，这个容器最多有mmm个0，nnn个1这个容器相当于一个背包，这个背包是有两个维度，最多有mmm个0，nnn个1，装潢这个背包最多需要多少个物品给出的数据集就是物品这是一道01背包问题动规五部曲这里要使用一个二维的动规
神经网络入门推荐知识,神经网络入门书籍推荐快乐的小肥熊 ai智能写作神经网络 matlab 人工智能 python
适合初学者的神经网络和遗传算法资料遗传算法（GeneticAlgorithm）是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型，是一种通过模拟自然进化过程搜索最优解的方法。遗传算法是从代表问题可能潜在的解集的一个种群（population）开始的，而一个种群则由经过基因（gene）编码的一定数目的个体(individual)组成。每个个体实际上是染色体(chromosome)带
目标检测算法以及常用库概述 YOLO大师目标检测算法人工智能
YOLO目标检测创新改进与实战案例专栏专栏目录：YOLO有效改进系列及项目实战目录包含卷积，主干注意力，检测头等创新机制以及各种目标检测分割项目实战案例专栏链接:YOLO基础解析+创新改进+实战案例目标检测是在图像中发现并识别物体的过程，它是深度学习和图像处理领域的重要成果之一。在创建物体定位时，识别物体时，常见的一种方法是使用边界框。这种方法具有很高的通用，可以训练目标检测模型来识别和检测多个特
22.日常算法三问走天下 #每日算法题算法数据结构
1.按奇偶排序数组题目来源给你一个整数数组nums，将nums中的的所有偶数元素移动到数组的前面，后跟所有奇数元素。返回满足此条件的任一数组作为答案。示例1：输入：nums=[3,1,2,4]输出：[2,4,3,1]解释：[4,2,3,1]、[2,4,1,3]和[4,2,1,3]也会被视作正确答案。classSolution{public:vectorsortArrayByParity(vecto
23.日常算法三问走天下 #每日算法题算法哈希算法
1.最小绝对差题目来源给你个整数数组arr，其中每个元素都不相同。请你找到所有具有最小绝对差的元素对，并且按升序的顺序返回。每对元素对[a,b]如下：a,b均为数组arr中的元素a>minimumAbsDifference(vector&arr){sort(arr.begin(),arr.end());inttarget=arr[1]-arr[0];vector>ret;intn=arr.size
24.日常算法三问走天下 #每日算法题算法哈希算法
1.数组中两元素的最大乘积题目来源给你一个整数数组nums，请你选择数组的两个不同下标i和j，使(nums[i]-1)*(nums[j]-1)取得最大值。请你计算并返回该式的最大值。示例1：输入：nums=[3,4,5,2]输出：12解释：如果选择下标i=1和j=2（下标从0开始），则可以获得最大值，(nums[1]-1)*(nums[2]-1)=(4-1)*(5-1)=3*4=12。classS
【算法学习】分治法应用—归并排序 _Huazzi 算法学习笔记算法学习排序算法 C++分治法
归并排序是分治思想的运用。文章目录基本思想：分治之美核心算法✂️分治流程：️过程演示⌛分步实现⌨️完整代码性能分析❓常见问题优化建议基本思想：分治之美将待排序元素分成大小大致相同的2个子集合，分别对2个子集合进行排序，最终将排好序的子集合合并成为所要求的排好序的集合。归并排序（MergeSort）是分治思想的经典应用。其核心理念是：分解：将复杂的大问题分割成简单的小问题解决：逐步解决小问题合并：将
【算法学习】分治法应用—快速排序 _Huazzi 算法学习笔记算法数据结构排序算法
欢迎来到“C语言算法学习”系列！快速排序（QuickSort）是一种非常高效的排序算法，广泛用于实践中。在这篇文章中，我们将详细介绍快速排序的工作原理、C语言实现，并提供一些优化建议、常见问题的解答以及编程技巧。快速排序简介快速排序是分治算法的一种，它的基本思想是：选择一个“分界点”元素，将数组分成两部分，使得左边的所有元素都不大于分界点，右边的所有元素都不小于分界点。然后，递归地对这两部分进行排
飞速搭震撼上线开启软件开发智能化新篇章低代码
近日，飞速低代码开发平台迎来了一项具有里程碑意义的重大更新——“飞速搭”正式上线。飞速搭通过深度融合前沿的人工智能技术，实现了从需求文档到应用发布的无缝衔接，一键智能生成应用，为软件开发领域带来了全新的突破和变革。“飞速搭”的实现路径高效而清晰。用户只需将需求文档或需求描述输入给预训练的大模型，这一步骤极大地简化了传统软件开发中繁琐的需求分析和文档编写过程，使用户能够更专注于核心需求的表达。大模型
基于CNN+Transformer混合模型实现交通流量时序预测(PyTorch版) 矩阵猫咪 cnn transformer pytorch 卷积神经网络深度学习
前言系列专栏:【深度学习：算法项目实战】✨︎涉及医疗健康、财经金融、商业零售、食品饮料、运动健身、交通运输、环境科学、社交媒体以及文本和图像处理等诸多领域，讨论了各种复杂的深度神经网络思想，如卷积神经网络、循环神经网络、生成对抗网络、门控循环单元、长短期记忆、自然语言处理、深度强化学习、大型语言模型和迁移学习。随着城市化进程的加速，交通流量预测成为城市交通管理与规划中的关键任务。准确的交通流量预测
智能体（Agent）如何具备自我决策能力的机理与实现方法由数入道人工智能应急管理人工智能自然语言处理
一、智能体自我决策能力的机理从人工智能和控制理论的角度看，智能体能够“自我决策”的核心在于其“感知–认知–行动”的循环过程，以及在此过程中引入自主学习与自主优化的机制。经过优化与补充，智能体具备自我决策能力的机理可以分解为以下五个部分：1.自主感知与信息获取智能体通过传感器、数据库、互联网信息等多源数据采集，构建全面的环境感知能力。通过数据清洗、去噪、融合等方法，提升感知数据的可靠性，结合高维特征
大语言模型应用指南：OpenAI大语言模型简介 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型应用指南：OpenAI大语言模型简介1.背景介绍1.1问题的由来在过去几年中,自然语言处理(NLP)领域取得了长足的进步,这主要归功于大型语言模型(LargeLanguageModels,LLMs)的出现和发展。LLMs是一种基于深度学习的人工智能模型,能够从大量文本数据中学习语言模式和语义关系,从而生成看似人类写作的自然语言输出。随着计算能力和数据可用性的不断提高,LLMs的规模也在不
25.日常算法三问走天下 #每日算法题算法哈希算法
1.仅仅反转字母题目来源给你一个字符串s，根据下述规则反转字符串：所有非英文字母保留在原有位置。所有英文字母（小写或大写）位置反转。返回反转后的s。示例1：输入：s=“ab-cd”输出：“dc-ba”classSolution{public:stringreverseOnlyLetters(strings){intleft=0,right=s.size();while(lefthash;for(a
【算法学习】归并排序算法思想的应用—求逆序对数量 _Huazzi 算法学习笔记算法排序算法学习 c++分治法
Hey，大家好！今天我们来聊聊一个有趣的话题——如何在归并排序的基础上，高效解决求逆序对数量的问题。如果你对算法感兴趣，或者正在准备算法面试，这篇文章一定会对你有所帮助！题目描述给定一个长度为n的整数数列，请你计算数列中的逆序对的数量。逆序对的定义如下：对于数列的第i个和第j个元素，如果满足ia[j]，则其为一个逆序对；否则不是。输入格式第一行包含整数n，表示数列的长度。第二行包含n个整数，表示整
代码随想录算法训练营第七天 | LeetCode344.反转字符串、LeetCode541.反转字符串II、卡码网54.替换数字 ORIPID 算法
代码随想录算法训练营第七天|LeetCode344.反转字符串、LeetCode541.反转字符串II、卡码网54.替换数字01-1LeetCode344.反转字符串相关资源题目链接：反转字符串文章讲解：反转字符串视频讲解：反转字符串题目：编写一个函数，其作用是将输入的字符串反转过来。输入字符串以字符数组s的形式给出。不要给另外的数组分配额外的空间，你必须原地修改输入数组、使用O(1)的额外空间解
通用免杀概论曦梦逐影安全
免杀：病毒木马免于被杀毒软件查杀，基于免杀的技术包含逆向工程、反汇编、系统漏洞等hack技术企业目前标配防护：EDR（终端主机防护）、IPS、IDS、HDR（流量监控）、XDR（相较于EDR更高级），早期的话，基于Server端、Agent端，以及后面更高级的Sass云端部署，早期赛门铁克比较多，目前亚信防毒墙。国内金融、护网：卡巴斯基居多。国外的话强对抗：猎鹰、S1（7x24小时人工智能）架构为
蓝桥与力扣刷题（240 搜索二维矩阵||） এ旧栎 leetcode 矩阵算法学习方法
题目：编写一个高效的算法来搜索mxn矩阵matrix中的一个目标值target。该矩阵具有以下特性：每行的元素从左到右升序排列。每列的元素从上到下升序排列。示例1：输入：matrix=[[1,4,7,11,15],[2,5,8,12,19],[3,6,9,16,22],[10,13,14,17,24],[18,21,23,26,30]],target=5输出：true示例2：输入：matrix=[
挑战程序设计竞赛（第2版）pdf lceBear 数据结构与算法
下载地址：网盘下载内容简介······世界顶级程序设计高手的经验总结【ACM-ICPC全球总冠军】巫泽俊主译日本ACM-ICPC参赛者人手一册本书对程序设计竞赛中的基础算法和经典问题进行了汇总，分为准备篇、初级篇、中级篇与高级篇4章。作者结合自己丰富的参赛经验，对严格筛选的110多道各类试题进行了由浅入深、由易及难的细致讲解，并介绍了许多实用技巧。每章后附有习题，供读者练习，巩固所学。本书适合程序
[转]挑战程序设计竞赛2 算法和数据结构读后感 Shawn Chou
介绍本篇主要是讲《挑战程序设计竞赛2算法和数据结构》书的读后感和部分题目的再次解读、编程。包括书中的部分代码和一些个人的见解。如果想深入了解，建议去网上买一本回来看，比较适合学习算法的初学者。章节第一章第一章主要让你在AOJ处注册登录，然后开始做题第二章2.5入门问题ALDS1_1_D:MaximumProfit第三章初等排序3.2插入排序法ALDS1_1_A:InsertionSort3.3冒泡
算法竞赛入门经典（第二版）第二章循环结构程序设计注解与习题下土豆呀土豆算法竞赛入门经典算法竞赛 ACM
2-4子序列的和输入两个正整数nintmain(){intn,m;doublea;while(scanf("%d%d",&n,&m)!=EOF&&n&&m){a=0.0;for(longlongi=n;i<=m;i++)//若变为int类型则，会有乘法溢出的问题{doubleb=i*i;a+=1/b;}printf("%.5f\n",a);}}2.5分数化小数输入正整数a,b,c，输出a/b的小数
算法随笔_24: 救生艇程序趣谈算法
上一篇:算法随笔_23:通过删除字母匹配到字典里最长单词-CSDN博客======题目描述如下:给定数组people。people[i]表示第i个人的体重，船的数量不限，每艘船可以承载的最大重量为limit。每艘船最多可同时载两人，但条件是这些人的重量之和最多为limit。返回承载所有人所需的最小船数。示例1：输入：people=[1,2],limit=3输出：1解释：1艘船载(1,2)=====
选择最佳线路（二）周山至水数翠峰算法数据结构贪心算法
如何要改进？在上文中，讨论了最佳线路计算的数据结构的算法。但在交通线路的描述中，对网站线路孤立的起点，为了防止计算中无效循环，人为增加了下一结点为-1的虚拟点。但增加结点ID为-1的点，与现实不符。本文试图取消ID为-1的结点，并对算法进行修改。修改后的深圳地铁的描述为string[]nsStr=["1:1","0:1>2:1>6:1>16:1","1:4>3:6>7:3>15:1","2:1>4
一、深度学习的基本介绍关关钧深度学习深度学习人工智能神经网络
机器学习的基本步骤：前馈运算、反向传播计算梯度、根据梯度更新参数值。一、定义及基本概念深度学习，就是一种利用深度人工神经网络来进行自动分类、预测和学习的技术。它可以从海量的数据中自动学习，找寻数据中的特征。所以说，它的本质就是自动提取特征的能力。可以说，深度学习就等于深度人工神经网络。一般认为超过三层的神经网络就可以叫做深度神经网络。深度学习属于一种特殊的人工智能技术。反向传播算法：此算法是人工神
【QT开发】所有控件基类QWidget类详解及实战应用 I'mAlex QT开发教程 qt 开发语言
QWidget是Qt中所有用户界面对象的基类，掌握它的用法对于学习和使用Qt进行GUI开发至关重要。通过本篇文章的学习，你应该对QWidget有了全面的理解，能够在自己的项目中正确使用它。博主简介：现任阿里巴巴嵌入式技术专家，15年工作经验，深耕嵌入式+人工智能领域，精通嵌入式领域开发、技术管理、简历招聘面试。CSDN优质创作者，提供产品测评、学习辅导、简历面试辅导、毕设辅导、项目开发、C/C++
数据结构与算法之递归: LeetCode 51. N 皇后 (Ts版) Wang's Blog Data Structure and Algorithms leetcode 算法
N皇后https://leetcode.cn/problems/permutations-ii/description/描述按照国际象棋的规则，皇后可以攻击与之处在同一行或同一列或同一斜线上的棋子n皇后问题研究的是如何将n个皇后放置在n×n的棋盘上，并且使皇后彼此之间不能相互攻击给你一个整数n，返回所有不同的n皇后问题的解决方案每一种解法包含一个不同的n皇后问题的棋子放置方案，该方案中‘Q’和‘.
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

CVPR 2022 | 旷视研究院入选论文亮点解读

你可能感兴趣的:(算法,计算机视觉,机器学习,人工智能,深度学习)