Amusi（CVer）

CVPR 2022 | 浙大提出Oriented RepPoints：旋转目标检测网络

点击下方卡片，关注“CVer”公众号

AI/CV重磅干货，第一时间送达

点击进入—> CV 微信技术交流群

作者：小海马 | 已授权转载（源：知乎）编辑：CVer

https://zhuanlan.zhihu.com/p/511356711

一般物体相比，空中目标通常是非轴对准的，具有杂乱的环境。与主流的包围盒方向回归方法不同，本文提出了一种有效的自适应点学习方法，该方法利用自适应点表示，能够捕捉任意方向实例的几何信息。为此，本文提出了三种定向转换函数，以便于分类和定位。此外，我们提出了一种有效的自适应点学习质量评估和样本分配方案，用于在训练过程中选择具有代表性的点样本，能够从相邻物体或背景噪声中捕获非轴对齐特征。在自适应学习中，引入空间约束来惩罚离群点。

Oriented RepPoints for Aerial Object Detection

论文：https://arxiv.org/abs/2105.11111

代码（已开源）：

https://github.com/LiWentomng/OrientedRepPoints

1.1 Introduction

CVPR 2022 | 浙大提出Oriented RepPoints：旋转目标检测网络_第2张图片

图1：传统与航空目标的区别

介绍：首先我们来看图1了解一下航空目标检测与传统的目标检测有什么不同；左图的传统的目标检测的数据，右图是航空目标检测的数据。很明显可以看出，1.传统的检测框是垂直的矩形框，而右图是斜着的带有方向的矩形框。2.航空图中的目标一般要比传统的目标更密集。【这里先铺垫一句，传统目标检测的GT box是4个值-左上角和右下角的（x，y）坐标，共四个值；而航空目标检测（也可说旋转目标检测）是有8个值来表示GT box-矩形框四个角点的（x，y）坐标，共8个值】

CVPR 2022 | 浙大提出Oriented RepPoints：旋转目标检测网络_第3张图片

图2：主流方法和RepPoint点集方法

动机：在航空目标检测任务中主流的方法是将此类任务视为（旋转目标检测，1.对目标框进行定位，2.对目标进行分类，3.回归预测处一个框的旋转角度），虽然定位比较准确，但是旋转方向的回归很多时候是不太准确的。作者就考虑，基于旋转角度的方向预测是不准的，选择不适用角度值预测方向。使用RepPoints点集表示目标框架使用点集对目标进行定位和结构的的表示，通过点集表示的目标结构直接回归处带有方向的检测框。这样避免了对角度的预测，通过目标结构预测定向更准确。

想要从零看懂这篇论文需要有知识框架的铺垫，1.理解可变形卷积。2.理解RepPoint点集表示目标检测框架。有兴趣可以自行查看原文：1. Deformable Convolutional Networks 2. RepPoints: Point Set Representation for Object Detection

1.2 Introduction：可变形卷积

CVPR 2022 | 浙大提出Oriented RepPoints：旋转目标检测网络_第4张图片

图3：可变形卷积的形式

CVPR 2022 | 浙大提出Oriented RepPoints：旋转目标检测网络_第5张图片

图4：可变形卷积的结构

首先要先理解一下可变形卷积，现在来看图3，这是可变形卷积想要表达的采样形式，a是代表普通的卷积核是3*3的，所示采样的点数是9个，b,c,d都是可变形卷积（c、d只是一种特殊的形式），可以看出a普通卷积采样的位置是固定的，而可变形卷积做的事情就是给9个采样点，每一个点加一个偏移量得到9个点新的采样坐标（偏移量是小数，例如原一个采样点坐标（3,4）加上偏移量可能为（3.6,5.8）坐标变成了小数，这个时候就用双线性插值法为该点取值），把新的9个位置作为可变形卷积采样点的位置，进行常规的卷积加权的操作。只是改变了采样点的位置。

在来说一下可变形卷积的结构，先从输入的特征图中，单独用一个小的卷积分支对特征图中的每一个点都学习一组偏移量的信息offset field（这里的通道数是2N，N表示采样点的个数3*3的卷积核N在这里表示9，2表示每个采样点都有x坐标偏移值和y坐标的偏移值），用来表示当卷积核的走到特征图该点的时候应该偏移到哪个位置来计算。这个偏移量没有具体的取值范围，offsets学出来值的应该是有正有负的小数(正负代表方向)，代码中有后处理是的在加上偏移量的新采样的位置不会超过特征图的范围。这个offsets就是点集表示目标的关键。

1.3 Introduction：RepPoints

RepPoints点集表示的目标检测和CenterNet其实是同一时期的文章都是2019年的属于anchor free的表示。在看这篇文章的时候网上的很多解读都是非常模糊，细节不清楚这就导致很难理解2022年的这篇Oriented RepPoints。自己仔细阅读梳理了一下这篇RepPoints文章，了解之后再看2022年的就很容易理解。（这里涉及了很多的细节，可能文章设置的逻辑有一点乱。不理解细节对不太熟目标检测框架的朋友很不友好）

CVPR 2022 | 浙大提出Oriented RepPoints：旋转目标检测网络_第6张图片

图5：RepPoints网络框架

论文中给出的流程图实际上不容易理解，这我在论文中的基础之上又重新画了一下。首先我们先从整体上来看这个网络，目标检测通常是分为定位目标位置和分类两个内容。这个网络的训练定位是分为两个阶段，分类是一个阶段。首先这个网络的backone是用的FPN，出来的是5个层级的Scale的特征图，在此处只对一个特征图出来的head举例子。一层特征图出来被分为两个分支，一个用来做目标的定位，另一个用来做分类。

定位分支首先是从一层特征图中做三次3*3的卷积，然后分为两个支路，上边的支路用作学习可变形卷积的offsets，通过offsets可以得到点集各个点的位置，可以从位置转换成边框，相当于两阶段的网络提出proposal的过程。下边的分支是用来对第一阶段的提出proposal做一个细化的定位。

上边的分支是典型的可变形学习产生Offsets的操作，先用一个3*3的卷积学习一下特征，然后1*1的卷积用来改变通道产生offsets，offsets的特征图是2N，N代表的是卷积核采样点的个数，乘以2的意思是说每一个采样点的的偏移量对应x方向的偏移和y方向的偏移，特征图的每一个点就代表一个点集（也可以说是代表一个目标或者代表一个anchor，此处的点集的个数默认是9，因为3*3的卷积核对应9个采样点），偏移量的取值是有正有负的小数（没有对取值范围进行限制，但是会对超出边界的采样点进行处理），偏移量加上特征图中点的位置可以得到采样点的位置，9个点按照scale的倍率映射回原图中的坐标，这个时候我们得到了一组点集9个点的坐标，在通过转换函数Convert即可以生成pseudo box，至此可以说是为特征图中的每个点都生成了一个ancher/pseudo box/proposal。(个人觉得在这里这三种叫法都说的过去) 第二阶段产生pseudo box的方式和第一阶段相同。

定位分为两个阶段：对于这两个阶段，在训练中只有positive目标被分配成为RepPoin作为正样本去做定位损失。两个阶段的定位损失都是smooth L1 loss对pseudo box的左上角和右下角的点做（这里可以看出实际上做损失监督的方式应该算是弱监督---不是直接对点集中点的位置做，而是对通过点集生成的pseudo box做损失。）一阶段正样本的选择方式1.通过GT的尺寸和下采样的倍率关系找出目标应该出现在特征图的哪一层（哪个scale，FPN出来了五层不同大小的特征图应该属于哪一层）；2.满足GT的中心点映射到特征图中点的位置。第二阶段细化阶段是先用一个可变形卷积学习一下然后是1*1的卷积，产生一组offsets，细化阶段指对正样本进行细化。第二阶段选择正样本的方式，在第一阶段产生的所有pseudo box中与GT的IOU的值大于0.5才去做细化的损失。

分类：分类分支也是对positive pseudo box（有目标的框）做分类，第一阶段产生的pseudo box与GT的IOU大于0.5认为有目标的框做分类损失，用的是focal loss。

转换函数Convert有三种：1.Min-max function.通过点集所有点的x，y坐标的最大最小值画框。2.Partial min-max function.通过点集部分点（代码中是前四个点）的x，y坐标的最大最小值画框。3.Moment-based function.通过一组点集中点位置的均值和标准差回归出框的位置。三种准换函数选择一种来应用，都是可导的再网络中可以反传。

分配positive总结：定位一阶段，根据GT的尺寸 s(B) = ⌊log2(√wBhB/4)⌋，选择给某一个scale的特征层；GT的中心点对应到特征图里的位置的一个feature map bin。满足这两个条作为positive。定位二阶段，第一阶段生成的box，与GT的IOU大于0.5的时候才拿去第二阶段作为positive进行细化。分类阶段，只对第一阶段生成的pseudo box进行分类，与GT的IOU大于0.5表示有目标作为positive再进行分类（特征图的通道C+1,是类别数+背景），小于0.4认为无目标，0.4-0.5之间的pseudo box被忽略。

思想理解：1.通过第一阶段的offsets产生点集定位，将offfsets作为分类和定位中可变形卷积（绿色的卷积快）中的偏移量，巧妙的将位置信息和类别特征结合起来，再网络反推学习的过程中可以联合监督。2.第一阶段的损失实际上只选择了一个positive（为一个目标选择了一个尺度中的一个pseudo box），这样可以在第一阶段就监督正确尺度和位置应该有最大特征响应。

理解Oriented RepPoints需要关注的地方：两个标注五角星的地方。1. RepPoints中的转换函数是转换成垂直的矩形框，而Oriented RepPoints需要的是定向框。2.第二阶段重采样的positive样本方式---第一阶段生成的pseudo box与GT的IOU值大于0.5才做第二阶段的细化。作者认为这种只用IOU衡量的方式是丢失了很多的信息（例如pseudo box的分类质量、方向质量没有有效来利用），需要更好的选择样本的方式。3.定位的smooth L1 loss是实际上在做定向目标检测时会有问题（下文会详细的探讨），作者对定位的损失也做了适用性的改进。

2. Flow chart：Oriented RepPoints

CVPR 2022 | 浙大提出Oriented RepPoints：旋转目标检测网络_第7张图片

图6：Oriented RepPoints网络框架

至此所有的铺垫基本完成，下面来看我们正文。这是今天的主要内容Oriented RepPoints.这张图是文章中的原图，这张图只是画图的表示方式不同。（除了用框标注出来的三处不同其他网络结构完全一致。注意reppoint中的数据是垂直box，GT的组成是四个值，左上x左上y右下x右下y；而Oriented RepPoint是用8个值表示GT框，四个角点的（x，y）总共8个值）。下面来看3个方面的变化，

1.引入定向转换函数，将每个特征图中一个点代表的点集（9个点），转换成有向的框。（对应reppoint中的生成框的部分，reppoint中是通过9个点映射回原图的位置画出了垂直矩形框。针对定向目标数据的不同改了转换函数）

2.点集学习提出了一种有效的自适应点评估和分配样本方案APPA，（此处对应的是reppoint中的第二阶段拿去细化的positive样本的分配。）

3.为了匹配定向目标数据和转换函数，提出了损失函数的改进。

下面来具体解释一下这三个方面的改进。

3.1 Method：oriented conversion function（定向转换函数）

CVPR 2022 | 浙大提出Oriented RepPoints：旋转目标检测网络_第8张图片

图7：定向转换函数

关于转换函数，作者是尝试了3种表示。MinAeraRect、 NearestGTCorner、ConvexHull，因为输出需要时矩形框所以预测和推理的时候只用MinAeraRect；训练网络的时候用NearestGTCorner、ConvexHull中的一种。

1.MinAeraRect ：在采样点中选择具有最小面积的旋转矩形；（该函数不可导在网路中训练参数不可以反传，所以只在推理的时候应用，此处是用cuda代码写的如果不做此方面的改进可以不必深究）

2.NearestGTCorner ：GT的四个角点，找4个距离最近采样点作为预测点。

3.ConvexHull：通过Jarvis March算法，找到包围所有采样点的外接多边形。

这里可以看出来，NearestGTCorner 和ConvexHull转换函数实际上生成的不是一个规则的矩形，而是一个不规则的四边形和多边形。所以这个时候就能用GT的角点来衡量loc的损失，这里是用的GIOU的损失，也对分布在GT范围以外的离群点做了惩罚。惩罚项就是对超出GT的离群点做惩罚，让所有的点分布在GT box之内。【这样其实不难理解，在刚训练网络的初期时候可能多边形是很乱的，但是经过一次次的迭代训练(GIOU和离群点惩罚的监督）多边形框就会越来越接近标准的矩形】

3.2 Method：Adaptive Points Assessment and Assignment（自适应点集评估和分配样本方案）

CVPR 2022 | 浙大提出Oriented RepPoints：旋转目标检测网络_第9张图片

图8：自适应点集评估和分配方案

这里是对于RepPoint中第二阶段选择positive样本方式的改进，原来是只要一阶段产生的pseudo box与GT box的IOU>0.5就被选为positive来做细化。作者认为直接按照IOU的标准是丢失了很多点集所表示的信息，所以作者提出了一个自适应点集评估和分配样本方案(Adaptive Points Assessment and Assignment)。该方案是在pseudo box与GT box的IOU>0.5的基础上，对这些pseudo box再从四个方面来衡量质量的好坏，然后按照质量分数对其进行排序，通过一个采样率选择质量分数Top前几的作为positive样本进行细化，通过此方式训练的网络可以更好

自适应点集评估和分配样本方案（APPA）从四个方面来衡量点集框的质量

1.分类质量：该点集与GT的分类损失focal loss来衡量分类质量。

2.定位质量：点集生成的多边形与GT的GIOU损失值来作为衡量定位的质量。

3.定向质量：定向质量实际上是通过倒角距离（Chamfer distance）来衡量，实际上这个距离的衡量方式是点集集合或者3D点云的思想。这里也不放具体的公式了感兴趣可以翻一下原文，只是简单说一下思想。首先对pseudo box和对应的GT box框一条边上等距离的分别采样40个点作为一个集合，形成pseudo box点集合和GT集合。倒角距离来衡量两个集合中点的距离。作为该边上定向的质量分数。(四条边每一条都这样做)

4. 逐点相关性质量：这个衡量的其实是点集中的一个点与整个点集所表示的特征的关联性。ei,k 表示第i组自适应点的第k点特征向量；ei 表示第i组特征向量的平均特征。而 e*i,k 和 e*i 分别表示进行规范化之后的特征向量，衡量这两个特征向量的余弦距离。

动态TOP K标签分配：按照质量分数排序最前面的质量最高。Nt 表示参与质量评估的所有点集，也就是和GT的IOU>0.5的点集; σ是采样率。意思很简单就是选择质量分数排在前面k的点集生成的pseudo box去做第二阶段的细化。

3.3 Method：Loss function

CVPR 2022 | 浙大提出Oriented RepPoints：旋转目标检测网络_第10张图片

图9：损失函数

这里应该都是很好理解的，只有个别的参数不是很清楚。首先是分类和定位损失中的 θ 这个参数论文里其实没有介绍和描述很难理解。通过对这个架构的理解，还有他再定位和类中都有出现，感觉理解成一个阈值比较合理就是定位和分类选择样本的IOU的0.5。Po 表示点集中不在对应GT中的点的坐标（out GT）， Pc 是指GT中心点的位置。

4. Experiment

思想已经很清晰了，实验以后再补吧。

喜欢的点赞，希望收藏的朋友随手给个赞吧。（收藏数比赞同数可多太多了）

CVPR 2022 | 浙大提出Oriented RepPoints：旋转目标检测网络_第11张图片

图10

CVPR 2022 | 浙大提出Oriented RepPoints：旋转目标检测网络_第12张图片

图11

点击进入—> CV 微信技术交流群

ICCV和CVPR 2021论文和代码下载

后台回复：CVPR2021，即可下载CVPR 2021论文和代码开源的论文合集

后台回复：ICCV2021，即可下载ICCV 2021论文和代码开源的论文合集

后台回复：Transformer综述，即可下载最新的3篇Transformer综述PDF

目标检测和Transformer交流群成立
扫描下方二维码，或者添加微信：CVer6666，即可添加CVer小助手微信，便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注：研究方向+地点+学校/公司+昵称（如目标检测或者Transformer+上海+上交+卡卡），根据格式备注，可更快被通过且邀请进群

▲扫码或加微信: CVer6666，进交流群
CVer学术交流群（知识星球）来了！想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料，欢迎扫描下方二维码，加入CVer学术交流群，已汇集数千人！

▲扫码进群
▲点击上方卡片，关注CVer公众号

整理不易，请点赞和在看

python鸢尾花数据集knn_【python+机器学习1】python 实现 KNN weixin_39629269 python鸢尾花数据集knn
欢迎关注哈希大数据微信公众号【哈希大数据】1KNN算法基本介绍K-NearestNeighbor(k最邻近分类算法)，简称KNN，是最简单的一种有监督的机器学习算法。也是一种懒惰学习算法，即开始训练仅仅是保存所有样本集的信息，直到测试样本到达才开始进行分类决策。KNN算法的核心思想：要想确定测试样本属于哪一类，就先寻找所有训练样本中与该测试样本“距离”最近的前K个样本，然后判断这K个样本中大部分所
2024年人工智能领域发生了哪些事儿？全球AI大事件1至12月盘点人工智能aigc
2024年，对人工智能（AI）而言是激动人心的一年。这一年不仅见证了AI技术的全面突破，也深刻改变了社会生活的方方面面。从金融到医疗、从教育到娱乐，AI的深度渗透无处不在。显然，这项技术已经从概念走向普及，并开始重新定义我们的未来。一月：人机交互技术的崭新开端2024年1月30日：Neuralink脑机接口植入Neuralink宣布，首名人类成功接受脑机接口芯片植入手术。这项手术由机器人完成，芯片
openGemini v1.2.0版本正式发布，IoT 场景性能大幅提升！开源时序数据库云原生版本发布
在openGeminiv1.2.0版本中，我们为您带来了一系列令人振奋的内核优化，将您的体验提升到新的高度，这包括针对IoT场景的性能优化，查询效率有极大的提升。针对数据存储的优化，进一步节约磁盘空间，降低数据存储成本。针对部分功能的优化，比如showtagkeys,stream等，使得功能更加丰富。新增了一部分内核的监控指标，进一步清楚了解内核的运行状态、行为和性能，帮助分析、定位和优化数据库性
Redis-内存机制 redismemory内存管理
大家好，我是半夏之沫一名金融科技领域的JAVA系统研发我希望将自己工作和学习中的经验以最朴实，最严谨的方式分享给大家，共同进步写作不易，期待大家的关注和点赞关注微信公众号【技术探界】前言Redis的数据都存储在内存中，所以本篇文章将学习Redis的内存机制，以帮助定位Redis的内存相关问题。正文一.查看Redis中的内存Redis提供了infomemory指令来查看Redis的内存情况，但是在查
【机器学习】使用scikit-learn中的KNN包实现对鸢尾花数据集或者自定义数据集的的预测加德霍克机器学习人工智能 python 学习作业
一、KNN算法概念K最近邻(K-NearestNeighbor,KNN)分类算法是数据挖掘分类技术中最简单的方法之一，是著名的模式识别统计学方法，在机器学习分类算法中占有相当大的地位。它是一个理论上比较成熟的方法。既是最简单的机器学习算法之一，也是基于实例的学习方法中最基本的，又是最好的文本分类算法之一。二、对鸢尾花数据集进行预测1、代码示例：fromsklearn.datasetsimportl
第84期 | GPTSecurity周报 aigc
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.利用数据流路径对大
未来商贸物流：人工智能与大数据的深度融合呆码科技临沂软件开发软件开发商贸物流科技人工智能
未来商贸物流：人工智能与大数据的深度融合在当今数字化浪潮汹涌澎湃的时代，商贸物流行业正站在变革的十字路口，而人工智能与大数据宛如一对闪耀的双子星，为其照亮前行的道路，深度融合之下，一个全新的未来画卷正徐徐展开。智能预测需求：精准把握市场脉搏传统的商贸物流往往依赖过往经验和粗略的市场调研来预估货物需求，这就如同在迷雾中摸索，充满不确定性。而如今，借助大数据的海量存储与超强分析能力，以及人工智能的深度
从文字到思维：呆马GPT在人工智能领域的创新之旅呆码科技 gpt 人工智能
引言生成式预训练变换器（GenerativePre-trainedTransformer，简称GPT）领域是人工智能技术中的一大革新。自OpenAI推出第一代GPT以来，该技术经历了多代发展，不断提升模型的规模、复杂度和智能化程度。GPT模型通过在大规模数据集上进行预训练，学习语言的统计规律和世界知识，然后在特定任务上进行微调，以适应不同的应用需求。GPT领域的发展推动了自然语言处理（NLP）技术
【20231214】银河麒麟系统（5.4.18-52-generic）ghost镜像还原失败问题风流倜傥小辣条丶 linux
【20231214】银河麒麟系统（5.4.18-52-generic）ghost镜像还原失败问题目录【20231214】银河麒麟系统（5.4.18-52-generic）ghost镜像还原失败问题0前言1问题概述1.1基础环境1.2问题现象2问题定位2.1日志分析2.22207系统验证2.3rsync工具3机理分析4解决措施5举一反三0前言转载请附上原文出处链接稀土掘金本文链接：https://j
小米Vela操作系统开源：AIoT时代的全新引擎 lilu8888888 开源前端
小米近日正式开源了其物联网嵌入式软件平台——Vela操作系统，并将其命名为OpenVela。这一举动在AIoT（人工智能物联网）领域掀起了不小的波澜，也为开发者们提供了一个强大的AI代码生成器和开发平台。OpenVela项目源代码已托管至GitHub和Gitee，采用Apache2.0开源协议，这意味着全球开发者都可以参与其中，共同推动物联网技术的进步。……Vela操作系统基于开源实时操作系统Nu
智源社区AI周刊：Hinton预测破解大脑机制时间；Gary Marcus批判追捧深度学习风潮；谷歌发布Imagen... 智源社区机器学习人工智能深度学习编程语言大数据
汇聚每周必看AI观点、研究和各类资源，不错过一条重要资讯！欢迎扫码订阅，获取邮件推送。观点“我们会在未来的五年内破解这些（人脑的）程序......现有的一切人工智能，都是建立在与大脑高层次上所做的事情完全不同的基础上......假设有数十亿的参数，这些神经元间的权重在大量训练实例的基础上去调整，会发生奇妙的事情。大脑是如此，深度学习也是如此。但问题在于，如何获得调整参数的梯度......目前我的信
Julia语言的计算机基础 Code侠客行包罗万象 golang 开发语言后端
Julia语言的计算机基础引言随着数据科学、机器学习和高性能计算的快速发展，对编程语言的需求也日益增加。在众多编程语言中，Julia语言因其独特的设计理念和高性能而迅速崛起。本文将详细探讨Julia语言的基础知识，包括其历史背景、安装与环境配置、基本语法、数据结构、函数与模块、以及性能优化等方面，旨在为对Julia感兴趣的读者提供一份全面的入门指南。一、Julia语言简介1.1历史背景Julia是
深度探索 DeepSeek-R1：国产大模型的AGI雏形与创新进展微凉的衣柜科技头条 agi 人工智能
随着人工智能技术的飞速发展，国内外企业纷纷发布了一系列创新的大模型，推动了AGI（通用人工智能）领域的探索。近期，DeepSeek-R1这一模型的发布引起了广泛关注，它不仅标志着国产大模型在智能化上的一次重大突破，还提出了全新的训练方法，解决了过去依赖大量人类数据的问题。本篇文章将详细介绍DeepSeek-R1的核心优势、技术创新以及实际应用案例，揭示它在AGI领域的潜力。1.DeepSeek-R
AI界的拼多多-中国人工智能初创公司DeepSeek如何与硅谷巨头竞争 xidianjiapei001 AI-人工智能与大模型人工智能 AI DeepSeek 大模型
这家公司打造出了一款成本更低且颇具竞争力的聊天机器人，其使用的高端计算机芯片数量少于谷歌和OpenAI等美国巨头企业，这凸显出芯片出口管制的局限性。圣诞节次日，一家名为DeepSeek的中国小型初创公司推出了一款新的人工智能系统，其性能可与OpenAI和谷歌等公司的尖端聊天机器人相媲美。仅此一点就堪称一个里程碑。但这个名为DeepSeek-V3系统的研发团队称，他们迈出了更大的一步。在一篇解释该技
学习AI职场应用技能的意义 Mieux718 学习人工智能
在智能化浪潮下，“人工智能+”通识必修课的普及，其核心并非在于培养人工智能领域的专家，而是旨在构建全民AI素养的基石。学习AI是可以让学生借助其技术力量，为各自的专业领域插上创新的翅膀。除了高校外，越来越多的企业也开始关注AI对企业业务的帮助，职场中掌握AI也变得越来越重要。随着人工智能技术的发展，许多行业都在引入相关技术和应用，人工智能应用场景已深度融入办公流程、项目管理、项目运营、客户服务等工
想转行到人工智能领域，我该学什么，怎么学？张登杰踩人工智能 python
转行到人工智能（AI）领域需要系统的学习和实践，以下是详细的路径建议，涵盖基础知识、技能学习、项目实践和求职准备：一、明确目标和领域方向人工智能领域广泛，建议先了解细分方向（如机器学习、深度学习、计算机视觉、自然语言处理、强化学习等），结合兴趣和职业规划选择切入点。二、构建基础知识1.数学基础线性代数：矩阵运算、特征值、向量空间。微积分：导数、梯度、优化理论。概率与统计：贝叶斯定理、分布、假设检验
MKV视频转换软件 MakeMKV v1.17.8 注册码 userteam 音视频电脑 windows
MakeMKV是一款专为光盘视频转换设计的实用工具，能够将DVD和蓝光光盘内容快速转换为MKV格式。MKV格式支持字幕封装，不需要额外设置，非常便捷。不管你是否熟悉技术操作，这款软件都能让你轻松实现视频转换。该版本已注册，可以使用全部功能。使用说明：1、将压缩文件解压到固定位置，不要随意移动。2、解压后，双击start_makeMKV.bat来运行软件3、不要更新，更新后注册效果会失效下载地址（链
2024人工智能AI+制造业应用落地研究报告汇总PDF洞察（附原数据表）拓端研究室人工智能
原文链接：https://tecdat.cn/?p=39068本报告合集洞察深入剖析当前技术应用的现状，关键技术创新方向，以及行业应用的具体情况，通过制造业具体场景的典型案例揭示人工智能如何助力制造业研发设计、生产制造、运营管理和产品服务的全流程智能化升级。在此基础上对制造业人工智能的未来发展趋势进行展望，以期为相关政策制定者以及行业从业者提供决策支持，共同助力我国制造业在人工智能时代的转型升级和
Open AI GPT大模型深度解析：通往智能的里程碑 xziyuan 人工智能 gpt
大模型——OpenAIGPT大模型介绍人工智能技术的快速发展引发了对智能系统和应用的巨大需求。多模态大模型已经成为了人工智能领域的重要研究方向之一。OpenAI作为一家全球领先的人工智能公司，在推动人工智能技术的边界上发挥着重要作用，其在大模型方面的研究和应用也是一直处于领先地位。本文将介绍OpenAI多模态大模型的研究成果和应用，探讨其在人工智能领域的重要性和影响力，以及给世界带来的可能性。1.
机器学习问题：AttributeError: ‘NoneType‘ object has no attribute ‘split‘ 解决办法零零鲎机器学习人工智能
参考博客：本次博客参考http://t.csdnimg.cn/8E7eH。写下来主要是为了整理自己在学习过程中遇到的问题并把解决办法列出来。学习内容：如果运行出现：AttributeError:‘NoneType’objecthasnoattribute'split’这样的问题。网上有很多解决办法是降级numpy到1.21.4。然后上面博客给出的解决方案是升级threadpoolctl。可以使用命
AI Agent：一场智能革命的开始机器人openai区块链
在当今科技日新月异的时代，AI（人工智能）技术正以前所未有的速度改变着我们的生活和工作方式。其中，AIAgent作为AI领域的一个新兴分支，正逐渐展现出其巨大的潜力和价值。本文将深入探讨AIAgent的发展现状、核心优势以及未来的发展方向，带您领略这一前沿技术的无限魅力。一、AIAgent的发展现状：技术突破与广泛应用近年来，随着大数据、云计算和机器学习等技术的飞速发展，AIAgent的技术水平得
python面试情景题_50道python笔试面试真题大集合我是史迪仔 python面试情景题
Python爬虫人工智能100GBweb爬虫数据分析人工智能视频免费领题目后面有50道题答案领取方式哦1、一行代码实现1--100之和利用sum()函数求和2、如何在一个函数内部修改全局变量利用global修改全局变量3、列出5个python标准库os：提供了不少与操作系统相关联的函数sys:通常用于命令行参数re:正则匹配math:数学运算datetime:处理日期时间4、字典如何删除键和合并两
AI人工智能代理工作流 AI Agent WorkFlow：在金融领域中的应用 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：在金融领域中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AIAgentWorkFlow,金融风险管理,自动化投资决策,数据驱动策略生成,量化交易系统1.背景介绍1.1问题的由来随着金融市场全球化和技术的飞速发展，金融机构面临着日益复杂的业务挑战。从风险管理和投资决策到客户关系管理
快手可灵视频生成大模型全方位测评人工智能llm
快手视频生成大模型“可灵”（Kling），是全球首个真正用户可用的视频生成大模型，自面世以来，凭借其无与伦比的视频生成效果，在全球范围内赢得了用户的热烈追捧与高度评价。截至目前，申请体验其内测版的用户数量已突破70万大关，累计生成的视频作品更是高达700万。可灵在持续创新的道路上也从未停下脚步，在七月份举办的世界人工智能大会（WAIC）期间，可灵再次迎来重大升级。新功能包括上线web端、基础模型效
AI人工智能代理工作流AI Agent WorkFlow：智能代理在金融系统中的应用 AGI大模型与大数据研究院大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：智能代理在金融系统中的应用1.背景介绍1.1金融系统的重要性金融系统是现代经济的核心支柱,它确保资金在不同经济实体之间的有效流动和分配。一个高效、可靠的金融系统对于促进经济增长、维护金融稳定和满足社会资金需求至关重要。然而,金融系统也面临着诸多挑战,例如复杂的监管要求、日益增长的交易量、网络安全风险等。1.2人工智能在金融领域的应用近年来,人工
8.2 从看图识字到智能解读：GPT-4 with Vision 开启多模态 AI 新纪元少林码僧 AI大模型应用实战专栏人工智能 chatgpt
从看图识字到智能解读：GPT-4withVision开启多模态AI新纪元引言：AI的多模态跃迁随着人工智能技术的快速发展，我们正迈入一个新的智能交互时代。传统的AI模型主要聚焦于文本处理，而多模态AI模型如GPT-4withVision（GPT-4V）则能够同时处理图像和文本。GPT-4V是OpenAI推出的多模态版本，它不仅能理解图片，还能结合文字对图片内容进行深入分析。这项技术为教育、创意、医
【自然语言处理（NLP）】NLTK的使用（分句、分词、词频提取）道友老李自然语言处理(NLP)自然语言处理人工智能
文章目录介绍NLTK主要功能模块安装使用分句分词去除标点符号去除停用词stopword噪音单词,词频提取个人主页：道友老李欢迎加入社区：道友老李的学习社区介绍自然语言处理（NaturalLanguageProcessing，NLP）是计算机科学领域与人工智能领域中的一个重要方向。它研究的是人类（自然）语言与计算机之间的交互。NLP的目标是让计算机能够理解、解析、生成人类语言，并且能够以有意义的方式
【自然语言处理（NLP）】序列数据研究（创建序列数据、简单的MLP模型、预测结果分析）道友老李自然语言处理(NLP)自然语言处理人工智能
文章目录介绍序列数据研究导包安装d2l创建序列数据创建模型开始训练预测多步预测结论个人主页：道友老李欢迎加入社区：道友老李的学习社区介绍自然语言处理（NaturalLanguageProcessing，NLP）是计算机科学领域与人工智能领域中的一个重要方向。它研究的是人类（自然）语言与计算机之间的交互。NLP的目标是让计算机能够理解、解析、生成人类语言，并且能够以有意义的方式回应和操作这些信息。N
深度学习-94-大语言模型LLM之基于langchain的链Chain的基础应用和调用方式皮皮冰燃深度学习深度学习语言模型 langchain
文章目录1Chain链的分类1.1LCELChains(链构造器)1.2LegacyChains(遗留链)2链的基础应用2.1OllamaLLM2.2是否使用chain的对比2.2.1不使用Chain2.2.2使用Chain3链的调用方式3.1通过invoke方法【推荐】3.2通过predict方法3.3通过apply方法3.4通过generate方法4参考附录1Chain链的分类为开发更复杂的应
原创提示词：中英法德四国翻译家姚瑞南 prompt实战应用案例人工智能 AIGC
本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。（转载需经授权）目录prompt应用效果：原文：英文(English):法文(Français)：德文(Deutsch):prompt#Role:Local-DialectProficientEdi
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持

CVPR 2022 | 浙大提出Oriented RepPoints：旋转目标检测网络

你可能感兴趣的:(定位,计算机视觉,机器学习,人工智能,深度学习)