l7H9JA4

mmdetection最小复刻版(五)：yolov5转化内幕

AI编辑：深度眸

0 摘要

在前一篇文章mmdetection最小复刻版(四)：独家yolo转化内幕中，我们已经详细分析了darknet框架训练的模型如何转化到mmdetection-mini中，这一篇文章讲解最火的yolov5如何转化到mmdetection-mini中。

这个转化就相对容易很多了，毕竟都是pytorch框架写的，但是由于他的代码比较乱，整个代码组织结构也比较乱，实在是不好用，所以我将其模型移植到mmdetection中。目前仅仅支持推理，后续会支持会模仿yolov5训练过程，支持到mmdetection-mini中。

通过本文你可以学会：

(1) yolov5整个结构的构建细节

(2) yolov5的前向推理流程

(3) 如何将yolov5模型迁移到mmdetection中

在阅读本文前，我建议你阅读进击的后浪yolov5深度可视化解析，该文对yolov5进行深入分析，包括模型设计、loss设计原则和正样本可视化等等非常详细，我相信你看完就一定能够理解yolov5了，然后在结合本文将可以了解到yolov5的每个细节。

github：

https://github.com/hhaAndroid/mmdetection-mini

欢迎star和提供改进意见

1 yolov5简要介绍

整个yolov5可以简单概况为：通过应用类似EfficientNet的channel和layer控制因子来灵活配置不同复杂度的模型，并且在正负样本定义阶段采用了跨邻域网格的匹配策略，从而得到更多的正样本anchor，加速收敛。

yolov5的结构设计是参考yolov4来的，也是包括backbone+pan+spp+yolov3 head。在深入浅出YOLOv5中有绘制的非常好看的结构图，我从里面copy出来，方便看：

一目了然，yolov5现在已经发展到第3个版本了，其说明见链接：

https://github.com/ultralytics/yolov5/releases/tag/v3.0 。相比第2版本，主要是将大部分激活函数全部换成mobilenetv3里面的nn.Hardswish()，大概在coco数据上可以提高1个点的mAP，特别是yolov5s小模型，提升很大。其余没有啥改变。不同大小模型通过depth_multiple和width_multiple两个参数控制，width_multiple是用来控制全局的通道数的，depth_multiple是用来控制BottleneckCSP模块的个数。

yolov5的模型构建仿照了darknet中采用的cfg模式，即通过配置文件来构建网络，但是考虑到darknet中的cfg文件细粒度过高，对于重新构建网络来说是很累人的，可读性比较差，本文作者借鉴了cfg思想，但是进行了适当改进即不再细分到conv+bn+act层，而最细粒度是模块，为后续模型构建、结构理解有很大好处，但是这种写法缺点是不再能直接采用第三方工具例如netron进行网络模型可视化了。

如果你看了前一篇文章，熟悉了darknet里面的cfg组织格式，那么yolov5网络构建模式应该很容易就理解了，这里就不说了。

2 yolov5转化为mmdetection

2.1 mmdetection中构建模型

首先yolov5中涉及到的几个模块都比较简单，基本上就是BottleneckCSP、Focus、SPP和卷积模块，而且本身就是pytorch写的，故我直接copy过来了。

在构建具体模型时候，为了后面简单(待会会说为啥)，我也是按照配置文件格式来构建模型，例如yolov5骨架构建如下：

通过append方式构建，然后全部转化为Sequential对象。

按照规范的结构拆分原则，此处应该有neck模块，用于存放pan+spp模块，但是作者直接放置在head部分了，所以我也暂时按照他的写法构建，后面可能会更改。head部分的代码构建也是类似，如下所示：

就是这么简单就把模型构造好了。

还有一个细节：pytorch1.6内部自带了nn.Hardswish()和nn.Identity()算子，而pytorch1.3是没有的，所以为了兼容，我重写了这两个类，效果是一样的，但是可能效率不如原生的。

2.2 yolov5模型转化

(1) 自动下载权重

要转化的前提应该是下载权重，你可以自己去官方地址下载，当然也可以去浏览器上下载，作者写的attempt_download函数可以自动下载权重。下载后你可以发现权重长这样：

(2) 模型转换为pytorch1.3可读权重

作为对比，yolov3的后缀是pth，但是yolov5s是pt，这是因为yolov5采用的pytorch版本是1.6，其采用全新的存储方式，你如果采用pytorch1.3读取是会报错的，必须也是pytorch1.6及其以上才行。

还有一个比较坑的，作者存储的模型里面包括了模型对象，而不仅仅是状态字典，即使你采用pytorch1.6读取权重，但是一旦你读取的代码不是放在yolov5对应的工程路径下也是会报错的，内部会报pickle对象无法Load的错误。所以你只能把我写的tools/darknet/convert_yolov5_weights_step1.py代码放在yolov5路径下运行，为了后面mmdetection能采用pytorch1.3进行读取，需要采用：

torch.save(data, save_name, _use_new_zipfile_serialization=False)

方式保存，这样就可以向前兼容了。

注意：yolov5训练好的pt文件里面存储了大量有用信息，而不仅仅是权重，包括anchor等等信息。为啥要保存呢？因为yolov5代码中有自动计算anchor和参数搜索的操作，如果他不保存起来，那么程序停止后就没有了，只保存状态字典无法在前向时候使用。这是一个不错的方式，即使代码修改了，参数也不会丢。

(3) 转化权重

前面说了模型为啥要采用append的模式构建，是为了这一个步骤方便。因为yolov5里面是按照顺序解析配置，然后转化为Sequential的，其状态字典中各层参数名称是按照0,1,2...这种方式存储的。如果我不也这样写，那么我的权重转化过程会比较累，这样做可以节省一些工作量。如果他后续模型改了，我这边改动也不大。

转换脚本在tools/darknet/convert_yolov5_weights_step2.py中，其需要输入前面转换得到的pytorch1.3模型。并且需要注意key和anchor这些字段，我们是不要的，如下所示：

到这里为止就完成了所有模型方面的转化，m/l/x模型也是一样的流程。

2.3 mmdetection新增bbox解码函数

看过yolov5解析的朋友，应该知道yolov5的编解码方式和其余yolo系列不一样，因为其跨网格预测了，故新增了

mmdet/det_core/bbox/coder/yolov5_bbox_coder.py编解码类，其解码过程为：

注意中心点预测范围变了，不是0-1，而是-0.5到1.5，wh预测也改变了，没有exp操作，而仅仅是尺度缩放了而已。作为对比，yolov3是如下：

到这里就全部完成了，下面就是测试下代码对不对了。

2.4 模型验证

第一次运行就能成功也是奇怪了，也蛮心酸的，一个人慢慢检查喽。

(1) 中心点还原代码没写对

在第一次写中心点解码时候写法是：

x_center_pred = (pred_bboxes[..., 0]*2 - 0.5) * stride + x_center
y_center_pred = (pred_bboxes[..., 1]*2 - 0.5) * stride + y_center

预测现象就是中心点预测完全不对劲，总感觉偏掉了。后面仔细思考，发现2不能乘到里面，而是外面。因为mmdetection中yolo生成的anchor其实是有0.5的偏移的，而不是0的，此时预测的中心点是正确的，但是还是有错误。

(2) 有一个anchor写错了参数

这个低级错误花费我一个下午才发现。前面说明yolov5权重里面会保存anchor的，我把anchor打印了然后复制过来，我靠，居然没有发现正好中间的一个anchor的w写错了，我检查了几遍都没有发现，尴尬啊！

我来说下如何找出的吧！当其中一个anchor写错的时候，现象是有些bbox预测是正确的，而有些是错误的。我当时首先就怀疑是不是我的bbox解码过程写错了，思考了很久都感觉没有错误。又看了一遍模型代码也没有问题，为了确定bbox解码过程是否正确，我彻底抛弃了mmdetection里面的anchor，而是采用yolo系列中常规的解码方式，类似v5中如下所示：

所以我重写了一个yolov5_bbox_coder.py,仿照上述写法来进行解码，结果发现改完了测试效果一模一样，我真是疯了，说明问题根本就不在解码这部分。

既然找不出问题，那就只能采用终结大招了。我把mmdetection-mini中的yolov5模型不包括解码部分移植到yolov5工程中，然后把他的模型代码替换为我自己的，类似于如下所示：

这样就可以保存输入、解码过程完全一致。接下来我要做的就是选中一张图片，分别运行yolov5模型和我的模型，保存各层输出tensor，然后比对数值是否完全相同，如果有哪一层不一样，那就说明这一层代码写错了。

结果发现居然所有层tensor完全相同，除了最后的bbox预测不一样外，此时我就知道模型肯定没有错误，问题在最后的解码层。然后仔细检查发现不一样的解码输出就是在某一层而已，其余层相同，那么所有问题肯定就是anchor了，然后我再看一眼才发现：

(116, 90), (156, 198), (373, 326)

写成了：

(116, 90), (90, 198), (373, 326)

使出了我的终结大招才解决问题，心累啊，如果当时有个人帮我检查下anchor，就没有这个问题了。说句题外话：通过这些模型转换过程，我总结学到的最多就是如何找出Bug，如何解决一个看起来很难解决的Bug,不管你是啥bug，我总有办法解决你，虽然有些办法有点笨。有好几次我都快放弃了，然后突然又想到一种调试方法，然后接着干，最终就解决了。

(3) 其余细节

BN的两个参数不是默认值，而是

self.bn = nn.BatchNorm2d(2 * c_, eps=0.001, momentum=0.01)

虽然对推理没有啥影响，但是还是需要知道。

(4) 图片处理逻辑不一样

到这里就可以测试了。以yolov5为例，下载608x608训练的权重，采用yolov5s测试val2017，配置参数如下：

yolov5参数：conf_thres=0.001 iou_thres=0.65  
mmdetection: 
       test_cfg = dict(
            nms_pre=1000,
            min_bbox_size=0,
            score_thr=0.05,
            conf_thr=0.001,
            nms=dict(type='nms', iou_thr=0.65),
            max_per_img=100)

结果如下：

orig yolov5s: [email protected] 56.2@mAP0.  
mmdetection: [email protected] [email protected]

发现居然少了一个点,这你可以忍？我首先猜测原因可能有：

1. 我实现的nn.Hardswish()效果不一样

2. 图片处理逻辑不一样

首先我在yolov5中把官方的写的hardswish替换，发现mAP一样，说明不是这个问题。那可能就是第2个问题了，然后我去研究了下yolov5的前向处理逻辑。我选择bus.jpg这张图片进行单张图片测试来验证的。也就是利用这张图片分别在mmdetection(image_demo.py)和yolov5(detect.py)中运行一遍，保存预测结果，看下是否相同。由于前处理逻辑不一样，所以虽然预测的框差不多，但是其实score值不一样，这说明前处理逻辑确实不一样。

在yolov5的detect.py中采用的是letterbox方式对图片进行处理，其逻辑为：

1. 计算缩放比例，假设input_shape = (181, 110, 3)，输出shape=201，先计算缩放比例1.11和1.9,选择小比例。这个是常规操作，保证缩放后最长边不超过设定值

2. 计算pad像素，前面resize后会变成(201,122,3)，理论上应该pad=(0,79)，但是内部采用最小pad原则，设置最多不能pad超过64像素,故对79采用取模操作，变成79%64=15，然后对15进行/2，然后左右pad即可

和常说的letterbox操作稍微有点区别，一般的letterbox操作输出都是通过pad操作变成正方形的。早期yolov5也是变成正方形进行推理，后来提出了矩形推理方式也就是上面的做法，输出是矩形，而不是正方形，在推理阶段可以加快速度。最小pad原则的目的是加快推理时间，细节可以参考 https://github.com/ultralytics/yolov3/issues/232

第一行是常规的正方形padding，第二行是上面介绍的最小pad原则得到的矩形图片。

然而在mmdetection中采用的是Resize函数，其直接保持长宽比进行resize，没有pad操作，效果应该说类似吧。注意letterbox和mmdetection中的Resize函数输出都不一定是指定size，也就是说即使你指定608x608，计算完成后也不一样的是608x608输出。目前mmdetection中也集成了letterbox操作。

基于这个设定，我也对mmdetection的推理流程进行修改，采用了letterbox模式，配置如下：

在采用demo/image_demo.py脚本进行运行，同样的bus.jpg图片，运行结果可视化，可以发现和yolov5完全一样了。说明推理时候确实如此，如下所示(左边是yolov5结果，右边是转化后mmdetection-mini结果)：

当我满怀欢喜，将这个改动应用于test(对应mmdetecion中的test.py和yolov5中的test.py)，重新测试mAP时候，发现居然没有啥变化，说明其实LetterResize和Resize应用于val2017没啥区别。

然后我再次审视了配置文件，发现yolov5里面没有score_thr这个参数，在mmdetection中这个参数的作用是应用conf_thr，然后应用score_thr参数删除预测对应类别的score小于预测的bbox，最后才是nms操作。但是yolov5中没有score_thr这个步骤，这会导致yolov5预测的框超级多，但是对mAP计算有利。我于是把这个参数值设置的超级小，相当于没有再次测试，如下所示：

test_cfg = dict(
        nms_pre=1000,
        min_bbox_size=0,
        score_thr=0.0000001,
        conf_thr=0.001,
        nms=dict(type='nms', iou_thr=0.6),
        max_per_img=300)

这个配置就是和yolov5里面完全相同了。mAP再次测试结果如下：

orig yolov5s: [email protected] 56.2@mAP0.    
mmdetection: [email protected] [email protected]

此时可以发现mAP就没有差那么多了，但是还差了0.4个点。现在的差距就又要说到letterresize函数了，因为我在单张图片测试时候明显预测值完全相同，理论上mAP肯定是完全相同，现在居然不一样，说明哪里还是有不同？我检查了下yolov3的测试逻辑和单张图推理逻辑的区别，发现差别在于dataset。

后来检查发现：yolov5中letterresize虽然是用了，但是其输入shape是自适应的，其保证了训练和测试的数据处理逻辑一样(除了mosaic逻辑外)，也就是说yolov5测试模式下，每个batch内部shape是一样的，但是不同batch之间的shape是不一样的，这会造成最终结果有差异。虽然他是指定的608x608进行推理，但是其内部还是相当于有个基于当前数据集进行自适应操作。而在detertor代码里面，是直接调用letterresize，而输入shape是指定的，所以才会出现在对某一张图进行demo测试时候，结果完全相同但是test代码时候mAP不一致。

总结来说，yolov5采用dataloader进行测试时候，实际上是有自适应的，虽然你设置的是608x608的输入，其流程是：

1. 遍历所有验证集图片的shape，保存起来

2. 开启Rectangular模式，对所有shape按照h/w比例从小到大排序

3. 计算所有验证集，一共可以构成多少个batch，然后对前面排序后的shape进行连续截取操作，并且考虑h/w大于1和小于1的场景，因为h/w不同，pad的方向也不同，保存每个batch内部的shape比例都差不多

4. 将每个batch内部的shape值转化为指定的图片大小比例，例如打算网络预测最大不超过608，那么所有shape都要不大于608

5. 对batch内部图片进行letterbox操作，测试或者训练时候，不开启minimum rectangle操作,也就是输出shape一定等于指定的shape。这样可以保证每个batch内部输出的图片shape完全相同

而mmdetection中test时候实现的逻辑是：

1. 将每张图片LetterResize到640x640(输出不一定是640x640)

2. 将图片shape pad到32的整数倍，右下pad

3. 在collate函数中将一个batch内部的图片全部右下pad到当前batch最大的w和h，变成相同shape

可以看出yolov5这种设置会更好一点，应该就是这个差异导致的mAP不一样，后面我把这个策略应用到mmdetection中。

3 总结

本文一步一步，从0开始讲解如何将yolov5模型转化到mmdetection中，其中对于我踩得每一个坑，我都详细说明了,希望下次其他朋友碰到同样问题可以快速跳过。

github：

https://github.com/hhaAndroid/mmdetection-mini

欢迎star和提供改进意见

推荐阅读

进击的后浪yolov5深度可视化解析

深入浅出YOLOv5

机器学习算法工程师

一个用心的公众号

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方

mmdetection最小复刻版(五)：yolov5转化内幕

你可能感兴趣的:(算法,python,人工智能,深度学习,java)