w94ghz

IOU系列：IOU、GIOU、DIOU、CIOU、SIOU、Alpha-IoU、WIOU详解

- 前言
- 一、IOU（Intersection over Union）
- - 1.1 优点
  - 1.2 缺点
  - 1.3 实现代码
- 二、GIOU（Generalized IoU）
- - 2.1 优点
  - 2.2 缺点
  - 2.3 实现代码
- 三、DIOU（Distance-IoU）
- - 3.1 优点
  - 3.2 缺点
  - 3.3 源代码
- 四、CIOU（Complete-IoU）
- - 4.1 缺点
  - 4.2 实现代码
- 五、EIOU（Efficient-IoU）
- - 5.1 Focal-EIOU
  - 5.2 优点
  - 5.3 实现代码
- 六、Alpha-IOU
- - 6.1 优点
  - 6.2 实现代码
- 七、 SIOU（SCYLLA-IoU）
- - 7.1 SIOU Loss
  - 7.2 实现代码
- 八、 WIoU（Wise-IoU）
- ⭐ 总结

前言

目标检测任务的损失函数一般由目标分类损失函数（Object Classificition Loss）和边界框回归损失函数（Bounding Box Regeression Loss）两部分构成，当然在YOLO系列中，还引入了置信度损失（Object Confidence Loss）。本文主要对边界框回归损失函数（Bounding Box Regeression Loss）进行讨论。

若想尝试改进YOLOv5-7.0中的损失函数：

YOLOv5改进实战（1）| 更换损失函数（一）之EIoU、Alpha-IoU、SIoU篇
YOLOv5改进实战（2）| 更换损失函数（二）之WIOU（Wise IoU）篇
YOLOv5改进实战（3）| 更换损失函数（三）之MPDIOU（2023最新IOU）篇

一、IOU（Intersection over Union）

ACM 2016 论文链接：UnitBox: An Advanced Object Detection Network

IOU（Intersection over Union）是一种用于衡量目标检测性能的评估指标。它主要用于计算两个边界框（Bounding Box）之间的重叠度，也就是所说的交并比。通常用于测量模型预测的边界框与真实边界框之间的匹配程度。

IOU的计算方式如下：
$IoU=\frac{\left | A \cap B \right | }{\left | A \cup B \right | }$

1.1 优点

IOU能够直观地反映出目标检测结果与真实情况之间的匹配程度。
IOU具有尺度不变性，由于IOU是基于重叠度量的，它不受目标尺度和形状变换的影响。这使得IOU适用于各种不同尺度和形状的目标检测任务。

1.2 缺点

当预测框和目标框不相交时，即IOU=0时，不能反映两个目标之间距离的远近，此时损失函数不可导，IOU Loss 无法优化。
当两个检测框大小相同，两个IOU也相同，IOU_Loss无法精确的反映两个框的重合度大小。

1.3 实现代码

def IOU(box1, box2, eps=1e-7):
    b1_x1, b1_y1, b1_x2, b1_y2 = box1
    b2_x1, b2_y1, b2_x2, b2_y2 = box2
    # 获取矩形框交集对应的左上角和右下角的坐标（intersection）
    xx1 = np.max([b1_x1, b2_x1])
    yy1 = np.max([b1_y1, b2_y1])
    xx2 = np.min([b1_x2, b2_x2])
    yy2 = np.min([b1_y2, b2_y2])
    # 计算两个矩形框面积
    area1 = (b1_x2 - b1_x1) * (b1_y2 - b1_y1)
    area2 = (b2_x2 - b2_x1) * (b2_y2 - b2_y1)
    inter = (np.max([0, xx2 - xx1])) * (np.max([0, yy2 - yy1]))  # 计算交集面积
    uniou = area1 + area2 - inter + eps
    iou = inter / uniou  # 计算交并比

    return iou

if __name__ == "__main__":
    box1 = np.array([0, 0, 100, 100])
    box2 = np.array([50, 0, 150, 100])
    print(IOU(box1, box2))

二、GIOU（Generalized IoU）

CVPR 2019 论文链接：Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

GIOU通过引入预测框和真实框的最小外接矩形来获取预测框、真实框在闭包区域中的比重，从而解决了两个目标没有交集时梯度为零的问题。
$GIoU=IoU-\frac{\left | C-\left ( A\cup B \right ) \right | }{\left | C \right | }$
其中 $C$ 是两个框的最小外接矩形的面积。

2.1 优点

与IoU只关注重叠区域不同，GIOU不仅关注重叠区域，还关注其他的非重合区域，能更好的反映两者的重合度；
GIOU是一种IoU的下界，取值范围 $[- 1, 1]$ 。在两者重合的时候取最大值1，在两者无交集且无限远的时候取最小值-1。因此，与IoU相比，GIoU是一个比较好的距离度量指标。

2.2 缺点

当两个预测框完全重叠时，这时GIOU就退化为IOU，无法区分相对位置关系；
对每个预测框与真实框均要去计算最小外接矩形，计算及收敛速度受到限制。

2.3 实现代码

详细代码请移步：代码区

三、DIOU（Distance-IoU）

AAAI 2020 论文链接：Distance-IoU Loss: Faster and Better Learning for Bounding Box Regression

考虑到GIOU的缺点，DIOU在IoU的基础上直接回归两个框中心点的欧式距离，加速了收敛速度。DIOU的惩罚项是基于中心点的距离和对角线距离的比值。这样就避免了GIOU在两框距离较远时产生较大闭包时所造成的Loss值较大而难以优化的情况。
$DIoU=IoU-\frac{\rho^{2} \left ( b,b^{gt} \right ) }{c^{2}}$
其中 $b$ ， $b^{gt}$ 分别表示预测框和真实框的中心点，且 $\rho$ 表示两个中心点间的欧式距离。 $c$ 表示能够同时包含预测框和真实框的最小闭包区域的对角线距离。

3.1 优点

DIOU在与目标框重叠时，仍然可以为边界框提供移动方向;
DIOU可以直接最小化两个目标框的距离，因此比GIOU收敛快得多；
DIOU还可以替换普通的IOU评价策略，应用于NMS中，使得NMS得到的结果更加合理和有效。

3.2 缺点

DIOU仅考虑了重叠面积和中心点距离，并没有考虑到长宽比。

3.3 源代码

详细代码请移步：代码区

四、CIOU（Complete-IoU）

AAAI 2020(与DIOU同一篇文章) 论文链接：Distance-IoU Loss: Faster and Better Learning for Bounding Box Regression

论文考虑到bbox回归三要素中的长宽比还没被考虑到计算中，因此CIOU在DIOU的基础上添加了长宽比的惩罚项，定义如下：
$CIoU=IoU-\frac{\rho^{2} \left ( b,b^{gt} \right ) }{c^{2}}-\alpha \upsilon$
$\upsilon$ 是用来衡量长宽比一致性的参数， $\upsilon$ 定义如下：
$\upsilon =\frac{4}{\pi ^2} \left ( \arctan \frac{\omega ^{gt}}{h^{gt}} - \arctan \frac{\omega}{h} \right ) ^2$
$\alpha = \frac{\upsilon }{\left ( 1- IoU \right ) + \upsilon }$

4.1 缺点

若预测框和gt框的长宽比相同但宽高的值不同，而长宽比的惩罚项却恒为0，会阻碍模型有效的优化。

4.2 实现代码

详细代码请移步：代码区

五、EIOU（Efficient-IoU）

arXiv 2021 论文链接：Focal and Efficient IOU Loss for Accurate Bounding Box Regression

EIOU是在 CIOU 的惩罚项基础上将预测框和真实框的纵横比的影响因子拆开，分别计算预测框和真实框的长和宽，并且加入Focal聚焦优质的锚框，来解决 CIOU 存在的问题。

EIoU损失函数公式如下：
$\begin{array}{l} L_{EIOU} = L_{IOU}+L_{dis}+L_{asp} \\ = 1-IOU+\frac{\rho^{2} \left ( b,b^{gt} \right ) }{c^{2}}+\frac{\rho^{2} \left ( \omega ,\omega^{gt} \right ) }{C^{2}_{\omega}}+\frac{\rho^{2} \left ( h,h^{gt} \right ) }{c^{2}_{h}} \end{array}$
其中 $C_\omega^2$ 和 $C_h^2$ 分别是预测框和GT框最小外接矩形的宽和高。

5.1 Focal-EIOU

利用Focal Loss对EIOU进行加权处理：
$L_{Focal-EIOU}=IOU^\gamma *L_{EIOU}$
其中 $\gamma$ 为控制异常值抑制程度的参数。该损失中的Focal与传统的Focal Loss有一定的区别，传统的Focal Loss针对越困难的样本损失越大，起到的是困难样本挖掘的作用；而根据上述公式：IOU越高的损失越大，相当于加权作用，给越好的回归目标一个越大的损失，有助于提高回归精度。

5.2 优点

EIOU在CIOU的基础上分别计算宽高的差异值取代了纵横比，宽高损失直接使预测框与真实框的宽度和高度之差最小，使得收敛速度更快；
引入了Focal Loss优化了边界框回归任务中的样本不平衡问题，即减少与目标框重叠较少的大量锚框对BBox 回归的优化贡献，使回归过程专注于高质量锚框。

5.3 实现代码

详细代码请移步：代码区

六、Alpha-IOU

NeurIPS 2021 论文链接：Alpha-IoU: A Family of Power Intersection over Union Losses for Bounding Box Regression

基于IoU Loss推广到一个新的Power IoU系列 Loss，该系列具有一个Power IoU项和一个附加的Power正则项，具有单个Power参数 $\alpha$ 。称这种新的损失系列为 $\alpha$ -IoU Loss。

⭐当 $\alpha=1$ 时，则回归到原始各个Loss。

6.1 优点

通过调节Power参数 $\alpha$ ，使检测器在实现不同水平的bbox回归精度方面具有更大的灵活性;
对小数据集和噪声的鲁棒性更强；
⭐通过实验发现，在大多数情况下，取 $\alpha$ =3 的效果最好（具体还是根据自身的数据集去调整，选择最优的阈值）。

6.2 实现代码

详细代码请移步：代码区

七、 SIOU（SCYLLA-IoU）

论文链接：SIoU Loss: More Powerful Learning for Bounding Box Regression

SIOU损失函数是引入了所需回归之间的向量角度，重新定义了距离损失，有效降低了回归的自由度，从而加速网络的收敛，进一步提升回归的准确性。

7.1 SIOU Loss

SIOU损失函数由4个Cost函数组成：

Angle cost
Distance cost
Shape cost
IoU cost

Angle cost（角度损失）：如果 $\alpha \le \frac{\pi}{4}$ ，则收敛过程将首先最小化 $\alpha$ ，否则最小化 $\beta$ 。当中心点在x轴或y轴上对齐时， $\Lambda=0$ ；当中心点连接到x轴45°时， $\Lambda=1$ 。

$\begin{array}{l} \Lambda =1-2*\sin^2\left ( \arcsin \left ( \frac{C_h}{\sigma} \right ) - \frac{\pi}{4} \right ) \\ = 1-2*\sin^2\left ( \alpha - \frac{\pi}{4} \right ) \\ = \cos ^2\left ( \alpha - \frac{\pi}{4} \right ) - \sin ^2 \left ( \alpha - \frac{\pi}{4} \right ) \\ = \cos \left ( 2\alpha - \frac{\pi}{2} \right ) \\ = \sin \left ( 2\alpha \right ) \end{array}$

其中 $C_h$ 为真实框和预测框中心点的高度差， $\sigma$ 为真实框和预测框中心点的距离， $\arcsin (\frac{C_h}{\sigma})$ 等于角度 $\alpha$ 。
$\frac{C_h}{\sigma} = \sin \left ( \alpha \right )$

Distance cost（距离损失）：当 $\alpha$ →0时，Distance cost的贡献大大降低。相反， $\alpha$ 越接近 $\frac{\pi}{4}$ ，Distance cost贡献越大。随着角度的增大，问题变得越来越难。
$\Delta =\sum_{t=x,y}^{} \left ( 1- e^{-\gamma\rho t } \right )$
其中， $\rho _x=\left ( \frac{b_{c_x}^{gt}-b_{c_x}}{c_w} \right ) ^2$ ， $\rho _y=\left ( \frac{b_{c_y}^{gt}-b_{c_y}}{c_h} \right ) ^2$ ， $\gamma =2-\Lambda$
$\gamma$ 被赋予时间优先的距离值，随着角度的增加。
Shape cost（形状损失）：与CIOU类似，CIOU考虑是两框整体形状的收敛，而SIOU是以长、宽两个边收敛来实现整体形状的收敛。
$\Omega = \sum_{t=w,h}^{} \left ( 1-e^{-\omega t } \right ) ^\theta$
$\omega _w = \frac{\left | w-w^{gt} \right | }{\max \left ( w,w^{gt} \right ) } ,\omega _h = \frac{\left | h-h^{gt} \right | }{\max \left ( h,h^{gt} \right ) }$
IoU cost（IoU损失）：
$L_{box}=1-IoU+\frac{\Delta +\Omega }{2}$

7.2 实现代码

详细代码请移步：代码区

八、 WIoU（Wise-IoU）

2023 论文链接：Wise-IoU: Bounding Box Regression Loss with Dynamic Focusing Mechanism

⭐这是作者的论文解读：Wise-IoU 作者导读：基于动态非单调聚焦机制的边界框损失，非常详细，本文则不再进行叙述。

WIoU v1 构造了基于注意力的边界框损失，WIoU v2 和 v3 则是在此基础上通过构造梯度增益 (聚焦系数) 的计算方法来附加聚焦机制。

所涉及的聚焦机制有以下几种：

静态：当边界框的 IoU 为某一指定值时有最高的梯度增益，如 Focal EIoU v1
动态：享有最高梯度增益的边界框的条件处于动态变化中，如 WIoU v3
单调：梯度增益随损失值的增加而单调增加，如 Focal loss
非单调：梯度增益随损失值的增加呈非单调变化

⭐ 总结

	IOU	GIOU	DIOU	CIOU	EIOU	$\alpha$ -IOU	SIOU	WIOU
优点	目标检测中最常用的指标，具有尺度不变性，满足非负性；同一性；对称性；三角不等性等特点	GIOU在基于IOU特性的基础上引入最小外接框，能更好的反映两者的重合度	DIOU在IoU的基础上直接回归两个框中心点的欧式距离，加速收敛	CIOU在DIOU的基础上增加了检测框尺度的Loss，增加了长宽比的Loss，使得目标框回归更加稳定	EIOU在CIOU的基础上分别计算宽高的差异值取代了纵横比，同时引入Focal Loss解决难易样本不平衡的问题	基于IoU Loss推广到一个新的Power IoU系列 Loss，通过调节 $\alpha$ ，使检测器在实现不同水平的bbox回归精度方面具有更大的灵活性	SIOU是引入了所需回归之间的向量角度，重新定义了距离损失，有效降低了回归的自由度，加速网络的收敛，进一步提升回归的准确性	WIoU v1 构造了基于注意力的边界框损失，WIoU v2 和 v3 则是在此基础上通过构造梯度增益 (聚焦系数) 的计算方法来附加聚焦机制。
缺点	1.若两个框不相交，不能反映两个框距离远近 2.无法精确的反映两个框的重合度大小	1.当检测框和真实框出现重叠退化成IOU 2.两个框相交时，在水平和垂直方向上收敛慢	回归过程中未考虑Bounding box的纵横比，精确度上尚有进一步提升的空间	若预测框和gt框的长宽比是相同的，那么长宽比的惩罚项恒为0，会阻碍模型有效的优化	/	/	/	/

Code

本代码摘抄于YOLOv5官方7.0版本，并在其基础上添加了Alpha-IOU、EIOU、SIOU和WIOU(后续添加)损失函数。

def bbox_iou(box1, box2, xywh=True, GIoU=False, DIoU=False, CIoU=False, SIoU=False, EIoU=False, Focal=False, alpha=1, gamma=0.5, eps=1e-7):
    # Returns Intersection over Union (IoU) of box1(1,4) to box2(n,4)

    # Get the coordinates of bounding boxes
    if xywh:  # transform from xywh to xyxy
        (x1, y1, w1, h1), (x2, y2, w2, h2) = box1.chunk(4, -1), box2.chunk(4, -1)
        w1_, h1_, w2_, h2_ = w1 / 2, h1 / 2, w2 / 2, h2 / 2
        b1_x1, b1_x2, b1_y1, b1_y2 = x1 - w1_, x1 + w1_, y1 - h1_, y1 + h1_
        b2_x1, b2_x2, b2_y1, b2_y2 = x2 - w2_, x2 + w2_, y2 - h2_, y2 + h2_
    else:  # x1, y1, x2, y2 = box1
        b1_x1, b1_y1, b1_x2, b1_y2 = box1.chunk(4, -1)
        b2_x1, b2_y1, b2_x2, b2_y2 = box2.chunk(4, -1)
        w1, h1 = b1_x2 - b1_x1, (b1_y2 - b1_y1).clamp(eps)
        w2, h2 = b2_x2 - b2_x1, (b2_y2 - b2_y1).clamp(eps)

    # Intersection area
    inter = (b1_x2.minimum(b2_x2) - b1_x1.maximum(b2_x1)).clamp(0) * \
            (b1_y2.minimum(b2_y2) - b1_y1.maximum(b2_y1)).clamp(0)

    # Union Area
    union = w1 * h1 + w2 * h2 - inter + eps

    # IoU
    # iou = inter / union # ori iou
    iou = torch.pow(inter/(union + eps), alpha) # alpha iou
    if CIoU or DIoU or GIoU or EIoU or SIoU:
        cw = b1_x2.maximum(b2_x2) - b1_x1.minimum(b2_x1)  # convex (smallest enclosing box) width
        ch = b1_y2.maximum(b2_y2) - b1_y1.minimum(b2_y1)  # convex height
        if CIoU or DIoU or EIoU or SIoU:  # Distance or Complete IoU https://arxiv.org/abs/1911.08287v1
            c2 = (cw ** 2 + ch ** 2) ** alpha + eps  # convex diagonal squared
            rho2 = (((b2_x1 + b2_x2 - b1_x1 - b1_x2) ** 2 + (b2_y1 + b2_y2 - b1_y1 - b1_y2) ** 2) / 4) ** alpha  # center dist ** 2
            if CIoU:  # https://github.com/Zzh-tju/DIoU-SSD-pytorch/blob/master/utils/box/box_utils.py#L47
                v = (4 / math.pi ** 2) * (torch.atan(w2 / h2) - torch.atan(w1 / h1)).pow(2)
                with torch.no_grad():
                    alpha_ciou = v / (v - iou + (1 + eps))
                return iou - (rho2 / c2 + torch.pow(v * alpha_ciou + eps, alpha))  # CIoU
            elif EIoU:
                rho_w2 = ((b2_x2 - b2_x1) - (b1_x2 - b1_x1)) ** 2
                rho_h2 = ((b2_y2 - b2_y1) - (b1_y2 - b1_y1)) ** 2
                cw2 = torch.pow(cw ** 2 + eps, alpha)
                ch2 = torch.pow(ch ** 2 + eps, alpha)
                if Focal:
                    return iou - (rho2 / c2 + rho_w2 / cw2 + rho_h2 / ch2), torch.pow(inter/(union + eps), gamma) # Focal_EIou
                else:
                    return iou - (rho2 / c2 + rho_w2 / cw2 + rho_h2 / ch2) # EIou
            elif SIoU:
                # SIoU Loss https://arxiv.org/pdf/2205.12740.pdf
                s_cw = (b2_x1 + b2_x2 - b1_x1 - b1_x2) * 0.5 + eps
                s_ch = (b2_y1 + b2_y2 - b1_y1 - b1_y2) * 0.5 + eps
                sigma = torch.pow(s_cw ** 2 + s_ch ** 2, 0.5)
                sin_alpha_1 = torch.abs(s_cw) / sigma
                sin_alpha_2 = torch.abs(s_ch) / sigma
                threshold = pow(2, 0.5) / 2
                sin_alpha = torch.where(sin_alpha_1 > threshold, sin_alpha_2, sin_alpha_1)
                angle_cost = torch.cos(torch.arcsin(sin_alpha) * 2 - math.pi / 2)
                rho_x = (s_cw / cw) ** 2
                rho_y = (s_ch / ch) ** 2
                gamma = angle_cost - 2
                distance_cost = 2 - torch.exp(gamma * rho_x) - torch.exp(gamma * rho_y)
                omiga_w = torch.abs(w1 - w2) / torch.max(w1, w2)
                omiga_h = torch.abs(h1 - h2) / torch.max(h1, h2)
                shape_cost = torch.pow(1 - torch.exp(-1 * omiga_w), 4) + torch.pow(1 - torch.exp(-1 * omiga_h), 4)
                return iou - torch.pow(0.5 * (distance_cost + shape_cost) + eps, alpha) # SIou
            return iou - rho2 / c2  # DIoU
        c_area = cw * ch + eps  # convex area
        return iou - torch.pow((c_area - union) / c_area + eps, alpha)  # GIoU https://arxiv.org/pdf/1902.09630.pdf

    return iou  # IoU

maven:Maven插件开发实践：动态依赖注入与架构演进说明 10km java maven java plugin artifact
最近的工作中设计了一个maven插件,需要在插件执行时的增加新的依赖库，本文作为总结，说明如何在插件执行时自主注入新的依赖库。动态依赖注入实现示例解析通过ExampleMojo插件，我们可以在编译阶段动态注入指定的依赖：publicvoidexecute()throwsMojoExecutionException{ArtifactSupport.injectCacheEngine(project,
CVAT标注工具使用与功能测试-Windows下（保姆式教程） Barry-mapping docker 计算机视觉 windows
目录一、安装所需要环境1.1、项目介绍（项目下载地址）1.2、Vue环境配置1.3、配置docker(Windows下)二、CVAT安装和使用2.1、CVAT安装2.2、CVAT使用2.2.1、创建用户（account）2.2.2、基本选项设置（Settings）2.2.3、创建工程（Createanewproject）2.2.4、创建任务（Createanewtask）2.2.5、开始标注（St
matlab连接散射点,使用小波散射做信号分类死月絲卡蕾特 matlab连接散射点
在时间序列信号的深度学习第二部分，我们将介绍一下怎样使用小波散射做信号分类。本视频将分为两部分。第一部分中我们已经简单介绍一下深度学习，包括它的概念和工作流程等。并且我们演示了如何用时频变换，和基于卷积神经网络的迁移学习来做心电图信号的分类。第二部分中我们将首先介绍什么是小波散射，之后将聚焦在怎样使用小波散射技术也就是不变散射卷积网络做自动特征提取，和使用长短期记忆网络也就是LSTM(LongSh
周志华机器学习西瓜书第五章神经网络-学习笔记(超详细) Sodas（填坑中....）周志华西瓜书——详细笔记附例题图解机器学习神经网络学习人工智能数据挖掘算法
在机器学习中，神经网络一般指的是"神经网络学习"，是机器学习与神经网络两个学科的交叉部分。所谓神经网络，目前用的最广泛的一个定义是"神经网络是由具有适应性的简单单元组成的广泛并行互连的网络，它的组织能够模拟生物神经系统对真实世界物体做出交互反应"。神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向--深度学习的基础。学习神经网络不仅可以让你掌握一门强大的机器学习方法，同时也可以更好地帮助
cve-2025-25064漏洞分析 Werqy3 网络安全
前言Zimbra提供一套开源协同办公套件包括WebMail，日历，通信录，Web文档管理和创作。漏洞描述漏洞原因漏洞的根本原因在于CancelPendingAccountOnlyRemoteWipe处理器中对用户输入（即设备ID）的处理方式不当漏洞代码//lib/ext/zimbrasync/zm-sync-store/com/zimbra/zimbrasync/service/CancelPen
Matlab 大量接单 matlabgoodboy matlab 开发语言
分享一个matlab接私活、兼职的平台1、技术方向满足任一即可2、技术要求3、最后技术方向满足即可MATLAB：熟练掌握MATLAB编程语言，能够使用MATLAB进行数据处理、机器学习和深度学习等相关工作。机器学习、深度学习、强化学习、仿真、复现、算法、神经网络、建模、图像识别、数据挖掘、数据获取、爬虫、数据分析、目标检测、算法创新、因子分析、相关分析、方差分析、判别分析、方程分析、线性回归、中介
Ubuntu20.04 ros-noetic下opencv多版本问题may conflict with libopencv_highgui.so.4.2 JANGHIGH 小技巧 OpenCV opencv 人工智能计算机视觉
Ubuntu20.04ros-noetic下opencv多版本问题问题解决情况1情况2方法当前终端生效将上述命令添加到~/.bashrc中，使其永久生效问题当编译某程序包时，出现如下警告，但是编译通过。/usr/bin/ld:warning:libopencv_highgui.so.406,neededby/lidar_slam_ws/devel/lib/libvikit_common.so,ma
深度学习五大模型：CNN、Transformer、BERT、RNN、GAN解析大模型_学习路线深度学习 cnn transformer 人工智能 AI大模型大模型 LLM
今天探讨它们各自适用的场景，让您知道在何种情况下选择何种模型；同时分析它们的优势与局限，助您全面评估这些模型的性能。一、卷积神经网络（ConvolutionalNeuralNetwork,CNN）原理：CNN主要由卷积层、池化层和全连接层组成。卷积层通过卷积核在输入数据上进行卷积运算，提取局部特征；池化层则对特征图进行下采样，降低特征维度，同时保留主要特征；全连接层将特征图展开为一维向量，并进行分
3.4.4- 先颜色后形状的方式 STM32串口通信 openmv+STM32串口通信 openmv串口通信openmv识别物体 openmv神经网络训练 openmv数字识好家伙VCC stm32 神经网络嵌入式硬件单片机硬件工程 51单片机嵌入式实时数据库
非常详细的视频和文字教程，讲解常见的openmv教程包括巡线、物体识别、圆环识别、阈值自动获取等。非常适合学习openmv、K210、K230等项目视频合集链接在:openmv教程合集openmv入门到项目开发openmv和STM32通信openmv和opencv区别openmv巡线openmv数字识别教程LCD3.4.4-先颜色后形状的方式可以再试试先颜色后形状的识别方式。importsenso
3.4.5-识别形状+颜色+增加最小变化阈值 STM32串口通信 openmv+STM32串口通信 openmv串口通信openmv识别物体 openmv神经网络训练 openmv数字识好家伙VCC stm32 神经网络嵌入式硬件硬件工程单片机机器学习人工智能
非常详细的视频和文字教程，讲解常见的openmv教程包括巡线、物体识别、圆环识别、阈值自动获取等。非常适合学习openmv、K210、K230等项目视频合集链接在:openmv教程合集openmv入门到项目开发openmv和STM32通信openmv和opencv区别openmv巡线openmv数字识别教程LCD3.4.5-识别形状+颜色+增加最小变化阈值在形状+颜色的识别效果中，发现小球是不动，
Slurm作业调度系统常见操作（使用超算运行深度学习）坐在云朵上的kiwi 工程项目 #deep learning 深度学习服务器
1.传输下载文件sftp远程命令cd,pwd等，本地命令lcd,lpwdget远程地址本地地址put本地地址远程地址上传文件夹1.在远程建立和本地一样名称的文件夹如data/2.put-rdata/2.建立虚拟环境moduleloadpython/3.8#加载modulevirtualenv--no-downloadENV#建立一个叫ENV的虚拟环境激活虚拟环境sourceENV/bin/acti
pyQT学习笔记-----pushbutton控制Graphics view内对象移动汉东省长达康 pyQT pyQT Graphics view pushbutton控制移动
pyQT学习笔记-----pushbutton控制Graphicsview内对象移动引言项目需要制作一个美观，大气，高逼格的控制界面，出于项目的需要，以及本人对于python语言的掌握程度远高于C，所以果断采用了python+pyQT这个框架，今天本人终于完成了这个控制系统二维操作的动态显示，历时三个周，前前后后试过很多的方法。第一种尝试：从lable显示图片开始，接着使用openCV，用labl
深度学习框架之主流学习框架 uu1224 深度学习学习人工智能机器学习神经网络
深度学习框架是一类专门设计用来简化和加速神经网络模型开发过程的软件工具。它们提供了构建、训练和部署神经网络所需的各种功能和库。以下是一些主流的深度学习框架及其特点：TensorFlow：由Google开发，是一个广泛使用的开源深度学习框架。它以强大的图计算模型和分布式计算能力著称，并且通过高级API如Keras，为用户提供了易于上手的开发体验。PyTorch：由Facebook开发，以其动态计算图
3.2.2-增加 + 缓冲区显示结果 openmv巡线循迹黑线循迹红线循迹 openmv循迹小车 openmv+STM32循迹小车循迹赛道视觉循迹好家伙VCC stm32 嵌入式硬件单片机
3.2.2-增加+缓冲区显示结果非常详细的视频和文字教程，讲解常见的openmv教程包括巡线、物体识别、圆环识别、阈值自动获取等。非常适合学习openmv、K210、K230等项目视频合集链接在:openmv教程合集openmv入门到项目开发openmv和STM32通信openmv和opencv区别openmv巡线openmv数字识别教程LCD上面的代码识别后结果输出在串行终端还是不够直观，我们可
ModuleNotFoundError: No module named ‘mmcv.runner‘ 中 get_dist_info的问题骆驼穿针眼 mmdet问题集 python
如何解决mmcv中没有get_dist_info的问题Traceback(mostrecentcalllast):File"./tools/train.py",line17,infrommmcv.runnerimportget_dist_info,init_distModuleNotFoundError:Nomodulenamed'mmcv.runner'mmcv中的很多库都改到了mmengine
频域分析：利用傅里叶变换（Fourier Transform）对图像进行深度解析那雨倾城 OpenCV应用计算机视觉图像处理 python opencv 视觉检测
在图像处理和计算机视觉领域，傅里叶变换（FourierTransform）是一项基础而强大的工具。它将时域信号（如图像）转化为频域信号，为我们提供了图像的频率特性，这对于图像的分析、压缩、去噪和特征提取等任务非常重要。本文将深入探讨傅里叶变换在图像中的应用，并通过实例展示如何利用傅里叶变换对输入图像进行频域分析。1.什么是傅里叶变换？傅里叶变换是一种数学变换，它将信号从时域（或空间域）转换到频域。
在 macOS 使用 .pem 私钥免密登录腾讯云服务器橙子小哥的代码世界基础知识 linux macos 腾讯云服务器 ssh
前言在腾讯云上创建服务器时，如果选择了「密钥对」的登录方式，就会得到一个.pem文件作为私钥。很多小伙伴在使用macOS系统时，可能不清楚如何使用这个私钥文件来SSH免密登录远程服务器。本文将详细介绍如何在本地配置.pem私钥文件并成功登录腾讯云服务器。1.在腾讯云上创建密钥对1.登录腾讯云控制台，选择「密钥管理」或在创建服务器（CVM）时选择「密钥对」的登录方式。2.创建密钥对后，系统会提供一个
C# ASP.NET MVC项目内使用ApiController chance_66 c#
1.在App_Start文件夹新建WebApiConfig.cs文件，建立webApi路由的注册方法。usingSystem.Web.Http;namespacePrivilegeManager{publicclassWebApiConfig{publicstaticvoidRegister(HttpConfigurationconfig){config.MapHttpAttributeRoute
DeepSeek应用场景及其解决的问题杏花春雨江南自然语言处理
DeepSeek是一种基于深度学习的智能技术，能够处理复杂的非结构化数据（如文本、图像、语音等），并在企业级应用开发中发挥重要作用。以下是DeepSeek在企业级应用开发中的典型应用场景及其解决的问题：1.企业知识管理与智能搜索场景：企业拥有大量的文档、报告、邮件、会议记录等非结构化数据，员工需要快速找到相关信息。DeepSeek的作用：通过语义搜索和自然语言处理（NLP），DeepSeek可以理
网络编程中的数据传输函数 C嘎嘎嵌入式开发网络服务器 linux c++
虽然send、recv、sendmsg和recvmsg都是用于在网络编程中进行数据传输的函数。但是它们各自的功能和应用场景有所不同send和recvsend功能：send用于将数据发送到连接的套接字。原型ssize_tsend(intsockfd,constvoid*buf,size_tlen,intflags);参数sockfd：套接字文件描述符。buf：指向要发送的数据的缓冲区。len：要发送
技术学习周刊第 3 期：Linux& 容器网络扫盲艾希逐月技术学习周刊学习 linux 网络
#IntroductiontoLinuxinterfacesforvirtualnetworking介绍了Linux中常用的网络概念，比如bridge网桥、veth对、VLAN&VXLAN、MACVLAN等，可以帮助自己对这些概念做一个快速的了解。#AnintroductiontoLinuxvirtualinterfaces:Tunnels算是上一篇文章的姊妹篇，主要介绍了Linux网络隧道相关的
OpenCV Python 版使用教程（三）摄像头读取延迟解决方法 tianchengwang opencv opencv python 人工智能
文章目录一、上篇回顾二、产生原因三、解决方法1.cap.grab()方法2.多线程法总结一、上篇回顾在上一篇中，简单介绍了如何使用OpenCV操作摄像头，本期来讲在摄像头读取时，可能会出现画面延迟的解决方法。二、产生原因OpenCV在读取的时候，会将视频流放在缓冲区中，然后每次调用的时候，会从缓冲区内读取视频帧。虽然说大多数情况难以出现写入缓冲区远大于读取缓冲区的速度，但是当设备出现性能瓶颈，尤其
pytorch与深度学习随记——AlexNet 黑色的山岗在沉睡深度学习随记深度学习 pytorch 人工智能
AlexNet和LeNet的设计理念非常相似，但也存在显著差异：基本结构对比网络深度：AlexNet比LeNet-5要深得多，AlexNet由八层组成：五个卷积层、两个全连接隐藏层和一个全连接输出层。激活函数：AlexNet使用ReLU而不是sigmoid作为其激活函数，这有助于缓解梯度消失问题并加速训练过程。AlexNet架构的创新点局部响应归一化(LRN)：AlexNet引入LRN层，可以创建
深度学习-138-LangGraph之应用实例(七)构建自动绘图系统皮皮冰燃深度学习深度学习人工智能 LangGraph
文章目录1初始化核心功能1.1大语言模型1.2结构化输出1.3搜索引擎1.4Python执行环境2编排流2.1创建图2.2可视化图2.3应用图3绘图指定线型4添加工具增强4.1执行工具和打印工具4.2绑定工具4.3编排流4.4可视化图4.5应用1初始化核心功能1.1大语言模型importosos.environ['OLLAMA_HOST']='127.0.0.1'os.environ['OLLAM
穿越AI边界：深度集成DeepSeek API与云平台的实践之路云边有个稻草人热门文章人工智能 DeepSeek 大数据集成DeepSeek API DeepSeek算法阿里云百炼平台集成
云边有个稻草人-CSDN博客随着人工智能技术的日益发展，深度学习和自然语言处理（NLP）已经在很多领域得到了广泛的应用。DeepSeek作为一款领先的大型语言生成模型，凭借其强大的推理和生成能力，已经被越来越多的开发者和行业专家所青睐。通过DeepSeek提供的API接口，开发者可以在多个领域中实现先进的自然语言理解和生成任务。本文将深入探讨如何使用Python调用DeepSeek的API接口，并
AI在农业中的应用:精准农业的新时代 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI,农业,精准农业,机器学习,深度学习,计算机视觉,农业机器人1.背景介绍农业是人类文明的基石，也是全球经济的重要支柱。然而，随着人口增长和资源短缺，传统农业面临着诸多挑战，例如低效率、资源浪费、环境污染和气候变化的影响。为了应对这些挑战，精准农业应运而生。精准农业是指利用现代信息技术和数据分析手段，对农业生产进行精细化管理，提高资源利用效率、产量和产品质量，同时减少环境污染。人工智能（AI）作
AI驱动的企业学习管理系统 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
AI、机器学习、深度学习、企业学习管理系统、个性化学习、学习路径推荐、知识图谱1.背景介绍在当今瞬息万变的数字化时代，企业面临着前所未有的挑战和机遇。知识更新速度加快，技术迭代日新月异，员工需要不断学习新技能，提升自身竞争力，才能适应不断变化的市场环境。传统的企业学习管理系统(LearningManagementSystem,LMS)往往以标准化课程和批量学习为主，难以满足员工个性化学习需求，且缺
从零到精通：小白DeepSeek全栈入门指南好东西不迷路各自资源 AI 前端 html python
第一部分：认知准备（1-3天）1.1基础概念搭建人工智能三要素：数据/算法/算力深度学习与传统机器学习的区别神经网络基本结构（输入层/隐藏层/输出层）常用术语解析：epoch、batch、loss、accuracy1.2环境配置实战Python环境搭建（推荐Anaconda）condacreate-ndeepseekpython=3.8condaactivatedeepseek深度学习框架选择指南
Python vLLM 实战应用指南 ghostwritten python python 开发语言
文章目录1.vLLM简介2.安装vLLM3.快速开始3.1加载模型并生成文本3.2参数说明4.实战应用场景4.1构建聊天机器人示例对话：4.2文本补全输出示例：4.3自定义模型服务启动服务调用服务5.性能优化5.1GPU加速5.2动态批处理6.总结vLLM是一种高性能的开源深度学习推理引擎，专注于高效的生成式模型推理任务。它通过动态批处理和内存优化技术大幅提高了大模型（如GPT系列）的推理性能，非
从零到一：利用DeepSeek构建高精度图像分类模型实战解析一碗黄焖鸡三碗米饭人工智能前沿与实践分类数据挖掘人工智能
引言：为什么选择DeepSeek进行图像分类？在计算机视觉领域，图像分类作为基础任务，其技术演进经历了从传统特征工程到深度学习的革命性转变。DeepSeek作为国产自研的深度学习框架，凭借其高效计算优化和灵活架构设计，在ImageNet等基准测试中展现出与PyTorch、TensorFlow等主流框架相媲美的性能。本文将手把手带您实现从零搭建工业级图像分类模型的全过程。一、DeepSeek技术架构
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16]root@192.168.11.10:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s