初初初夏_

【目标检测】YOLOv5算法实现(四)：损失计算

本系列文章记录本人硕士阶段YOLO系列目标检测算法自学及其代码实现的过程。其中算法具体实现借鉴于ultralytics YOLO源码Github，删减了源码中部分内容，满足个人科研需求。
本系列文章主要以YOLOv5为例完成算法的实现，后续修改、增加相关模块即可实现其他版本的YOLO算法。

文章地址：
YOLOv5算法实现(一)：算法框架概述
YOLOv5算法实现(二)：模型加载
YOLOv5算法实现(三)：数据集加载
YOLOv5算法实现(四)：损失计算
YOLOv5算法实现(五)：预测结果后处理
YOLOv5算法实现(六)：评价指标及实现
YOLOv5算法实现(七)：模型训练
YOLOv5算法实现(八)：模型验证
YOLOv5算法实现(九)：模型预测(编辑中…)

本文目录

1 引言
2 正样本匹配
3 IoU计算
4 损失计算

1 引言

本篇文章实现模型损失函数的计算，主要涉及loss.py文件，内容包括正样本匹配和多级损失计算，其运算流程如图1所示。

图1 模型损失计算流程

正样本匹配根据目标的实际位置，确定预测该目标的单元格位置。模型预测结果有如下形式[nf，bs，na，grid_y，grid_x，no]其中nf表示由哪几个feature_map实现对该目标的预测，na表示由哪几个Anchor实现对该目标的预测，[grid_y，grid_x]表示由哪几个像素单元实现对该目标的预测。其中feature_map上的正样本根据目标的宽高和当前feature_map上的Anchor的宽高比进行筛选，选取宽高比小于设定阈值的Anchor作为该feature_map上的样本；该feature_map上预测单元的正样本筛选如图2所示，根据目标的中心点坐标选择至多三个预测单元作为正样本。

图2 预测单元筛选

损失计算中包含三部分损失的计算：
位置损失(仅计算正样本)：获得正样本对应的[feature_map，img_index，anchor_index，grid_y，grid_x]的位置预测结果，和正样本计算IOU损失，不同的IOU计算方法如图3所示。Iou损失计算公式为：
$I o uL oss = 1 - I o U / G I o U / D I o U / C I o U$

图3 不同IoU计算方法

类别损失(仅计算正样本)：获得正样本对应的[feature_map，img_index，anchor_index，grid_y，grid_x]的类别预测结果，和正样本计算类别损失，其中类别采用独热编码的形式[0,0,0,1,0,0]，长度为目标的类别数，其中对应类别处值为1，其余位置为0。类别损失的计算方法如下：
$\sum\limits_{i = 0}^{nf} {\{ {1 \over n}\sum\limits_{j = 0}^n {[{1 \over {nc}}\sum\limits_{k = 0}^{k = nc} {({y_i}} } } \log (\sigma ({p_i})) + (1 - {y_i})\log (1 - \sigma ({p_i})))]\}$
目标类别置信度损失(计算所有样本)：有正样本的位置将其值设置为IoU，其余位置设置为0。置信度损失的计算方法如下：
$\sum\limits_{i = 0}^{nf} {\{ {1 \over {na}}\sum\limits_{j = 0}^{na} {[{1 \over {gridy \times gridx}}\sum\limits_{m = 0}^{gridy} {\sum\limits_{n = 0}^{gridx} {(y\log (\sigma (p)) + (1 - y)\log (1 - \sigma (p)))]} } } } \}$

2 正样本匹配

    def build_targets(self, p, targets):
        '''
        所有GT筛选相应的anchor正样本
        :param p: 预测信息(feature_map输出)
                list, 存放三个列表, 如输入为(4, 3, 640, 640)
                {[4, 3, 80, 80, 85], [4, 3, 40, 40, 85], [4, 3, 20, 20, 85]}
                [bs, na, grid_y, grid_x, xywh(回归参数)+class+classes]
        :param targets: 当前batch中的真实框 [nt, 6] [image_index, classes, xywh(相对坐标)]
        :return:tcls: 正样本类别
                tbox: 正样本位置(xywh) 其中xy为这个target对当前grid_cell左上角偏移量, xywh均为当前特征图上的绝对坐标
                indices: b:表示正样本的image index
                         a:表示正样本使用的anchor index
                         gj: 表示正样本的预测单元左上角y坐标
                         gi: 表示正样本的预测单元左上角x坐标
                anch: 表示正样本使用的anchor的尺度(相对于feature map)
        '''
        na, nt = self.na, targets.shape[0]  # anchor数量, 当前图片中的标签数
        tcls, tbox, indices, anch = [], [], [], []  # 存储类别、位置、索引、Anchor尺度

        # gain是为了后面将targets=[na, nt, t]中的相对坐标xywh映射到feature map上(绝对坐标)
        # image_index + class + xywh + anchor_index
        gain = torch.ones(7, device=self.device)

        # ai代表3个anchor上的所有target对应的anchor索引
        # [1, 3](0, 1, 2) -> [3, 1] -> [3, nt] 第一行nt个0, 第二行nt个1, 第三行nt个2
        ai = torch.arange(na, device=self.device).float().view(na, 1).repeat(1, nt)

        # 对一个feature map:这一步操作将target复制三份, 每一份对应一个feature map的一个anchor
        # 先假设所有的target的由三个anchor进行匹配, 再进行筛选, 将ai加进去用于标记当前target匹配的anchor_index
        # [nt, 6] [3, nt] -> [3, nt, 6] [3, nt, 1] -> [3, nt, 7] 7:image_index+class+xywh+anchor_index
        targets = torch.cat((targets.repeat(na, 1, 1), ai[..., None]), dim=2)

        # 以下两个参数用于扩展正样本, 一个target可能有多个cell预测到(上下左右, 3个anchor, 3个feature, 3个cell, 最多有3×3×3个anchor进行匹配)
        g = 0.5  # 中心偏移, 用于配上或下cell以及左或右cell
        # 以自身+周围上下左右4个网格 = 5个网格 来计算offsets, 最后的grid要减去偏移量
        off = torch.tensor(
            [
                [0, 0],
                [1, 0],   # j 左边(x-1)
                [0, 1],   # k 上边(y-1)
                [-1, 0],  # l 右边(x+1)
                [0, -1],  # m 下边(y+1)
            ],
            device=self.device).float() * g  # offsets
        # 遍历三个feature map, 筛选正样本
        for i in range(self.nl):  # nl: 输出特征层数量
            # 当前feature map对应的anchor尺寸 [3, 2]
            anchors, shape = self.anchors[i], p[i].shape

            # gain增益, 保存当前feature map的宽和高: gain[2:6] = gain[w, h, w, h]
            # gain用于将target上的xywh相对坐标转换为feature_map上的绝对坐标
            gain[2:6] = torch.tensor(shape)[[3, 2, 3, 2]]  # (1, 1, w, h, w, h, 1)

            t = targets * gain  # [3, nt, 7] 7:image_index + class + xywh(特征图上的绝对坐标) + anchor_index

            # 若存在正样本, 则开始匹配
            if nt:
                # t[:, :, 4:6] shape [3, nt, 2], anchors[:, None] shape[3, 1, 2]
                # r[3, nt, 2]
                # 所有的gt与当前层的三个anchor的宽高比(w / w, h / h)
                r = t[..., 4:6] / anchors[:, None]

                # 正样本筛选条件 GT与anchor的宽比或高比超过一定的阈值, 就当作负样本
                # torch.max(r, 1. / r) = [3, 63, 2] 筛选出宽比w1/w2, w2/w1和高比h1/h2, h2/h1中最大的那个
                # .max(dim=2)返回宽比、高比两者中较大的一个值和其索引, [0]为返回值, [1]为返回索引
                # j [3, nt] 小于anchor_t的为正样本 True:正样本, False:负样本
                j = torch.max(r, 1 / r).max(2)[0] < self.hyp['anchor_t']

                # 根据筛选条件j, 过滤负样本, 得到所有gt的anchor正样本
                # 知道gt的坐标属于哪张图片正样本对应的idx, 也就得到了当前正样本anchor
                # t [3, nt, 7], j[3, nt](假设其中42个为True) -> [126, 7]
                t = t[j]

                # offsets筛选当前格子周围格子, 找到两个离target中心最近的两个格子, 可能周围的格子也预测到了当前样本
                # 除了target所在的当前格子, 还有2个格子对目标进行检测(计算损失)
                # 利用中心坐标对1求余与g比较, 判断选择哪两个格子
                # gxy:[126, 2] gain[[2, 3]]:[1,2]
                gxy = t[:, 2:4]  # grid xy 取目标中心的坐标(绝对坐标,相对于feature map左上角的坐标)
                gxi = gain[[2, 3]] - gxy  # (绝对坐标, 相对于feature map右下角的坐标)

                # j: [126] 如果是True表示当前target中心点所在的格子的左边格子也对该target进行回归
                # k: [126] 如果是True表示当前target中心点所在大的格子的上边格子也对该target进行回归
                j, k = ((gxy % 1 < g) & (gxy > 1)).T

                # l: [126] 如果是True表示当前target中心点所在的格子的右边格子也对该target进行回归
                # m: [126] 如果是True表示当前target中心点所在的格子的下边格子也对该target进行回归
                l, m = ((gxi % 1 < g) & (gxi > 1)).T

                # j [5, 126] torch.ones_like(j): 当前格子不需要筛选均为True, j,k,m,l:左上右下格子的筛选结果
                j = torch.stack((torch.ones_like(j), j, k, l, m))
                # 得到筛选后的所有格子正样本 格子数 <= 3 * 126, 不在边上时等号成立
                # t复制5份, 分别对应五个格子
                # t [126, 7]->[5, 126, 7]; j[5, 126]
                # t[5, 126, 7] + j[5, 126] = t[378, 7] 理论上小于等于3倍的126, 当且仅当没有边界格子时等号成立
                t = t.repeat((5, 1, 1))[j]

                # gxy:[126, 2] torch.zeros_like(gxy)[None]: [1, 126, 2]
                # off:[5,2]  off[:, None]:[5, 1, 2]  off[:, None][j] = [5, 126, 2] + [5, 126] = [378, 2] 广播机制
                # offsets: [378, 2]得到所有筛选后的网格的中心相对于这个要预测的真实框所在网格边界（左右上下边框）的偏移量
                offsets = (torch.zeros_like(gxy)[None] + off[:, None])[j]
            else:
                t = targets[0]
                offsets = 0
            # t[378, 7] t.chunk(4, dim=1)在维度1上划分为4个块 (image_index, class, x, y, w, h, anchor_index)
            # bc:(image_index, class) gxy gwh a(anchor_index)
            bc, gxy, gwh, a = t.chunk(4, 1)
            # a:anchor_index, b:image_index, c:class
            a, (b, c) = a.long().view(-1), bc.long().T
            gij = (gxy - offsets).long()  # 预测真实框的网络所在的左上角坐标, 其中.long()化为长整型进行了取整 [378, 2]
            gi, gj = gij.T  # grid xy

            # b:image_index, a:anchor_index, gj:网格左上角y坐标, gi:网格的左上角x坐标
            indices.append((b, a, gj.clamp_(0, shape[2] - 1), gi.clamp_(0, shape[3] - 1)))
            # xywh(绝对坐标), 其中xy为target对当前grid_cell左上角的偏移量
            tbox.append(torch.cat((gxy - gij, gwh), 1))
            # 对应所有的anchors
            anch.append(anchors[a])
            tcls.append(c)

        return tcls, tbox, indices, anch

3 IoU计算

def bbox_iou(box1, box2, xywh=True, GIoU=False, DIoU=False, CIoU=False, eps=1e-7):
    '''
    计算Iou/GIou/DIou/CIou,默认计算普通IoU
    '''

    # 将xywh坐标形式转换成xyxy(左上角右下角)坐标形式,便于计算面积与对角线长度
    if xywh:  # transform from xywh to xyxy
        (x1, y1, w1, h1), (x2, y2, w2, h2) = box1.chunk(4, -1), box2.chunk(4, -1)
        w1_, h1_, w2_, h2_ = w1 / 2, h1 / 2, w2 / 2, h2 / 2
        b1_x1, b1_x2, b1_y1, b1_y2 = x1 - w1_, x1 + w1_, y1 - h1_, y1 + h1_
        b2_x1, b2_x2, b2_y1, b2_y2 = x2 - w2_, x2 + w2_, y2 - h2_, y2 + h2_
    else:  # x1, y1, x2, y2 = box1
        b1_x1, b1_y1, b1_x2, b1_y2 = box1.chunk(4, -1)
        b2_x1, b2_y1, b2_x2, b2_y2 = box2.chunk(4, -1)
        w1, h1 = b1_x2 - b1_x1, b1_y2 - b1_y1 + eps
        w2, h2 = b2_x2 - b2_x1, b2_y2 - b2_y1 + eps

    # 计算交集面积
    inter = (torch.min(b1_x2, b2_x2) - torch.max(b1_x1, b2_x1)).clamp(0) * \
            (torch.min(b1_y2, b2_y2) - torch.max(b1_y1, b2_y1)).clamp(0)

    # 计算并集面积
    union = w1 * h1 + w2 * h2 - inter + eps
	
	# 计算IoU
    iou = inter / union
    if CIoU or DIoU or GIoU:
    	# 计算包围两个矩形框的最小框宽和高
        cw = torch.max(b1_x2, b2_x2) - torch.min(b1_x1, b2_x1)  # 最小包围矩形框宽度
        ch = torch.max(b1_y2, b2_y2) - torch.min(b1_y1, b2_y1)  # 最小包括矩形框高度
        if CIoU or DIoU:  # Distance or Complete IoU https://arxiv.org/abs/1911.08287v1
            c2 = cw ** 2 + ch ** 2 + eps  # 最小包围矩形框对角线长度
            rho2 = ((b2_x1 + b2_x2 - b1_x1 - b1_x2) ** 2 + (b2_y1 + b2_y2 - b1_y1 - b1_y2) ** 2) / 4  # 矩形框中心点连线长度
            if CIoU:  # https://github.com/Zzh-tju/DIoU-SSD-pytorch/blob/master/utils/box/box_utils.py#L47
                v = (4 / math.pi ** 2) * torch.pow(torch.atan(w2 / h2) - torch.atan(w1 / h1), 2)
                with torch.no_grad():
                    alpha = v / (v - iou + (1 + eps))
                return iou - (rho2 / c2 + v * alpha)  # CIoU
            return iou - rho2 / c2  # DIoU
        c_area = cw * ch + eps  # 最小包围矩形框面积
        return iou - (c_area - union) / c_area  # GIoU https://arxiv.org/pdf/1902.09630.pdf
    return iou  # IoU

4 损失计算

class ComputeLoss:
    '''
    Anchor-based
    YOLOv5正负样本匹配方法
    '''
    sort_obj_iou = False  # 后面筛选置信度损失时是否先对iou进行排序
    def __init__(self, model):
        device = next(model.parameters()).device  # 获取模型训练的设备
        h = model.hyp  # 损失计算中用到的超参数

        # 定义obj置信度损失和分类损失
        # 其中pos_weight为了处理样本不均衡问题, 在正样本的损失前面乘上系数
        BCEcls = nn.BCEWithLogitsLoss(pos_weight=torch.tensor([h['cls_pw']], device=device))
        BCEobj = nn.BCEWithLogitsLoss(pos_weight=torch.tensor([h['obj_pw']], device=device))

        # 标签平滑, 防止过拟合并能缓解分类问题中错误标签的影响
        # 正样本标签, 负样本标签
        self.cp, self.cn = smooth_BCE(eps=h.get('label_smoothing', 0.0))


        m = model.model[-1]  # Detect() module
        # 针对obj损失, 对samll, medium, large物体的检测损失乘上系数
        self.balance = {3: [4.0, 1.0, 0.4]}.get(m.nl, [4.0, 1.0, 0.25, 0.06, 0.02])

        self.BCEcls, self.BCEobj, self.hyp = BCEcls, BCEobj, h
        self.na = m.na  # anchors数量
        self.nc = m.nc  # 类别数量
        self.nl = m.nl  # 输出特征层数量
        self.anchors = m.anchors  # anchors [3, 3, 2], 缩放到feature map上的anchors尺寸
        self.device = device
    def __call__(self, p, targets):  #predictions, targets
        # prediction ([bs, 3, 20, 20, 85], [bs, 3, 40, 40, 85], [bs, 3, 80, 80, 85])
        # targets[nt, 6]  image_index, classes, xywh
        lcls = torch.zeros(1, device=self.device)  # 类别损失
        lbox = torch.zeros(1, device=self.device)  # 位置损失
        lobj = torch.zeros(1, device=self.device)  # 物体置信度损失
        # 正样本匹配: 根据实际目标(x, y)筛选正样本grid, 根据实际目标(w, h)和anchors的长宽比筛选用于匹配的anchor
        # tcls: 正样本类别 tbox: 正样本在当前feature map上的绝对坐标 xywh, 其中xywh为相对grid_cell左上角偏移量
        # indices: image_index, anchor_index, gj, gi anchors: target使用的anchor尺度(相对于feature map)
        tcls, tbox, indices, anchors = self.build_targets(p, targets)  # targets

        # 计算损失, 针对每一个feature_map进行
        for i, pi in enumerate(p):  # 层数, 预测信息[bs, 3, 20, 20, 85]
            # 当前正样本的匹配信息: image_index, anchor_index, gridy, gridx
            b, a, gj, gi = indices[i]
            # 目标置信度(初始化为0)
            tobj = torch.zeros(pi.shape[:4], dtype=pi.dtype, device=self.device)  # [bs, 3, 20, 20]
            # 当前预测feature_map上的匹配正样本数
            n = b.shape[0]
            if n:  # 若存在正样本
                # 对应的正样本预测信息 xy:[nt, 2], wh:[nt, 2], cls[nt, nc]
                pxy, pwh, _, pcls = pi[b, a, gj, gi].split((2, 2, 1, self.nc), dim=1)

                # 预测的回归参数进行回归到feature_map上的xy绝对坐标
                pxy = pxy.sigmoid() * 2 - 0.5
                # 预测的回归参数进行回归到feature_map上的wh绝对坐标
                # anchors[i]当前匹配的正样本的anchors尺寸, 对应feature map
                pwh = (pwh.sigmoid() * 2) ** 2 * anchors[i]
                # 预测的边界框, 相对于feature map的绝对值(xy为相对cell的)
                pbox = torch.cat((pxy, pwh), 1)
                # 计算IoU
                iou = bbox_iou(pbox, tbox[i], CIoU=True).squeeze()
                # 计算IoU损失
                lbox += (1.0 - iou).mean()

                iou = iou.detach().clamp(0).type(tobj.dtype)
                if self.sort_obj_iou:  # 根据iou对正样本进行排序
                    j = iou.argsort()
                    b, a, gj, gi, iou = b[j], a[j], gj[j], gi[j], iou[j]
                # 利用iou作为物体置信度的标签值
                tobj[b, a, gj, gi] = iou

                # 计算分类损失, 若nc=1, 则类别损失与物体置信度损失重复, 无需重复计算
                if self.nc > 1:
                    # 负样本标签为cn
                    t = torch.full_like(pcls, self.cn, device=self.device)
                    # 正样本标签为cp
                    t[range(n), tcls[i]] = self.cp
                    lcls += self.BCEcls(pcls, t)
            # 计算物体置信度损失, 针对所有样本
            obji = self.BCEobj(pi[..., 4], tobj)
            # 针对不同大小的feature map即针对不同大小的物体检测的损失权重不同
            lobj += obji * self.balance[i]

        lbox *= self.hyp['box']
        lobj *= self.hyp['obj']
        lcls *= self.hyp['cls']

        # loss = lbox + lobj + lcls
        return {"box_loss": lbox,
                "obj_loss": lobj,
                "class_loss": lcls}
    def build_targets(self, p, targets):
		pass

基于python的Kimi AI 聊天应用 hunter206206 python python 自然语言处理
因为这几天deepseek有点状况，导致apikey一直生成不了，用kimi练练手。这是一个基于MoonshotAI的Kimi接口开发的聊天应用程序，使用PythonTkinter构建图形界面。项目结构项目由三个主要Python文件组成：1.main_kimi.py主程序入口文件，继承了ChatWindow类并实现了问答逻辑：创建主应用程序窗口初始化聊天逻辑实现提交问题的处理函数2.gui.py图
夜晚场景下的人车检测数据集VOC+YOLO格式4199张6类别 FL1623863129 数据集深度学习机器学习人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：4199标注数量(xml文件个数)：4199标注数量(txt文件个数)：4199标注类别数：6标注类别名称(注意yolo格式类别顺序不和这个对应，而以labels文件夹classes.txt为准):["bus","car
网球比赛检测数据集VOC+YOLO格式6648张5类别 FL1623863129 数据集深度学习机器学习人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：6648标注数量(xml文件个数)：6648标注数量(txt文件个数)：6648标注类别数：5标注类别名称(注意yolo格式类别顺序不和这个对应，而以labels文件夹classes.txt为准):["ball","ba
101算法javaScript描述【3】 2401_89317507 算法 javascript java
通常情况下，不能出现超过连续三个相同的罗马数字并且罗马数字中小的数字在大的数字的右边。但也存在特例，例如4不写做IIII，而是IV。数字1在数字5的左边，所表示的数等于大数5减小数1得到的数值4。同样地，数字9表示为IX。这个特殊的规则只适用于以下六种情况：I可以放在V(5)和X(10)的左边，来表示4和9。X可以放在L(50)和C(100)的左边，来表示40和90。C可以放在D(500)和M(1
详解python的单例模式 hunter206206 python python
单例模式是一种设计模式，它确保一个类只有一个实例，并提供一个全局访问点来获取这个实例。在Python中实现单例模式有多种方法，下面我将详细介绍几种常见的实现方式。1.使用模块Python的模块天然就是单例的，因为模块在第一次导入时会被加载到内存中，之后的导入都是直接使用内存中的模块对象。因此，你可以通过模块来实现单例模式。#singleton.pyclassSingletonClass:def__
LeetCode—406.根据身高重建队列(Queue Reconstruction by Height)——分析及代码（Java）江南土豆数据结构与算法 LeetCode Java 题解
LeetCode—406.根据身高重建队列[QueueReconstructionbyHeight]——分析及代码[Java]一、题目二、分析及代码1.贪心算法（1）思路（2）代码（3）结果三、其他一、题目假设有打乱顺序的一群人站成一个队列。每个人由一个整数对(h,k)表示，其中h是这个人的身高，k是排在这个人前面且身高大于或等于h的人数。编写一个算法来重建这个队列。注意：总人数少于1100人。示
LeetCode：300.最长递增子序列 xiaoshiguang3 代码随想录-跟着Carl学算法 leetcode 算法 java 动态规划
跟着carl学算法，本系列博客仅做个人记录，建议大家都去看carl本人的博客，写的真的很好的！代码随想录LeetCode：300.最长递增子序列给你一个整数数组nums，找到其中最长严格递增子序列的长度。子序列是由数组派生而来的序列，删除（或不删除）数组中的元素而不改变其余元素的顺序。例如，[3,6,2,7]是数组[0,3,1,6,2,2,7]的子序列。示例1：输入：nums=[10,9,2,5,
LeetCode：674.最长连续递增序列 xiaoshiguang3 代码随想录-跟着Carl学算法 leetcode 算法 java 动态规划
跟着carl学算法，本系列博客仅做个人记录，建议大家都去看carl本人的博客，写的真的很好的！代码随想录LeetCode：674.最长连续递增序列给定一个未经排序的整数数组，找到最长且连续递增的子序列，并返回该序列的长度。连续递增的子序列可以由两个下标l和r（lnums[i-1])dp[i]=dp[i-1]+1publicintfindLengthOfLCIS(int[]nums){intlen=
Python数据的筛选、排序与聚合大数据张老师 Python程序设计 python 开发语言 Python数据处理
Python数据的筛选、排序与聚合在数据分析过程中，我们常常需要对数据进行筛选、排序和聚合操作，以便从数据集中提取有价值的信息。这些操作是数据预处理和分析的基础，尤其在处理大型数据集时，能够帮助我们快速定位关键数据，进行进一步的分析。Pandas提供了强大的工具来支持这些操作，主要通过对Series和DataFrame的相关方法进行操作来实现。本节将详细讲解如何使用Pandas的Series和Da
C语言实现图像二值化变换项目源码爽新全效瓷兔膏
本文还有配套的精品资源，点击获取简介：本项目提供了一个C语言编程案例，专门用于解决图像处理中的“百马百担”问题，即图像二值化。项目展示如何使用C语言进行图像的读取、处理和保存，特别是二值化转换的实现，通过设定阈值将图像简化为黑白色调，以突出其特征。源码中包括了图像读取、阈值设置、像素遍历和图像写入等关键步骤，适合C语言学习者和图像处理领域开发者学习实践。1.C语言图像处理简介简介C语言作为一种高效
Python机器学习实战：人脸识别技术的实现和挑战 AI天才研究院 AI大模型企业级应用开发实战大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python机器学习实战：人脸识别技术的实现和挑战作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：人脸识别技术,模型训练,多人识别,动态人脸检测,应用场景1.背景介绍1.1问题的由来随着科技的进步和互联网的普及，人脸识别技术因其在安全验证、生物特征识别、智能监控等多个领域的广泛应用而迅速崛起。从传统的门禁系统到现代的人脸支付、社交媒体的自动登
深度学习：基础原理与实践阿尔法星球深度学习 python 人工智能
1.深度学习概述1.1定义与发展历程深度学习是机器学习的一个分支，它基于人工神经网络的学习算法，特别是那些具有多层（深层）结构的网络。深度学习模型能够自动从原始数据中提取复杂的特征，而不需要人为设计特征提取算法。定义：深度学习可以定义为使用深层神经网络进行学习的过程，这些网络由多个非线性的变换组成，能够学习数据的多层次表示。发展历程：深度学习的起源可以追溯到1943年WarrenSturgisMc
什么是MOE架构？哪些大模型使用了MOE？明哲AI AIGC 架构人工智能大模型 MOE
在人工智能快速发展的今天，大语言模型（LLM）的规模越来越大，参数量动辄上千亿甚至万亿。然而，更大的模型往往意味着更高的计算成本和更多的资源消耗。混合专家模型（MixtureofExperts，简称MoE）作为一种创新的架构设计，为解决这一难题提供了一个优雅的解决方案。什么是混合专家模型？想象一下，如果把一个大语言模型比作一所综合性大学，传统的模型就像是让所有教授（参数）都参与每一次教学活动。而M
2025最新版Java面试八股文大全 m0_74823452 java 面试开发语言
一、Java并发面试题1、ThreadLocal1.1谈谈你对ThreadLocal的理解？ThreadLocal的作用主要是做数据隔离，填充的数据只属于当前线程，变量的数据对别的线程而言是相对隔离的。它不是针对程序的全局变量，只是针对当前线程的全局变量。1.2ThreadLocal底层实现原理？Threadlocal内部有一个非常关键的内部类ThreadlocalMap，里面定义了一个由key-
代码随想录算法训练营Day38||完全背包问题、leetcode 518. 零钱兑换 II 、 377. 组合总和 Ⅳ 、70. 爬楼梯（进阶） jiegongzhu3z 算法 leetcode 职场和发展
一、完全背包问题相较于01背包，完全背包的显著特征是每个物品可以用无数次，遍历顺序也不需要为了保证每个物品只去一次而倒序遍历。#include#includeusingnamespacestd;intmain(){intN,V;cin>>N>>V;vectorweight(N+1,0);vectorvalue(N+1,0);for(inti=0;i>weight[i]>>value[i];}vec
探索高效图像识别：基于OpenCV的形状匹配利器崔庭盼Melvina
探索高效图像识别：基于OpenCV的形状匹配利器【下载地址】形状匹配find_scaled_shape_model资源文件本资源文件提供了使用OpenCV实现Halcon中算子`find_scaled_shape_model`的功能。该功能主要用于在图像中查找与模板形状相似的目标，并支持缩放变换。具体实现细节和使用方法可以参考相关博客文章项目地址:https://gitcode.com/open-
愿景：做机器视觉行业的颠覆者 gaoenyang760525 人工智能
一个愿景，两场战斗，专注制胜。一个愿景：做机器视觉行业的颠覆者。我给自己创业，立一个大的愿景：做机器视觉行业的颠覆者。两场战斗：无监督-大模型上半场，无监督。2025-2030，共五年。用无监督算法，颠覆现有缺陷检测方法，争取在2-3个场景落地。在以下几个场景中，选择最容易的场景落地，做细分场景的标准检测设备：1、视觉筛选机2、PCB相关3、半导体、芯片4、纺织服装5、包装印刷（激光打标、喷码、瓶
LeetCode：406. 根据身高重建队列（Java 贪心） Cosmoshhhyyy LeetCode leetcode 算法职场和发展
目录406.根据身高重建队列题目描述：实现代码与解析：贪心原理思路：406.根据身高重建队列题目描述：假设有打乱顺序的一群人站成一个队列，数组people表示队列中一些人的属性（不一定按顺序）。每个people[i]=[hi,ki]表示第i个人的身高为hi，前面正好有ki个身高大于或等于hi的人。请你重新构造并返回输入数组people所表示的队列。返回的队列应该格式化为数组queue，其中queu
蓝桥备赛指南（5）神里流~霜灭蓝桥备赛 c++数据结构贪心算法动态规划排序算法
queue队列queue是一种先进先出的数据结构。它提供了一组函数来操作和访问元素，但它的功能相对较简单，queue函数的内部实现了底层容器来存储元素，并且只能通过特定的函数来访问和操作元素。queue函数的常用函数1.push()函数：在队尾插入元素；2.pop()函数：弹出队首元素；3.front()函数：返回队首元素；4.back()函数：返回队尾元素；5.empty()函数：检查队列是否为
第三篇：模型压缩与量化技术——DeepSeek如何在边缘侧突破“小而强”的算力困局 python算法(魔法师版) 数据挖掘机器学习人工智能深度学习神经网络生成对抗网络边缘计算
——从算法到芯片的全栈式优化实践随着AI应用向移动终端与物联网设备渗透，模型轻量化成为行业核心挑战。DeepSeek通过自研的“算法-编译-硬件”协同优化体系，在保持模型性能的前提下，实现参数量与能耗的指数级压缩。本文从技术原理、工程实现到落地应用，完整解析其全链路压缩技术体系。第一章算法层创新：结构化压缩与动态稀疏化1.1非均匀结构化剪枝技术DeepSeek提出**“敏感度感知通道剪枝”（SAC
（每日一题）连续⼦数组最⼤和———＜动态规划-线性dp＞课堂随笔每日一题动态规划算法考研每日一题
1.题⽬链接：DP6连续⼦数组最⼤和2.题⽬描述：3.解法：算法思路：简单线性dp。i.状态表⽰：dp[i]表⽰：以i位置为结尾的所有⼦数组中，最⼤和是多少。ii.状态转移⽅程：dp[i]=max(dp[i-1]+arr[i],arr[i])C++算法代码：#include#includeusingnamespacestd;intmain(){//初始化intn;cin>>n;vectortemp
智能汽车嵌入式软件开发基础篇-嵌入式C语言基础2 每日超级储能汽车 c语言开发语言
1、引入函数的原因编程中常遇到完成某个功能的程序段出现多次；大家均要用到的功能。为了减少不必要的重复编程使程序质量提高。在计算机高级语言中，引入函数（或子程序、过程）2、函数的分类C程序是由一个主函数和其它若干函数构成，每个函数实现一定的功能，其中主函数main()是必需的，其它函数被主函数调用或者其它函数之间相互调用。C语言的函数可以分为三类：主函数main()、库函数（如printf()、sc
某验第四代滑块逆向快速破解码王吴彦祖 JS逆向实战 js逆向 node.js 加密
本期地址如下，使用base64解码获得网址aHR0cHM6Ly9ndDQuZ2VldGVzdC5jb20v前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站破解某验，某盾已经是司空见惯的事情了，网上也有很多资料查阅，但是大多数都是繁琐、冗长，本文以最直接快速理解的方法讲解，稍微认真一点看完文章，你至少能在半个小时内完成破解本文大致步骤如下：找到加密位置
2D游戏中的枪口火焰效果实现 t0_54coder 编程问题解决手册游戏 java 服务器个人开发
在2D游戏开发中，创建一个逼真的枪口火焰效果是提升游戏体验的关键部分之一。今天，我们将探讨如何使用Godot引擎来实现一个自然流畅的枪口火焰动画效果。问题描述当玩家按住鼠标左键射击时，枪口火焰的动画会播放。然而，一旦玩家松开鼠标按钮，动画会在播放过程中突然停止，导致视觉效果不连续，显得非常生硬。原始代码分析以下是原始的Godot脚本代码：extendsStaticBody2D@onreadyvar
告警架构高可用怎么做？企鹅侠客面试云原生架构监控告警 prometheus
在Prometheus和Thanos环境中，为了实现告警架构的高可用性，需要在多个层面进行设计和配置。以下是实现告警高可用性的几个关键步骤：1.Prometheus实例的高可用多Prometheus实例：部署多个Prometheus实例来监控相同的服务和指标。这些实例可以彼此独立运行，保证即使其中一个实例发生故障，其他实例仍然可以继续收集数据和评估告警规则。Prometheus数据同步：使用Tha
Go语言接口（面向对象） yuzhang_zy go go
在Go语言中，接口是一种抽象的类型，定义了一个对象的行为规范，是对行为的概括与抽象，只定义规范但是不实现，由实现接口的对象去定义具体的行为规范，Go语言的接口是一组方法的集合；Go语言接口类似于其他语言，相当于提供了一个规范，当我们看到一个接口的时候我们只知道它大概是用来干什么的但是不知道具体实现；Go语言不像其他语言一样有"类"这个概念，但是可以通过结构体与接口配合使用可以实现复杂的数据类型（虽
Python 如何安装 distutils模块？？ bug菌¹ 全栈Bug调优(实战版)#CSDN问答解惑(全栈版)python 数据库开发语言
本文收录于《全栈Bug调优(实战版)》专栏，主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！问题描述电脑安装了Python3.12，但是里面没有distutils模块，如何安装该模块解决方案如下是上述问题的解决方案，仅供参考：在Python3.12中，dis
linux进程调度HMP,HMP调度器和EAS调度器熙公主的爪牙 linux进程调度HMP
HMP调度器为了降低功耗，ARM开发了大小核架构处理器。Linux内核中的负载均衡算法基于SMP模型，并未考虑big.LITTLE模型，因此Linaro开发了一个HMP调度器用于支持这种架构，它也被用于Android5.x和Android6.x中，但这种调度器并没有被合入内核的基线中。该调度器的进程调度算法基本上和CFS一样，主要区别在于调度域和负载均衡的处理上。HMP调度域的实现比自带的CFS调
计算机视觉领域的轻量化模型——GhostNet 模型 DuHz 边缘计算轻量化模型计算机视觉人工智能算法深度学习神经网络边缘计算网络
GhostNet模型详解GhostNet是一个高效的轻量化卷积神经网络模型，专为资源受限的设备（如移动设备和嵌入式系统）设计。它的核心创新是Ghost模块，该模块通过生成更多的特征图来减少计算资源消耗。GhostNet适用于实时计算任务，如图像分类和物体检测，同时在保持较高准确率的基础上，优化了计算效率。目录GhostNet背景Ghost模块概述GhostNet网络架构Ghost模块的数学原理Gh
Tomcat：应用加载原理分析 IT巅峰技术 Tomcat 基础知识中间件 tomcat 服务器 java 架构师分布式
前情回顾上一篇文章主要了解了一下Tomcat启动入口，以及初步的分析了Tomcat的启动流程，下面我们将会解密Tomcat应用部署的实际流程。一、直观对比虽然前面已经说了那么多关于Tomcat的东西，但是我相信绝大部分同学应该都没有专门的去研究过Tomcat的内部实现。我们接触最多的应该还是上传一个war包丢在webapps目录下，然后重启一下Tomcat服务器(甚至不重启)。下面我们以图形的形式
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不