bryant_meng

【YOLOv5】

学习摘抄来自

Yolov5技术总结
YOLOv5-Lite 详解教程 | 嚼碎所有原理、训练自己数据集、TensorRT部署落地应有尽有
YOLOV5代码解析(更新中) —— https://github.com/Laughing-q/yolov5_annotations
yolov5特征图可视化

文章目录

1 Backbone
2 Neck
3 Detection (YOLO) layer
4 输出
5 损失函数
6 优化策略
7 数据增强：
8 后处理
9 特征图可视化
10 Yolov5-1.0、2.0、3.0

1 Backbone

1）Focus
减少计算量加快速度

yolov5中的Focus模块的理解

class Focus(nn.Module):
    # Focus wh information into c-space
    def __init__(self, c1, c2, k=1, s=1, p=None, g=1, act=True):  # ch_in, ch_out, kernel, stride, padding, groups
        super(Focus, self).__init__()
        self.conv = Conv(c1 * 4, c2, k, s, p, g, act)      # 这里输入通道变成了4倍

    def forward(self, x):  # x(b,c,w,h) -> y(b,4c,w/2,h/2)
        return self.conv(torch.cat([x[..., ::2, ::2], x[..., 1::2, ::2], x[..., ::2, 1::2], x[..., 1::2, 1::2]], 1))

用 Focus 的原因

yolov5中的Focus模块的理解

2）SPP
分别采用 5/9/13 的最大池化，再进行 concat 融合，提高感受野；

3）BottleNeckCSP
Cross Stage Partial Networks，减少计算量，提高卷积神经网络学习能力；

4）C3
C3 Leyer 是 YOLOv5 作者提出的 CSPBottleneck 改进版本，它更简单、更快、更轻，在近乎相似的损耗上能取得更好的结果。但 C3 Layer 采用多路分离卷积，测试证明，频繁使用 C3 Layer 以及通道数较高的 C3 Layer，占用较多的缓存空间，减低运行速度。

为什么通道数越高的 C3 Layer 会对 cpu 不太友好?，主要还是因为 Shufflenetv2 的 G1 准则，通道数越高，hidden channels 与 c1、c2 的阶跃差距更大，来个不是很恰当的比喻，想象下跳一个台阶和十个台阶，虽然跳十个台阶可以一次到达，但是你需要助跑，调整，蓄力才能跳上，可能花费的时间更久

5）ShuffleNetV2

是 YOLOv5 Lite 中的主要结构

stride = 2

stride = 1

Channel Split 的好处

整个特征图分为 2 个组了，但是这样的分组又不像分组卷积一样，增加了卷积时的组数，符合准则 2；这样分开之后，将 A 组认为是通过 short-cut 通道的，而 B 组经过的 bottleneck 层的输入输出的通道数就可以保持一致，符合准则1；

同时由于最后使用的 concat 操作，没有用 TensorAdd 操作，符合准则4；

可以看到，这样一个简单的通道分离的操作带来了诸多好处；但是从理论上来说，这样的结构是否还符合 short-cut 的初衷（即bottleneck 学到的是残差 Residual 部分）？这里笔者也不好妄加揣测，但是可以想到的是经过后面的 Channel Shuffle 的乱序之后，每个通道应该都会经过一次 bottleneck 结构。

上述的结构是不改变输入输出通道数和特征图大小的情况，而池化操作使用图（d）代替了，跟 ShuffleNetV1 类似，经过这样的结构之后，图像通道数扩张为原先的 2 倍。

2 Neck

在 Backbone 和输出层，会插入一些层，这个部分称为 Neck

3 Detection (YOLO) layer

1）Anchor

根据超参数中的 hyp[‘anchor_t’] 来检查默认 anchor 与数据集标签的契合度，如果＜0.98，则根据数据集标签进行聚类重新获得anchor；

默认anchor如下：

- [10,13, 16,30, 33,23] # P3/8
- [30,61, 62,45, 59,119] # P4/16
- [116,90, 156,198, 373,326] # P5/3

自适应计算 Anchor，流程如下

1）载入数据集，得到数据集中所有数据的wh;
2）将每张图片中wh的最大值等比例缩放到指定大小img_size，较小边也相应缩放;
3）将bboxes从相对坐标改成绝对坐标（乘以缩放后的wh）;
4）筛选bboxes，保留wh都大于等于两个像素的bboxes;
5）使用k-means聚类得到n个anchors（掉k-means包涉及一个白化操作）;
6）使用遗传算法随机对anchors的wh进行变异，如果变异后效果变得更好（使用anchor_fitness方法计算得到的fitness（适应度）进行评估）就将变异后的结果赋值给anchors，如果变异后效果变差就跳过，默认变异1000次;

2）anchor 匹配机制

这里先说一下 YOLOv3 的匹配策略：

假设一个图中有一个目标，这个被分割成三种格子的形式，分割成13×13 、26 × 26、52 × 52 。

这个目标中心坐标下采样8倍，（416/8=52），会落在 52 × 52 这个分支的所有格子中的某一个格子，落在的格子会产生3个anchor，3个anchor和目标（已经下采样8倍的目标框）分别计算iou，得到3个iou，凡是iou大于阈值0.3的，就记为正样本，就会将label[0]中这个iou大于0.3的anchor的相应位置赋上真实框的值。
这个目标中心坐标下采样16倍，（416/16=26），会落在 26 × 26 这个分支的所有格子中的某一个格子，落在的格子会产生3个anchor，3个anchor和目标（已经下采样16倍的目标框）分别计算iou，得到三个iou，凡是iou大于阈值0.3的，就记为正样本，就会将label[1]中这个iou大于0.3的anchor的相应位置赋上真实框的值。
这个目标中心坐标下采样32倍，（416/32=13），会落在 13 × 13 这个分支的所有格子中的某一个格子，落在的格子会产生3个anchor，3个anchor和目标（已经下采样32倍的目标框）分别计算iou，得到三个iou，凡是iou大于阈值0.3的，就记为正样本，就会将label[2]中这个iou大于0.3的anchor的相应位置赋上真实框的值。
如果目标所有的anchor，9个anchor，iou全部小于阈值0.3，那么选择9个anchor中和下采样后的目标框iou最大的，作为正样本，将目标真实值赋值给相应的anchor的位置。

总的来说，就是将目标先进行 3 种下采样，分别和目标落在的网格产生的 9 个 anchor 分别计算 iou，大于阈值 0.3 的记为正样本。如果 9 个 iou 全部小于 0.3，那么和目标 iou 最大的记为正样本。对于正样本，我们在label上相对应的anchor位置上，赋上真实目标的值。

下面再看看 yolov5 的匹配机制

采用了跨网格匹配规则，增加正样本 Anchor 数目的做法

对于任何一个输出层，yolov5 抛弃了 Max-IOU 匹配规则而采用 shape 匹配规则，计算标签 box 和当前层的 anchors 的宽高比，即:wb/wa,hb/ha。如果宽高比大于设定的阈值说明该 box 没有合适的 anchor，在该预测层之间将这些box 当背景过滤掉。

# r为目标wh和锚框wh的比值，比值在0.25到4之间的则采用该种锚框预测目标
r = t[:, :, 4:6] / anchors[:, None]  # wh ratio：计算标签box和当前层的anchors的宽高比，即:wb/wa,hb/ha
# 将比值和预先设置的比例anchor_t对比，符合条件为True，反之False
j = torch.max(r, 1 / r).max(2)[0] < self.hyp['anchor_t']  # compare

eg：hyp['anchor_t'] 设置为 4，则 0.25~4 之间的 shape 符合

对于剩下的 GT bbox，计算其落在哪个网格内，同时利用四舍五入规则，找出最近的2个网格，将这3个网格都认为是负责预测该bbox 的，可以发现粗略估计正样本数相比前 yolo 系列，增加了3倍。code 如下

在 general.py 的 build_targets 中可以找到

g = 0.5
# Offsets
# 得到相对于以左上角为坐标原点的坐标
gxy = t[:, 2:4]  # grid xy
# 得到相对于右下角为坐标原点的坐标
gxi = gain[[2, 3]] - gxy  # inverse
# 这两个条件可以用来选择靠近的两个邻居网格
# jk和lm是判断gxy的中心点更偏向哪里
j, k = ((gxy % 1 < g) & (gxy > 1)).T
l, m = ((gxi % 1 < g) & (gxi > 1)).T
j = torch.stack((torch.ones_like(j), j, k, l, m))
# yolov5不仅用目标中心点所在的网格预测该目标，还采用了距目标中心点的最近两个网格
# 所以有五种情况，网格本身，上下左右，这就是repeat函数第一个参数为5的原因
t = t.repeat((5, 1, 1))[j]
# 这里将t复制5个，然后使用j来过滤
# 第一个t是保留所有的gtbox，因为上一步里面增加了一个全为true的维度，
# 第二个t保留了靠近方格左边的gtbox，
# 第三个t保留了靠近方格上方的gtbox，
# 第四个t保留了靠近方格右边的gtbox，
# 第五个t保留了靠近方格下边的gtbox，
offsets = (torch.zeros_like(gxy)[None] + off[:, None])[j]

对于 YOLOv5，不同于 yolov3, yolov4 的是：其 gt box 可以跨层预测，即有些 gt box 在多个预测层都算正样本；同时其 gt box 可匹配的 anchor 数可为 3~9个，显著增加了正样本的数量。不再是 gt box 落在那个网格就只由该网格内的 anchor 来预测，而是根据中心点的位置增加 2 个邻近的网格的 anchor 来共同预测。

如下图所示，绿点表示该 gt bbox 中心，现在需要额外考虑其2个最近的邻域网格的 anchor 也作为该 gt bbox 的正样本，明显增加了正样本的数量。

目标检测重中之重可以理解为 Anchor 的匹配策略

补充（标签分配）：

每个网格除了回归中心点在该网格的目标，还会回归中心点在该网格附近周围网格的目标，
grid(i, j)也会回归grid(i, j+1)，grid(i, j-1)，grid(i+1, j)，grid(i-1, j)中的部分框，如下图中红色部分，
这也契合了上面的边框回归中心点的范围为-0.5~1.5；

总结；

跨预测分支预测（多个 feature map）：假设一个ground truth框可以和2个甚至3个预测分支上的anchor匹配，则这2个或3个预测分支都可以预测该ground truth框，即一个ground truth框可以由多个预测分支来预测。
跨网格预测（多个 cell）：假设一个ground truth框落在了某个预测分支的某个网格内，则该网格有左、上、右、下4个邻域网格，根据ground truth框的中心位置，将最近的2个邻域网格也作为预测网格，也即一个ground truth框可以由3个网格来预测；
跨 anchor 预测（多个 anchor）：假设一个ground truth框落在了某个预测分支的某个网格内，该网格具有3种不同大小anchor，若ground truth可以和这3种anchor中的多种anchor匹配，则这些匹配的anchor都可以来预测该ground truth框，即一个ground truth框可以使用多种anchor来预测。

3）边框回归
先回顾下 v3 和 v4 的

下面看看 v5 的

在进行边框回归筛选样本对应 anchor 的时候，就是通过 hyp[‘anchor_t’] 来筛选，而不是 iou；
新的边框回归方式：

$(2 * y [..., 0 : 2] - 0.5 + g r i d [0]) * s t r i d e [0]$

以 640x640 输入为例

$g r i d [0]$ 的维度为 [1，1，80，80，2]，两个 80 表示 1/8 特征图的每个空间位置，2 表示 anchor 的横纵坐标
$s t r i d e [0]$ 的维度为 [8, 8]

$y [..., 0 : 2]$ 是经过 sigmoid 的输出，可以看出，偏移的范围为 $\sim 1）-0.5 = -0.5\sim 1.5$

$2*y[..., 2:4])^2*achor\_grid[0]$

$achor\_grid[0]$ 维度为 [1，3，1，1，2]，3 表示 3 种 anchor

中心偏移的范围是 [-0.5,1.5]，hw偏移的范围是 (0, 4)，范围是 0~4 的 anchor ，这是因为采用了跨网格匹配规则，要跨网格预测了。

为啥这么改造

可以看出，对于不同的 $tw$ 和 $t h$ ，当他们大于零比较多时，YOLOv5 的反馈更加平滑，相对于v 3、v4也就更容易收敛

4 输出

图中向量包含 4 个坐标信息，一个包含目标概率和 80 个类别得分，换句话解释就是“这个图像中是否有目标（物体出现的概率）？有的话是什么（80 类的类别得分）？然后就是这个目标物体在哪里（box 坐标位置）？

5 损失函数

边框回归：CIOU loss（GIoU）
Objectness：BCEWithLogits Loss
分类：BCE

损失平衡：ciou = 0.05，objectness = 1， cls = 0.5;

三个输出层损失平衡：4.0, 1.0, 0.4 分别对应下采样 8,16,32 的输出层

6 优化策略

Warmup热身训练；
Cosine余弦退火；
梯度累积；
EMA；

7 数据增强：

Mosaic；
仿射变换，随机的旋转，平移，缩放，裁剪，上下左右翻转；
随机hsv；

进行数据增强操作还有一个 bbox 筛选的过程：
去除被裁剪过小的框（面积小于裁剪前的20%），并且还有长和宽必须大于 2 个像素，且长宽比范围在 (1/20, 20) 之间的限制；

def box_candidates(xxx):
	xxx

8 后处理

DIoU NMS

因为前面讲到的 CIOU loss，是在 DIOU loss 的基础上，添加的影响因子，包含 ground truth 标注框的信息，在训练时用于回归。但在测试过程中，并没有 ground truth的信息，不用考虑影响因子，因此直接用DIOU NMS即可。

补充材料

YOLO系列算法在构建回归目标时一个主要的区别就是如果将图像划分成 SxS 的格子，每个格子只负责目标中心点落入该格子的物体的检测，如果没有任何目标的中心点落入该格子，则为负样本

Selective Search，主要思路是通过图像中的纹理、边缘、颜色等信息对图像进行自底向上的分割，然后对分割区域进行不同尺度的合并，每个生成的区域即一个候选Proposal，如下图所示。这种方法基于传统特征，速度较慢

Soft NMS相对于NMS的改进即每次并不是直接排除掉和已选框重叠大于一定阈值的框，而是以一定的策略降低对应框的得分，直到低于某个阈值，从而不至于过多删除拥挤情况下定位正确的框。

Softer NMS相对于NMS的改进即每次并不是直接以得分最大的框的坐标作为当前选择框的坐标，而是和得分最大的框重叠大于一定阈值的所有框的坐标进行一定策略的加权平均，所得的新的框作为当前选择的得分最大的框的坐标，从而尽可能准确地定位物体。

IOU-Guided NMS：即以IOU（交并比）得分作为NMS的排序依据，因为IOU得分直接反应了对应框的定位精确程度，优先考虑定位精度较高的框，防止定位精度较低但是其他得分较高的框被误排序到前面。

9 特征图可视化

来自 yolov5特征图可视化

在 utils 中的 general.py 或者 plots.py 添加如下函数

import matplotlib.pyplot as plt
from torchvision import transforms

def feature_visualization(features, model_type, model_id, feature_num=64):
    """
    features: The feature map which you need to visualization
    model_type: The type of feature map
    model_id: The id of feature map
    feature_num: The amount of visualization you need
    """
    save_dir = "features/"
    if not os.path.exists(save_dir):
        os.makedirs(save_dir)
 
    # print(features.shape)
    # block by channel dimension
    blocks = torch.chunk(features, features.shape[1], dim=1)
 
    # # size of feature
    # size = features.shape[2], features.shape[3]
 
    plt.figure()
    for i in range(feature_num):
        torch.squeeze(blocks[i])
        feature = transforms.ToPILImage()(blocks[i].squeeze())
        # print(feature)
        ax = plt.subplot(int(math.sqrt(feature_num)), int(math.sqrt(feature_num)), i+1)
        ax.set_xticks([])
        ax.set_yticks([])
 
        plt.imshow(feature)
        # gray feature
        # plt.imshow(feature, cmap='gray')
 
    # plt.show()
    plt.savefig(save_dir + '{}_{}_feature_map_{}.png'
                .format(model_type.split('.')[2], model_id, feature_num), dpi=300)

接着在 models 中的 yolo.py 中的这个地方：

def forward_once(self, x, profile=False):
        y, dt = [], []  # outputs
        for m in self.model:
            if m.f != -1:  # if not from previous layer
                x = y[m.f] if isinstance(m.f, int) else [x if j == -1 else y[j] for j in m.f]  # from earlier layers
 
            if profile:
                o = thop.profile(m, inputs=(x,), verbose=False)[0] / 1E9 * 2 if thop else 0  # FLOPS
                t = time_synchronized()
                for _ in range(10):
                    _ = m(x)
                dt.append((time_synchronized() - t) * 100)
                print('%10.1f%10.0f%10.1fms %-40s' % (o, m.np, dt[-1], m.type))
 
            x = m(x)  # run
            y.append(x if m.i in self.save else None)  # save output
 
            # add in here
 
        if profile:
            print('%.1fms total' % sum(dt))
        return x

添加

            feature_vis = True
            if m.type == 'models.common.C3' and feature_vis:
                print(m.type, m.i)
                feature_visualization(x, m.type, m.i)

yolo.py 的开头添加 from utils.general import feature_visualization

添加在 yolo.py后，无论是在 detect.py还是在 train.py 中都会进行可视化特征图。

10 Yolov5-1.0、2.0、3.0

1）1.0->2.0:
yolov5x mAP有提升，但yolov5s mAP却下降了,
训练策略的改变，包括余弦退火的公式更新了，以及类别损失 cls_loss 的系数 gain，对数据进行仿射变换 (dataset.py数据增强部分) 的超参数进行调整，三个output的损失比重balance的调整。

2）2.0->3.0:
V3.0据作者所说，大约10％的推理速度为代价提高了所有模型的mAP。尽管CUDA内存需求增加了约10％，但训练速度并未受到明显影响，具体未测试；
最小的模型从Hardswish（）**中受益最大，YOLOv5s / m / l / x的增加幅度为+0.9/+0.8/+0.7/[email protected]：0.95。

主要做出的变化是，采用了hardswish**函数替换CONV(下图右下角模块)模块的LeakyReLu，但是注意：BottleneckCSP模块中的LeakyReLu未被替换，采用了CIOU作为损失函数(但这个更新好像是还在v2.0版本过度的时候已经更新)，还更改了一个默认超参数:translate=0.5 → 0.1(数据增强的仿射系数)。

运用python制作一个完整的股票分析系统大懒猫软件 python 开发语言 django beautifulsoup
使用python制作一个股票分析系统，可以通过股票价格走势动态界面，实时动态监测不同类型股票的变化情况。以下是一个完整的股票分析系统开发指南，包括股票价格走势动态界面和实时监测功能。这个系统将结合网络爬虫、数据分析、机器学习和可视化技术，帮助你实时监测不同类型股票的变化情况。1.系统功能概述数据采集：使用网络爬虫技术从财经网站采集股票数据。数据处理：计算技术指标（如KDJ、BOLL）并进行数据预处
《探秘AI绿色计算：降低人工智能硬件能耗的热点技术》程序猿阿伟人工智能
在人工智能飞速发展的当下，其硬件能耗问题愈发凸显。据国际能源署预测，人工智能的能源消耗可能大幅增长。因此，降低人工智能硬件能耗，实现绿色计算，已成为行业关键课题。以下是一些正在崭露头角的热点技术。新型硬件架构与材料计算随机存取内存（CRAM）：明尼苏达大学的研究团队开发的CRAM，能让数据完全在内存阵列内处理，无需离开计算机存储信息的网格，打破了传统冯·诺依曼体系结构中计算与内存之间的壁垒，可将人
Google Cloud技术学习总结谭俊杰Jerry 人工智能
GoogleCloudPlatform（GCP）是由Google提供的一套云计算服务，帮助企业和开发者利用Google的基础设施来构建、部署和扩展应用程序。GCP提供了广泛的服务，涵盖计算、存储、数据分析、机器学习和网络等领域。以下是GoogleCloud的技术总结：核心服务计算服务GoogleComputeEngine：提供虚拟机（VM）实例，支持自定义配置，适合各种工作负载。GoogleKub
本地部署DeepSeek模型技术指南 Evaporator Core apache Doris 人工智能 deepseek
DeepSeek模型是一种先进的深度学习模型，广泛应用于自然语言处理、计算机视觉等领域。为了充分利用DeepSeek模型的强大功能，许多开发者和研究人员选择在本地环境中部署该模型。本文将详细介绍如何在本地环境中部署DeepSeek模型，包括环境准备、模型下载、配置、优化以及代码实现等内容。通过本文的指导，您将能够在本地成功部署并运行DeepSeek模型。1.环境准备在部署DeepSeek模型之前，
使用Python中的LangChain库优化消息长度：从聊天历史到模型性能的全面指南 m0_57781768 python langchain easyui
使用Python中的LangChain库优化消息长度：从聊天历史到模型性能的全面指南在现代人工智能应用中，大语言模型（LLM）扮演着越来越重要的角色，尤其是在对话系统、智能助理和其他自然语言处理任务中。然而，所有的模型都有一个有限的上下文窗口，意味着它们可以处理的输入令牌（tokens）数量是有限的。当我们需要处理较长的对话历史或复杂的任务链时，如何管理传递给模型的消息长度变得至关重要。在这篇文章
DeepSeek R1蒸馏版模型部署的实战教程 herosunly DeepSeek从入门到精通 deepseek 大模型人工智能实战教程
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
DeepSeek R1 vs ChatGPT o1 实测 7 大场景终极对决网络安全我来了人工智能 AI chatgpt
R1vso1：7大场景终极对决引言你需要的不是「最好」，而是「最合适」想象一下，你面前有两把瑞士军刀：一把刀锋锐利但功能单一，另一把功能繁多但需要时间磨合。你会怎么选？人工智能模型的选择也是如此。DeepSeekR1和ChatGPTo1就像这两把军刀，它们的胜负不在绝对强弱，而在场景适配。根据实测数据，我们将通过编程、教育、创意等7个战场，解剖这两大AI巨头的真实战斗力。一、语言战场当AI成为「读
强化学习在连续动作空间的应用：DDPG与TD3 AI天才研究院计算 AI大模型应用入门实战与进阶大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA 计算 AI大模型应用
1.背景介绍1.1强化学习简介强化学习（ReinforcementLearning，简称RL）是一种机器学习方法，它通过让智能体（Agent）在环境（Environment）中与环境进行交互，学习如何根据观察到的状态（State）选择动作（Action），以最大化某种长期累积奖励（Reward）的方法。强化学习的核心问题是学习一个策略（Policy），即在给定状态下选择动作的映射关系。1.2连续动
书籍-《机器学习的秘密：它是如何工作的以及它对你的意义》机器学习深度学习人工智能
书籍：SecretsOfMachineLearning:HowItWorksAndWhatItMeansForYou作者：TomKohn出版：WorldScientificPublishingCoPteLtd编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《机器学习的秘密：它是如何工作的以及它对你的意义》01书籍介绍在众多关于机器学习和人工智能的技术文献及充满恐慌的书籍中，《机器学习的秘密》犹
从取代到增强：AI如何与人类协作，共同创造未来海棠AI实验室人工智能理论与学术深度学习人工智能
人工智能（AI）的飞速发展正在改变全球各行各业。它不仅承诺提高效率、加速创新，还带来了前所未有的可能性。然而，随着这一技术的崛起，许多人开始担心：AI是否会取代人类？这个疑问在很多传统上被认为是“人类专属”的领域中尤为突出，尤其是在创意、决策和情感交流等方面。但如果我们将AI的发展方向从“取代”转向“增强”呢？如果我们将AI视为人类的强大协作伙伴，而不是冷冰冰的竞争对手，会有什么样的未来？这是我们
用AI提升电商平台的客户体验：从个性化推荐到智能客服 Echo_Wish 人工智能前沿技术人工智能
用AI提升电商平台的客户体验：从个性化推荐到智能客服随着电商行业的竞争日益激烈，如何在海量商品中脱颖而出，吸引和保持客户的关注，成为平台生存和发展的关键。而在这场竞争中，人工智能（AI）正在发挥着越来越重要的作用。AI不仅可以优化电商平台的后台操作，还能在前端提供更为个性化、智能化的客户体验，让消费者感受到前所未有的便捷与高效。本文将从个性化推荐、智能客服、智能搜索等方面，详细探讨如何通过AI技术
python 学习曲线函数_如何使用学习曲线来诊断你的LSTM模型的行为？（附代码）... weixin_39576066 python 学习曲线函数
LSTM是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。在自然语言处理、语言识别等一系列的应用上都取得了很好的效果。《LongShortTermMemoryNetworkswithPython》是澳大利亚机器学习专家JasonBrownlee的著作，里面详细介绍了LSTM模型的原理和使用。该书总共分为十四个章节，具体如下：第一章：什么是LSTMs？第二章：怎么样训练
transformer概述沉墨的夜 transformer 深度学习人工智能
Transformer架构的提出，不仅在自然语言处理（NLP）领域掀起了革命，也在多个深度学习任务中获得了广泛应用。自2017年由Vaswani等人提出以来，Transformer经历了多次优化和扩展，成为深度学习领域的基石。以下是Transformer架构的演进历程、作用和意义、架构详情以及未来发展趋势的详细阐述。Transformer架构的演进历程(1)Transformer的起源（2017年
【漫话机器学习系列】041.信息丢失（dropout） IT古董漫话机器学习系列专辑机器学习人工智能深度学习
信息丢失（Dropout）Dropout是一种广泛应用于神经网络训练中的正则化技术，旨在减少过拟合（overfitting），提高模型的泛化能力。虽然"信息丢失"（dropout）这个术语在某些情况下可能引起误解，指的并非是数据的丢失，而是训练过程中故意“丢弃”神经网络中的部分神经元。这种做法可以避免模型过于依赖于某些特定的神经元，从而提高模型在新数据上的表现。Dropout的工作原理在神经网络的
第二章：12.3 建立表现基准望云山190 基准性能水平人工智能机器学习
背景介绍语音识别是一种常见的机器学习应用，用户通过语音输入代替键盘输入，系统需要将语音转换为文本。在这个过程中，算法的性能可以通过训练误差和交叉验证误差来评估。误差定义训练误差（Jtrain）：指算法在训练数据集上无法正确转录的音频片段的百分比。在这个例子中，训练误差是10.8%，意味着算法在训练数据上犯了10.8%的错误。交叉验证误差（Jcv）：指算法在未见过的数据（交叉验证集）上无法正确转录的
Ai时代，搞钱的6种方法大耳朵爱学习人工智能 AI大模型大模型产品经理自然语言处理深度学习语言模型
随着人工智能（Ai）技术的迅速发展，越来越多的人意识到它不仅是一种前沿科技，更是一种变革性力量，为我们打开了赚钱的新大门。无论你是创业者、自由职业者，还是打算给自己的业务注入新活力，利用Ai赚钱都是一种值得尝试的选择。本文将结合当前最热门的Ai工具，为你提供6种高效、实用的搞钱思路。——1——内容创作：用Ai做你的创意助手1.1自媒体内容创作利用Ai模型，你可以轻松撰写公众号文章、知乎回答、短视频
第二章：12.4 学习曲线望云山190 深度学习机器学习人工智能
学习曲线的基本概念学习曲线是展示机器学习模型性能如何随着训练数据量增加而变化的图表。它们可以帮助我们理解模型在不同数据量下的表现，以及模型是否过拟合或欠拟合。二阶模型的学习曲线交叉验证错误（Jcv）：这条绿色曲线表示模型在未见过的数据上的表现。它反映了模型的泛化能力，即模型对新数据的预测能力。训练错误（Jtrain）：这条红色曲线表示模型在训练数据上的表现。它反映了模型对训练数据的拟合程度。学习曲
Pytorch官方文档英语翻译 yanzhiwen2 深度学习Pyrotch pytorch 机器学习 python 人工智能深度学习
深度学习Pytorch-Pytorch官方文档英语翻译1.a-e1.1span跨度1.2blended混合的1.3criterion标准1.4deprecated弃用的1.5clamp钳制1.6arbitraryshapes任意形状1.7explodinggradients梯度爆炸1.8converge收敛1.9approximate近似1.10arg参数1.11argument参数1.12con
微信DeepSeek王炸组合金枝玉叶9 程序员知识储备1 程序员知识储备2 vue.js
1.背景信息微信：腾讯旗下的超级社交应用，涵盖通讯、支付、小程序生态等，月活用户超10亿。DeepSeek：专注AGI（通用人工智能）的中国公司，核心产品包括大模型（如DeepSeek-R1、DeepSeek-Chat）、多模态技术及行业解决方案。“王炸组合”：通常指强强联合的顶级合作，可能暗示技术互补或场景融合。2.可能的合作方向AI功能嵌入微信生态：DeepSeek的大模型能力（如对话、搜索、
机器学习相关基础星辰瑞云机器学习
1.预备知识人工智能:用人工的方法在机器(计算机)上实现的智能;或者说是人们使机器具有类似于人的智能。人工智能学科:人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。2.日常生活中的机器学习:①称为RGB(由红色，绿色，蓝色组成)，这种是欠拟合欠拟合和过拟合区别:•欠拟合（Underfitting）：模型在训练数据上表现不佳，无法很好地捕捉数据中的规律。通
《传统教培机构的痛点：数字化转型如何破局？》
数字化浪潮下的困境在当今时代，数字化浪潮正以前所未有的速度席卷全球，深刻地改变着人们的生活、工作和学习方式。这是一个数据爆炸的时代，数据成为了驱动社会发展的核心要素之一。据统计，全球每天产生的数据量高达数万亿字节，这些数据涵盖了人们生活的方方面面，从购物习惯到社交行为，从健康状况到学习偏好，都被数字化记录下来。[]()数字化时代的技术创新日新月异，人工智能、大数据、云计算、物联网等新兴技术不断涌现
AIMv2：多模态自回归预训练的视觉新突破人工智能
AIMv2：多模态自回归预训练的视觉新突破阅读时长：19分钟发布时间：2025-02-17近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】导言视觉模型在人工智能领域的地位愈发重要，从图像识别、目标检测到多模态理解，其应用场景不断拓展。在大规模数据集上进行预训练，能助力模型学习丰富的视觉特
FastAPI：解锁高性能API开发的密钥，轻松构建现代Web服务醉心编码人工智能基础 fastapi 前端
FastAPI：解锁高性能API开发的密钥，轻松构建现代Web服务一、核心特点二、应用场景三、技术优势四、安装与基本用法五、社区与文档FastAPI是一个基于Python的现代、快速（高性能）的Web框架，专门用于构建APIs，特别是基于Python的RESTfulAPIs。它以其高性能、易用性和可扩展性而闻名，适合开发者、数据科学家和机器学习工程师等多种岗位使用。以下是对FastAPI的详细介绍
AIGC与AICG的区别解析倔强的小石头_ AIGC
目录一、AIGC（人工智能生成内容）（一）定义与内涵（二）核心技术与应用场景（三）优势与挑战二、AICG（计算机图形学中的人工智能）（一）定义与内涵（二）核心技术与应用场景（三）优势与挑战三、AIGC与AICG的区别（一）侧重点不同（二）应用领域不同（三）技术重点不同在当今快速发展的人工智能领域，新的概念和术语不断涌现。其中，AIGC和AICG这两个看似相近的术语引起了广泛的关注。尽管它们仅有字母
AI 发展的第一驱动力：人才引领变革倔强的小石头_ 热点时事人工智能
在科技蓬勃发展的当下，AI成为了时代的焦点，然而其发展并非一帆风顺，究竟什么才是推动AI持续前行的关键力量呢？目录AI发展现状剖析期望与现实的落差落地困境根源人才：AI发展的核心动力编辑技术突破的引领者行业融合的推动者人才驱动下的AI多元赋能创新应用场景加速产业升级培育AI人才的战略路径教育体系革新企业人才战略AI发展现状剖析期望与现实的落差近年来，全球科技大厂纷纷将目光聚焦于人工智能领域，对其寄
掌握AI Prompt的艺术：如何有效引导智能助手黑金IT langchain 人工智能 prompt langchain AI编程
开头叙述：在人工智能的世界里，Prompt（提示）是沟通人类意图与机器理解之间的桥梁。它不仅是一串简单的文字，而是一把钥匙，能够解锁AI模型的潜力，引导它们执行复杂的任务。本文将探讨Prompt的重要性，并展示如何通过精心设计的Prompt来提升AI助手的效率和准确性。无论是在聊天、会议总结还是日程管理中，正确的Prompt都能让AI助手成为你工作中的得力助手。让我们一起深入了解Prompt的力量
PyTorch实战深度学习——用CNN进行手写数字识别一位小说男主人工智能入门深度学习
用CNN进行手写数字识别---计算机专业研究生的代码第一课，相当于”HelloWorld“，不管以后选择什么研究方向，都值得一看,欢迎大家留言交流学习！下面手把手教大家一步一步实现该任务：1.环境准备首先呢，您需要确保安装了PyTorch库。如果还没有安装，可以使用以下命令进行安装，这里默认您已经有Anaconda并创建好虚拟环境啦，如果还没有安装，可以参考其他更完整的安装pytorch的教程：p
AIGC开启人工智能新时代靖节先生人工智能
AIGC：开启智能生成内容的全新时代在数字化技术飞速发展的当下，AIGC（ArtificialIntelligence-GeneratedContent）横空出世，宛如一颗璀璨的新星照亮了内容创作领域的天空。它正以不可阻挡之势重塑着我们的生活、工作与娱乐方式，成为众多行业创新发展的重要驱动力。一、AIGC的概念AIGC，即人工智能生成内容，是指利用人工智能技术自动生成各类内容的过程。它依托机器学习
推荐学习图像处理的入门书：《Python图像处理实战》天飓学习感悟学习图像处理 python
《Python图像处理实战》是一本全面介绍Python图像处理技术的实用指南，是由人民邮电出版社于2020年12月出版。这本书的作者桑迪潘·戴伊是一位兴趣广泛的数据科学家，主要研究机器学习、深度学习、图像处理和计算机视觉。在《Python图像处理实战》一书中，作者主要介绍了如何用Python图像处理库（如PIL、python-opencv、Scipy等），机器学习库（scikit-learn）和深
RK3588+昇腾AI｜40TOPS算力AI盒子设计方案 ARM+FPGA+AI工业主板定制专家 AI盒子瑞芯微人工智能
综合视频智能AI分析系统介绍以计算机视觉技术为基础，AI赋能千行百业，依托人工智能视觉分析技术以及强大的“端+边”算力支撑，实时分析烟火，入侵等事件，同时结合云上预警业务平台，实现事件发现、预警、处置全流程闭环。设计架构系统架构视频智能识别系统自下而上分为“感知层、网络层、支撑层、应用层”四层，系统逻辑架构如下图所示：感知层对接前端感知设备，如视频监控、NVR、和其他物联感知设备，对重要通道和场所
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟