咕哥

Yolov 8源码超详细逐行解读+ 网络结构细讲(自我用的小白笔记)

YOLO V8网络结构

由于作者之前的Yolov8 复现受到了部分好评，所以决定继续从小白学习路线，进行复现代码，磕代码，学理论知识。
代码复现：

完整且详细的Yolov8复现+训练自己的数据集_咕哥的博客-CSDN博客https://blog.csdn.net/chenhaogu/article/details/131161374?spm=1001.2014.3001.5501（若觉得简单易上手，创作不易，请点赞收藏，谢谢大家！）

提示：若只想关注代码讲解，直接从代码讲解部分看即可。作者初衷为“拆封装，看本质，换自己”，在了解核心代码后，用自己的方式重写没有封装的网络结构。

文章目录

一、主体网络结构
二、head
总结

一、主体网络结构

1、Backbone：主体是CSPDarkNet结构。

yolov5和yolov8主体都是该结构，yolov5主要体现思想的结构是c3模块；yolov8主要体现思想的是c2f模块。

2、CSPnet（Cross Stage Partial）：

想要更细致了解的可看知乎一位博主的介绍，非常详细。

CSPNet——PyTorch实现CSPDenseNet和CSPResNeXt - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/263555330

总体来说是参考了DenesNet，减少了计算量和增强梯度（不了解DenesNet的同学可以再csdn或者知乎都可以搜到相关论文，若想节省时间简略了解，可加上讲解等字眼。）。可描述为一部分进入卷积网络进行计算，一部分保留最后concat。而在中间过程也有restnet的思想。用一句名言总结莫过于：大肠包小肠。

3、Partial Transition Layer：

对比这四种结构，发现各有其优点。图a是传统的密集型网络思想。图b是图c和图d的综合考虑。图c是part1和part2的大量特征信息最终得以使用，图d这是对一部分进行利用，计算量得以缩小。

4、代码讲解：

（1）网络结构：

（2）网络模型文件保存在models->v8->yolov8.yaml

# YOLOv8.0n backbone
backbone:
  # [from, repeats, module, args]
  - [-1, 1, Conv, [64, 3, 2]]  # 0-P1/2
  - [-1, 1, Conv, [128, 3, 2]]  # 1-P2/4
  - [-1, 3, C2f, [128, True]]
  - [-1, 1, Conv, [256, 3, 2]]  # 3-P3/8
  - [-1, 6, C2f, [256, True]]
  - [-1, 1, Conv, [512, 3, 2]]  # 5-P4/16
  - [-1, 6, C2f, [512, True]]
  - [-1, 1, Conv, [1024, 3, 2]]  # 7-P5/32
  - [-1, 3, C2f, [1024, True]]
  - [-1, 1, SPPF, [1024, 5]]  # 9

from：输入。-1表示上层的输出作为本层的输入。

repeats：模块的重复次数。

module：使用的模块。

args：模块里面的参数

计算size的公式：out_size =（ in_size - k +2 * p）/ s + 1

(3)卷积的代码（nn->modules->conv.py）

def autopad(k, p=None, d=1):  # kernel, padding, dilation
    """Pad to 'same' shape outputs."""
    if d > 1:
        k = d * (k - 1) + 1 if isinstance(k, int) else [d * (x - 1) + 1 for x in k]  # actual kernel-size
    if p is None:
        p = k // 2 if isinstance(k, int) else [x // 2 for x in k]  # auto-pad
    return p


class Conv(nn.Module):
    """Standard convolution with args(ch_in, ch_out, kernel, stride, padding, groups, dilation, activation)."""
    default_act = nn.SiLU()  # default activation

    def __init__(self, c1, c2, k=1, s=1, p=None, g=1, d=1, act=True):
        """Initialize Conv layer with given arguments including activation."""
        super().__init__()
        self.conv = nn.Conv2d(c1, c2, k, s, autopad(k, p, d), groups=g, dilation=d, bias=False)
        self.bn = nn.BatchNorm2d(c2)
        self.act = self.default_act if act is True else act if isinstance(act, nn.Module) else nn.Identity()

    def forward(self, x):
        """Apply convolution, batch normalization and activation to input tensor."""
        return self.act(self.bn(self.conv(x)))

    def forward_fuse(self, x):
        """Perform transposed convolution of 2D data."""
        return self.act(self.conv(x))

conv（x）-> bn() -> SiLU()

imput map channel：3 size：640*640

第0层（Conv[3,2,1]) channel：64 size：320*320

第1层（Conv[3,2,1]） channel：128 size：160*160

（4）开始进入核心模块c2f，代码在（nn->modules->block.py）

class C2f(nn.Module):
    """CSP Bottleneck with 2 convolutions."""

    def __init__(self, c1, c2, n=1, shortcut=False, g=1, e=0.5):  # ch_in, ch_out, number, shortcut, groups, expansion
        super().__init__()
        self.c = int(c2 * e)  # hidden channels
        self.cv1 = Conv(c1, 2 * self.c, 1, 1)
        self.cv2 = Conv((2 + n) * self.c, c2, 1)  # optional act=FReLU(c2)
        self.m = nn.ModuleList(Bottleneck(self.c, self.c, shortcut, g, k=((3, 3), (3, 3)), e=1.0) for _ in range(n))

    def forward(self, x):
        """Forward pass through C2f layer."""
        y = list(self.cv1(x).chunk(2, 1))
        y.extend(m(y[-1]) for m in self.m)
        return self.cv2(torch.cat(y, 1))

    def forward_split(self, x):
        """Forward pass using split() instead of chunk()."""
        y = list(self.cv1(x).split((self.c, self.c), 1))
        y.extend(m(y[-1]) for m in self.m)
        return self.cv2(torch.cat(y, 1))

[-1, 3, C2f, [128, True]]： 3：重复3次C2f； True:Bottleneck有shortcut

难懂代码在于：

self.m = nn.ModuleList(Bottleneck(self.c, self.c, shortcut, g, k=((3, 3), (3, 3)), e=1.0) for _ in range(n))

n：表示n个bottleneck，假设3个，rang(3) -> m:[Bottleneck,Bottleneck;Bottleneck],m此时相当于一个集成的模块。

可以看到三个通道参数，c1=输入通道数；c2=输出通道数；c=0.5*输出通道数；下面是假设输入为[2,128,160,160]各个块的参数。

x先经过cv1 ;

接着开始不同维度的分块，torch.chunk(块数，维度），这里chunk（2，1）是第一维度分成两块；

m(y[-1]) for m in self.m：意思是把第二块放进n个Bottleneck里,等价于：

##举例对比
    m(y[-1]) for m in self.m                     x*x for x in range(3)
=>
    for m in self.m:                             for x in range(3):
        m(y[-1])                                    print(x*x)

##流程，假设3个Bottleneck

Bottleneck0->m  m(y[-1]);y.extend加上去            0 -> x -> 0*0=0
Bottleneck1->m  m(y[-1]);y.extend加上去            1 -> x -> 1*1=1
Bottleneck2->m  m(y[-1]);y.extend加上去            2 -> x -> 2*2=4

y=[Bottleneck0处理过的第二部分，
   Bottleneck1处理过的第二部分，
   Bottleneck2处理过的第二部分]

因此，y变成2+n块；

torch.cat(y, 1) 将y的第一维度拼接在一起（因为上面chnk是在第一维度分割）；

最后经过cv2, featuremap.size 128*160*160。

imput map channel：3 size：640*640

第0层（Conv[3,2,1]) channel：64 size：320*320

第1层（Conv[3,2,1]） channel：128 size：160*160

第2层（C2f）* 3 channel：128 size：160*160

经过一层Conv

imput map channel：3 size：640*640

第0层（Conv[3,2,1]) channel：64 size：320*320

第1层（Conv[3,2,1]） channel：128 size：160*160

第2层（C2f）* 3 channel：128 size：160*160

第3层（Conv[3,2,1]） channel：256 size： 80*80

经过6*C2f，这一层后开始进入常见金字塔型结构连接检测头，检测头部份后面再细讲

C2F部分讲解和上面一致，这次是6个重复模块。

imput map channel：3 size：640*640

第0层（Conv[3,2,1]) channel：64 size：320*320

第1层（Conv[3,2,1]） channel：128 size：160*160

第2层（C2f）* 3 channel：128 size：160*160

第3层（Conv[3,2,1]） channel：256 size： 80*80

第4层（C2f）* 6 channel：256 size： 80*80

经过一层Conv

imput map channel：3 size：640*640

第0层（Conv[3,2,1]) channel：64 size：320*320

第1层（Conv[3,2,1]） channel：128 size：160*160

第2层（C2f）* 3 channel：128 size：160*160

第3层（Conv[3,2,1]） channel：256 size： 80*80

第4层（C2f）* 6 channel：256 size： 80*80

第5层（Conv[3,2,1]） channel：512 size： 40*40

经过6*C2f

imput map channel：3 size：640*640

第0层（Conv[3,2,1]) channel：64 size：320*320

第1层（Conv[3,2,1]） channel：128 size：160*160

第2层（C2f）* 3      channel：128 size：160*160

第3层（Conv[3,2,1]） channel：256 size： 80*80

第4层（C2f）* 6      channel：256 size：   80*80

第5层（Conv[3,2,1]） channel：512 size： 40*40

第6层（C2f）* 6      channel：512 size： 40*40

经过一层Conv

imput map channel：3 size：640*640

第0层（Conv[3,2,1]) channel：64 size：320*320

第1层（Conv[3,2,1]） channel：128 size：160*160

第2层（C2f）* 3      channel：128 size：160*160

第3层（Conv[3,2,1]） channel：256 size： 80*80

第4层（C2f）* 6      channel：256 size：   80*80

第5层（Conv[3,2,1]） channel：512 size： 40*40

第6层（C2f）* 6      channel：512 size： 40*40

第7层（Conv[3,2,1]） channel：512 size： 20*20

经过3*C2f

imput map channel：3 size：640*640

第0层（Conv[3,2,1]) channel：64 size：320*320

第1层（Conv[3,2,1]） channel：128 size：160*160

第2层（C2f）* 3      channel：128 size：160*160

第3层（Conv[3,2,1]） channel：256 size： 80*80

第4层（C2f）* 6      channel：256 size：   80*80

第5层（Conv[3,2,1]） channel：512 size： 40*40

第6层（C2f）* 6      channel：512 size： 40*40

第7层（Conv[3,2,1]） channel：512 size： 20*20

第8层（C2f）* 3      channel：512 size： 20*20

（6）SPPF，代码在（nn->modules->block.py）

imput map channel：3 size：640*640

第0层（Conv[3,2,1]) channel：64 size：320*320

第1层（Conv[3,2,1]） channel：128 size：160*160

第2层（C2f）* 3      channel：128 size：160*160

第3层（Conv[3,2,1]） channel：256 size： 80*80

第4层（C2f）* 6      channel：256 size：   80*80

第5层（Conv[3,2,1]） channel：512 size： 40*40

第6层（C2f）* 6      channel：512 size： 40*40

第7层（Conv[3,2,1]） channel：1024 size： 20*20

第8层（C2f）* 3      channel：1024 size： 20*20

第9层（SPPF[k=5]）       channel：1024 size： 20*20

代码：

class SPPF(nn.Module):
    """Spatial Pyramid Pooling - Fast (SPPF) layer for YOLOv5 by Glenn Jocher."""

    def __init__(self, c1, c2, k=5):  # equivalent to SPP(k=(5, 9, 13))
        super().__init__()
        c_ = c1 // 2  # hidden channels
        self.cv1 = Conv(c1, c_, 1, 1)
        self.cv2 = Conv(c_ * 4, c2, 1, 1)
        self.m = nn.MaxPool2d(kernel_size=k, stride=1, padding=k // 2)

    def forward(self, x):
        """Forward pass through Ghost Convolution block."""
        x = self.cv1(x)
        y1 = self.m(x)
        y2 = self.m(y1)
        return self.cv2(torch.cat((x, y1, y2, self.m(y2)), 1))

maxpool的计算公式：

二、Head

1、已经讲解完backbone，下面讲解一下检测头部分

代码如下：（代码在ultralytics -> models -> v8 ->yolov8.yaml）

# YOLOv8.0n head
head:
  - [-1, 1, nn.Upsample, [None, 2, 'nearest']]
  - [[-1, 6], 1, Concat, [1]]  # cat backbone P4
  - [-1, 3, C2f, [512]]  # 12

  - [-1, 1, nn.Upsample, [None, 2, 'nearest']]
  - [[-1, 4], 1, Concat, [1]]  # cat backbone P3
  - [-1, 3, C2f, [256]]  # 15 (P3/8-small)

  - [-1, 1, Conv, [256, 3, 2]]
  - [[-1, 12], 1, Concat, [1]]  # cat head P4
  - [-1, 3, C2f, [512]]  # 18 (P4/16-medium)

  - [-1, 1, Conv, [512, 3, 2]]
  - [[-1, 9], 1, Concat, [1]]  # cat head P5
  - [-1, 3, C2f, [1024]]  # 21 (P5/32-large)

  - [[15, 18, 21], 1, Detect, [nc]]  # Detect(P3, P4, P5)

（1）第10层：经过SSPF的模块，接着进入上采样upsample。

None：不指定输出尺寸。

2：输出的尺寸为输入尺寸的2倍。

nearest：使用邻近插值算法。经过上采样后尺寸从10242020 -> 10244040。

经过路线如图所示：

（2）第11层：Concat模块，与经过上采样的上一层和第六层（P4）concat。（代码在：ultralytics -> nn -> modules-> _init_.py）

[1]：在维度为1上拼接；

此时经过上采样的尺寸为1024*40*40 + 第6层输出尺寸为512*40*40 = 1536*40*40。

class Concat(nn.Module):
    """Concatenate a list of tensors along dimension."""

    def __init__(self, dimension=1):
        """Concatenates a list of tensors along a specified dimension."""
        super().__init__()
        self.d = dimension

    def forward(self, x):
        """Forward pass for the YOLOv8 mask Proto module."""
        return torch.cat(x, self.d)

进过的路线如下图所示：

（3）第12层：3C2f；通道数为512，不进行shortcut。此时尺寸从15364040 -> 51240*40

（4）第13层：upsample，第12层作为输入。与第10层原理一样。尺寸从5124040 -> 5128080

（5）第14层：Concat模块，与经过上采样的上一层（13层）和第四层（P3）连接。

此时经过上采样的尺寸为512*80*80 + 第4层输出尺寸为256*80*80 = 768*80*80。

经过路线如图所示：

**（6）第15层： 3C2f；通道数为256，不进行shortcut。此时尺寸从7688080 -> 25680*80。**

经过路线如图所示：

（7）第16层：经过卷积Conv，通道256，k=3，s=2，计算公式上面介绍过。**2568080 -> 2564040.**

经过路线如图所示：

（8）第17层：Concat模块，与经过卷积的16和第12层连接。

16层：256*40*40 + 第12层：512*40*40 = 768*40*40。

经过路线如图所示：

（9）**第18层： 3*C2f；通道数为512，不进行shortcut。此时尺寸从**7684040 -> 5124040。

经过路线如图所示：

(10) 第19层：经过卷积Conv，通道512，k=3，s=2，计算公式上面介绍过。**5124040 -> 5122020.**

经过路线如图所示：

（11）第20层：Concat模块，与经过卷积的19和第9层连接。

[[-1, 9], 1, Concat, [1]]

19层：512*20*20 + 第9层：1024*20*20 = 1536*20*20。

经过路线如图所示：

（12）**第21层： 3C2f；通道数为1024，不进行shortcut。尺寸变化：15362020 -> 102420*20**

经过路线如图所示：

至此，已经经过所有的head部分，下面进入detect。

三、Detect

1、第22层

代码如下：

[[15, 18, 21], 1, Detect, [nc]]  # Detect(P3, P4, P5)

class Detect(nn.Module):
    """YOLOv8 Detect head for detection models."""
    dynamic = False  # force grid reconstruction
    export = False  # export mode
    shape = None
    anchors = torch.empty(0)  # init
    strides = torch.empty(0)  # init

    def __init__(self, nc=80, ch=()):  # detection layer
        super().__init__()
        self.nc = nc  # number of classes
        self.nl = len(ch)  # number of detection layers
        self.reg_max = 16  # DFL channels (ch[0] // 16 to scale 4/8/12/16/20 for n/s/m/l/x)
        self.no = nc + self.reg_max * 4  # number of outputs per anchor
        self.stride = torch.zeros(self.nl)  # strides computed during build
        c2, c3 = max((16, ch[0] // 4, self.reg_max * 4)), max(ch[0], self.nc)  # channels
        self.cv2 = nn.ModuleList(
            nn.Sequential(Conv(x, c2, 3), Conv(c2, c2, 3), nn.Conv2d(c2, 4 * self.reg_max, 1)) for x in ch)
        self.cv3 = nn.ModuleList(nn.Sequential(Conv(x, c3, 3), Conv(c3, c3, 3), nn.Conv2d(c3, self.nc, 1)) for x in ch)
        self.dfl = DFL(self.reg_max) if self.reg_max > 1 else nn.Identity()

    def forward(self, x):
        """Concatenates and returns predicted bounding boxes and class probabilities."""
        shape = x[0].shape  # BCHW
        for i in range(self.nl):
            x[i] = torch.cat((self.cv2[i](x[i]), self.cv3[i](x[i])), 1)
        if self.training:
            return x
        elif self.dynamic or self.shape != shape:
            self.anchors, self.strides = (x.transpose(0, 1) for x in make_anchors(x, self.stride, 0.5))
            self.shape = shape

        x_cat = torch.cat([xi.view(shape[0], self.no, -1) for xi in x], 2)
        if self.export and self.format in ('saved_model', 'pb', 'tflite', 'edgetpu', 'tfjs'):  # avoid TF FlexSplitV ops
            box = x_cat[:, :self.reg_max * 4]
            cls = x_cat[:, self.reg_max * 4:]
        else:
            box, cls = x_cat.split((self.reg_max * 4, self.nc), 1)
        dbox = dist2bbox(self.dfl(box), self.anchors.unsqueeze(0), xywh=True, dim=1) * self.strides
        y = torch.cat((dbox, cls.sigmoid()), 1)
        return y if self.export else (y, x)

    def bias_init(self):
        """Initialize Detect() biases, WARNING: requires stride availability."""
        m = self  # self.model[-1]  # Detect() module
        # cf = torch.bincount(torch.tensor(np.concatenate(dataset.labels, 0)[:, 0]).long(), minlength=nc) + 1
        # ncf = math.log(0.6 / (m.nc - 0.999999)) if cf is None else torch.log(cf / cf.sum())  # nominal class frequency
        for a, b, s in zip(m.cv2, m.cv3, m.stride):  # from
            a[-1].bias.data[:] = 1.0  # box
            b[-1].bias.data[:m.nc] = math.log(5 / m.nc / (640 / s) ** 2)  # cls (.01 objects, 80 classes, 640 img)

接下来的讲解参考博主，大家也可以去看这位博主写的。yolov8的Detect层详解(输出维度改动)_银嘉诚的博客-CSDN博客对于部署端需要拿到onnx的output进行后处理，但是基于anchor_free的yolov8输出是1*(4+cls)*8400，不是我们常见的ncwh格式，所以对Detect层进行了学习，分享一下体会。https://blog.csdn.net/yjcccccc/article/details/130261153?ops_request_misc=&request_id=&biz_id=102&utm_term=yolov8%E7%9A%84detect%E6%A8%A1%E5%9D%97&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-0-130261153.nonecase&spm=1018.2226.3001.4187

先看初始化的参数：

nc: 类别数；
nl: 检测模型中所使用的检测层数；
reg_max: 每个锚点输出的通道数；
no: 每个锚点的输出数量，其中包括类别数和位置信息；
stride: 一个形状为(nl,）的张量，表示每个检测层的步长；
cv2: 一个 nn.ModuleList 对象，包含多个卷积层，用于预测每个锚点的位置信息；
cv3: 一个 nn.ModuleList 对象，包含多个卷积层，用于预测每个锚点的类别信息；
dfl: 一个 DFL（Differentiable Feature Localization）类对象，用于应用可微分几何变换，以更好地对目标框进行回归；（代码后面会介绍）
shape属性表示模型期望的输入形状，如果模型只接受固定形状的输入，则 self.shape 存储该形状

前向函数：

（1）shape=x的shape，即 batch，channel，h，w

 shape = x[0].shape  # BCHW

（2）

        for i in range(self.nl):
            x[i] = torch.cat((self.cv2[i](x[i]), self.cv3[i](x[i])), 1)

假设输入的图：3*640*640；
ch是元组，nl是这个元组的长度。

x[0]= cv2[0][x[0]] + cv3[0]x[0] (后面的1表示第一维度拼接)；

那么cv2[0]为 Conv(x, c2, 3)，cv3[0]为Conv(x, c3, 3)

描点的输出计算方式：self.no = nc + self.reg_max * 4，假设80类，self.no=80+4*16=144；

那么输出的三个特征图应该分别是1*144*80*80（640/8）、1*144*40*40（640/16）和1*144*20*20（640/32）；

后面请大家参考上面那位博主，他写的足够好了，大家可以给他点赞收藏。

总结

以上就是今天要讲的内容，本文仅仅简单介绍了源码结构，后面还会持续更新讲解，由于这次写的太多了，怕大家看不过来。过段时间继续拆封代码并尝试用常见的pytorch原始框架复现缩减版yolov8。也许上面还有很多错误，欢迎大家指正！！！

Adobe Lightroom Classic（简称LRC）图像编辑和管理软件下载安装与使用 xczrFDG adobe
AdobeLightroomClassic（LRC）软件简介AdobeLightroomClassic（简称LRC）是一款强大的图像编辑和管理软件，专为摄影师和图像处理爱好者设计。LRC不仅提供了一系列的编辑工具，还集成了强大的照片管理和组织功能，使用户能够高效地处理和发布摄影作品。该软件是AdobeCreativeCloud的一部分，适用于各类用户，无论是业余爱好者还是专业摄影师。安装包http
基于协同过滤推荐算法的景点票务数据系统（python-计算机毕设）计算机程序设计(接毕设) 推荐算法机器学习毕业设计 python 人工智能
摘要IABSTRACTII第1章引言1研究背景及意义1研究背景1研究意义1国内外研究现状2智慧旅游3旅游大数据3研究内容4本章小结4第2章相关技术概述5基于内容的推荐算法5基于内容的推荐算法原理5基于内容的推荐算法实现5协同过滤推荐算法6协同过滤算法原理6协同过滤算法实现7SpringBoot框架9SpringBoot简介9SpringBoot特性10SpringBoot工作原理10Vue.js框
PyTorch模型训练实战指南：掌握动态图特性与工业级部署技巧 lmtealily pytorch 人工智能 python
前言在深度学习领域，PyTorch凭借其动态计算图、高效的自动微分系统及高度Pythonic的设计哲学，已成为学术界与工业界的主流框架。其即时执行模式大幅简化了模型调试流程，而灵活的模块化设计则为复杂模型的构建提供了坚实基础。然而，从实验原型到工业级部署的全链路实践中，开发者仍需系统性掌握框架核心特性与工程化技巧。本文以实战为导向，深入剖析PyTorch动态图机制与自动微分原理，详解从数据预处理、
巨人学术搜索官网入口，免费参考文献论文及学术搜索引擎黄豆匿zlib 学习方法
巨人学术搜索自2024年上线以来，迅速成为学术界不可或缺的重要工具，尤其受到研究人员、教师及学生的青睐。这款专注于学术领域的专业搜索引擎，覆盖了自然科学、人文科学、社会科学等多个学科领域，整合了国内外众多主流数据库，包括维普、万方、Elsevier、WebofScience等，为用户提供了期刊论文、学位论文、专利、图书、预印本等多种类型资源的精准检索服务。与普通搜索引擎相比，巨人学术搜索的优势在于
目标检测YOLO实战应用案例100讲-基于毫米波雷达与摄像头协同的道路目标检测与识别（续）林聪木目标检测 YOLO 人工智能
目录3.2实测数据采集与分析3.2.1回波数据处理3.2.2毫米波雷达数据采集实验3.3基于传统图像特征的目标识别算法3.3.1基于灰度共生矩阵的时频图特征提取3.3.2支持向量机分类器3.3.3实验及结果分析3.4基于卷积神经网络的目标识别算法3.4.1卷积神经网络的基本理论3.4.2卷积神经网络框架设计3.4.3实验及结果分析基于图像的目标检测算法4.1目标检测算法一般流程4.2典型目标检测算
【新能源集成热管理系统的开发与优化】新能源汽车--三电老K 研发测试汽车学习方法
新能源集成热管理系统的开发与优化涉及多阶段的试验、标定和策略调整，需结合实验室仿真、环境仓测试及实车道路验证，以应对高低温、极端气候等复杂工况。以下是具体实施方法：一、环境仓试验室测试系统标定与基础验证模型搭建：通过AMESim等仿真工具建立机-电-热耦合模型，涵盖电池、电机、空调等子系统，分析高温工况下各部件能耗占比及整车续航表现。参数标定：在环境仓中模拟极端温度（如38℃高温或-30℃低温），
计算机视觉毕业设计选题推荐：选题技巧建议收藏 HaiLang_IT 毕业设计人工智能计算机视觉
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了人工智能专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇
JDK8 Stream 数据流效率分析，Java开发你需要了解的那些事气质大叔程序员后端面试 java
此外还有一系列特化流，如IntStream，LongStream，DoubleStream等），Java8引入的的Stream主要用于取代部分Collection的操作，每个流代表一个值序列，流提供一系列常用的聚集操作，可以便捷的在它上面进行各种运算。集合类库也提供了便捷的方式使我们可以以操作流的方式使用集合、数组以及其它数据结构；作为阅读福利，小编也整理了一些Java学习笔记（包含面试真题+脑图
React中useEffect和useLayoutEffect的区别 CreatorRay 前端面试 react react.js 前端面试
在最近一次面试中被问到，我印象中好像从来没用过useLayoutEffect，就没答上来。但是看名字应该是跟布局相关的，而且跟useEffect会有类似的作用。在React中，useEffect和useLayoutEffect都是用于处理副作用的Hooks，但它们的执行时机和对渲染流程的影响有显著区别。以下是两者的核心差异及使用场景：公众号：Code程序人生，个人网站：https://creato
前端面经真题解析10-字节/抖音电商/前端/超详细记录浪里个浪zxf 前端面试前端
文章目录1.自我介绍2.介绍下自己的项目3.看你项目里面用了axios,说下请求拦截和响应拦截怎么做？4.说下项目里面前后端交互过程及设计？5.怎么处理切换分页请求数据的，优化手段？6.说下你爬取别人网站数据的时候，别人如果设置了拦截，你的解决方案是？7.你说下http请求的refer字段？**Origin字段：****Referer字段：****Host字段****区别：**8.看你做了路由懒加
深入解析：C# 中 `Task.Delay` 与 `Thread.Sleep` 的对比与实战墨夶 C#学习资料1 c#开发语言
嘿，小伙伴们！今天我们要一起深入探讨C#中的Task.Delay和Thread.Sleep。想象一下，你正在开发一个需要处理异步操作的应用程序，如何有效地管理线程和延迟执行任务呢？别急，让我们通过这篇文章来详细解析Task.Delay和Thread.Sleep的区别，并涵盖以下内容：基本概念Thread.Sleep的用法Task.Delay的用法对比分析实战示例注意事项与最佳实践常见面试题及答案正
Java泛型 lgily-1225 日常积累 java 开发语言后端
Java泛型是Java5引入的一项重要特性，旨在增强类型安全、减少代码冗余，并支持更灵活的代码设计。以下是对泛型的详细介绍及使用指南：一、泛型核心概念泛型允许在类、接口、方法中使用类型参数（如），使得代码可以处理多种数据类型，而无需重复编写逻辑。解决的问题类型安全：避免运行时ClassCastException。消除强制类型转换：编译器自动处理类型转换。代码复用：同一逻辑可处理不同类型的数据。二、
【数学建模】TOPSIS法简介及应用烟锁池塘柳0 数学建模数学建模算法
文章目录TOPSIS法的基本原理TOPSIS法的基本步骤TOPSIS法的应用总结在多目标决策分析中，我们常常需要在多个选择中找到一个最优解。TOPSIS（TechniqueforOrderPreferencebySimilaritytoIdealSolution）法是一个广泛应用的决策方法，基于理想解与负理想解的距离来评估各个选项的优劣。本文将简要介绍TOPSIS法的基本原理、步骤以及其在实际决策
【Dive Into Stable Diffusion v3.5】1：开源项目正式发布——深入探索SDv3.5模型全参/LoRA/RLHF训练 Donvink 大模型 #AIGC stable diffusion AIGC 人工智能机器学习深度学习
目录1引言2项目简介3快速上手3.1下载代码3.2环境配置3.3项目结构3.4下载模型与数据集3.5运行指令3.6核心参数说明3.6.1通用参数3.6.2优化器/学习率3.6.3数据相关4结语1引言在人工智能和机器学习领域，生成模型的应用越来越广泛。StableDiffusion作为其中的佼佼者，因其强大的图像生成能力而备受关注。今天，我的开源项目DiveIntoStableDiffusionv3
开源模型应用落地-qwen模型小试-调用Qwen2-7B-Instruct-进阶篇（十二）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型
一、前言经过前五篇“qwen模型小试”文章的学习，我们已经熟练掌握qwen大模型的使用。然而，就在前几天阿里云又发布了Qwen2版本。无论是语言模型还是多模态模型，均在大规模多语言和多模态数据上进行预训练，并通过高质量数据进行后期微调以贴近人类偏好。本文将介绍如何使用Transformers库进行模型推理（相较于qwen1系列，使用方式上有较大的调整），现在，我们赶紧跟上脚步，去体验一下新版本模型
Java IDEA中Gutter Icons图标的含义路宇 java笔记 java intellij-idea 开发语言 gutter-icons 图标 Java开发工具
前些天发现了一个蛮有意思的人工智能学习网站,8个字形容一下"通俗易懂，风趣幽默"，感觉非常有意思,忍不住分享一下给大家。点击跳转到教程前言：很多人刚开始用IDEA来学习编程，会发现下面这些图标。但是我们有时候并不知道它的含义和设置显示与隐藏，下面给大家讲解一下装订线图标位于左侧编辑器中。它们调用一些基本操作以及其他特定于框架和技术的功能。设置步骤File->Setting进到idea的设置页面。接
【考研计算机网络】课堂笔记1 第一章概述刘鑫磊up #操作系统计算机网络计算机网络
文章目录：一：计算机网络的概述1.计算机网络的基本概念2.计算机网络的组成3.计算机网络的功能4.计算机网络的分类4.1分布范围分类4.2传输技术分类4.3按照拓扑结构分类4.4按照使用者分类4.5按照传输介质分类二：计算机网络的标准化工作及相关组织三：计算机网络的性能指标速率kb千Mb兆Gb吉Tb太的单位换算存储容量KBMBGBTB的单位换数四：网络分层五：计算机网络协议、接口、服务的概念1.协
使用fastapi部署stable diffusion模型明晚十点睡代码 fastapi stable diffusion pytorch python 人工智能深度学习计算机视觉
使用vscode运行stablediffusion模型，每次加载模型都需要10+分钟，为算法及prompt调试带来了极大麻烦。使用jupyter解决自然是一个比较好的方案，但如果jupyter由于种种原因不能使用时，fastapi无疑成为了一个很好的选择。参考github链接：https://github.com/jarvislabsai/fastapi-sd-templatefromfastap
详细74系列IC功能说明 heraldww 硬件设计
详细74系列IC说明7400TTL2输入端四与非门7401TTL集电极开路2输入端四与非门7402TTL2输入端四或非门7403TTL集电极开路2输入端四与非门7404TTL六反相器7405TTL集电极开路六反相器7406TTL集电极开路六反相高压驱动器7407TTL集电极开路六正相高压驱动器7408TTL2输入端四与门7409TTL集电极开路2输入端四与门7410TTL3输入端3与非门74107
【科大讯飞笔试题汇总】2024-04-21-科大讯飞春招笔试题-三语言题解(CPP/Python/Java) 春秋招笔试突围最新互联网春秋招试题合集 python java 开发语言春招笔试互联网大厂笔试题
大家好这里是KK爱Coding，一枚热爱算法的程序员✨本系列打算持续跟新科大讯飞近期的春秋招笔试题汇总～ACM银牌|多次AK大厂笔试｜编程一对一辅导感谢大家的订阅➕和喜欢KK这边最近正在收集近一年互联网各厂的笔试题汇总，如果有需要的小伙伴可以关注后私信一下KK领取，会在飞书进行同步的跟新，5月1日之前限时免费领取哦，后续会由ACM银牌团队持续维护~。文章目录01.硬币最少组合问题问题描述输入格式输
【科研必备】EI/Scopus收录！2025年3-4月智能制造、自动化、无人驾驶、人工智能等前沿领域国际会议邀您参与~与全球学者交流，让学术之光在国际舞台上闪耀！努力毕业的小土博^_^ 学术会议推荐制造自动化人工智能深度学习神经网络算法
【科研必备】EI/Scopus收录！2025年3-4月智能制造、无人驾驶、人工智能等前沿领域国际会议邀您参与~与全球学者交流，让学术之光在国际舞台上闪耀！【科研必备】EI/Scopus收录！2025年3-4月智能制造、无人驾驶、人工智能等前沿领域国际会议邀您参与~与全球学者交流，让学术之光在国际舞台上闪耀！文章目录【科研必备】EI/Scopus收录！2025年3-4月智能制造、无人驾驶、人工智能等
OSPO Summit 2025 正式定档！议题征集同步开启开源
历经二十余年的发展，OSPO已然成为企业数字化转型的战略枢纽、产学研协同创新的关键桥梁、公共领域开放生态建设的核心引擎。作为这一进程的重要见证者和推动者，OSPOSummit也将在2025年6月12日迎来它的第三次进化。会议信息时间：2025年6月12日地点：北京议题征集，期待你的声音现在，我们面向全球开源社区决策者、企业技术管理者、学术机构研究者及一线开发者，发起议题征集！诚邀您分享OSPO如何
FPGA——DDS原理及代码实现
FPGA——DDS原理及代码实现一、DDS各参数意义如图，一个量化的32点的正弦波，也就是说一个ROM里存了32个这样的数据，每次读出一个数据要1ms，分别读出1,2,3...30,31,32,共32个点，读取完整的正弦波需要1ms*32=32ms的时间该正弦波参数为>周期T=1ms*32=32ms,>频率为f=1/T=1/(1ms*(32/1))在读出一个数据时间不变（1ms）的情况下，想要让读
https证书获取的方法及好处
获取HTTPS证书的多种方法及其优势✨在现代互联网环境中，HTTPS已成为保障网站安全的基本标准。获取HTTPS证书不仅能提升网站的安全性，还能增强用户信任度和提升搜索引擎排名。本文将详细介绍获取HTTPS证书的几种常见方法及其各自的优势，并通过图表和流程图帮助理解其工作原理。获取HTTPS证书的方法️1.购买商业证书购买商业证书是获取HTTPS证书的传统方式，适用于需要高信任度和额外保障的企业和
【VSCode】VSCode常用插件 Ctrl Z. vscode ide 编辑器
Chinese(Simplified)(简体中文)LanguagePackforVisualStudioCode：简体中文支持插件HTML/CSS/JavaScriptSnippets：支持HTML/CSS/JavaScript快速匹配输入HTMLSnippets：这个插件提供了一系列HTML代码片段，通过简单的缩写就可以快速生成常用的HTML结构。例如，输入!并按下Tab键，就可以快速生成一个完
CTF二维码补标识位writeup 开心星人 photoshop
鉴于我在网上各种搜罗PS如何图层叠加等一系列问题没有结果之后，在我得知了答案之后就来分享一下，好让后来者能够搜到，当时在我用PS咋都不行的时候，突然茅塞顿开，用powerpoint，直接就拼出来了，非常的好用，也非常简单！不过今天还是说一下PS如何操作题目是直接丢过来一个二维码，缺少二维码定位符，所以搜素一下二维码定位符截取图片，去除白色背景首先将两张图片都打开将页面切换到定位符选中左侧工具栏的移
友思特新品 | OCT-3D断层扫描成像测量系统OQ StrataScope升级2.0型号！友思特机器视觉与光电机器视觉 3d OCT 光学相干断层扫描
ProductUpdate！友思特高精度OCT-3D断层扫描成像测量系统推出OQStrataScope升级2.0/R型号！同时，原有的OQStrataScope1.0型号产品将暂时停产。OCT新品简介OQStrataScope2.0是仅用于研究和工业领域应用的光学相干断层扫描系统，可针对高度散射的样品介质增加极深的成像深度。相较于OQLabScope系列，OQStrataScope中心波长可达13
图生视频技术的发展与展望：从技术突破到未来图景 Liudef06 Stable Diffusion 音视频人工智能深度学习 stable diffusion
一、技术发展现状图生视频（Image-to-VideoGeneration）是生成式人工智能（AIGC）的重要分支，其核心是通过单张或多张静态图像生成动态视频序列。近年来，随着深度学习、多模态融合和计算硬件的进步，图生视频技术经历了从基础研究到商业落地的快速演进。早期探索与GAN的奠基早期图生视频技术主要基于生成对抗网络（GAN），通过对抗训练生成低分辨率的视频片段。例如，DeepMind的DVD
Python 的 ultralytics 库详解白.夜人工智能
ultralytics是一个专注于计算机视觉任务的Python库，尤其以YOLO（YouOnlyLookOnce）系列模型为核心，提供了简单易用的接口，支持目标检测、实例分割、姿态估计等任务。本文将详细介绍ultralytics库的功能、安装方法、核心模块以及使用示例。1.ultralytics库简介ultralytics库由Ultralytics团队开发，旨在为YOLO系列模型提供高效、灵活且易
深入解析 MySQL 数据库：隔离级别的选择幽兰的天空 MYSQL数据库数据库 mysql oracle
在数据库中，创建事务一般包含几个简单的步骤。以下是如何在MySQL中创建事务的基本指南，包括相关的SQL语句和操作流程：1.启动事务在MySQL中，你可以使用STARTTRANSACTION或BEGIN语句来启动一个新的事务。这表示你将开始执行一系列操作，这些操作要么全部成功（提交），要么全部失败（回滚）。STARTTRANSACTION;--或者使用BEGIN;2.执行操作在事务被启动后，你可以
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb

Yolov 8源码超详细逐行解读+ 网络结构细讲(自我用的小白笔记)

YOLO V8网络结构

文章目录

一、主体网络结构

1、Backbone：主体是CSPDarkNet结构。

2、CSPnet（Cross Stage Partial）：

3、Partial Transition Layer：

4、代码讲解：

（1）网络结构：

（2）网络模型文件保存在models->v8->yolov8.yaml

(3)卷积的代码（nn->modules->conv.py）

（4）开始进入核心模块c2f，代码在（nn->modules->block.py）

经过一层Conv

经过6*C2f，这一层后开始进入常见金字塔型结构连接检测头，检测头部份后面再细讲

经过一层Conv

经过6*C2f

经过一层Conv

经过3*C2f

（6）SPPF，代码在（nn->modules->block.py）

二、Head

1、已经讲解完backbone，下面讲解一下检测头部分

（1）第10层：经过SSPF的模块，接着进入上采样upsample。

None：不指定输出尺寸。

2：输出的尺寸为输入尺寸的2倍。

nearest：使用邻近插值算法。经过上采样后尺寸从1024*20*20 -> 1024*40*40。

（2）第11层：Concat模块，与经过上采样的上一层和第六层（P4）concat。（代码在：ultralytics -> nn -> modules-> _init_.py）

（3）第12层：3*C2f；通道数为512，不进行shortcut。此时尺寸从1536*40*40 -> 512*40*40

（4）第13层：upsample，第12层作为输入。与第10层原理一样。尺寸从512*40*40 -> 512*80*80

（5）第14层：Concat模块，与经过上采样的上一层（13层）和第四层（P3）连接。

（6）第15层： 3*C2f；通道数为256，不进行shortcut。此时尺寸从768*80*80 -> 256*80*80。

（7）第16层：经过卷积Conv，通道256，k=3，s=2，计算公式上面介绍过。256*80*80 -> 256*40*40.

（8）第17层：Concat模块，与经过卷积的16和第12层连接。

（9）第18层： 3*C2f；通道数为512，不进行shortcut。此时尺寸从768*40*40 -> 512*40*40。

(10) 第19层：经过卷积Conv，通道512，k=3，s=2，计算公式上面介绍过。512*40*40 -> 512*20*20.

（11）第20层：Concat模块，与经过卷积的19和第9层连接。

（12）第21层： 3*C2f；通道数为1024，不进行shortcut。尺寸变化：1536*20*20 -> 1024*20*20

三、Detect

1、第22层

总结

你可能感兴趣的:(Yolo系列复现及改进,目标跟踪,人工智能,计算机视觉)

nearest：使用邻近插值算法。经过上采样后尺寸从10242020 -> 10244040。

（3）第12层：3C2f；通道数为512，不进行shortcut。此时尺寸从15364040 -> 51240*40

（4）第13层：upsample，第12层作为输入。与第10层原理一样。尺寸从5124040 -> 5128080

**（6）第15层： 3C2f；通道数为256，不进行shortcut。此时尺寸从7688080 -> 25680*80。**

（7）第16层：经过卷积Conv，通道256，k=3，s=2，计算公式上面介绍过。**2568080 -> 2564040.**

（9）**第18层： 3*C2f；通道数为512，不进行shortcut。此时尺寸从**7684040 -> 5124040。

(10) 第19层：经过卷积Conv，通道512，k=3，s=2，计算公式上面介绍过。**5124040 -> 5122020.**

（12）**第21层： 3C2f；通道数为1024，不进行shortcut。尺寸变化：15362020 -> 102420*20**