`cv4` 在 `YOLO-Pose` 任务中的作用

我们以一个具体的例子来分析 self.cv4 处理特征图时 通道数高宽 的变化。


假设初始输入

假设 ch = (256, 512, 1024),表示 YOLO 网络输出的 3 个特征层,每个层的通道数分别是 2565121024
假设输入图片大小为 640×640

不同特征层的输入大小

通常,YOLO 采用 FPN 结构,多尺度特征图大致如下:

特征层 通道数 (x) 特征图大小
P3 (小目标) 256 80×80
P4 (中目标) 512 40×40
P5 (大目标)

你可能感兴趣的:(AI论文写作,YOLO)