别再死记硬背YAML了！手把手带你拆解YOLOv5s的Backbone网络结构（附源码逐行解析）

张

张建站

2026/6/10 21:25:13

10分钟阅读

别再死记硬背YAML了！手把手带你拆解YOLOv5s的Backbone网络结构（附源码逐行解析）

从YAML到代码用侦探思维拆解YOLOv5s的Backbone架构当你第一次打开YOLOv5的YAML配置文件时那些密密麻麻的数字和缩写是否让你感到无从下手作为计算机视觉领域最流行的目标检测框架之一YOLOv5的成功很大程度上归功于其精心设计的Backbone网络。但与其死记硬背配置文件中的参数不如让我们换一种方式——像侦探破案一样通过源码逆向工程来真正理解这个网络的构建逻辑。1. 逆向工程从配置文件到网络结构YOLOv5的Backbone定义在models/yolov5s.yaml中这个看似简单的YAML文件实际上包含了整个网络架构的DNA。与许多深度学习框架不同YOLOv5采用了一种极为简洁的网络定义方式# YOLOv5 v6.0 backbone backbone: # [from, number, module, args] [[-1, 1, Conv, [64, 6, 2, 2]], # 0-P1/2 [-1, 1, Conv, [128, 3, 2]], # 1-P2/4 [-1, 3, C3, [128]], [-1, 1, Conv, [256, 3, 2]], # 3-P3/8 [-1, 6, C3, [256]], [-1, 1, Conv, [512, 3, 2]], # 5-P4/16 [-1, 9, C3, [512]], [-1, 1, Conv, [1024, 3, 2]], # 7-P5/32 [-1, 3, C3, [1024]], [-1, 1, SPPF, [1024, 5]], # 9 ]每一行定义都包含四个关键元素from: 输入来源层索引number: 模块重复次数module: 模块类型(Conv, C3, SPPF等)args: 模块参数列表1.1 参数缩放机制YOLOv5引入了两个独特的缩放因子使得同一套配置文件可以生成不同大小的模型参数说明示例(v5s)depth_multiple控制模块深度(重复次数)0.33width_multiple控制通道宽度0.50这两个参数的实际作用可以通过一个例子来说明。考虑第一个C3模块的定义[-1, 3, C3, [128]]在YOLOv5s中实际模块数量 3 × 0.33 ≈ 1输出通道数 128 × 0.50 64这种设计使得模型可以灵活调整大小而无需重写整个架构。1.2 特征图尺寸计算理解特征图尺寸的变化对调试网络至关重要。以第一个卷积层为例[-1, 1, Conv, [64, 6, 2, 2]] # 输入3x640x640计算过程输出通道 64 × 0.5 32特征图尺寸 (640 - 6 2×2)/2 1 320因此输出为32x320x320的特征图。提示特征图尺寸公式为(W - K 2P)/S 1其中W是输入尺寸K是核大小P是填充S是步长。2. 核心模块解析2.1 Conv模块不只是卷积YOLOv5中的Conv模块实际上是Conv-BN-SiLU的组合定义在common.py中class Conv(nn.Module): def __init__(self, c1, c2, k1, s1, pNone, g1, actTrue): super().__init__() self.conv nn.Conv2d(c1, c2, k, s, autopad(k, p), groupsg, biasFalse) self.bn nn.BatchNorm2d(c2) self.act nn.SiLU() if act else nn.Identity() def forward(self, x): return self.act(self.bn(self.conv(x)))几个关键点默认使用SiLU激活函数(Sigmoid Linear Unit)自动计算padding保持特征图尺寸支持分组卷积(groups参数)2.2 C3模块跨阶段部分连接C3模块是YOLOv5的核心创新之一它结合了CSPNet和Bottleneck的设计思想class C3(nn.Module): def __init__(self, c1, c2, n1, shortcutTrue, g1, e0.5): super().__init__() c_ int(c2 * e) # 隐藏层通道数 self.cv1 Conv(c1, c_, 1, 1) self.cv2 Conv(c1, c_, 1, 1) self.cv3 Conv(2 * c_, c2, 1) self.m nn.Sequential(*[Bottleneck(c_, c_, shortcut, g, e1.0) for _ in range(n)]) def forward(self, x): return self.cv3(torch.cat((self.m(self.cv1(x)), self.cv2(x)), 1))数据流经两个分支主分支Conv → n个Bottleneck捷径分支直接通过Conv 最后将两个分支的结果拼接并通过最后的Conv融合。2.3 Bottleneck设计Bottleneck是C3模块中的基本构建块其设计灵感来自ResNet但有所改进class Bottleneck(nn.Module): def __init__(self, c1, c2, shortcutTrue, g1, e0.5): super().__init__() c_ int(c2 * e) self.cv1 Conv(c1, c_, 1, 1) self.cv2 Conv(c_, c2, 3, 1, gg) self.add shortcut and c1 c2 def forward(self, x): return x self.cv2(self.cv1(x)) if self.add else self.cv2(self.cv1(x))与原始ResNet的Bottleneck相比YOLOv5的版本使用更简洁的结构(只有两个卷积层)保留shortcut连接但条件更严格支持分组卷积2.4 SPPF模块空间金字塔池化SPPF是YOLOv5中用于捕获多尺度特征的模块class SPPF(nn.Module): def __init__(self, c1, c2, k5): super().__init__() c_ c1 // 2 self.cv1 Conv(c1, c_, 1, 1) self.cv2 Conv(c_ * 4, c2, 1, 1) self.m nn.MaxPool2d(kernel_sizek, stride1, paddingk // 2) def forward(self, x): x self.cv1(x) y1 self.m(x) y2 self.m(y1) y3 self.m(y2) return self.cv2(torch.cat([x, y1, y2, y3], 1))SPPF通过串联不同尺度的最大池化结果使网络能够捕获从细粒度到粗粒度的多尺度特征。3. 网络构建过程解析3.1 模型解析流程YOLOv5的模型构建始于models/yolo.py中的parse_model函数def parse_model(d, ch): anchors, nc, gd, gw d[anchors], d[nc], d[depth_multiple], d[width_multiple] layers, save, c2 [], [], ch[-1] for i, (f, n, m, args) in enumerate(d[backbone] d[head]): m eval(m) if isinstance(m, str) else m for j, a in enumerate(args): try: args[j] eval(a) if isinstance(a, str) else a except: pass n max(round(n * gd), 1) if n 1 else n if m in [Conv, GhostConv, Bottleneck, ...]: c1, c2 ch[f], args[0] args [c1, c2, *args[1:]] elif m is C3: c1, c2 ch[f], args[0] args [c1, c2, n, *args[1:]] # ...其他模块处理 m_ nn.Sequential(*[m(*args) for _ in range(n)]) if n 1 else m(*args) # ...保存层信息 return nn.Sequential(*layers), sorted(save)这个函数完成了几个关键任务解析depth_multiple和width_multiple处理每个层的参数动态计算输入/输出通道构建最终的模型序列3.2 特征图变化轨迹让我们追踪一张640x640图像在Backbone中的变化过程层类型参数输入尺寸输出尺寸计算说明0Conv[64,6,2,2]3x640x64032x320x320(640-64)/213201Conv[128,3,2]32x320x32064x160x160(320-30)/211602C3[128,3]64x160x16064x160x160保持尺寸3Conv[256,3,2]64x160x160128x80x80(160-30)/21804C3[256,6]128x80x80128x80x80保持尺寸5Conv[512,3,2]128x80x80256x40x40(80-30)/21406C3[512,9]256x40x40256x40x40保持尺寸7Conv[1024,3,2]256x40x40512x20x20(40-30)/21208C3[1024,3]512x20x20512x20x20保持尺寸9SPPF[1024,5]512x20x20512x20x20保持尺寸4. 自定义Backbone的技巧理解了YOLOv5 Backbone的构建原理后我们可以根据特定需求进行定制化修改4.1 修改网络深度调整depth_multiple可以改变模型的深度增大(如0.75)增加C3模块中的Bottleneck数量提升模型容量减小(如0.25)减少Bottleneck数量得到更轻量模型4.2 调整通道宽度通过width_multiple控制特征通道数# 原始配置 width_multiple: 0.50 # v5s width_multiple: 0.75 # v5m width_multiple: 1.0 # v5l width_multiple: 1.25 # v5x4.3 添加自定义模块在common.py中定义新模块后只需在YAML中引用即可class MyBlock(nn.Module): def __init__(self, c1, c2): super().__init__() self.conv Conv(c1, c2, 3) def forward(self, x): return self.conv(x)然后在YAML中[[-1, 1, MyBlock, [256]]]4.4 特征图可视化技巧使用torchviz工具可以生成网络计算图from torchviz import make_dot # 假设model是你的YOLOv5模型 x torch.randn(1, 3, 640, 640) y model(x) make_dot(y, paramsdict(model.named_parameters())).render(backbone, formatpng)5. 调试与性能优化5.1 常见问题排查当Backbone表现不如预期时可以检查以下几点特征图尺寸不匹配确保卷积参数计算正确检查padding是否设置合理梯度消失/爆炸检查BatchNorm层是否正常工作考虑调整初始化方式性能瓶颈使用torch.profiler分析各层耗时考虑将部分操作转为TensorRT加速5.2 计算量分析可以使用thop库计算FLOPs和参数量from thop import profile input torch.randn(1, 3, 640, 640) flops, params profile(model, inputs(input,)) print(fFLOPs: {flops/1e9:.2f}G, Params: {params/1e6:.2f}M)5.3 内存优化技巧对于显存受限的场景使用梯度检查点降低batch size采用混合精度训练优化数据加载流程# 混合精度训练示例 scaler torch.cuda.amp.GradScaler() with torch.cuda.amp.autocast(): outputs model(inputs) loss criterion(outputs, targets) scaler.scale(loss).backward() scaler.step(optimizer) scaler.update()

手把手教你用nRF Connect抓包分析BLE的MTU交换过程（从请求到响应）

实战解析：用nRF Connect捕获BLE设备MTU交换全流程在低功耗蓝牙（BLE）开发中，MTU（Maximum Transmission Unit）大小直接影响着数据传输效率。想象一下这样的场景：你的智能手环需要传输一段长达100字…...

2026/6/10 21:25:12 阅读更多 →

CISP-PTE文件上传题新思路：绕过随机命名，用PHP文件读写函数写Webshell

CISP-PTE文件上传漏洞新解法：巧用PHP文件操作函数绕过随机命名防御在CISP-PTE认证考试和实际渗透测试中，文件上传漏洞一直是高频考点和突破口。传统思路往往聚焦于如何绕过前端验证、MIME类型检测或内容安全检查，但当遇到服务器对上传文件进行…...

2026/6/10 21:20:19 阅读更多 →

手把手教你用TMS320F28377S的CAN模块：从邮箱配置到数据收发实战

TMS320F28377S CAN模块实战：从邮箱配置到数据收发的完整指南在工业控制、汽车电子和能源管理系统中，CAN总线因其高可靠性和实时性成为首选通信协议。TMS320F28377S作为TI C2000系列中的高性能DSP，其内置的CAN模块为工程师提供了强大的通信解决…...

2026/6/10 21:19:08 阅读更多 →

如何用Rust构建高效小说下载器：Tomato-Novel-Downloader技术深度解析

如何用Rust构建高效小说下载器：Tomato-Novel-Downloader技术深度解析【免费下载链接】Tomato-Novel-Downloader 番茄小说下载器不精简版项目地址: https://gitcode.com/gh_mirrors/to/Tomato-Novel-Downloader 在数字阅读时代，如何高效管理和离…...

2026/6/9 17:00:49 阅读更多 →

Windows与Office激活难题的终极解决方案：KMS_VL_ALL_AIO完全指南

Windows与Office激活难题的终极解决方案：KMS_VL_ALL_AIO完全指南【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 还在为Windows系统激活失败而烦恼吗？每次重装系统后都要…...

2026/6/10 7:46:40 阅读更多 →