从一次深夜调试说起上周三凌晨两点,盯着监控画面里漏检的集装箱编号,我意识到RT-DETR的主干网络该动手术了。原版ResNet在复杂光照下就像近视眼——特征抓不准重点。注意力机制?早就该上了。但SE、CBAM、EMA这三个怎么选、怎么插、怎么调,才是真功夫。今天就把这三个模块在RT-DETR主干里的实战踩坑记录分享出来。为什么要在主干加注意力?目标检测不是特征提取比赛,是特征筛选竞赛。主干网络输出的特征图里,背景信息和目标信息混在一起,后续的Transformer解码器负担太重。注意力机制就像给主干网络装了个“智能聚光灯”,让网络自己学会哪些区域该重点看,哪些可以忽略。实测下来,在港口集装箱检测场景,合理引入注意力能让小目标召回率提升3-5个百分点。SE模块:轻量但有效的起点SE(Squeeze-and-Excitation)是我最先试的,结构简单,计算量小,适合嵌入式部署。核心思想就两步:全局池化抓全局信息,两个全连接层学习通道权重。classSEBlock(nn.Module)/