YOLO26最新创新改进系列:(粉丝反馈涨点模型TOP3)融合轻量级网络Ghostnet(幽灵卷积or幻影卷积),实测参数量降低!轻量化水文小神器!
YOLO26最新创新改进系列粉丝反馈涨点模型TOP3融合轻量级网络Ghostnet(幽灵卷积or幻影卷积)实测参数量降低轻量化水文小神器购买相关资料后畅享一对一答疑畅享超多免费持续更新且可大幅度提升文章档次的纯干货工具原文戳这里GhostNet: More Features from Cheap Operations摘要该论文提供了一个全新的Ghost模块旨在通过廉价操作生成更多的特征图。基于一组原始的特征图作者应用一系列线性变换以很小的代价生成许多能从原始特征发掘所需信息的“Ghost”特征图Ghost feature maps。该Ghost模块即插即用通过堆叠Ghost模块得出Ghost bottleneck进而搭建轻量级神经网络——GhostNet。幻影卷积步骤先进行1 x 1卷积聚合通道间的信息特征然后再使用分组卷积生成新的特征图。为了减少网络计算量作者将传统的卷积分成两步进行首先通过传统的卷积生成channel较小的特征图以较少的计算量然后在得到的特征图的基础上通过cheap operation(depthwise conv廉价操作)再进一步减少计算量生成新的特征图最后将两组特征图拼接到一起得到最终的output。卷积操作是卷积-批归一化BN-非线性激活全套组合而所谓的线性变换或者廉价操作cheap operation均指普通卷积不含批归一化和非线性激活。一 简介在效果较好的CNN模型中特征图存在冗余是非常重要的但是很少有人在模型结构设计上考虑特征图冗余问题从特征图冗余问题出发提出一个仅通过少量计算cheap operations就能生成大量特征图的结构——Ghost ModuleGhost Module通过一系列线性操作a series of linear transformations生成特征图其中经过线性操作生成的特征图称为ghost feature maps而被操作的特征图称为intrinsic feature mapsGhost Module的优点即插即用Ghost Module是一个即插即用模块可以无缝衔接现有的CNN中使用Ghost Module组成的Ghost bottlenecks设计出GhostNet在ILSVRC-2012上top-1超过Mobilenet-V3并且参数(params)更少。本文作者在观察ResNet50第一个残差块输出的特征图时发现有许多输出特征很相似图一中的红、绿、蓝框的特征图作者认为很相似基本只要进行简单的线性变换就能得到而不需要进行复杂的非线性变换得到作者该对其中的一个特征图可以通过廉价操作图中用扳手表示将另一特征图变换而获得可以认为其中一个特征图是另一个的“Ghost”。因为本文提出并非所有特征图都要用卷积操作来得到“Ghost”特征图可以用更廉价的操作来生成。二 方法Ghost Bottlenecks利用Ghost模块的优势作者介绍了专门为小型CNN设计的Ghost bottleneckG-bneck。如图所示Ghost bottleneck似乎类似于ResNet中的基本残差块Basic Residual Block其中集成了多个卷积层和shortcut。Ghost bottleneck主要由两个堆叠的Ghost模块组成第一个Ghost模块用作扩展层增加了通道数这里将输出通道数与输入通道数之比称为expansion ratio第二个Ghost模块减少通道数以与shortcut路径匹配,然后使用shortcut连接这两个Ghost模块的输入和输出。这里借鉴了MobileNetV2第二个Ghost模块之后不使用ReLU因为深度卷积后再加ReLU效果会变差可能是深度卷积输出太浅了, 应用 ReLU会带来信息丢失其他层在每层之后都应用了批量归一化BN和ReLU非线性激活。上述Ghost bottleneck适用于stride 1对于stride 2的情况shortcut路径由下采样层和stride 2的深度卷积Depthwise Convolution来实现。出于效率考虑Ghost模块中的初始卷积是逐点卷积Pointwise Convolution。基于Ghost bottleneck作者提出GhostNet如下所示1.作者遵循MobileNetV3的基本体系结构的优势然后使用Ghost bottleneck替换MobileNetV3中的bottleneck2.GhostNet主要由一堆Ghost bottleneck组成其中Ghost bottleneck以Ghost模块为构建基础第一层是具有16个卷积核的标准卷积层然后是一系列Ghost bottleneck通道逐渐增加。这些Ghost bottleneck根据其输入特征图的大小分为不同的阶段除了每个阶段的最后一个Ghost bottleneck是stride 2其他所有Ghost bottleneck都以stride 1进行应用3.最后利用全局平均池和卷积层将特征图转换为1280维特征向量以进行最终分类。SE模块也用在了某些Ghost bottleneck中的残留层4.与MobileNetV3相比这里用ReLU换掉了Hard-swish激活函数。尽管进一步的超参数调整或基于自动架构搜索的Ghost模块将进一步提高性能但下表所提供的架构提供了一个基本设计参考。三 结论1.Ghost模块消融实验当s2、d3的时候Ghost模块的性能优于更小或更大的Ghost模块。这是因为大小为1的内核无法在特征图上引入空间信息而较大的内核例如d5或d7会导致过拟合和更多计算。2.特征图可视化生成的特征足够灵活可以满足特定任务的需求。3.ImageNet分类数据集通常较大的FLOPs会在这些小型网络中带来更高的准确性这表明了它们的有效性。而GhostNet在各种计算复杂度级别上始终优于其他竞争对手主要是因为GhostNet在利用计算资源生成特征图方面效率更高。4.硬件推理速度作者的模型总体上胜过其他最新模型例如谷歌MobileNet系列ProxylessNASFBNet和MnasNet。5.COCO目标检测数据集GhostNet可以在单阶段的RetinaNet和两阶段的Faster R-CNN框架上达到和MobileNetV2和MobileNetV3类似的mAP。四 修改步骤4.1 修改YAML文件4.2 新建.py4.3 修改tasks.py五 验证是否成功即可执行命令python train.py改完收工关注B站Ai学术叫叫兽er从此走上科研快速路遥遥领先同行写在最后学术因方向、个人实验和写作能力以及具体创新内容的不同而无法做到一通百通关注我CSDN、B站及抖音Ai学术叫叫兽在所有B站资料中留下联系方式以便在科研之余为家人们答疑解惑本up主获得过国奖发表多篇SCI擅长目标检测领域拥有多项竞赛经历拥有软件著作权核心期刊等经历。因为经历过所以更懂小白的痛苦因为经历过所以更具有指向性的指导祝所有科研工作者都能够在自己的领域上更上一层楼以下为给大家庭小伙伴们免费更新过的绘图代码均配有详细教程超小白也可一键操作! 后续更多提升文章档次的资料的更新请大家庭的小伙伴关注我B站及抖音Ai学术叫叫兽