Paper Reading - Model系列 - LiteHRNet-CFANZ编程社区

Abstract

更多关注
计算机视觉-Paper&Code - 知乎

paper code

paper

HRNet由微软亚洲研究院和中科大提出，已发表于CVPR2019
王井东 IEEE fellow 目前已经加入百度AIGroup作为CV首席架构师，主要研究领域为姿态估计、分割检测工业界学术界大牛。
回顾上次分享的HRNet，在保持高分辨和高语义信息下虽然得到了很好的效果，但是没有下采样阶段，模型复杂度高，部署困难的问题。对此团队继续推出了轻量化的LiteHRNet

总结来说文章主要以下创新贡献

借鉴Shuffle Block, 使用SB代替了原先的RB, 使用depthwise卷积代替fuse layer中的传统卷积，得到Naive Lite HRNet，大大减少计算量
提出并使用Conditional Channel Weighting操作代替第一点中提到的1*1 pointwise卷积得到LiteHRNet

ShuffleNet主要通过以下三个操作来修改residual block，详见子韵如初：Paper Reading - Model系列 - ShuffleNet

传统encoder-decoder架构下都需要从低分辨率中恢复空间信息，类似SegNet则会去对不同分辨率的输入采用不同的计算，以降低整体复杂性。BiSeNet通过采用两个分支网络去将细节信息和上下文信息整合起来。HRNet则一直保持着高分辨率特征图

该领域主要通过动态生成以输入为条件的conv kernel。常见的几个工作方向为

MetaNet采用元学习器来生成权重以学习跨任务知识。SOLOV2将此设计应用于实例分割任务，为每个实例生成mask sub-network的参数
SENet使用全局信息来激发或抑制channel的权重。（详见子韵如初：Paper Reading - 模型结构系列 - The Last Champion Squeeze-and-Excitation）
CBAM相比为se的channel attention还利用了空间注意力来细化特征。
本文的conditional channel weighting可以被视为conditional channel-wise 1 × 1 convolution。大大减少了计算量，还能够跨通道交换信息。