期刊:IEEE Transactions on Multimedia 2020
作者:邱荷茜,李宏亮,吴庆波,孟凡满,King Ngi Ngan,石恒粲
论文简介:
像素级分割已广泛应用于改进目标检测。现有的大多数方法通过增加分割分支的约束或简单地将高级分割特征嵌入到局部感受野内的检测特征中来优化检测特征。然而,在现实世界的应用中,噪声分割特征是不可避免的,并且很容易导致误报。为了解决这个问题,该论文提出了一种新颖的层次上下文嵌入模块,以有效地将分割特征嵌入到检测特征中。该模块的核心思想是通过学习多个注意力图来捕获包括局部对象或部分和非局部上下文特征的层次上下文信息,随后利用特征之间的相互依赖性重新校准噪声分割特征。此外,该论文在提出的门控编码器-解码器网络中使用了该模块,该网络基于门机制自适应地聚合不同分辨率的特征图,从而将多尺度分割特征图嵌入到检测特征中,以更准确地检测各种尺寸的物体。实验结果证明了该方法在Pascal VOC 2012Seg数据集、Pascal VOC数据集和MS COCO数据集上的有效性。
