|论文成果

Disturbed Augmentation Invariance for Unsupervised Visual Representation Learning

文:|图:信通学院| 发布时间: 2023-04-19 18:25:53|

期刊:IEEE Transactions on Circuits and Systems for Video Technology, 2023

作者:程浩洋;李宏亮;吴庆波;邱荷茜;张效良;孟凡满;赵泰锦

论文简介:对比学习近年来备受瞩目,它通过简单的增强不变性实现了卓越的性能。然而,由于机械式的增强策略,简单的对比对缺乏多样性。在本文中,该论文提出了扰动增强不变性(简称DAI),通过在特征空间中为每个增强视图生成适当的扰动视图来构建扰动对比对,以增加多样性。具体来说,该论文为每个增强视图建立一个多元正态分布,其均值对应于增强视图,协方差矩阵则根据数据集中最近的邻居进行估计。然后,该论文从该分布中随机抽取向量作为扰动视图,以构建扰动对比对。为了避免随着扰动对比对数量增加而增加的额外计算成本,该论文利用平凡扰动增强不变性损失的上界来构建DAI损失。此外,受信息瓶颈原理的启发,该论文提出了扰动增强不变性的瓶颈版本(简称BDAI),它通过额外增加原始对比对的方差来进一步精炼提取的信息并学习紧凑的表示。为了使BDAI有效工作,该论文设计了一种统计策略来控制所有扰动对比对共享的信息量与表示的紧凑性之间的平衡。该论文的方法在多种下游任务(如图像分类、目标检测和实例分割)上相对于流行的对比学习方法取得了一致的改进。