近日,以博士生邱荷茜为第一作者,李宏亮教授为通讯作者共同完成的研究论文《偏移区间分类网络用于实现精确的目标检测》(Offset Bin Classification Network for Accurate Object Detection)被人工智能顶级会议CVPR 2020接收。CVPR(IEEE Conference on Computer Vision and Pattern Recognition)是计算机视觉领域全球最有影响力的会议,受到全世界学界和工业界的广泛关注。
目标检测是一项基本且富有挑战性的计算机视觉研究课题,包括目标分类和目标定位两个子任务。一系列广泛的应用,如自动驾驶,视频监视和机器人技术,将受益于精确的目标检测。典型的方法定位目标通过利用回归网络预测锚点框和真实框之间的偏移,往往导致了次优的回归网络和不精确的定位。对此,该论文创新性地提出了一种偏移区间分类网络,将回归问题转化为分类问题,以实现精确的目标定位。同时,该论文提出了一种基于期望的偏移预测方法和一种分层聚焦的方法去逐步地精细化偏移区间,从而进一步地改进预测精度。该论文提出的方法相比基础方法的检测精度取得了大幅度地提高,并在多个标准数据集上均优于现有的方法。
