近日,以博士生石恒璨为第一作者,李宏亮教授为通讯作者共同完成的研究论文《通过综合分类模型及差异正则化算法进行场景解析》(Scene Parsing via Integrated Classification Model and Variance-Based Regularization)被人工智能顶级会议CVPR 2019接收。CVPR(IEEE Conference on Computer Vision and Pattern Recognition)是计算机视觉领域全球最有影响力的会议,受到全世界学界和工业界的广泛关注。
场景解析,又称语义分割,是计算机视觉领域最重要的研究课题之一。其被广泛应用于机器人、汽车、监控、医疗等诸多行业。现有的深度学习语义分割技术采用单一分类器,往往不足以胜任复杂多变的现实应用场景。对此,本论文创新性地提出了一种综合分类模型,综合设计多个不同种类的分类器,以应对真实场景中多样的对象。同时,本论文还提出了一种差异正则化算法。该算法能够更好地辨别外观相似的对象,从而进一步提升语义分割精度。本论文提出的方法在多个标准数据集上均优于现有的方法,达到了最好的语义分割性能。
