|相关新闻

团队论文获CVPR2024密集人群场景机器人视觉感知研讨会最佳论文奖

文:|图:信通学院| 发布时间: 2024-07-03 17:24:42|

近日,项目成员邱荷茜为第一作者,王岚晓和李宏亮教授为共同通讯作者,赵泰锦和孟凡满教授为共同作者的研究论文《HumanFormer: Human-centric Prompting Multi-modal Perception Transformer for Referring Crowd Detection》被在美国西雅图召开的CVPR2024密集人群场景机器人视觉感知研讨会(CVPR2024:5th Workshop on Robot Visual Perception in Human Crowded Environments)接收并被评选为最佳论文。

密集人群指示检测任务旨在根据自然语言描述在复杂密集人群场景中定位特定个体。该论文设计了一个基于视觉语言预训练大模型的密集人群指示检测框架,结合人类中心的提示学习器,构建局部提示的多模态编码器提取细粒度辨别性特征,提出属性提示的推理解码器精准定位目标个体。该框架解决了人类中心的细粒度人体属性特征提取和关系建模问题,在多个验证数据集上取得了最先进的性能。

论文成果的研究质量和影响力被主办方高度评价,并在研讨会举办期间为作者团队颁发了最佳论文奖。在论文海报展示环节,研究成果也受到了众多海内外研究者的关注。