10月9日,北京航空航天大学李胜曦教授应邀做客“学术沙龙”活动,为学校师生带来“面向视觉语义重构的表征与压缩方法”的主题报告,并与参会师生进行了深入交流和探讨。本次活动由教师发展中心主办,信息与通信工程学院承办,信息与通信工程学院朱策教授主持。

李胜曦教授首先从主成分分析、自动压缩机、变分自动压缩机等角度介绍了信号表征与重构的涵义。然后介绍了对抗生成网络(GAN)在语义重构场景中的应用及现有IPM-GAN的缺陷。IPM-GAN的缺陷在于隐变量空间的矩匹配并不完备,即使两个分布的各阶矩都一样也无法说明两个分布相等。基于此李教授认为可以使用分布匹配代替矩匹配,引入特征函数衡量两个分布的距离,实验结果表明,该方法能得到语义更加完备的隐变量空间。
随后,李教授介绍了面向语义重构的生成对抗网络以及可逆化方法,该方法的创新点在于利用残差完全恢复丢失的细节信息,大幅降低了MSE。李教授详细介绍了该方法的思路,首先训练基于特征函数的可逆GAN,强化重建能力;然后训练压缩器,优化语义重构;最后基于自适应补偿网络优化细节重构。李教授向与会师生展示了相关实验结果,与现有的GAN可逆方法相比,李教授介绍的方法生成的重建图像与编辑图像在细节重构上具有压倒性优势。

最后,李教授介绍了面向机器视觉的压缩进展,其核心思路为在相同码率情况下,构建压缩算法以提升视觉任务性能为目标,相比于现有面向人类视觉的压缩方法,可显著节省压缩码流。
讲座结束后,与会师生就相关学术问题与李胜曦教授进行了深入交流和讨论,现场气氛非常热烈。
本次学术沙龙由教师发展中心主办、信息与通信工程学院承办。
相关链接:
李胜曦,北京航空航天大学教授,国家青年人才。博士毕业于伦敦帝国理工电气与电子工程学院,师从Danilo Mandic教授(IEEE Fellow,获INNS Dennis Gabor奖),博士研究方向为智能信号处理与概率生成模型。硕士和本科均就读于北京航空航天大学电子信息工程学院,师从徐迈教授,研究方向为图像处理和视频压缩。目前在IEEE TPAMI、TNNLS等IEEE期刊以及NeurIPS、CVPR等CCF会议共计发表论文30余篇,撰写书籍共计2部,贡献10余项MPEG标准组织提案,成果在国际标准化ISO、ITU组织多项最新标准中得到应用。获中国优秀自费留学生奖、帝国理工Lee Family奖学金(每年仅2名青年华人学者)、中国电子学会优秀硕士论文提名等奖励。