近日,电信学院师生论文“EfficientPose: Efficient Human Pose Estimation with Neural Architecture Search” 获得Computational Visual Media (CVMJ, 计算可视媒体) 2021年度最佳论文奖(Best Paper Award)。论文共同第一作者为电信学院硕士研究生张文强、博士研究生方杰民,通讯作者为电信学院王兴刚副教授和刘文予教授。
图 1 论文所提出的EfficientPose网络框架图
论文研究了视频图像中的人体姿态估计问题,这是视觉媒体领域最重要的任务之一,在元宇宙、虚拟现实、游戏交互、生活辅助等场景有广泛的应用价值。该论文提出了一种新的高效计算框架(EfficientPose),该框架相较于传统姿态估计方法在计算效率上取得了显著提升,同时维持了高水平的预测精度。EfficientPose框架主要包含两部分,即高效骨干网络和高效头部网络。文章通过可微分的网络架构搜索,以极低的计算代价自动化设计骨干网络,骨干架构在优化过程中既能面向姿态估计任务进行特异性调整、又能优化架构计算效率;另外,论文还提出了空间信息矫正模块,其以极小代价有效解决了预测中的棋盘效应,进而提升预测精度。
CVMJ是由清华大学和Springer(施普林格)出版社联合出版的新兴国产期刊。该期刊发表视觉媒体相关领域的原创、高质量研究论文和综述性文章,涵盖计算机视觉、计算机图形学、图像视频处理、机器学习等众多方向,于2019年入选中国科技期刊卓越行动计划。CVMJ最佳论文奖评选过程严格:期刊副主编从2021年度CVMJ发表论文中推举候选论文11篇,进而由主编邀请的领域内专家委员会评选唯一一篇论文产生最佳论文奖。该奖项包含奖金1000美元,并将在CVM 2022大会上颁发。
图 2 EfficientPose方法的测试效果
图 3 CVMJ期刊官网最佳论文奖公布页面
(http://cvm.tsinghuajournals.com/EN/column/column5214.shtml)