近日,国际顶级学术刊物《IEEE Transactions on Pattern Analysis and Machine Intelligence》(IEEE TPAMI)接收了我院人工智研究所的最新研究成果“PCL: Proposal Cluster Learning for Weakly Supervised Object Detection”。IEEE TPAMI是人工智能领域最顶级的国际期刊,其影响因子为 9.455。
该论文提出了一种基于弱监督学习的物体检测网络,简称为PCL,克服了之前弱监督目标检测方法中只能检测到物体局部的问题。弱监督物体检测是当前计算机视觉领域的热点问题,其目的在于在给定图像分类的监督情况下,自动学习得到一个物体检测器,能够显著减少人工智能任务中的人工标记工作量。论文在深度神经网络的设计上做出了一系列创新,如:在深度网络中进行物体候选特征聚类、两层多示例学习、伪监督训练等,且这些新设计的模块在整个网络可以进行端到端优化。目前在权威的弱监督物体检数据集(如:PASCAL VOC、COCO)上,该论文所提出的深度网络都取得了业内最高的精度。
该工作是我院博士生唐芃和和导师刘文予教授、白翔教授、王兴刚副教授(通讯作者)联合美国约翰斯·霍普金斯大学Alan Yuille等教授等完成。目前论文可以在https://arxiv.org/abs/1807.03342下载,对应代码已全部开源:https://github.com/ppengtang/oicr/tree/pcl/。
为大力促进人工智能方向的科学研究和人才培养工作,电信学院今年成立人工智能研究所,进一步整合资源,凝练方向,做好发展规划,加强团队建设。今年电信学院在人工智能领域尤其是计算机视觉方向研究成果丰硕,2018年度已在TPAMI上录用三篇长文,第一作者均为本院博士生。其中博士生石葆光和柏松已经获得了博士学位,如今分别在微软西雅图研究院和牛津大学继续开展人工智能研究。研究生在人工智能最高水平期刊PAMI上不断发表论文,也标志着人工智能研究所在人才培养质量方面取得了实质的突破。