近日,电信学院2019级来华留学博士研究生王兴(WONDIMU GEBRE DIKUBAB,埃塞俄比亚籍),发布了首个阿姆哈拉语场景文字检测与识别综合公共数据集和初步的算法解决方案,其论文“Comprehensive Benchmark Datasets for Amharic Scene Text Detection and Recognition”发表在国内计算机领域顶级期刊《SCIENCE CHINA Information Sciences》上。
埃塞俄比亚联邦民主共和国是非洲大陆最古老的非殖民化独立国家之一,也是非洲第二大人口大国,是中国“一带一路”倡议的积极参与者与推动者。阿姆哈拉语是埃塞俄比亚的官方工作语言,是仅次于阿拉伯语的第二大闪米特语系,在世界范围内有着广泛的应用。埃塞俄比亚/阿姆哈拉文字(Abugida)也是非洲最古老的书写系统之一,被应用于东非的至少23种语言中,共计被超过1.2亿人使用。基于阿姆哈拉语的文字图片进行识别,将有助于促进东非国家在办公、交通、旅游等相关领域的数字化智能化转型。
基于阿姆哈拉语的文字图片识别是一项极具挑战性的任务。为了解决构成阿姆哈拉语的不同字母具有高度的视觉相似性、目前缺乏公开的面向非洲文字理解的文字数据集等难点,王兴同学在白翔教授的指导下,提出了首个全面的、公开的阿姆哈拉文字识别数据集,包含是HUST-ART、HUST-AST、A.B.E.和Tana四个部分,总共包含了15039张真实场景的文字图像以及2927682张合成的文字图像。针对该数据集,王兴与合作者设计了大量的实验,以评估目前最先进的文字识别方法在该数据集上识别阿姆哈拉语文字的性能。
论文被《SCIENCE CHINA Information Sciences》接收后,相关成果及数据在网络上进行了公开,并受到了广泛的关注。截至目前,已有超过25 327次浏览、496次互动、193次评论、38次转发分享,其中包含366位高校研究人员。该工作的贡献对于阿姆哈拉语的技术发展是里程碑式的,将直接促进埃塞俄比亚官方语言和其他非洲语言的文字识别应用。
自1996年以来,电信学院持续开展来华留学教育,实现了本、硕、博贯通式培养,累计培养国际学生超过1000人。经过不断的探索与实践,电信学院不断完善培养模式和体系,国际学生的培养质量稳步提升。