2020级控制工程专业硕士研究生陈雷同学的两项研究成果近期分别发表在多媒体领域知名国际会议ICME 2023 (CCF推荐B类会议)和国际期刊《IEEE Transactions on Circuits and Systems for Video Technology》(一区TOP)。这两项研究均在戴呼合副教授和计算机学院(软件学院)郑媛副教授的指导下完成。
ICME的全称为IEEE International Conference on Multimedia and Expo,是多媒体领域最重要的学术会议之一。被ICME 2023录取论文的题目为“ICANet: A LIGHTWEIGHT INCREASING CONTEXT AIDED NETWORK FOR REAL-TIME IMAGE SEMANTIC SEGMENTATION”(Oral Presentation)。在该研究中提出了渐增式上下文辅助实时语义分割网络(Increasing Context Aided Network,ICANet)。考虑到现有低参数量网络存在分割精度差的问题,提出了翻转深度可分离卷积块(Inverted Depthwise Sparable convolution block,IDS block)。该块能够从具有少量通道数的特征图中提取丰富的语义信息。基于 IDS block,构建了 ICANet 的编码器。在ICANet的解码器中,采用逐分辨率融合策略高效融合编码器的特征输出。ICANet 只有 0.56M 参数,在 Cityscapes 和 CamVid 测试集中,以全分辨率输入进行推理,分别获得了 178.2 FPS,72.4% mIoU 和 221.1 FPS,76.1% mIoU 的优异性能表现。
陈雷在ICME 2023会议现场做报告
被《IEEE Transactions on Circuits and Systems for Video Technology》录取论文的题目为“RAFNet: Reparameterizable Across-resolution Fusion Network for Real-time Image Semantic Segmentation”(DOI: 10.1109/TCSVT.2023.3293166)。在该研究中提出了可重参数化跨分辨率融合网络(Reparameterizable Across-resolution Fusion Network,RAFNet)用于图像实时语义分割。RAFNet 采用编码器-解码器结构。并提出了可重参数化通道扩张卷积(Reparameterizable Channel & Dilation convolution block,RCD block)。该块利用重参数化策略解耦训练模型和推理模型实现更高的分割精度与更快的推理速度。同时,该块使用扩张率不同的扩张卷积从广阔的感受野中提取特征信息。基于 RCD block,构建了RAFNet 的编码器。为获得更高分割精度,在 RAFNet 的解码器中提出了跨分辨率融合策略,其高效地融合来自不同阶段的编码器输出。RAFNet只有0.96M参数,在 Cityscapes 和 CamVid 测试集中,以全分辨率输入进行推理,分别获得 了107 FPS,75.3% mIoU 和 195 FPS,75.8% mIoU 的性能表现。
被录取的两篇文章第一作者均为陈雷同学。这两项研究均得到了国家自然科学基金地区项目、内蒙古自然基金面上项目、必赢唯一官方网站高层次人才科研启动项目以及内蒙古自治区本级引进人才项目的支持。