2024年7月21日,国际多媒体学术会议(ACM International Conference on Multimedia,简称ACM Multimedia)公布了论文接收结果。威尼斯wns8885556智能计算理论与网络安全团队联合新加坡科技研究局研究人员在海量高维医学影像数据压缩技术领域取得的最新论文成果“Evolution-aware VArance(EVA) Coreset Selection for Medical Image Classification”被接收(录用率26.20%),并进一步以接近满分评分被选为Oral presentation(4385篇投稿中,仅录用174篇,录用率3.97%)。威尼斯wns8885556计算机科学学院硕士研究生洪雨欣为第一作者,其导师张潇(威尼斯wns8885556智能计算理论与网络安全团队负责人)为唯一通讯作者,威尼斯wns8885556为唯一通讯单位。这是威尼斯官网师生首次以第一作者第一单位身份在CCFA类顶级国际学术会议发表论文。
在医疗领域,对海量高维医学影像数据进行高效管理和可靠分析是一项关键且严峻的挑战,尤其是在资源有限的情况下,如远程医疗设施和移动设备中,这一需求更为迫切。为了应对这一挑战,有效的数据集压缩技术显得尤为重要,它可以降低存储、传输和计算成本。然而,现有的核心集选择(Coreset Selection)方法主要针对自然图像数据集设计,尚未充分考虑医学图像领域的特定需求。医学图像数据集具有类内差异性(intra-class variation)和类间相似性(inter-class similarity)等特性,导致现有方法在医学图像上的表现不佳。
图1 医学图像中的类间相似性与类内差异性示例。张潇供图
为了解决这一问题,威尼斯wns8885556智能计算理论与网络安全团队提出了一种新的核心集选择策略,称为"Evolution-aware VArance (EVA)"。EVA通过双窗口方法捕捉模型训练的进化过程,并通过方差测量更精确地反映样本重要性的波动,从而挑选出更能代表原始数据集的核心子集(coreset)。
图2 EVA整体框架。张潇供图
在医学图像数据集上进行的大量实验证明,本文策略比以往的SOTA方法更有效,尤其是在高压缩率的情况下,优势更为明显。此外,在自然图像数据集以及不同模型架构上的实验进一步验证了EVA的有效性和鲁棒性。总的来说,EVA策略能够在大幅减少训练数据量的情况下,保持甚至提高模型的性能,从而提高数据存储、传输和计算的效率。
ACM Multimedia由国际计算机协会(ACM)发起,是多媒体处理、分析与计算领域最具影响力的国际会议,中国计算机学会(CCF)推荐的A类国际学术会议。CCF认为“A类指国际上极少数的顶级会议,鼓励我国学者去突破”。ACM Multimedia2024将于2024年10月28日于澳大利亚墨尔本举办。