近日,医学信息与工程学院单东晶团队,在模式识别权威期刊《Pattern Recognition》上发表研究论文,提出一种名为MCF-UNet的多层级上下文融合网络,用于免疫组织化学图像中Ki67阳性细胞的自动分割。该方法针对传统U-Net在处理细胞尺度剧烈变化、弱染色边界模糊以及复杂组织背景干扰时的建模不足,设计了三个核心模块。
首先,团队构建了混合CNN-Transformer编码器,其中Multi-scale Morphology Awareness(MSMA)模块采用三个并行深度可分离卷积(核尺寸5×5、7×9、9×9)提取多尺度局部形态特征,随后与Swin Transformer的窗口自注意力机制级联,实现局部纹理细节与全局上下文依赖的联合建模。其次,在跳跃连接处引入Mask-guided Dynamic Feature Fusion(MDFF)模块:将深层语义特征、浅层结构特征与解码器当前特征按通道分组,利用粗分割掩码作为空间注意力先验,自适应学习每组中浅层与深层特征的融合权重,从而抑制背景噪声、增强弱边界响应。最后,在瓶颈层设计Multi-receptive Field Optimization(MRFO)模块,将输入特征沿通道维度四等分后分别采用扩张率1~4的深度可分离空洞卷积,再按通道索引跨尺度重组并经过逐点卷积融合,实现多感受野上下文的高效聚合。
在CC-Ki67(宫颈癌)和BCData(乳腺癌)两个数据集上的实验表明,MCF-UNet的Dice系数分别达到90.34%和76.24%,mIoU达到82.38%和61.60%,显著优于U-Net、TransUNet、Swin-UNet等基线。消融研究验证了MSMA、MDFF、MRFO各自对性能的贡献,且MDFF模块带来的增益最为显著。该网络参数量为45M,在RTX 3090上推理速度为12 FPS,适用于病理图像的离线批处理分析。未来工作将聚焦于知识蒸馏与量化加速,以及向全切片图像(WSI)的端到端扩展。