论文名称:WFDENet: Wavelet-based frequency decomposition and enhancement network for diabetic retinopathy lesion segmentation
论文作者:李萱,马丁,邬向前
论文链接:https://doi.org/10.1016/j.patcog.2025.112492
近日,哈工大多模态智能及应用研究中心(MAIA)的研究团队在国际权威期刊《Pattern Recognition》上发表了一项创新性研究成果,提出了一种基于小波频率分解与增强的网络模型(WFDENet),在糖尿病视网膜(以下简称糖网)病变分割任务上达到了最先进的性能。
1.研究动机
糖网病变是糖尿病最常见的眼部并发症,也是导致成年人视力受损和失明的主要原因之一。糖网病变的准确分割有助于糖网病变的早期诊断。糖网病变分割存在目标相似度高的难题,例如出血、微动脉瘤和血管均为红色目标(见图1第一行)。此外,微小病变分割和边界勾勒也极具挑战(见图1第二行)。解决上述挑战的一种有效方式是设计能够捕捉精确的语义和细节信息的模型。

图1:本文方法与WSRFNet的定性示例。其中比较区域是眼底图像(a)中绿色框标记的区域。用红色、绿色和蓝色边缘标记或填充这些颜色的区域分别是硬性渗出物、出血和微动脉瘤。在比较区域的真实标签(b)中,白色实线框标记的是具有挑战性的病变。在(c)和(d)中,白色虚线框标记的是漏检和误检区域。黄色虚线框标记的是分割边界精度较低的区域。
为了获取含有准确语义和细节的特征,现有的方法注意到高层次和低层次编码器特征分别包含丰富的语义和细节信息,因而大多致力于设计精妙的多层次特征细化和融合方法,如图2(a-c)所示。

图2:用于捕获语义和细节的糖网病变分割方法的架构对比。(a)基于多层次特征融合的方法。 (b)基于特定任务编码器的方法。 (c)基于空间域多层次特征细化的方法。 (d)基于小波频率分解与增强的方法(本文的方法)。
然而,上述方法忽略了对多层次特征内在低频和高频信息的探索,而这些信息同样能够描述语义和细节。为了增强多层次特征内在的低频和高频信息,本文提出了基于小波的频率分解与增强网络(WFDENet),主要贡献如下:
WFDENet利用低频增强器(LFB)和高频增强器(HFB)分别增强多层次编码器特征的低频和高频分量,以获取优质的语义和细节信息。
在 HFB 中,本文设计了一个的复数卷积频率注意力模块(CCFAM),该模块利用动态复数通道和空间注意力在傅里叶域中增强高频特征。
本文在流行的糖网数据集上进行了充分的实验,结果表明所提出的 WFDENet 模型优于当前最先进的模型。
2.研究方法
(1)整体架构
图3展示了本文的整体架构,它由五个部分组成,包括一个基于CNN的编码器、基于小波的高低频分解器(WHLFD)、低频增强器(LFB)、高频增强器(HFB)和分割解码器(SD)。

图3:本文的流程图。
(2)低频增强器
低频增强器(见图3(c))利用多尺度信息融合增强每个层次特征的低频分量,从而强化模型的语义理解能力。
(3)高频增强器
高频增强器(见图3(d))通过两个步骤增强每个层次编码器特征的高频分量:1)第一步是利用复数卷积频率注意力模块(CCFAM)在傅里叶空间中增强关键特征并减少噪声(见图4)。2)第二步是利用多尺度信息进行细化。

图4:复数卷积频率注意力模块的架构。
(4)分割解码器
本文的分割解码器(SD),通过整合相邻编码器特征来进一步增强语义和细节信息,并聚合增强后的多层次特征用于预测,如图5所示。

图5:分割解码器的结构图。
3.实验结果
本文在两个流行的数据集上进行评估,即IDRiD和DDR,分别如表1和2所示。本文在两个数据集上的主要评价指标(mAUPR、mDice、mIoU)都达到了最先进的结果。

表1:在IDRiD数据集上与现有方法的定量比较。

表2:在DDR数据集上与现有方法的定量比较。
此外为了验证泛化能力,本文使用DDR训练集训练模型在IDRiD测试集进行测试。从表3可以看出,与现有方法相比,本文的WFDENet取得了最佳的mAUPR值。

表3:泛化性研究。
此外,本文还评估了WFDENet的计算效率。如表4所示,本文的模型在计算效率方面实现了最佳性能。

表4:模型复杂度比较。
同时,本文与现有方法做了定性比较如图6所示。从图6可以看出本文方法获得了最好的分割效果。

图6:DDR数据集上的定性比较。
4. 未来展望与临床意义
本文提出的方法通过频域的创新处理,实现了对糖网病变更精准的分割。这种频率域增强策略也有望扩展到其他医学影像分析任务中。该技术的进一步发展,将为糖网病变的早期筛查和诊断提供更可靠的工具,助力眼科疾病的精准诊疗。
