作为2024年服贸会重要组成部分之一,国家卫生健康委员会百姓健康频道(CHTV)定于9月13日在京举办“2024首都国际医学大会的平行论坛——数智医疗与医学人工智能创新论坛”。近日,吕乐博士带领团队研发的LN-DETR模型在淋巴结检测取得突破,显著提升诊断的准确性和效率。
淋巴筛查,一个需要解决、但一直没有得到解决的问题,尤其是在医学影像分析领域,淋巴结(LN)的准确检测对于癌症的诊断、分期和治疗策略至关重要。为此,吕乐博士已致力于相关研究长达十一年。
在三维计算机断层扫描(3D CT)图像中,LN的识别受到其分散性、低对比度及与周围解剖结构相似性的影响。吕乐博士曾在2014发表了关于2.5D新型淋巴结检测显示方法的研究文章,“A New 2.5D Representation for Lymph Node Detection using Random Sets of Deep Convolutional Neural Network Observations”,入选了MICCAI 2014,同时也是MICCAI 2018年会上获得当年唯一一篇young researcher publication impact award五年最有影响力论文奖。
随后,“Improving Computer-aided Detection using Convolutional Neural Networks and Random View Aggregation”的研究文章,也被收录MICCAI 2014会议文章的期刊扩展版。
在今年,吕乐博士沿用了此前的研究思路,带领阿里巴巴达摩院医疗AI团队联合多家知名高校与医院,提出了一种创新LN检测模型——LN-DETR,目前已经被计算机视觉的三大会议之一ECCV(欧洲计算机视觉会议)2024接收,其扩展版也被医学影像年度顶会MICCAI 2024接收。
01
▼
深度融合2.5D特征,精准捕捉淋巴结三维信息
为提升LN检测的准确性,研究团队通过强化2D骨干网络,并结合多尺度2.5D特征融合技术,以明确地结合整合3D上下文信息。
多尺度2.5D特征融合方法,允许模型同时处理和分析不同尺度的2D图像特征,进而构建出更为丰富的3D空间表示。这样的设计使得模型不仅能够捕捉到LN在单个切片上的局部特征,还能够理解其在邻近切片中的连续性和空间分布,从而更全面地理解LN的结构和位置。此外,这种技术还可有助于模型在处理具有相似图像特征的周围组织时,减少误判可能性。
通过这种方式,LN-DETR模型能够更准确地区分LN和其他组织,提高检测的特异性和敏感性。
02
▼
创新技术,提高模型识别LN的准确性
LN边界模糊是检测中的一个难题。为此,研究团队在LN-DETR模型中引入了创新技术——IoU预测头和位置去偏查询选择机制。
IoU预测头通过评估模型预测的LN区域与实际区域的重叠程度,为模型提供了直接优化目标,使其在训练中更加关注定位精度高的查询;位置去偏查询选择机制则结合了分类置信度(哪些区域最有可能是LN)和IoU预测(这些区域与实际LN的吻合程度),有效地平衡了这两方面的考量,帮助模型挑选出最可靠的LN候选区域。
此外,LN-DETR还采用了查询对比学习策略,通过构建正负样本对,强化了模型对LN与真实LN匹配度的学习,同时降低了与非LN区域的关联。这种对比学习的方法,让模型在“视野”中更加突出真实的LN查询,减少了假阳性结果,提高了检测的特异性。
注:该模型的改进包括在编码器和解码器中集成了位置去偏查询选择模块,以及一个查询对比学习模块,这些模块可以增强模型对淋巴结候选区域特征的理解和表达,以便更准确地识别真正的淋巴结,并区分它们与附近的假阳性或重复查询。
LN-DETR模型的整体架构由一个配备多尺度2.5D特征融合的CNN骨干网络以及变换器编码器和解码器组成
03
▼
多中心淋巴结CT数据,提供全面学习场景为了构建一个全面且具有代表性的LN检测模型,研究团队汇集了7个LN检测数据集,包含了来自1067名患者的CT扫描数据,用于训练和测试LN-DETR模型。这些数据覆盖了人体的关键部位,如颈部、胸部和腹部(为常见病变区域),以及头颈癌、食管癌、肺癌等多种疾病类型。
其中,5个数据集用于模型的开发和内部测试,而剩下的2个数据集用作独立的外部测试集,以验证模型的泛化能力(表1)。通过这种方式,研究团队能够全面评估LN-DETR模型的性能,并确保其在实际临床应用中的有效性。
表1 7个淋巴结检测数据集的统计信息
注:NIH-LN是一个公共数据集,其他数据集是来自五个不同临床中心的内部收集数据集。HN、Eso和Mul.分别代表头颈癌、食管癌和多种类型的疾病。
04
▼
数据验证显示LN-DETR卓越的检测能力
LN-DETR在多中心临床数据集上展现了卓越的LN检测能力,平均召回率达到56.27%,相比现有技术提升了4%~5%,尤其在维持低假阳性率方面表现突出。同时,模型在外部测试集上也表现优异,平均召回率为52.04%,证实了模型良好的泛化和实用性。
其中,LN-DETR采用的多尺度2.5D特征融合技术,2.5D特征融合将性能提高了1.08%的平均召回率(51.32%提高至52.40%);查询对比学习和单独的位置去偏查询选择可以分别提高淋巴结检测平均召回率1.04%(52.40%提高至53.44%)和2.11%(52.40%提高至54.51%),见表2。
表1 研究中提出的多尺度2.5D融合、去偏查询选择和对比学习有效性的消融测试结果
在NIH DeepLesion数据集的通用病变检测任务中,LN-DETR以88.46%的平均召回率领先(表3),显示了处理多样化医学影像数据时LN-DETR的泛化能力,同时,也预示着在更广泛临床应用中的潜力。
表3 在NIH DeepLesion测试数据集上的定量结果05
▼
结语
自2014年吕乐博士致力于攻克淋巴结检测的临床挑战以来,今年LN-DETR模型在该领域取得了显著的进展。这一创新模型的开发,不仅为临床诊断和治疗开辟了新途径,也预示着未来医疗服务将更加精准和高效
人工智能技术的迅猛发展预示着其在医疗领域的应用将日益广泛,预计不久的将来,AI技术将在提高医疗质量和改善患者体验方面发挥更加关键的作用,为全球健康事业贡献重要力量
参考文献
QINJI YU, YIRUI WANG, KE YAN, et al. Effective Lymph Nodes Detection in CT Scans Using Location Debiased Query Selection and Contrastive Query Representation in Transformer[J]. ArXiv abs/2404.03819 (2024): n. pag.
编辑:耳东
二审:石头
三审:清扬
排版:半夏
封面图源:医学论坛网