医疗人工智能 (AI)在识别视网膜图像中的健康状况迹象以及加快眼部疾病和全身性疾病的诊断方面具有巨大潜力。然而,开发人工智能模型需要大量的标注,而且模型通常针对特定任务,对不同临床应用的通用性有限。在此,我们提出了一种视网膜图像基础模型——RETFound,它能从无标注视网膜图像中学习具有代表性的特征,并为多个应用中的高效标注模型适配提供了基础。具体来说,RETFound是通过自监督学习[1]的方式在160万张无标签视网膜图像上进行训练的,然后适应于带有明确标签的疾病检测任务。我们的研究表明,经过调整的RETFound在威胁视力的眼部疾病诊断和预后以及复杂系统疾病(如心力衰竭和心肌梗塞)的事件预测方面始终优于几个比较模型,而且标记数据较少。RETFound为提高模型性能和减轻专家标注工作量提供了可推广的解决方案,从而使视网膜成像技术在临床人工智能领域得到广泛应用。
图1:开发和评估基础模型(RETFound)的示意图。
第一阶段,通过自监督学习使用来自MEH-MIDAS[4]和公共数据集的CFP[2]和OCT[3]构建RETFound。第二阶段,通过内部和外部评估的监督学习使RETFound适应下游任务。
注:
[1] Self-Supervised Learning,缩写是SSL,自监督学习。一般机器学习分为有监督学习,无监督学习和强化学习。自监督学习是无监督学习里面的一种。自监督学习主要是为了解决数据标注成本高昂的问题而出现的一种机器学习方法,其主要的方式就是通过算法自己监督自己实现。通常分两个阶段实现:第一阶段把模型参数从没有任何标注训练到初步成型,这个过程中使用无标签数据集。第二阶段根据不同的后续任务,用第一阶段输出的带标签数据集把参数训练到完全成型。更多介绍可参考《Self-Supervised Learning 超详细解读 (目录)》。
[2] colour fundus photography,彩色眼底照相。是眼科中比较常用眼底检查项目,对眼科疾病的早期诊断有重要作用。更多介绍可参考《一文概览眼底照相机发展历程》和《了解眼底图像,看这篇就够了!》。
[3] optical coherence tomography,光学相干断层扫描。是一种非侵入式光学成像技术,可提供实时、1维深度、2维截面或3维立体图像,分辨率可达微米量级(~um),成像深度为毫米量级(~mm)。更多介绍可参考《光学相干层析成像(OCT)的原理及应用浅析》。
[4] MEH-MIDAS是一个回溯数据集,包括2000年1月至2022年3月期间在莫菲尔德眼科医院(Moorfields Eye Hospital)就诊的37401名糖尿病患者的完整眼部成像记录。
BMEN202310280003
来源:Nature
标题:A foundation model for generalizable disease detection from retinal images