2025 年 3 月 4 日,来自全球 6 个国家的研究团队展开联合研究,并在国际知名学术期刊《视网膜与眼科学进展》(PROGRESS IN RETINAL AND EYE RESEARCH)上发表了题为《眼组学:当前概念与证据》(Oculomics: Current Concepts and Evidence)的综述研究。
该研究的通讯作者是来自北京清华长庚医院眼科中心/BERI 黄天荫教授。此次跨国合作汇聚了全球多个顶尖研究团队的力量,共同为眼科学领域贡献了新的见解和成果。
澳大利亚:澳大利亚眼科研究中心、墨尔本大学眼科学系、莫纳什大学视觉研究中心、弗洛里神经科学与心理健康研究所等。
英国:伦敦大学学院Moorfields眼科医院NIHR生物医学研究中心、剑桥大学眼科基因组学实验室、伯明翰大学视觉与认知研究中心等。
爱尔兰:都柏林大学学院神经视觉研究中心等。
眼睛为全身健康以及系统性疾病的发生和发展提供了新的见解。在过去十年中,越来越多的证据表明,眼睛的结构和功能可以反映多种全身健康状况,尤其是在心血管疾病、神经退行性疾病和肾脏损伤方面。这促成了眼组学(oculomics,或眼科学组学)这一领域的诞生——即应用眼科生物标志物来理解机制、检测和预测疾病。这一领域的发展得益于三大进展:1)高分辨率、非侵入性眼科成像技术的可用性和广泛临床应用(“硬件”);2)大型研究的可用性,以探究相关性(“大数据”);3)包括人工智能(AI)在内的新型分析方法的开发(“软件”)。眼组学为我们提供了加深对眼睛与全身相互作用的理解的机会,同时也支持了创新性诊断、预后和治疗工具的开发。这些进展进一步得益于人工智能的发展,以及将眼部影像数据与全身健康数据相链接的大规模联合数据集。眼组学能够检测、筛查、诊断和监测许多全身健康状况。此外,结合人工智能的眼科学组学可以预测系统性疾病的风险,实现风险分层,为预防或个体化风险预测和预防开辟了新的途径,促进个性化医疗的发展。在本综述中,我们总结了眼组学领域的当前概念和证据,强调了已取得的进展、仍存在的挑战以及未来研究的机遇。
图1. 眼睛作为全身健康窗口的示意图
将眼睛视为健康窗口的生物学基础源于其与其他器官在胚胎起源、解剖特征和生理特性方面的相似性。从胚胎学角度看,视网膜起源于间脑,从中枢神经系统延伸而来,这意味着视网膜血管的变化可能反映大脑血管中发生的变化。解剖学上,视网膜血管与脑循环相似,视网膜神经元的轴突通过视神经和中枢视觉通路与视觉皮层相连。生理学上,肾脏中参与血管内皮功能障碍的肾素-血管紧张素-醛固酮级联反应在眼睛中也处于活跃状态。有趣的是,眼睛的相对免疫豁免特性,包括其血视网膜屏障和下调的免疫反应,使其免受炎症的侵害。然而,全身性疾病可能会破坏这些屏障,从而导致眼部问题。例如,白塞病和其他形式的葡萄膜炎会破坏这种免疫豁免,导致眼内炎症。研究还发现,在视网膜病变患者中存在肝脏来源的蛋白质,以及在青光眼中肠道来源的免疫细胞会诱导神经节细胞损伤,这表明眼部疾病和全身疾病之间存在共同的病理生理机制。
1.2. 眼睛作为全身健康窗口的概念演变
1.2.1. 19世纪中叶:检眼镜的发明
眼睛作为全身健康窗口的概念可以追溯到19世纪中叶(图2)。检眼镜的发明使得人们能够直接观察视网膜。早期的观察发现,视网膜微血管特征与高血压、肾脏疾病和脑血管疾病之间存在关联。1939年,Keith等证实视网膜微血管异常的严重程度可以预测高血压患者的死亡率。随后的研究进一步探讨了视网膜病理与全身状况之间的相关性,包括高血压、肾脏疾病、心血管疾病、脑血管疾病、阿尔茨海默病、中风和死亡率。
图2. 眼睛作为全身健康窗口的概念演变
(图中包含Tien Yin Wong提供的IVAN图像和Carol Y. Cheung提供的SIVA图像)
1.2.2. 20世纪90年代末至2000年代初:数字眼底摄影和光学相干断层扫描
随后的阶段发生在20世纪90年代末至2000年代初,随着数字眼底摄影技术的发展,视网膜评估从主观的定性分析转变为客观的定量评估。
这种先进技术迅速被纳入大规模人群队列研究。在美国,动脉粥样硬化社区研究(ARIC)、心血管健康研究(CHS)、多民族动脉粥样硬化研究(MESA)以及Beaver Dam眼科研究均采用了新的眼底摄影技术。同样,澳大利亚的蓝山眼科研究和荷兰的鹿特丹研究也利用眼底摄影技术研究视网膜变化与多种全身疾病之间的关联。这些大规模队列研究不仅验证了数字眼底摄影在人群水平上的可行性,还为探索视网膜与全身健康之间的关系提供了宝贵的数据。光学相干断层扫描(OCT)的出现进一步实现了视网膜结构的深度分辨可视化,为研究视网膜神经退行性病变与全身疾病之间的关联奠定了基础。
1.2.3. 2000年代-2015年:半自动化的计算机辅助测量与诊断
从2000年代开始,眼科成像从手动评估转变为半自动化的计算机辅助测量。例如,IVAN(Integrative Vessel Analysis)和SIVA(Singapore I Vessel Assessment)等软件的开发,使得视网膜微血管特征的评估更加高效和标准化。例如,IVAN被应用于Beaver Dam眼科研究和新加坡马来眼科研究,揭示了视网膜微血管特征与高血压和心血管疾病(CVD)等全身疾病之间的关联。然而,这些半自动化软件系统依赖于专家级人类视网膜图像分级员的耗时输入,这凸显了完全自动化、人工智能驱动的视网膜图像分析技术的需求。
1.2.4. 2015年至今:人工智能在视网膜图像分析中的应用
大约在2015年,随着人工智能(AI)在视网膜图像分析中的应用,出现了变革性的第四阶段。强大的计算能力、不断发展的模型和大型数据集的出现,使得人工智能,尤其是深度学习(DL)技术,在视网膜图像分析中取得了显著的性能,有望彻底改变眼部疾病的筛查、诊断和管理方式。这一领域引起了科学界和大众媒体的广泛关注,因为人工智能对大量视网膜图像数据的分析能够识别出超出人类感知范围的图像特征和疾病关联。本综述的重点是使用人工智能技术在这一领域取得的进展。
1.3. 视网膜成像技术(“硬件”)
视网膜成像技术的快速发展提高了图像分辨率和可及性。这些创新使得大规模、快速、轻松地探索眼部结构成为可能。常用的眼底成像方式包括眼底摄影、光学相干断层扫描(OCT)和光学相干断层扫描血管成像(OCTA)。图3展示了这些成像技术的多模态示例。
图3. 一位48岁健康女性的多模态视网膜成像。以黄斑为中心的彩色眼底照片(A1)和以视盘为中心的彩色眼底照片(A2)。横断面光学相干断层扫描(OCT)图像,清晰显示各个视网膜层(B)。以黄斑为中心的光学相干断层扫描血管成像(OCTA)图像,显示黄斑中心凹无血管区(C1),以及以视盘为中心的OCTA图像(C2)。
1.3.1. 彩色眼底摄影(CFP)
CFP是最常用的成像技术,用于拍摄视网膜的彩色照片(图3A)。典型眼底相机的光学设计基于单眼间接检眼镜的原理,利用瞳孔进行照明和成像光束。它可以用于捕捉视网膜血管的定性特征(例如,视网膜病变)和定量特征(例如,血管口径、迂曲度),并作为图像分析计算机软件(如SIVA、IVAN、VAMPIRE、AutoMorph)的输入数据。
1.3.2. 光学相干断层扫描(OCT)
OCT是一种基于低相干干涉测量的高分辨率成像技术,可用于视网膜的非侵入性活体光学活检(Aumann等,2019)(图3B)。OCT的出现极大地推动了对视网膜微结构的定量(例如,视网膜亚层厚度)和定性(例如,反射率)特征的评估。近年来,从时域OCT向频域OCT(SD-OCT)的演变实现了更高的扫描速度、更高的轴向分辨率和更低的测量变异性。重要的是,随着图像处理技术和正常值数据库的进步,现在可以进行详细的视网膜神经细胞分析。内置的分割算法有助于从OCT扫描中提取视网膜厚度信息。
1.3.3. 光学相干断层扫描血管成像(OCTA)
作为OCT的功能扩展,OCTA以更详细、深度分辨的方式提供了视网膜血管的有价值信息(图3C)。通过比较视网膜内重复的结构图像,OCTA可以检测到反映红细胞运动的运动区域,并随后生成高分辨率的血流图,类似于血管造影。OCT和OCTA的发展彻底改变了视网膜研究,提供了微观分辨率的成像,能够清晰显示视网膜的细胞层以及毛细血管水平的微血管。
1.4. 包括眼部与全身健康数据的大型数据集(“大数据”)
大多数医疗机构拥有从数万到数千万次扫描的眼底成像数据。然而,由于获取和可用性方面的障碍,即使有意愿将这些数据用于研究,研究人员也常常无法访问这些数据。眼科成像技术的进步促进了大规模、真实世界数据集的创建,这些数据集整合了眼底图像与临床数据,为探索眼部健康与全身疾病之间的联系提供了宝贵的资源。
高质量的大型数据集,尤其是那些数据标签丰富且详细的数据集,推动了先进统计和计算方法的发展,包括深度学习、大型语言模型和生成模型(Brown等,2024;Zhou等,2023a)。此外,这些数据集还使得人工智能在眼科及相关全身疾病中的应用成为可能,包括图像分割、自动诊断、疾病预测和预后评估等任务(Lamb,1986;Rim等,2020a)。这些创新有望显著提高诊断准确性,改善患者预后,并为眼部与全身健康之间的相互作用提供新的见解。
这些数据集包括英国生物样本库(UK Biobank),涵盖了多种眼部数据,如眼部疾病诊断、屈光不正、习惯性视力、配镜状态、眼底彩色照片、OCT成像,以及广泛的全身健康指标和诊断。美国动脉粥样硬化社区研究(ARIC)的眼部测量包括远视力和近视力评估、对比敏感度以及一只随机选择眼睛的眼底照片。新加坡眼科疾病流行病学研究(SEED)包括全面的眼部检查,如裂隙灯检查、眼压测量、眼底摄影、OCT和OCTA,同时还进行了系统的全身检查。这项研究为新加坡多民族人群的眼部健康提供了宝贵的见解,能够探索不同人群中的眼部和全身疾病关联。其他包含眼部和全身健康数据的研究还包括心血管健康研究(CHS)、多民族动脉粥样硬化研究(MESA)、蓝山眼科研究、鹿特丹研究、Beaver Dam眼科研究、古腾堡健康研究(GHS)、北京眼科研究以及年龄、基因/环境易感性-雷克雅未克研究(表1)。
表1. 关键研究:将视网膜成像与全身健康相关联
1.5. 人工智能(“软件”)
1.5.1. 理解人工智能
人工智能(AI)是计算机科学的一个分支,旨在创建能够模拟人类认知功能(如学习、推理和解决问题)的智能机器。在眼组学中,AI主要涉及机器学习(ML)及其子集深度学习(DL),用于分析眼部影像数据(见图4)。机器学习通过从数据中学习模式并进行预测或决策,而深度学习则利用人工神经网络对数据中的复杂模式进行建模。卷积神经网络(CNNs)是一类深度学习模型,旨在自动且分层地从图像中提取特征,模仿人类视觉系统处理信息的方式。这些模型由多层相互连接的节点组成,能够从大量标记图像的数据集中学习识别模式,例如视网膜血管的变化。
公开可用的眼组学数据集正被来自不同领域的研究人员广泛使用,从流行病学家到计算机科学家。从全球视角来看,这些数据集在推动研究进展方面具有巨大潜力。然而,如同任何数据来源一样,考虑数据的来源和局限性至关重要。一个关键问题是确保数据集中有足够多样化的群体代表性。仅在一个单一人群组上训练的人工智能算法可能无法很好地推广到其他群体,从而可能限制其在更广泛临床环境中的适用性和准确性。这突显了在人工智能模型开发阶段纳入多样化和包容性数据集的极端重要性。通过确保在不同的人口统计学、种族和临床背景中的代表性,研究人员可以增强人工智能系统的稳健性和适用性,最终促使其在现实世界医疗场景中成功部署。
此外,为了深入理解眼组学特征及其与全身生理和病理变化的关系,开展更大规模且随访时间更长的研究至关重要。这类研究不仅能为眼科学组学标志物与全身状况之间的关联提供宝贵的见解,还可能阐明驱动这些关系的潜在机制。这些知识对于将眼科学组学研究转化为能够改善患者预后的临床可操作工具至关重要。
总之,将基于眼组学的人工智能模型成功应用于临床实践——作为最终目标——从根本上依赖于高质量、大规模数据集的可用性。实现这一目标的途径涉及几个关键组成部分:开发多样化且具有代表性的数据集,以确保在不同人群中的普适性;建立严格的基准验证标准,以评估模型的性能和可靠性;以及开展随机对照试验,以评估临床疗效和安全性,无论是否整合人工智能算法。这些步骤每一个都至关重要,以弥合研究与现实世界临床应用之间的差距,确保基于眼组学的人工智能模型能够在医疗环境中提供准确、可靠且可操作的见解。
图4. 人工智能、机器学习和深度学习的层级关系
1.5.2. 深度学习模型的开发
深度学习(DL)的实施涉及多个关键步骤,包括多模态数据输入、预处理、模型训练和具有临床相关性的输出。该过程从数据输入开始,结合眼部成像方式与全身健康数据。随后,原始眼部图像经过归一化处理,以标准化亮度/对比度,接着通过自动分割感兴趣区域来分离与疾病相关的特征。为了扩大有限的训练数据集,还会应用数据增强技术。
在模型训练过程中,深度神经网络(例如卷积神经网络,CNN)学习将预处理后的数据映射到临床结果。通过前向传播和反向传播,网络的权重会不断迭代更新,随后进行参数调整。验证集用于监控模型性能并调整超参数,以减少过拟合并提高泛化能力。在最终的输出阶段,模型预测被转化为可操作的见解,例如二元分类、连续风险评分或可解释性图。例如,Grad-CAM(梯度加权类激活映射)技术通过可视化与AI决策过程最相关的感兴趣区域,增强了模型的可解释性。
为了在多样化的临床任务中评估深度学习模型的性能,研究人员依赖于针对预测类型(例如二元分类与连续风险估计)量身定制的标准评估指标。表2总结了关键评估指标、其定义以及临床解释。例如,虽然接收者操作特征曲线下面积(AUC)为二元分类器提供了全局评估,但精确度和召回率在疾病筛查中平衡了假阳性和假阴性之间的权衡。在回归任务中,平均绝对误差(MAE)和均方根误差(RMSE)等指标用于量化预测误差。
表2. 深度学习模型评估指标总结
尽管深度学习(DL)驱动的分析带来了显著的进步,但仍然存在局限性。不同人群和成像设备之间的数据变异性会影响模型的泛化能力,因此需要在多样化的数据集上进行外部验证。模型的可解释性仍然是一个挑战,因为深度学习模型通常被视为“黑箱”,难以解释单个预测结果。此外,训练数据中的偏差可能导致在不同人群组中疾病检测的不平等。
1.5.3. 大型语言模型(LLM)、基础模型和基于推理的模型的开发
2022年前后,人工智能领域出现了几项重大进展,这些进展超出了深度学习框架的范畴。首先,受《Attention Is All You Need》中提出的Transformer架构的启发,Vision Transformer(ViT)架构将深度学习从卷积神经网络(CNN)转向基于注意力的架构。ViT具有不同的归纳偏差、训练稳定性和数据效率。ViT将整个图像作为更小的图像块序列进行处理,使其能够捕捉全局上下文关系,而不仅仅是依赖于局部特征提取。ViT在视网膜成像中表现出色,尤其是在图像分类任务中。
其次,大型语言模型(LLM)的出现,例如ChatGPT(OpenAI,2021),利用大规模基于文本的数据集生成类似人类的响应。尽管最初是为自然语言处理设计的,但LLM越来越多地被用于多模态任务,整合文本和基于图像的输入。在眼科领域,这些模型为人工智能辅助临床决策、自动化医学报告生成以及增强医患沟通提供了机会。例如,ChatZOC是一个增强型LLM框架,通过整合全面的眼科数据集和评估框架对基础LLM进行了改进。该模型已在临床中部署,并正在多个地点进行试点测试。
第三,基础模型在大规模多模态数据集上进行预训练,然后针对特定医疗任务进行微调。一个显著的例子是RETFound,这是一个在160万张视网膜图像上进行预训练的基础模型。与依赖大量标记数据的传统监督学习方法不同,RETFound在仅用少量标记数据进行微调时,表现出了与完全监督模型相当的性能。这种能力已在预测心力衰竭等全身状况中得到证明。此外,通用医学人工智能(GMAI)展现出在没有特定任务训练的情况下执行多样化医疗任务的能力。例如,VisionFM是一个多模态多任务视觉基础模型,已在检测多达十种常见眼科疾病(包括糖尿病视网膜病变、青光眼和年龄相关性黄斑变性)方面表现出准确性。
最近,基于推理的LLM引起了关注,解决了传统人工智能的一个关键限制——“黑箱”问题。基于推理的LLM,如DeepSeek、OpenAI的o1和o3-mini以及Google的Gemini 2.0,通过引入思维链提示和逐步推理来提高医疗决策中的透明度。这一进步在医疗保健领域尤为重要,因为医生和患者对不透明决策过程的担忧限制了LLM的接受度。
1.6. 眼组学
1.6.1. 定义与范围
“组学”(omics)这一概念反映了生物学各个领域中全面、综合的理解。正如“基因组”代表对遗传信息的整体探索一样,“眼组学”(oculome)这一术语表示对眼部与健康和疾病相关的宏观、微观和分子特征的全面理解。
“眼组学”这一术语首次出现在2020年的一篇名为《通过基于视网膜成像的眼组学洞察全身疾病》的出版物中。作者提出,通过分析可能表明身体其他部位疾病或状况的眼部变化,眼睛可以用作全面的“全身健康窗口”。随着技术的进步和研究的深入,眼科学组学已超越单纯的观察,深入到大数据和人工智能的结合中。本综述聚焦于眼科学组学的狭义定义——利用大数据、人工智能和眼部成像来识别全身疾病的视网膜生物标志物。
1.6.2. 眼组学与其他“组学”的价值
眼组学与其他“组学”领域(如基因组学、蛋白质组学、转录组学、表观基因组学和代谢组学)存在相似之处,这些领域都利用高通量技术来识别潜在的疾病生物标志物(见表3)。眼组学将大数据和人工智能与眼部成像相结合,甚至在全身状况的临床表现之前识别细微的视网膜生物标志物。相比之下,基因组学关注生物体中完整的脱氧核糖核酸(DNA)集合,提供对疾病遗传易感性的见解。蛋白质组学涉及对细胞、组织或生物体中蛋白质结构、功能和相互作用的大规模研究。转录组学关注核糖核酸(RNA)转录本,提供对特定疾病中基因表达和调控的见解。表观基因组学涵盖DNA甲基化、组蛋白修饰和RNA介导的过程,研究这些修饰如何影响细胞功能和生物过程。代谢组学分析生物样本中的小分子代谢物,提供对代谢途径的深入理解,并为全身健康的生理和病理状态提供关键见解。
表3. 眼组学、基因组学、蛋白质组学、转录组学、表观基因组学和代谢组学的比较
作为一门新兴领域,眼组学提供的临床价值远远超出了传统医疗模式的范畴。首先,它为一系列疾病的早期筛查、分级、监测和风险分层提供了一种非侵入性、简单且快速的方法,从而促进了及时的预防和干预。其次,眼组学可以帮助解决健康不平等问题并优化资源配置。视网膜成像设备和基于人工智能的眼组学软件的可及性能够简化疾病检测,潜在地消除了多次支付和复杂人员配置模式的需求。结合及时的干预,这项技术可以减轻疾病负担并节省医疗成本。第三,将基于人工智能的眼组学整合到临床实践中,可以赋予医疗专业人员更精确和个体化的护理能力,考虑患者的具体需求,从而提高治疗结果的质量。最后,除了满足临床需求外,眼组学还为系统性疾病的整体科学理解做出了贡献。这一点在最近的研究中得到了体现,这些研究在房水和泪液中发现了蛋白质组学和代谢组学标志物,这些标志物表明了帕金森病(PD)的发病机制。同样,在多发性硬化症和阿尔茨海默病(AD)患者中,观察到泪液中的脂质和代谢物谱存在显著差异。这些发现强调了眼组学和其他组学技术的潜力,尤其是在它们的快速发展中,揭示系统性疾病的新型生物标志物。
1.7. 综述目的
本综述旨在总结眼组学的当前概念和证据,并突出其为未来研究提供的机遇。
02 当前证据
自2018年以来,眼组学领域已提出具有代表性的研究成果。Poplin等利用来自两个独立数据集的近30万名参与者的视网膜眼底图像进行验证,预测心血管风险因素(包括年龄、性别、吸烟状态等)以及主要不良心血管事件,其表现与目前使用的临床风险评分相当。Rim等随后的研究进一步加强并验证了眼组学估计传统风险因素的能力,该研究纳入来自7个不同亚洲和欧洲队列的超过20万张眼底照片,预测了47种反映不同器官功能的全身生物标志物作为结果变量。此外,在涵盖11个临床场所的多中心研究中进一步证明,眼部外部照片也包含涉及多个器官系统的全身生物标志物的关键信息。
心血管疾病(CVD)是全球死亡的主要原因,由于眼睛与心脏之间的密切关系,已成为眼组学研究的主要焦点。利用来自多民族、多国家数据集的超过20万张视网膜照片的大规模研究显示,视网膜图像可以被深度学习算法用于预测冠状动脉钙化(CAC)评分和心肌梗死,这些预测与传统心血管疾病风险生物标志物相当,例如通过心脏CT扫描测量的CAC和汇总队列方程(PCE)。随着眼组学的不断发展,其应用范围已扩展到多种系统性疾病,包括神经系统疾病、慢性肾脏病(CKD)、肝胆疾病和贫血。一项基于超过1万张来自11个国家不同研究的视网膜照片训练的深度学习模型能够准确检测阿尔茨海默病和痴呆的病理变化。另一项具有代表性的研究由Zhang等开发,利用来自两个独立队列的眼底图像开发了用于CKD检测的深度学习模型。该研究特别值得关注的是,其纳入了通过智能手机相机拍摄的图像,展示了在不同临床环境中进行非侵入性CKD和糖尿病预测的可行性。
这些研究在多个人群基础、多民族数据中开展,显示了眼组学在不同临床环境中的普适性,然而每个模型通常仅针对单一疾病检测任务设计。2023年,Zhou等开发了一个视网膜图像的基础模型,用于多种系统性疾病检测的通用下游任务,开启了大型基础模型与眼组学结合的时代。另一个基础模型为使用多种成像方式诊断和预测多种疾病提供了高效的平台。其开源的模型权重和代码库使其具有高度可扩展性,能够整合更多数据、成像方式和应用。随着这些标志性研究的积累,它们代表了该领域的当前状态,我们正逐渐接近眼组学的全部潜力。
总体而言,利用人工智能(“软件”)的眼组学可以归纳为三个主要框架。第一个框架涉及估计传统风险因素,如年龄、性别和血压,这些是多种疾病的通用风险因素(见表4)。第二个框架专注于替代系统性生物标志物,例如用于动脉粥样硬化的冠状动脉钙化(见表5)。第三种方法涉及检测特定疾病,尤其是影响心脏、大脑和肾脏的疾病(见表6)。
表4. 人工智能在估计传统风险因素中的应用总结
注释:CFP = 彩色眼底照片;OCT = 光学相干断层扫描;BP = 血压;SBP = 收缩压;DBP = 舒张压
a. 包括体脂率、肌肉量、身高、体重、腰臀比等 b. 例如,收缩压高时的敏感性差,舒张压高时的特异性差
注释:CFP = 彩色眼底照片;OCT = 光学相干断层扫描;OCTA = 光学相干断层扫描血管成像;MRI = 磁共振成像;MMSE = 简易精神状态检查;CAIDE = 心血管危险因素、衰老和痴呆发病率;eGFR = 估算肾小球滤过率
a. 定义为左心室舒张末期容积和左心室质量
b. 定义为基于MRI的全球与年龄相关的白质病变评分≥2
c. 定义为eGFR < 90 ml/min/1.73m²
d. 包括中央动脉口径、静脉口径、动静脉比(AVR)
e. 包括分形维度、血管密度、血管段、解剖因素和迂曲度值
f. 包括汇总队列方程(PCE)、Framingham风险评分(FRS)、QRISK3、WHO-CVD风险、动脉粥样硬化性心血管疾病(ASCVD)、10年缺血性CVD风险评分
g. 包括RetiAGE、视网膜年龄差距、LensAge
a. 临床因素包括传统全身疾病风险因素,如人口统计学因素(例如年龄、性别)、健康状况(例如糖尿病、高血压)、生活方式(吸烟、饮酒)等
b. 包括心肌梗死、中风或心血管疾病死亡
c. 包括肾衰竭和糖尿病肾病
2.1. 人工智能在估计传统风险因素中的应用
2.1.1. 人口统计学因素
2.1.1.1. 年龄
从彩色眼底照片(CFP)预测年龄的准确性令人印象深刻,决定系数(R²)或AUC值超过0.9,平均绝对误差(MAE)约为3年。Poplin等的研究纳入超过20万名参与者,其模型的平均绝对误差在3.26年以内。视网膜血管和视盘等关键视网膜特征在预测人口统计学信息方面发挥了重要作用。尽管这些算法的内部表现通常非常出色(R²超过0.8),但在包含新加坡、韩国、中国和英国多样化人群的大型外部数据集中,这些值会降至0.5-0.6(接近随机猜测)。高血压、糖尿病、吸烟和高龄等混杂因素也可能影响年龄预测的准确性。
除了视网膜图像外,人工智能还可通过OCT图像预测年龄,其MAE约为5-6年,表明这种年龄估计在适度误差范围内是可靠的。同样,外眼照片也包含预测年龄的有价值信息。基于眼角和眼前节图像训练的深度学习(DL)模型表现出高准确性,MAE值分别为2.3年和2.8年。然而,用于验证的样本量相对较小,可能限制了这些模型在更广泛人群中的临床应用。为解决多样化人群中外部数据集年龄预测不准确的挑战,以及缺乏同时包含OCT和外眼照片的数据集的问题,迫切需要开发更多公开可访问的数据集。这些数据集应涵盖更广泛的眼组学特征,并确保全球范围内的公平代表性。此外,它们必须遵循公平性、隐私保护和符合监管规范的原则,从而增强眼组学研究及其临床应用中的信任和可靠性。
2.1.1.2. 性别
使用视网膜眼底图像训练以预测性别的AI算法表现出一贯的高准确性。最早使用视网膜眼底照片预测性别的研究报告了0.97的高AUC值。最近,研究人员尝试识别与性别相关的可解释特征,例如视盘-黄斑角、视网膜镶嵌指数、视网膜血管角度和视网膜动脉轨迹。尽管一些算法建议黄斑形态在性别识别中发挥重要作用,但其他研究即使在去除了黄斑区域的图像中也发现性别的高AUC值,并强调了邻近血管区域和脉络膜血管的重要性。结果差异可能归因于图像质量的差异、图像预处理技术的不同以及所使用的特定神经网络架构。此外,未来研究应仔细评估混杂因素和潜在的数据集偏差。
此外,研究人员也在尝试使用其他成像方式(如带有虹膜纹理的眼前节图像)进行性别预测。未来的工作应确保基于眼组学的性别预测模型的准确性和适用性,以便应用于未来的安全监控系统和法医领域。这包括确保模型的可靠性,并使其能够跨多样化的人群和人群组进行推广。
2.1.2. 身体成分测量
由于体质指数(BMI)和身体成分与肥胖相关健康风险、临床结果以及免疫治疗的副作用相关,其测量具有重要意义。眼组学也被应用于预测身体成分测量,但现有算法在预测这些连续变量方面普遍表现不佳。例如,即使在英国生物样本库(UK Biobank)等大型数据集中,从眼底照片预测体脂百分比和BMI的R²值均低于0.2。最近,其他身体成分测量指标(如肌肉量和腰臀比)被认为比BMI更可靠的反映心脏代谢风险和营养状态的指标。然而,对这些生物标志物的预测也显示出低准确性,R²值低于0.5,表明其表现并不优于随机猜测。
尽管如此,模型在跨种族多样化数据集中的普适性仍需进一步改进)。注意力热图显示,AI模型的关注点是非特异性的,这表明身体成分的预测信号可能在视网膜图像中广泛分布。这些发现表明,当前用于身体成分预测的深度学习模型尚未能够识别出包含身体成分信息的特定视网膜区域,或者这些信号是多种因素的复合体,难以分离。
2.1.3. 血压
基于视网膜血管的高血压相关变化(如小动脉狭窄和动静脉交叉压迫),AI模型在预测血压方面表现出不同的性能。对于收缩压(SBP)和舒张压(DBP)的预测,模型表现被认为是可以接受的(R²值为0.24-0.4),但在亚组人群之间存在差异。对于高SBP(超过140 mmHg)的预测,AI模型表现出高特异性但低敏感性,而对于高DBP(超过80 mmHg)的预测则相反,表明模型倾向于低估SBP而高估DBP。来自不同AI模型的注意力图显示,预测SBP时视网膜血管是主要关注点,但对于DBP并未突出显示特定特征。另一个主要问题是,当将AI模型应用于其训练种族群体之外时,准确性会降低。例如,使用英国生物样本库数据训练的AI模型可能在肯尼亚人群中表现不佳,尤其是在长期随访数据中。
2.1.4. 血液学、血糖和血脂参数
眼组学在预测各种血液学指标(如贫血分类、血红蛋白水平、红细胞和白细胞计数、血小板计数和红细胞比容)方面显示出潜力。Babenko等利用来自超过300个地点的145,832名糖尿病患者的图像,训练了一个基于DL的模型,并在包括来自198个额外筛查地点的48,644名患者的四个验证数据集上进行了外部验证。该模型在检测血红蛋白<11.0 g/dL、白细胞<4.0×10³/μL和血小板<150.0×10³/μL方面的准确性分别为73.8%-82.5%、64.5%-71.5%和58.9%-71.0%。
总体而言,AI模型在二元分类任务(例如高血糖和血脂异常检测)中的表现优于预测连续血液学参数。Google Health团队发现,仅基于眼底图像的模型比仅基于元数据的模型更好地预测血红蛋白浓度和贫血水平,贫血预测的准确性达到0.87。
通过分析眼部图像检测血糖水平,有助于发现血管变化和神经损伤。Zhang等的研究是一个里程碑,该研究利用视网膜眼底照片预测血糖水平,作为糖尿病严重程度和进展的指标。该模型使用来自57,672名患者的115,344张视网膜眼底照片进行训练和验证,在内部和外部测试集中显示出良好的结果(MAE为0.65-1.1 mmol/L),并且糖化血红蛋白(HbA1c)与随机血糖之间高度一致。另一个使用EyePACS/LACDHS数据集中的外眼图像的AI模型也显示出良好的预测表现(AUC为70.2%),进一步加强了眼组学在不同图像类型中的价值。
也有研究尝试使用视网膜或虹膜图像预测高胆固醇水平,这可能作为心脏病和中风风险的指标。尽管这种方法为非侵入性脂质检测提供了希望,但目前的研究大多局限于小规模研究。在这些方法能够临床应用之前,需要进一步验证。
2.1.5. 生化指标
通过深度学习利用视网膜照片预测血清生化参数(如电解质水平)的尝试显示出较差的表现,这些参数的R²值低于0.15。然而,在使用外眼照片预测低钙血症(血钙<8.6 mg/dL)方面取得了一些成功,其中一个模型在该任务中实现了超过0.7的AUC值。值得注意的是,从外眼照片中移除瞳孔和虹膜并不会影响模型的准确性,而排除颜色则会使AUC降低约10%。这表明生化信息可能更有效地通过外眼的外观(尤其是巩膜和眼睑)捕获。
2.2. 人工智能在替代全身生物标志物中的应用
2.2.1. 心脏疾病
2.2.1.1. 冠状动脉钙化(CAC)
CAC是国际指南认可的用于动脉粥样硬化性心血管疾病(CVD)风险分层的工具,通常通过非对比多层螺旋计算机断层扫描(CT)检测。然而,由于成本和辐射暴露问题,美国Medicare不覆盖CAC测量。视网膜成像作为一种低成本、无辐射的筛查工具,有望用于区分CVD高危患者的CAC状态。Rim等开发了一个基于视网膜照片预测CAC的DL系统,该系统使用来自韩国、新加坡和英国的216,152张视网膜照片组成的大数据集。该DL系统优于所有其他单一临床参数模型,AUC值为0.742,与CT扫描测量的CAC在心血管风险分层中的表现相当。
其他研究探索了提高CAC评分预测准确性的方法,包括将临床数据与眼底照片结合以及使用双眼视网膜成像。视网膜血管和黄斑被认为是此类预测中的重要区域,因为它们包含了大多数可识别的模式(Son等,2020)。
2.2.1.2. 颈动脉超声和其他基于心血管成像的生物标志物
颈动脉超声评估颈动脉内膜-中层厚度(CIMT)并识别颈动脉斑块特征,这对于预测颈动脉粥样硬化的进展和CVD事件至关重要。DL-FAS模型在韩国的15,408张眼底图像上进行训练,用于预测通过颈动脉超声测量的颈动脉粥样硬化,AUC值为0.713,优于传统的Framingham风险评分。在健康对照组中,与颈动脉粥样硬化相关的信息主要集中在视盘血管区域,尽管这种模式在疾病组中有所减弱。
另一项研究开发了一种AI模型,使用眼底照片和人口统计学数据预测心血管磁共振(MR)指标,如左心室舒张末期容积和左心室质量。该模型显示出高AUC值(0.8),表明视网膜成像作为磁共振成像的更易获取的替代方法的潜力。
然而,收集同时拥有视网膜图像和心脏成像结果(如CAC评分)的患者数据具有挑战性。这一困难限制了研究数量,并阻碍了对未来心脏事件的进一步纵向预测。此外,这些心脏检查仅提供心脏功能的特定方面信息。因此,基于心脏检查结果的预测最终是间接的,并不能全面反映心脏健康的整体状态。
2.2.2. 神经系统疾病
视网膜在血管解剖、血脑屏障、神经解剖和病理生理学方面与大脑具有一定相似性。这些相似性使得眼部图像可以作为某些大脑功能的代理,并用于识别多种神经系统疾病。例如,通过视网膜图像早期检测与年龄相关的白质变化(如白质高信号[WMH])可能对人群筛查有用,从而为认知衰退的早期干预提供机会。据报道,DL模型主要关注黄斑和视网膜血管以检测WMH,表明这些区域对预测白质变化至关重要。
此外,经过训练以预测认知功能的AI系统表现出与传统认知功能测试相当的性能,例如简易精神状态检查(MMSE)和心血管危险因素、衰老和痴呆发病率(CAIDE)痴呆风险评分。这些AI模型比传统认知测试提供了更简单、更标准化的临床工作流程,因为它们仅需要眼底照片。
大脑功能高度复杂,当前的眼组学方法主要反映认知功能障碍。例如,眼底驱动的微视野检查不仅评估视网膜的功能状态,还评估整个视觉系统,研究表明视网膜敏感性与大脑组织丢失的地形参数(如总灰质体积、皮层厚度和海马体积)以及2型糖尿病患者认知障碍的大脑低代谢相关。然而,这些方法目前还无法与运动功能、行为和情绪等方面联系起来。此外,AI技术仍需要与更详细和更广范围的成像相结合,以全面表征和预测各种人脑状态。这种整合可能为深入了解不同脑区及其功能提供更深入的见解。
2.2.3. 肾脏功能
探索通过视网膜图像评估肾脏功能的深度学习应用,例如检测肾功能受损(估算肾小球滤过率[eGFR] <90 ml/min/1.73m²),得出了混合结果。在视网膜瘢痕、视网膜下液或视盘水肿的病例中观察到假阳性,可能限制了这种方法的临床应用。另一个从视网膜照片预测血清肌酐浓度的DL模型在验证中显示出0.38的R²值,表明其预测性能中等,但大部分变异仍未得到解释。尽管DL在从眼底图像预测肾脏功能方面显示出一定能力,但这些发现表明其在特定肾脏参数的临床应用中具有局限性。
几项横断面研究强调了异常肾脏功能与OCT参数之间的关联。LIFE-Adult研究涉及8952名个体,发现视盘周围视网膜神经纤维层厚度变薄与肾功能受损(通过胱抑素C和eGFR评估)相关。在其他研究中,脉络膜变薄与微血管结构和功能改变的生物标志物变化相关。几项研究发现,脉络膜在eGFR较低和蛋白尿较高的个体中更薄,独立于临床风险因素,强烈暗示了微血管功能障碍。然而,通过OCT预测肾脏功能仍然是一个挑战。肾功能受损患者的视网膜和脉络膜厚度变化是非特异性的,且训练数据有限。
2.2.4. 肝脏功能
肝脏分泌多肽进入血液,包括调节体内铁水平的铁调素。即使在完整的血视网膜屏障存在的情况下,血浆铁水平升高也可能导致视网膜铁积累。然而,对视网膜照片的DL分析在预测某些肝功能生物标志物(如γ-谷氨酰转移酶和丙氨酸氨基转移酶[ALT],外部测试集中的R²≤0.10)方面显示出有限的效果。同样,外眼照片在预测ALT水平异常方面的准确性有限,AUC值约为61.7%,低白蛋白水平的AUC为77.0%。需要进一步研究以阐明为什么某些肝功能生物标志物可以通过眼组学预测,而其他则不能,并为基于眼组学的肝病预测建立科学基础。
2.2.5. 甲状腺功能
甲状腺相关眼病(TAO)是Graves病和其他甲状腺疾病患者中常见的自身免疫性疾病。已开发出放射组学模型以协助诊断、分期、分级和对TAO的治疗决策。然而,探索基于眼组学的AI检测甲状腺功能或甲状腺相关抗体的研究仍然有限。在Babenko等的研究中,使用外眼照片训练的AI模型预测促甲状腺激素(TSH)水平升高,准确率为62.5%,略高于60.5%的基线表现。未来的研究应深入探讨TSH和甲状腺激素如何影响眼组学,为使用AI驱动的TAO诊断和治疗策略的进步铺平道路。
2.2.6. 视网膜血管参数
历史上,测量视网膜参数依赖于半自动分割和人工校正,这需要人工参与并引入不一致性。AI的出现简化了这一过程,使得视网膜血管参数(包括视网膜血管口径和迂曲度特征)的自动测量快速且可靠。通过对视网膜血管结构的详细评估,研究人员可以识别出与全身疾病(包括CVD、中风、认知障碍和肾脏疾病)相关的特定眼组学特征。
2.2.6.1. 视网膜血管口径
视网膜血管口径是评估全身血管特征的重要参数。最初,测量视网膜血管口径的想法涉及使用AI在眼底照片和OCT/OCTA中进行准确的血管分割,然后基于分割后的血管进行测量。视网膜血管分割方法包括监督方法(例如贝叶斯方法、支持向量机、随机森林)和非监督方法(例如高斯混合模型、模糊C均值、K均值聚类)。最近DL的进步显著提高了血管分割和测量的准确性。例如,全卷积神经网络和三阶段深度学习模型以及生成对抗网络通过生成合成视网膜图像(尤其是具有视网膜病变的图像)增强了分割效果。研究人员开发并验证了SIVA深度学习系统,以自动测量视网膜血管口径而无需分割。使用这种方法,研究团队将基线时较窄的视网膜小动脉口径与痴呆风险增加联系起来。
2.2.6.2. 视网膜血管迂曲度
视网膜血管迂曲度的评估反映了血管网络的几何复杂性和自相似性,这对于理解广泛的疾病中的血管变化很重要。然而,目前尚无视网膜血管迂曲度的标准化定义。从彩色眼底图像中手动或半自动测量血管迂曲度是复杂且耗时的,需要对多个视网膜拓扑特征进行细致的测量。
分形维度(FD)作为反映视网膜血管整体分支模式的生物标志物,已被证明对检测亚临床全身状况具有价值。DL模型已开发用于从眼底照片中分割视网膜微血管并测量FD。DL模型还在分析各种视网膜拓扑特征(如血管密度、血管段、解剖因素和迂曲度值)方面表现出色,其准确性与临床专家相当。尽管可以从单张眼底照片中提取数百个视网膜参数,但将这些参数与临床结果联系起来仍然是一个挑战。需要先进的分析方法和综合方法,以充分发挥这些视网膜参数在临床实践中的潜力。
2.2.7. 风险评估工具
2.2.7.1. 心血管风险评分
准确的风险分层对于识别和管理CVD风险个体至关重要。目前,已开发出各种风险评估工具,例如汇总队列方程(PCE)和Framingham风险评分(FRS),以估计未来CVD风险。然而,这些方法在资源有限的地区可能具有挑战性,因为需要进行侵入性测试和多次主观输入。眼组学提供了一种自动、快速且非侵入性的心血管风险评估方法。
Reti-CVD是一个基于CAC预测模型(RetiCAC)构建的工具,已在包括英国和韩国在内的多民族人群中得到验证,显示出与传统风险评分在识别中高CVD风险个体方面具有高度可比性。此外,包括颈动脉粥样硬化、冠状动脉钙化水平、动脉僵硬度和视网膜血管口径在内的其他血管健康信息可以增强个体化CVD风险预测。由于不同种族群体之间的差异,在训练针对现有CVD风险评估工具的算法时应考虑人群背景。最近的研究进一步提供了在初级保健环境中实施基于AI的视网膜CVD风险评估系统的现实世界证据。Hu等通过一项实用主义试验表明,一个自动化的AI辅助系统成功地为超过95%的初级保健患者实时生成了rpCVD风险评分,其预测表现与世界卫生组织(WHO)CVD风险评分相当,并且具有高水平的患者和医生接受度。这些发现支持了将眼组学技术从“代码”转化为“实践”的潜力。
2.2.7.2. 衰老评分
实际年龄与生物学年龄之间的差距突显了有效生物学衰老指标的重要性。DL在预测实际年龄和生物学年龄方面显示出潜力,误差为3-5年。Nusinovici等开发了“RetiAGE”,这是一个基于视网膜照片的DL模型,用于预测个体≥65岁的概率。RetiAGE评分,作为生物学衰老的指标,与死亡率和发病率的风险增加相关。在此基础上,Nusinovici等引入了一个基于DL的标记“RetiPhenoAge”,它整合了视网膜图像和表型年龄生物标志物以预测发病率和死亡率。RetiPhenoAge与全因死亡率(风险比[HR] 1.92)、心血管疾病死亡率(HR 1.97)、癌症死亡率(HR 2.07)和CVD事件(HR 1.70)显示出稳健的关联,优于其他衰老标记物,如握力、端粒长度和体力活动。
Zhu的研究团队提出了“视网膜年龄差距”作为基于彩色眼底图像的生物学衰老的衡量标准。视网膜年龄差距每增加1岁,与全因死亡率风险增加2%和非心血管、非癌症疾病特异性死亡率增加3%相关。此外,较高的视网膜年龄差距与主要发病率原因显著相关,包括CVD、中风、代谢疾病、帕金森病和肾病终末期。除了视网膜之外,Li等利用晶状体的累积年龄相关变化开发了一个基于DL的模型,通过晶状体照片预测实际年龄,引入了“LensAge指数”。
值得注意的是,目前没有定义生物学年龄的标准方法,这使得衰老评分预测的“真实值”不确定。AI的“黑箱”特性进一步复杂化了预测误差的识别。尽管当前的眼组学方法已显示出使用眼部图像进行衰老预测的潜力,但方法学的异质性可能导致不同工具之间的显著差异。因此,当前衰老眼组学的兼容性和普适性仍然是重大挑战,并呼吁方法学创新。
2.3. 人工智能在疾病检测中的应用
2.3.1. 神经系统疾病
视网膜摄影可以作为一种非侵入性工具,用于定性分析神经系统疾病。OCT和OCTA技术能够检测视网膜层和微血管的细微变化,这些变化可能预示着神经系统疾病的发病。AI作为一种有前景的解决方案,能够整合跨越视网膜病变、视网膜和脉络膜层厚度、血管参数以及ERG指数的眼部生物标志物,以有效早期检测中枢神经系统疾病。
2.3.1.1. 阿尔茨海默病和痴呆
眼组学是一个利用多种眼部诊断工具(如视网膜摄影、OCT、OCTA、微视野检查、视网膜电图和眼动追踪器)的领域,与阿尔茨海默病(AD)和全因痴呆的关联性日益增加。这些技术能够评估可能反映大脑变化的视网膜和视觉系统生物标志物,为认知衰退的早期检测和监测提供潜在机会。近年来,基于AI的算法已开发用于分析视网膜特征(如血管变化、视网膜神经纤维层厚度和眼动),这些特征与受神经退行性影响的特定大脑区域相关。
监督式机器学习(ML)通过利用全面的视网膜参数促进AD的临床诊断。值得注意的是,Cheung等利用12,949张视网膜照片,从648名AD患者中开发了一个基于DL的模型,用于从眼底照片中检测AD,总体诊断表现良好(准确率范围为0.796至0.921)。该模型成功地区分了淀粉样蛋白β阳性和阴性参与者。然而,常见共病在没有眼部疾病或糖尿病的患者中略微损害了模型性能,降低了大约10%的准确性。
特定的视网膜特征,包括细小的视网膜血管和OCT特征(如面积、实度、视网膜纹理等)在检测认知障碍方面也显示出强大的预测价值。尽管整合多种数据以增强痴呆预测的模型性能看起来很有希望,但涉及OCT、OCTA参数和超广角眼底图像的多模态研究与仅使用眼底照片的研究相比,并未显示出显著更高的准确性(范围为0.67至0.84)。
一种新兴的方法是使用眼动特征进行痴呆的早期和非侵入性检测。AD患者的眼部评估显示出扫视功能障碍,特别是面部和眼睛的同时垂直运动。参与者被给予视觉刺激以收集数据,其眼动被记录以创建眼动追踪数据集。分析注视、扫视和再注视等特征的ML方法可以实现合理的性能,而深度神经网络可能会增强区分视觉注意力差异的能力。然而,收集高质量眼动数据的挑战和眼动追踪设备的成本限制了这些模型的样本量较小。未来的研究可能会致力于开发低成本、基于可穿戴传感器的眼镜,以实现更广泛和高质量的数据收集。
2.3.1.2. 帕金森病
AI也被用于探索眼组学与帕金森病(PD)临床表现之间的联系。然而,从眼底照片中检测PD仍然是一个挑战。一项结合眼底图像和人口统计学数据的研究表明了非侵入性PD监测的潜力,但并未达到临床可行的准确性。Zhu等研究了视网膜年龄差距,发现这一指标每增加1岁,患PD的风险增加10%。通过OCT评估的视网膜纹理为区分健康个体和PD患者提供了见解。此外,随着PD的进展,眼动恶化,其特征是扫视潜伏期延长和反应准确性降低。
2.3.1.3. 多发性硬化症(MS)
目前通过眼组学诊断MS依赖于OCT参数作为中间步骤。各种机器学习算法,包括支持向量机、集成分类器和循环神经网络,在MS的诊断和预测中显示出有效性,AUC值在0.82至0.88之间。AI还识别了MS诊断的关键眼部参数,如通过OCT测量的神经节细胞层(GCL)和全视网膜厚度。然而,研究在关于视网膜神经纤维层(RNFL)厚度丢失与GCL的诊断价值方面存在差异,甚至提倡使用脉络膜厚度数据而不是视网膜厚度进行诊断。这种差异可能是由于应用了不同版本的McDonald标准来诊断MS。目前,DL显著增强了3D OCT图像分割,能够在快速的10秒时间内提取细微的视网膜变化。未来的研究可能会转向直接从视网膜图像中识别MS并预测其发病和进展,旨在实现更简单、更直接的诊断策略。
2.3.2. 心血管疾病
2.3.2.1. 冠状动脉疾病
自21世纪初以来,临床医生观察到视网膜微血管异常与CVD风险之间存在显著关联。研究人员已经识别出与CVD死亡率和事件相关的特定生物标志物,如血管迂曲度增加。AI技术提供了自动无监督分析的潜力,揭示了以前未被探索的新视网膜生物标志物和途径。
将眼底照片的预测输出与传统CVD风险因素相结合的多模态方法已显示出在CVD诊断性能上的改进。除了传统风险因素外,将双能X线吸收法和视网膜图像作为输入可以提高2-3%的准确性。基于OCTA的视网膜血管网络参数也被应用于识别冠状动脉疾病(CAD)。尽管先前的研究表明OCTA在CAD诊断中具有潜力,但OCTA相对于临床参数的附加价值很小,并且仅适用于没有高血压或糖尿病视网膜病变变化的患者。为了更好地突出眼组学的潜力,需要进一步的研究,包括具有纵向图像和更广泛患者人群的研究。
2.3.2.2. 主要不良心血管事件
Rudnicka等开发了一个基于DL的模型,利用视网膜血管特征预测包括循环系统死亡率、心肌梗死和中风在内的不良事件,C统计值为0.75-0.77,与Framingham风险评分相当。同样,Poplin等开发了模型,利用眼底照片单独预测未来5年内的不良心血管事件,AUC值为0.70,表现与综合SCORE风险计算器相当。在糖尿病患者中,视网膜参数,无论是单独使用还是与冠状动脉疾病的多基因风险评分结合,都显示出在10年内主要不良心血管事件的增量预测价值(Mordi等,2022)。此外,“视网膜年龄差距”这一概念已被证明是CVD死亡率的有效预测生物标志物。
2.3.3. 肾脏疾病
AI在直接预测肾脏事件(如慢性肾脏病和糖尿病肾脏病)方面显示出潜力,可能超过依赖传统风险因素的模型。几种DL算法已出现,用于在初级保健环境中筛查慢性肾脏病,为基于血液检测的方法提供了一种非侵入性替代方案。据报道,视网膜血管的细微变化不仅表明现有的慢性肾脏病,还可以预测未来慢性肾脏病的发展,C统计值范围为0.638至0.703,反映出中等准确性。最近的一项荟萃分析专注于使用眼底照片预测慢性肾脏病,报告了公平的表现,汇总敏感性为87.8%,特异性为62.4%,AUC为0.864。然而,由于DL方法、眼底相机以及图像和数据集样本大小的不同,DL对慢性肾脏病检测的诊断效能差异显著。
通过从眼底照片中分析视网膜年龄差距,Zhu团队揭示了基线时视网膜年龄差距每增加1岁,与未来十年内肾衰竭发生风险增加10%相关。这些努力强调了将视网膜图像纳入肾脏疾病预测的附加值。然而,当前模型的低特异性表明假阳性率可能较高,强调了进一步完善和验证这些模型的迫切需要。
2.3.4. 其他疾病
2.3.4.1. 贫血
眼部表现,如眼睑结膜的颜色,为贫血诊断提供了一种快速且非侵入性的方法,无需进行侵入性血液检测。AI帮助推进了这一领域的发展,其表现超过了人类专家在血液疾病筛查和早期检测中的表现。基于AI的筛查系统可以帮助检测镰状细胞视网膜病变,并从多模态视网膜图像(包括超广角眼底照片、眼底荧光素血管造影和OCTA)中自动检测和量化病理血管变化。此外,研究人员将DL检测系统整合到常规眼底照片中,以估算血红蛋白水平和贫血状态。基于远程医疗的AI方法可以预测未来视力丧失的风险,并识别需要眼科治疗的血液疾病患者,从而减少对视网膜专家的依赖并提高患者依从性。
2.3.4.2. 糖尿病
除了预测血糖参数外,研究还采用DL方法直接从视网膜图像(包括眼底和OCTA图像)中检测糖尿病。Zhang等开发的模型不仅准确检测了现有的糖尿病,还预测了在未来五年内发展为2型糖尿病的可能性。随着自适应光学(AO)等技术提供比传统成像方式更高分辨率的图像,即使在糖耐量受损尚未发展为糖尿病的个体中,早期动脉功能障碍的迹象也显示出通过非侵入性测量进行检测的希望,即使在糖尿病前期患者中也是如此。因此,提供更广视野、更详细的显微技术以及在更多样化的临床和人群队列中进行额外训练的仪器,可以进一步提高诊断准确性和临床实用性。这些进展也对降低当前糖尿病诊断阈值具有重要意义。
基于AI的诊断能力不仅适用于使用专业相机获得的视网膜图像,还适用于使用智能手机拍摄的外眼图像。通过虹膜纹理、颜色、组织薄弱、破裂等特征,也可以实现高准确率的糖尿病检测。然而,由于外眼图像的自动化分割有限,该方法依赖于人工标记,突显了进一步改进的必要性。糖尿病并发症(如糖尿病周围神经病变)也可以从角膜共聚焦显微镜图像中检测出来,无需进行神经分割。这些方法为未来开发用于糖尿病筛查的远程移动工具提供了基础。
03 挑战
3.1. 缺乏现实世界的前瞻性研究
尽管如前文所述,已开发出许多用于通过眼部图像评估全身健康的工具/算法,但在现实世界中应用这些技术仍存在显著差距。现实世界证据对于弥合这一差距至关重要。首先,由于成像设备和人群特征的变化,算法在现实世界环境中的表现可能会受到影响。此外,将这些技术转化为临床实践不仅取决于技术性能的稳健性,还取决于技术在临床环境中的适应性、工作流程整合以及最终用户的接受度。前瞻性研究可以为这些工具的监管批准和成功整合到常规医疗实践中提供必要的数据。
迄今为止,只有少数与眼组学相关的算法经过了外部验证并作为临床工具获得了批准。值得注意的是,Reti-CVD算法通过韩国的一项关键监管试验验证了其从视网膜图像预测CAC存在可能性的能力,显示出与已建立的生物标志物(包括CAC评分、颈动脉内膜-中层厚度和踝臂脉搏波速度)相当的心血管风险分层能力。尽管眼组学在现实世界应用中处于起步阶段,但其临床转化潜力是乐观的,尤其是随着一些基于AI的临床设备获得批准用于从视网膜图像检测糖尿病眼病,例如IDx-DR和EyeArt(FDA,2018)。特别是,IDx-DR(Digital Diagnostics Inc)已成功在眼科诊所之外实施,并在现实世界人群中显示出准确性和安全性。使用IDx-DR设备的自动化分级以及AI-人类混合工作流程已被证明在检测可转诊和威胁视力的糖尿病视网膜病变方面有效。基于眼组学的AI系统在筛查、转诊和诊断一种或多种疾病方面具有实现变革性突破的显著潜力。然而,要充分实现其在革新眼部和全身医疗保健方面的潜力,这些系统必须在多样化的现实世界环境中接受严格的验证。这种验证对于证明其在不同人群和医疗环境中的稳健性、普适性和临床实用性至关重要。
早在2018年,Google Health就在泰国进行了一项前瞻性干预研究,以验证基于AI的糖尿病视网膜病变(DR)检测的实时表现。研究结果表明,AI与视网膜专家的表现相当。同时进行的系统临床现场研究进一步识别了实施此类系统的社会环境因素以及促进和阻碍因素。Nguyen等利用先进的3D OCT图像在越南前瞻性验证了一种用于糖尿病黄斑水肿(DME)检测的DL算法,其准确性与人类专家在实时中的表现相似。此外,最近在澳大利亚进行的一项实用主义试验首次验证了在实时中评估心血管风险的自动化AI系统的现实世界可行性、准确性和最终用户接受度。
眼组学中现实世界前瞻性研究的有限数量可以归因于几个挑战。首先,对于预测未来全身疾病的算法,验证表现需要长期随访以捕捉结果的发生,需要有足够数量的发病病例的大型队列。其次,与眼部疾病检测不同,眼组学研究中对视网膜图像的标注通常需要超出眼科专业知识。某些全身性疾病的诊断需要结合不同的检测和检查来确定诊断。例如,阿尔茨海默病的诊断需要基于临床标准的诊断工具、淀粉样蛋白正电子发射断层扫描(PET)、脑脊液评估或血液检测。前瞻性记录信息以形成金标准可能是成本高昂且资源密集的,并且需要跨学科合作。第三,获得现实世界干预研究的伦理批准可能具有挑战性,特别是当AI被纳入临床工作流程中并向临床医生提供额外信息时。这些潜在风险也可能阻碍临床医生和参与者的参与。因此,精心设计的研究和稳健的风险缓解策略对于确保顺利执行至关重要。最后,如果没有必要的基础设施,如软件界面、成像设备和安全的数据管理解决方案,现实世界的研究就无法启动。为临床研究建立支持性基础设施将为开展现实世界的前瞻性研究奠定坚实基础。
3.2. 眼组学相关医疗设备的监管批准
AI技术及相关设备的快速发展为这些医疗设备的监管批准带来了挑战。全球监管机构已认识到这些挑战,并正在努力开发适用于基于AI/ML设备的框架。美国食品药品监督管理局(FDA)发布了《人工智能和机器学习软件作为医疗设备行动计划》,强调了为基于AI/ML的软件作为医疗设备(SaMD)制定量身定制的监管框架的必要性(FDA,2021a)。同样,欧洲药品管理局(EMA)和药品机构负责人(HMAs)在2018年发布了AI工作计划(EMA,2023),中国国家药品监督管理局(NMPA)也发布了《人工智能基医疗软件产品分类定义原则》,以加强对这些创新的监管(NMPA,2021)。
AI基础算法或SaMD的监管批准所需的证据水平与传统医疗设备或药物不同,后者通常需要随机对照试验(RCT)。这种差异主要是由于AI算法的独特性、动态性和适应性,它们通过现实世界的学习和更新随时间演变。传统的监管框架是为静态设备设计的,在跟上AI技术的快速发展方面面临挑战。认识到这一点,FDA正在探索基于产品全生命周期的监管框架,以解决适应性算法的安全性和有效性问题,因为当前指南不足以管理其独特特性。
尽管并非所有基于AI/ML的SaMD都需要RCT,但严格的临床验证仍然至关重要。监管机构如FDA强调了通过适当的研究设计展示临床效用的重要性,包括具有代表性的临床研究参与者、在临床相关条件下对设备性能进行测试,以及在部署后对模型进行监控和重新训练风险管理,这些是SaMD部署的要求(FDA,2021b)。例如,用于糖尿病视网膜病变检测的iDx-DR系统在初级保健环境中进行了前瞻性关键试验,并因其敏感性和特异性高于预设值而获得批准。此外,新加坡眼底病变分析仪(SELENA+)在2019年获得了新加坡卫生科学局的批准,该批准基于在新加坡综合糖尿病视网膜病变计划(SiDRP)以及来自中国、澳大利亚、美国和墨西哥的全球数据集中进行的全面和广泛验证。对于眼组学导向的SaMD,只有一个软件RetiCVD获得了监管批准。它获得了欧盟的CE认证,并作为IIa类医疗设备获得了韩国食品药品安全部(K-MFDS)的授权,这是基于一项关键试验的临床证据,该试验回顾性评估了其与已建立的心脏生物标志物的性能。
3.3. AI的可扩展性、潜在偏见和伦理影响
在眼组学中应用AI的有效性面临着多个扩展挑战。眼组学涉及处理来自各种眼部成像技术和医疗记录的复杂多模态数据,这些数据跨越不同的人群和医疗环境。为应对这些挑战,研究人员开发了几种关键解决方案。云计算基础设施提供了处理大量医疗数据所需的计算能力。先进的AI方法,如RETFound,展示了如何通过自监督学习在大型视网膜和OCT图像数据集上训练基础模型,以适应新任务,而无需额外的标记数据。Lin等的最新工作展示了AI系统如何适应不同设备,使在高端眼底相机上训练的算法能够在使用便携式、低成本设备拍摄的图像上保持性能。这有助于在不同的医疗环境中扩大对眼组学技术的访问。
数据偏差和代表性问题在眼组学AI模型的部署中构成了重大挑战。开发集和测试集之间的领域偏移,源于人群分布的差异,可能会损害AI在特定测试数据集上的表现。例如,一个在韩国人群中训练的用于生物学衰老的眼组学模型在外部验证英国生物样本库数据集时表现较差,该数据集主要由白人组成。在多样化队列中进行广泛的验证是解决这一问题的最重要的方法之一。最近为减少数据偏差所做的努力包括创建平衡的数据集以训练算法。美国国立卫生研究院资助了一个名为AI Ready and Equitable Atlas for Diabetes Insights(AI-READI)的项目,旨在构建一个在性别、种族和糖尿病状态方面平等代表个体的数据集(AI-READI,2025)。研究人员还探索了各种可以在算法处理管道中应用的偏差缓解技术。
将眼组学技术应用于临床需要仔细考虑数据隐私和责任等伦理问题。开发AI算法需要大量的现实世界数据,而数据泄露、滥用和未经授权的访问等问题可能导致严重的伦理问题。最近的研究探索了增强医疗数据安全的技术,例如联邦学习,它允许多个合作者在不共享机密数据的情况下训练模型。区块链技术也因其通过授权数据访问的潜力而被讨论。此外,需要明确的法律和监管框架来解决AI系统的责任和责任问题。如果AI做出误诊并伤害患者,可能不清楚责任应由开发者、医院还是使用AI的临床医生承担。在部署后建立AI系统持续监控和升级的流程也至关重要,因为期望在现实世界使用开始之前解决所有安全问题是不现实的。积极应对隐私、安全和责任周围的伦理挑战,对于将眼组学技术负责任地整合到临床实践中至关重要。
3.4. 谁将使用眼组学?
鉴于以往研究证据表明视网膜成像和AI在检测或预测人口统计学因素、全身生物标志物和全身疾病方面的能力,眼组学有望成为一种超越眼科专业人士的宝贵临床工具。它能够在各种医疗领域广泛使用,例如全科医生、心脏病专家、神经学家和其他专家,不仅可以评估眼部健康,还可以评估全身状况,推动多学科方法改善患者护理(见图6)。
图6. 眼组学在医疗学科中的潜在用户
3.4.1. 眼科医生和验光师
眼科专业人士,包括提供初级眼保健的验光师和提供高级眼保健的眼科医生,最有可能成为眼组学的主要用户。由于眼科诊所中基于办公室的眼部成像设施已成为标准工具,实施眼组学测试的基础设施大多已经到位。此外,AI在眼科专业人士中的接受度越来越高。最近的一项调查显示,72%的验光师认为AI将提升他们的实践水平,高达88.1%的眼科医生愿意将AI作为临床辅助工具。特别是,COVID-19大流行进一步加速了数字健康解决方案的采用,增加了将AI纳入日常实践的意愿。
AI在眼部疾病管理中通过提高诊断准确性、实现早期疾病检测、预测疾病进展以及优化患者管理,显示出其价值。AI的使用可以协助眼科医生提高诊断的准确性和效率。例如,Guo等提出了一种使用自然语言处理从电子病历(EMR)中提取视网膜疾病关键诊断信息的智能决策支持系统,提高了眼科医生的诊断效率。AI还可以协助眼科保健提供者提供个性化和以患者为中心的护理。例如,最近开发的DeepDR Plus系统能够预测糖尿病视网膜病变(DR)的进展时间线,允许根据基线DR状态提供个性化的筛查间隔建议,而不是遵循固定的每年一次的周期。同样,通过机器学习使用患者基线临床信息预测接受抗血管内皮生长因子(VEGF)治疗后的新生血管性年龄相关性黄斑变性(AMD)的预后也是可能的。
除了眼部疾病外,眼组学还有潜力让眼科专业人士参与全身状况的管理。通过分析眼部的细微变化——如视网膜血管的改变或结构变化——眼组学可以揭示糖尿病、心血管疾病和神经退行性疾病等疾病的早期迹象。这使得眼科医生和验光师能够在识别全身健康风险、指导患者走向适当的护理路径以及与其他医疗保健提供者合作进行综合疾病管理方面发挥关键作用,从而将他们的影响扩展到传统眼保健之外。例如,在糖尿病视网膜病变筛查期间,整合预测糖尿病、高血压或心血管疾病风险的算法,可以使验光师提供额外的转诊建议。这将最大化单次眼科检查的效益,促进更全面的患者护理。然而,到目前为止,这种护理模式的研究有限,未来需要进一步研究以探索这种护理路径的可行性和有效性。
3.4.2. 全科医生、心脏病专家、神经学家、糖尿病专家和其他专家
眼组学的潜力远远超出眼保健领域,为跨多种医学专业的整合提供了变革性的机会,增强了疾病预防和管理能力。全科医生(GPs)作为社区中最为便捷且服务患者最多的医疗保健专业人士,可能是采用眼组学的关键参与者。它有望帮助全科医生解决他们在实践中面临的主要挑战,例如在进行常见疾病(如心血管疾病和慢性肾脏病)的全面风险评估时的时间限制。基于AI的工具(如眼组学)可以通过简单使用视网膜图像来评估风险,从而优化分流,增强对高负担疾病(如慢性肾脏病和糖尿病)的预防工作。因此,在一般实践中整合基于眼组学的筛查将增强全科医生在早期检测和预防方面的作用,最终改善公共卫生结果。此外,眼组学还可以弥合全科医生在技能上的差距,提高诊断准确性。例如,全科医生经常报告解读眼底照片存在困难,但眼组学辅助的糖尿病视网膜病变筛查使他们能够积极参与DR筛查,提供及时转诊,并与内分泌科医生协调糖尿病护理。
心脏病专家也可以利用眼组学进行心血管疾病风险评估,特别是在将患者转诊进行昂贵的高级检查(如冠状动脉钙化评分、计算机断层扫描冠状动脉造影和心血管磁共振)之前。例如,采用Reti-CVD等工具,该工具可以从视网膜成像中预测冠状动脉钙化,作为一种具有成本效益的方法,优化资源使用。
此外,眼组学在早期检测神经系统疾病(如中风,可能表现为中央视网膜动脉阻塞,或导致颅内肿瘤或出血增加眼内压,表现为视乳头水肿)方面具有潜力。由于传统眼底镜检查对神经学家来说具有挑战性,眼组学可以协助识别这些危及生命的神经系统迹象。这也可以扩展到急诊科医生,作为患有突发视力下降或头痛的患者的辅助工具。
在糖尿病及其各种并发症的全面管理中,眼组学在协助糖尿病专家进行早期检测、进展预测以及其他糖尿病护理的关键方面具有显著潜力。糖尿病并发症,包括微血管和大血管结果以及其他全身状况,是导致发病率和死亡率的主要原因。例如,糖尿病视网膜病变是工作年龄人群视力受损和失明的主要原因,而心血管事件和糖尿病肾病是导致死亡的主要因素。传统评估糖尿病全身并发症的方法,如冠状动脉钙化扫描、血液检查和估算肾小球滤过率(eGFR)评估,通常具有侵入性且成本较高,使得全球糖尿病人群难以获得这些服务。相比之下,使用视网膜成像通过人工智能驱动的早期和非侵入性检测这些全身并发症已经作为一种有前景的方法出现。这种方法为识别高风险个体提供了一个理想的平台,并能够实施更具针对性和强化的干预措施,从而减少与糖尿病相关的发病率和死亡率,并减轻其社会负担。这些干预措施可能包括健康教育、饮食和生活方式管理以及针对症状的特定治疗,最终改善患者结果并减少糖尿病相关发病率和死亡率的负担。未来的研究应优先进行跨多样化人群的严格验证,进一步进行定量研究,重点关注更深入的分析和更广泛的现实世界影响,并加强临床转化和政策制定,从而支持糖尿病专家提供更有效和个性化的护理。
其他医疗保健专业人士,包括联合健康专业人士,也可能是眼组学的潜在用户。联合健康专业人士或其他初级保健从业者可以进一步利用眼组学来定制行为干预并改善以患者为中心的护理。尽管这些应用突显了眼组学的潜力,但需要进一步研究以将这些工具整合到不同临床专业的工作流程中。由于每个专业都有不同的日常工作和特定需求,定制化的实施策略将是至关重要的。
3.5. 眼组学AI算法是否符合“筛查测试”的标准?
尽管眼组学在检测和预测一系列眼部和全身疾病方面显示出显著的潜力,但其作为有效筛查工具的广泛采用取决于其是否能够满足筛查测试的严格标准(澳大利亚政府和卫生及老年护理部,2018)。必须解决关键的监管挑战,以确保其临床效用和可靠性。例如,眼组学的“真实情况”是什么,特别是在风险分层的背景下?监管机构如何评估眼组学风险预测能力的准确性和临床效用?这些问题突显了需要强有力的验证框架和明确的监管指导。
为应对这些挑战,开发和实施基于眼组学的AI系统需要跨学科合作。这涉及组建包括视觉研究人员、内科专家、数据科学家、流行病学家和临床试验专家在内的多学科团队。这种合作对于克服将眼组学整合到主流医疗保健中的技术、临床和监管复杂性至关重要。通过利用多样化的专业知识,这些团队可以确保基于眼组学的AI系统既科学稳健又具有临床适用性。
这一过程中的关键步骤是将眼组学标准化整合到标准临床工作流程中。一致的成像协议对于确保高质量数据收集至关重要,这对于训练可靠的AI模型至关重要。此外,将视网膜成像技术的使用扩展到传统眼科环境之外——例如进入重症监护病房、住院病房和初级保健设施——可以显著扩大眼组学应用的范围,增强其在全身健康监测中的作用。标准化不仅对于推进该领域至关重要,而且对于为眼组学建立可靠的“真实情况”以及确保其风险预测能力的准确性和临床效用的可重复性和普适性也至关重要。
3.5.1. 目标疾病的流行率
目标疾病的流行率是确定眼组学作为筛查工具可行性的一个关键组成部分。通过视网膜成像分析眼部生物标志物,眼组学特别适合检测具有重大公共健康影响的广泛疾病,同时也为罕见疾病提供见解。
心血管疾病(CVD)、糖尿病和慢性肾脏病(CKD)是主要的公共健康问题,特别是在老龄化人口中,对全球疾病负担贡献显著。CVD每年导致近2050万人死亡,使其成为筛查的关键目标。全球有5.29亿人患有糖尿病,通过视网膜成像进行早期检测不仅可以预测糖尿病风险,还可以解决糖尿病视网膜病变、糖尿病肾病和心血管风险。CKD影响约10%的人口(Kidney Disease: Improving Global Outcomes [KDIGO] CKD Work Group,2024),通常在晚期才被诊断,但眼组学可以帮助在早期阶段检测CKD。鉴于其高流行率、对发病率和死亡率的影响以及可检测的眼部表现,这些疾病非常适合基于眼组学的筛查。这种方法可以实现早期诊断,并通过及时干预减轻医疗保健负担。
神经退行性疾病,如阿尔茨海默病和帕金森病,由于视网膜变化可能先于临床症状,因此被探索作为眼组学的目标。尽管与CVD或糖尿病相比,这些疾病的流行率较低,但它们对生活质量有重大影响。眼组学在精神分裂症的检测中也显示出潜力,但由于这些疾病的全球流行率较低——精神分裂症影响不到1%的人口——使得广泛筛查不切实际。这些疾病需要更具针对性的研究来评估可行性,并且更适合在高风险或专业群体中进行筛查。
疾病的流行率直接影响基于眼组学筛查的阳性预测值(PPV)。高流行率疾病(如糖尿病和CVD)筛查结果更准确,使其能够合理地整合到常规项目中。相比之下,低流行率疾病存在更高的假阳性风险,导致不必要的后续检查和焦虑。
尽管眼组学在CVD和糖尿病等高流行率疾病中具有强大潜力,但其在低流行率疾病中的使用将需要进一步研究,并仔细考虑针对性筛查策略,以确保其有效性。
3.5.2. 目标人群
为了最大化眼组学AI筛查的临床影响,定义目标人群至关重要,这有助于优化医疗资源的使用并改善患者结果(澳大利亚政府和卫生及老年护理部,2018)。年龄、病史和生活方式等关键风险因素为筛查资格提供了基础标准。广泛且可操作的标准(如年龄和性别)允许扩展性,而针对特定高风险群体(如患有高血压或糖尿病的患者)则确保了在视网膜评估效益最大化的群体中的临床相关性。基于标准的筛查有效性已在既定项目中得到证明,例如英国国家医疗服务体系糖尿病眼筛查计划,该计划针对所有12岁及以上的糖尿病患者(英格兰和NHS,2024),以及澳大利亚的国家癌症筛查计划,这些计划以年龄为主要决定因素(澳大利亚政府和卫生及老年护理部,2023)。在CVD的情况下,年龄同样被用作临床指南中的简单标准,使能够针对高风险人群进行有针对性的接触和简化招募。
此外,优先考虑特定群体——例如可能从早期疾病干预中获得更大生产力、健康和生活质量收益的年轻或中年人群——与筛查已经患有晚期疾病的老年人相比,可以优化筛查影响。流行病学数据可以进一步通过揭示当地人群中全身疾病的流行模式来细化目标,帮助将标准与区域健康趋势对齐。
通过专注于这些高风险人群,基于眼组学的AI算法可以最大化其改善健康结果、降低医疗成本和提高整体生活质量的潜力,从而展示其在公共卫生战略中的相关性和重要性。
3.5.3. 成本效益
眼组学的成本效益是评估其作为筛查工具潜力的关键考虑因素。许多研究调查了在各种医疗保健环境中实施基于AI的视网膜筛查系统的经济影响,强调了其通过减少对医疗保健专业人士的依赖实现显著成本节约的潜力。然而,AI驱动筛查的成本效益可能受到几个因素的影响,这些因素需要在现实世界实施中进行权衡。
地区经济状况和医疗保健基础设施是影响AI驱动筛查工具(如眼组学)成本效益的关键因素。在一些低收入地区,研究表明AI驱动筛查可能不如传统人工筛查方法具有成本效益,这可能归因于这些环境中人工评估的相对低成本。因此,眼组学的经济可行性是情境依赖的,强调了根据具体地区条件量身定制其实施以实现最佳价值的必要性。
影响眼组学成本效益的另一个关键因素是筛查过程中使用的AI算法的准确性。标准筛查测试通常期望实现高灵敏度和高特异性。Wang等验证了基于AI的糖尿病视网膜病变筛查的灵敏度和特异性截止值,证明了最低灵敏度为88.2%,特异性为80.4%。随着实现这些标准在当前AI技术环境中变得越来越普遍,预计实施眼组学将非常有可能更具成本效益。
此外,基于眼组学筛查的长期有效性和成本效益在很大程度上取决于覆盖范围和可及性。与人工筛查相比,AI驱动筛查工具的便携性和自动化特性使其更具可及性,特别是在农村、偏远或资源有限的地区。Hu等证明增加筛查覆盖范围与改善健康结果直接相关。增加筛查覆盖范围可以实现疾病的早期检测和治疗。尽管这可能会增加治疗成本,但它有助于防止更多人进展到需要复杂和昂贵干预措施的严重阶段,最终节省显著的医疗保健成本。
总之,尽管通过眼组学实现成本节约的潜力令人鼓舞,但仔细考虑当地经济环境、AI算法的准确性以及筛查计划的可及性将是实现基于眼组学筛查全部价值的关键。
3.5.4. 后续考虑因素
眼组学辅助筛查后的后续考虑因素对于评估其作为合格筛查测试的有效性至关重要。需要评估的关键因素包括患者对后续建议和再筛查计划的依从性,以及对已识别疾病的治疗选择的可用性。
后续护理的可用性和可及性在筛查计划的整体结果中发挥着重要作用。为了使筛查测试有效,目标疾病应有现成的治疗方法,并且可以通过早期干预有效预防。心血管疾病(CVD)、慢性肾脏病(CKD)和糖尿病视网膜病变(DR)等疾病就是这一原则的例证。例如,通过简单的行为干预有效管理风险因素可以预防高达75%的CVD病例,这突显了早期检测和管理的潜在益处。
相比之下,尽管眼组学在实验环境中对某些疾病(如痴呆症或精神分裂症)显示出希望,但这些疾病的预防和治疗选择极为有限。这种限制引发了对筛查这些疾病是否可能导致参与者情绪困扰的担忧。因此,在考虑实施基于眼组学的筛查用于目前缺乏有效治疗方法的疾病时,必须谨慎。
此外,确保可访问的后续护理对于维持患者对下游管理的依从性至关重要。如果患者收到后续建议但未能寻求进一步护理,早期检测的好处可能会减少。尽管一些现实世界的研究跟踪了AI驱动视网膜筛查后参与者的依从率,显示出比常规实践组更高的依从率,但依从率仍有待提高,范围从35.5%到77.78%。需要更多研究来调查基于眼组学筛查的后续结果,并开发增强对后续访问和护理计划依从性的策略。
3.6. 临床医生将如何解释和使用眼组学?
临床医生越来越认识到基于眼组学的技术是决策支持、疾病监测和优化临床工作流程的宝贵工具,特别是在利用非侵入性眼部成像管理全身疾病方面。
在决策支持方面,最近的研究表明,眼组学无论单独使用还是与临床数据结合,都能显著增强全身性疾病的早期诊断、预防和治疗。眼部病变和神经血管特征的先进分割算法促进了AI在决策支持中的应用,实现了自动疾病报告、注释和可解释的临床决策支持。
随着眼组学的不断发展,其与电子健康记录(EHR)的潜在整合可能在未来为患者健康提供全面视图。通过将眼部生物标志物与更广泛的健康参数相结合,临床医生可以提高诊断精度并做出更明智的临床决策。
对于个性化疾病监测,临床医生可以利用视网膜成像观察视网膜神经纤维层、血管和视盘的变化,这些是全身健康问题的关键指标。视网膜成像平台的可及性不断增加,包括基于智能手机的解决方案,为跟踪疾病进展提供了动态方法,特别是对于糖尿病视网膜病变和青光眼等慢性疾病。基于眼组学的工具,利用在大型数据集上预训练的模型,能够实时监测患者全身疾病的危险水平,帮助临床医生降低失明或中风等严重后果的风险。此外,通过将组学数据(基因组学、蛋白质组学、代谢组学)与眼部成像相结合,眼组学有望在未来提供精准监测,并更深入地理解疾病进展和潜在机制。
在工作流程优先级方面,包括干预建议和安排后续随访,鼓励越来越多地使用大型语言模型(LLM)和智能调度工具与眼组学结合来协助临床医生。目前正在探索如何将LLM整合到电子健康记录(EHR)中以应用于临床医学。Jiajia等提供了一个令人信服的例子,开发了DeepDR-LLM,这是一个结合基于图像的深度学习用于从眼底图像进行糖尿病视网膜病变/糖尿病黄斑水肿(DME)分级与LLM用于个性化糖尿病管理建议的集成系统。它可以支持初级保健医生,提供DR/DME诊断结果,并利用患者从电子病历(EHR)中的数据,包括病史、体格检查和实验室结果,自动生成个性化的管理建议。现实世界的前瞻性研究表明,将DeepDR-LLM整合到初级保健工作流程中可以改善患者的自我管理,提高对DR转诊的依从性,并增强临床建议的质量和同理心。尽管仍处于早期阶段,LLM已经在展示增强患者护理和提高医生效率的潜力。
然而,临床医生在解释眼组学和应用新技术时必须谨慎,认识到其局限性。许多以前的模型主要在结构化实验室数据上进行训练,而临床环境通常涉及来自患者叙述的非结构化信息。为了优化可靠性,标准化表型并整合来自不同来源的数据与EHR至关重要。AI辅助决策需要结合临床医生的专业知识和患者的实际环境,包括家庭、经济和社会因素。此外,设计研究和解释眼组学结果时必须考虑新的偏倚,例如数字鸿沟以及按地理、人群群体和社会经济地位划分的互联网接入不平等。
虽然流行病学研究的许多数据不容易转化为临床应用,但还需要进一步的步骤来促进这种整合。眼部生物标志物、视网膜成像的标准化协议以及提高不同类型视网膜成像设备之间的互操作性至关重要。例如,STRIVE计划提出了视网膜生物标志物的标准定义和成像协议,特别是在脑小血管病的背景下。开发基于证据的指南和最佳实践对于推进这一领域也至关重要。
此外,涉及多样化人群的临床试验,代表不同的种族、民族和性别,对于测试人工智能辅助算法的实施和建立验证的基准数据集是必要的。然而,在非眼科环境中部署眼科成像设备仍然是一个挑战,除非获得研究资金以支持图像捕获、分级和解释。为了最终过渡到临床实践,共享数据(包括图像和临床信息)的中心化平台以及用于分级和解释的中心化阅读中心将是不可或缺的。
3.6.1. 眼组学中的可解释性人工智能
可解释性人工智能(XAI)的概念在眼组学的背景下尤为重要。可解释性确保临床医生能够理解和信任AI模型的决策过程,并确保临床医生与患者之间的清晰沟通,从而提高采用率和整合到临床工作流程中。此外,XAI与医疗实践中对透明度和责任的关键需求相一致。医疗决策直接影响患者结果和安全,因此需要临床医生理解和验证AI生成的建议。当AI系统出现错误、表现出偏倚或受到外部因素(如视网膜图像质量)的限制时,可解释性对于理解、纠正和弥补这些局限性至关重要。
AI模型的“黑箱”特性尤其与使用视网膜图像预测无法通过原位病理学可视化的全身疾病或风险因素的场景相关。研究人员开发了一系列技术,以提供AI系统的可理解可视化,增强AI部署的有效性和可信度。例如,Poplin等首次在眼组学中应用软注意力技术,可视化对准确预测心血管疾病风险因素有贡献的视网膜区域。这些区域通过眼科医生的盲法方法进一步验证,证明了算法的临床可解释性。最近,眼组学研究中还使用了SHapley Additive exPlanations(SHAP)值等新方法,以进一步识别导致疾病结果的因素。这些发现标志着XAI在眼组学中的重要性,其意义不仅在于建立信任。XAI的结果通过突出视网膜特征与全身状况之间以前未知的关系,提供了额外的科学理解,可能导致新生物标志物的发现和针对性干预。
2025年,推理模型的发展(例如DeepSeek、OpenAI的o1和o3-mini、Google的Gemini 2.0 Flash Thinking等)可能对眼组学特别有用,因为该领域的转化受到模型“黑箱”限制的阻碍,导致医生和患者的接受度较低。新的推理模型纳入了思维链,并展示了中间推理步骤,可能为眼组学提供未来研究方向。这种可解释的方法可能通过提供基于证据的推理来阐明视网膜特征与全身疾病之间的联系,从而增加临床医生对技术的接受度,并提高信任和临床采用率。
3.7. 谁将为眼组学买单?
除了医院和诊所作为其诊断基础设施的一部分投资于眼组学设备和成像技术(例如OCT、扫描激光检眼镜[SLO]、自适应光学)外,一系列利益相关者——包括患者、创新者、公司、Medicare和健康保险公司——都准备支持并资助新兴眼组学技术的采用。
3.7.1. 患者
预防性健康和疾病管理是普遍关注的问题。寻求个性化医疗或特定疾病早期检测的患者可能愿意为服务付费,尤其是当它们提供实时反馈时,正如眼组学所做的那样。这一趋势的一个显著例子是可穿戴传感器(如配备心率监测器和心电图的智能手表)的使用不断增加,它们提供持续的健康监测。AI已成为这一迅速扩展的可穿戴传感器领域的关键参与者。眼组学同样提供了非侵入性、实时数据收集的优势。当与LLM整合时,它有可能提供跨多个器官的全面、实时健康洞察,显著增强护理的个性化。
此外,眼组学可以从其他组学领域的成功商业模式中汲取灵感。对基因组测序服务的需求不断增加,个人愿意为从唾液样本中获得个性化见解付费,就是一个强有力的先例。与基因组测序不同,后者通常只进行一次,眼组学鼓励重复测量,使其易于获取的技术对更广泛的人群具有吸引力。
3.7.2. 创新者和公司
通过眼组学生成的大量数据集可能会吸引商业实体和数据公司的兴趣,为医疗机构创造潜在的收入来源。经过处理的眼组学数据——经过清理、分类或预处理——可以提供,以增强其用于分析和训练AI模型的可用性。此外,专门设计用于AI训练的标记数据集,如计算机视觉中的图像分类或自然语言处理中的文本注释,由于其稀缺性、质量、适用性和竞争价值而需求旺盛。
制药公司可能会投资于基于眼组学的技术,用于临床试验和药物开发过程,利用其识别生物标志物、预测患者反应和监测疾病进展的潜力。此外,开发眼组学技术的公司可以通过向医疗保健提供者提供免费或低成本的试用来抵消早期采用成本。这种策略不仅有助于市场建立,还可以在完全由医疗保健提供者或保险公司承担财务责任之前,展示眼组学技术的实际价值。
3.7.3. 医疗保险
AI驱动的医疗保健技术越来越多地被整合到公共医疗服务中,显示出其在增强临床结果和运营效率方面的潜力。例如,新加坡卫生部(MOH)已经开始将AI整合到临床决策支持系统和疾病预测工具中,例如肺炎临床评估和药物不良反应监测系统。
同样,美国医疗保险和医疗补助服务中心(CMS)在2019年启动了一项AI挑战,以开发预测非计划住院和专业护理机构安置的预测模型,进一步说明了联邦政府将AI嵌入医疗保健系统的承诺。
在这种情况下,眼组学有望利用这些AI倡议生成的大量数据,推进Medicare促进健康公平、扩大护理获取和改善多样化人群健康结果的使命。Medicare可能会考虑投资于眼组学技术,包括视网膜扫描仪等成像设备,作为其诊断基础设施的重要组成部分,以支持精准医疗。
3.7.4. 健康商业保险
将AI整合到眼组学中,显著增强了全身性疾病的早期检测,这不仅改善了患者结果,还减少了与晚期疾病管理相关的长期财务负担。通过在早期阶段识别糖尿病和高血压等疾病的并发症,保险公司可以减少对昂贵晚期干预的需求。此外,眼组学驱动的工具可以优化治疗计划,潜在地降低住院再入院率和并发症。预测分析可以识别特定疾病高风险个体,使及时预防措施得以实施,从而最小化昂贵的急诊护理或住院需求。
对于健康保险公司而言,眼组学促进了全身性疾病工作流程的优化,导致管理成本降低和索赔处理简化。AI驱动的工具可以进一步完善护理计划,减少并发症和住院再入院率,最终降低保险公司的总体医疗成本。鉴于成本节约和改善健康结果的潜力,健康保险公司越来越有可能支持基于眼组学的预防服务。这种方法不仅加强了保险模式的财务可持续性,还提高了提供给患者的护理质量。
总之,患者、创新者、公司、医疗保险和健康保险提供商都有动力投资基于眼科组的医疗保健,因为它有潜力降低成本、改善患者治疗效果、提高系统效率并提供有价值的预防保健工具。通过实现早期疾病检测和促进个性化治疗计划,眼科组学不仅解决了紧迫的医疗保健挑战,而且符合利益相关者的经济利益,促进了更可持续、更有效的医疗保健生态系统。
04 未来机遇
眼组学的未来提供了重塑医疗保健、增强研究能力和提供广泛可及的先进诊断的激动人心的机遇。这些机遇由眼部成像技术的进步、多样化数据来源的整合以及创新的多模态AI算法的发展推动(见图7)。
4.1. 眼部成像技术的进步(“硬件”)
眼部成像是一个快速发展的领域,提供了新的方法来可视化和诊断视网膜和全身疾病。创新的眼部成像技术超越了传统的彩色眼底照片(CFP)和光学相干断层扫描(OCT)技术。
4.1.1. 偏振敏感OCT、多普勒OCT、可见光OCT和氧饱和度测量
在OCT的进步中,出现了多种结构和功能测量的新兴技术,包括偏振敏感OCT(ps-OCT)、多普勒OCT和可见光OCT(Vis-OCT)。ps-OCT及其亚型偏振多样性OCT(PD-OCT)是重要的创新。ps-OCT测量光的偏振状态,增强了对组织特性和病理变化的评估。偏振均匀度(DOPU)是一个开发用于测量这种去偏振的指标。PD-OCT可以获得DOPU对比度,除了传统SS-OCT成像可获得的散射信息外。这些技术在通过其独特的偏振特性区分视网膜色素上皮(RPE)和其他视网膜层方面具有价值,允许对RPE进行自动分割,并改善对黄斑和视神经头病理的检测。
多普勒OCT允许在结构成像的基础上,以高空间分辨率和灵敏度量化运动粒子的速度,有望研究视网膜血管健康及其与全身状况的关系。例如,多普勒OCT可以非侵入性地评估糖尿病视网膜病变和青光眼中的血流动力学,揭示微血管损伤的程度并指导治疗决策。Vis-OCT在亚微米水平上提供结构信息和内源性色素定量测量的功能信息,增强对糖尿病和其他缺血性视网膜病变中的缺血和神经退行性的理解,并改善对青光眼和阿尔茨海默病以及其他视神经病变的损伤量化。将氧饱和度测量与OCT整合提供了更全面的视网膜视图。由于视网膜血流和氧合是视网膜缺血的生理指标,通常先于解剖症状出现,使其成为疾病诊断的早期生物标志物候选。与荧光素血管造影(FA)等侵入性方法相比,氧饱和度测量非侵入性地测量视网膜氧水平,增强了对缺血性心脏病等与氧合相关疾病的理解。
4.1.2. 广角数字成像、高光谱成像和自适应光学
其他视网膜成像方式也提供了进一步的机遇。例如,广角数字成像(WFDI)可以捕捉视网膜的广阔视野,高光谱眼底成像(HFI)可以通过捕捉多波长信息检测化学成分,自适应光学(AO)技术允许在细胞水平上进行视网膜成像。具体而言,WFDI提供180-200度的超广视野,这对于检查糖尿病视网膜病变和新生儿眼科筛查中的周边视网膜特别有用。周边视网膜的变化可能与全身血管并发症相关,使视网膜成像成为诊断和管理全身疾病的重要工具。HFI通过提供视网膜的光谱信息,有助于识别与全身疾病相关的病理结构,例如视网膜血管氧合中的血红蛋白代谢状态以及与阿尔茨海默病相关的淀粉样病变。它可以作为荧光素血管造影的非侵入性替代方法,即使在白内障存在的情况下,也能实现视网膜和脉络膜结构的实时、高分辨率可视化,从而增强全身疾病的检测。
AO技术通过校正光学波前畸变,将光学系统的分辨率提高到2微米,允许在体内准确量化细胞密度和连接性。AO已被应用于健康眼睛和各种眼部疾病中的结构成像,以在细胞水平上评估视网膜。在临床上,AO用于研究如Stargardt病、视网膜色素变性和无色素性视网膜病变等遗传性视网膜疾病的进展,以及锥杆营养不良,提供对光感受器健康和功能的见解。AO成像还可以揭示与高血压相关的微血管变化,将视网膜的细胞级观察与全身健康联系起来。高分辨率和自适应成像在全身疾病中的进一步应用可能会揭示额外的眼部生物标志物。
4.1.3. 便携式和低成本成像方式
眼组学最有前景的未来机遇之一是眼部成像的可及性增强,这得益于基于智能手机的眼底成像的进步以及半自动、全自动、便携式和低成本视网膜成像设备的发展。移动健康(mHealth)行业的全球兴起促进了使用移动或平板设备的家庭健康监测的演变。最近,眼科家用设备的出现,如视力测试应用、视野检查和眼内压家用设备,以及基于智能手机的自动折射仪,吸引了大量关注。家庭自我管理OCT成像的研究也在进行中。这些创新将显著扩大视网膜评估的可及性。例如,在服务不足和资源有限的地区,配备基于智能手机的眼底相机的医疗工作者可以筛查糖尿病视网膜病变、青光眼和其他疾病。此外,它们使非眼科医疗保健提供者能够进行视网膜评估。通过将这些设备整合到常规健康检查中,全科医生可以筛查糖尿病、高血压和心血管疾病等全身疾病的视网膜生物标志物,从而及时将患者转诊给专家。总之,随着视网膜成像的可及性增加,包括非眼科医生在内的更广泛人群可以进行视网膜评估。
4.2. 数据的进步和整合(“大数据”)
4.2.1. 结合临床数据和元数据
通过整合表格化的临床数据和元数据,包括来自不同来源和种族群体的多模态图像和结构化临床信息,眼组学可以提供对全身健康的更全面和精确的评估。
随着组学方式和开放获取资源的进步,如基因组学、蛋白质组学和代谢组学,开发单一领域检测以识别未来事件高风险个体已成为多疾病和死亡预防的可行方法。目前大多数研究集中在单一组学方式上,无法在同一研究队列中对不同组学领域进行定量比较,主要是由于数据限制,对眼部成像的重视不足。然而,一些研究已成功整合了两种或多种组学方式。例如,通过基因预测的多组学特征促进了多组学数据的大规模生成和应用,以供更广泛的社区使用。此外,视网膜层的代谢指纹显示出改善预测性和临床效用的潜力,用于分层未来疾病,如2型糖尿病。因此,眼组学的未来本质上是多维的,提供了整合多样化数据来源的机会,包括基因组学、蛋白质组学、代谢组学,甚至是单细胞组学。
基于深度学习的多组学数据整合方法有可能阐明眼部发育机制、发现眼部疾病生物标志物和识别致病靶点。最近,眼部液体活检的蛋白质组学与单细胞转录组学整合,追踪在房水中检测到的蛋白质的细胞起源。此外,眼组学揭示了帕金森病中的视网膜退行性变化,并识别了随着疾病阶段变化的糖尿病视网膜病变细胞,这改变了分子诊断和预后的范式,同时揭示了新的细胞疾病和衰老机制。数据处理和共享系统的发展将进一步增强数据驱动的AI技术,促进医疗保健和研究的整体方法。值得注意的是,多模态数据的整合也伴随着技术复杂性,需要更先进的技术解决方案。
4.2.2. 多模态机器学习
随着领域的发展,算法将越来越多地结合来自不同方式和学科的数据。多模态机器学习具有评估多种成像方式组合的灵活性,并确定具有最佳诊断或预测能力的AI算法。除了增强筛查、诊断和预测效率外,使用多模态输入对于展示眼组学的优势至关重要。例如,预测神经系统疾病应涉及评估相应的大脑脑电图(EEG)、CT或MRI的变化,并将其性能与眼组学进行比较。尽管眼睛和并行视觉通路的发育、可塑性和功能与大脑共享相似性,但眼组学的效用应准确、稳健且有说服力地报告,而不夸大,并应与其他方式相比较。
尽管多模态输入可能有助于提高AI系统的诊断和预测能力,并更接近模拟临床医生的决策过程,但其在现实世界中的部署可能具有挑战性。例如,从现实世界的临床实践中获取完整的多模态数据集可能受到限制。因此,需要在多模型算法的最佳性能与在现实世界实践中为合格患者获取多模态数据集的可行性之间取得平衡。
4.3. 拥抱多学科合作伙伴关系
只有通过超越眼科的多学科合作努力,才能充分发挥眼组学的潜力。例如,眼组学有望利用AI开发创新工具以应对各种疾病。例如,对于大脑疾病,机器学习的进步现在能够解释人类的情感和认知状态。这一能力为患有大脑疾病的人带来了希望,通过促进基于眼组学的AI在神经医疗保健中的应用。这些应用可以增强患者对症状的自我监测,并实现实时干预以改善社会和心理功能。这一例子突显了在实现眼组学最终目标中多学科合作的重要性。
吸引来自不同学科的专家,包括医学、生物学、数字技术、计算机科学、数学和成像工程,带来了多样化的视角、技术知识和创新方法。例如,临床医生和研究人员可以共同制定与临床相关的眼组学问题并开发创新解决方案。数字技术、计算机科学和AI方面的专家非常适合解决眼组学中的复杂数据问题。他们的专业知识可以简化多样化数据源的整合、增强数据处理、提高模型准确性并促进技术的实施。成像工程和计算机工程专家的合作可以导致更复杂和用户友好的成像设备的开发,增强眼组学数据的质量和可及性。此外,最终用户体验研究和市场准入策略的参与将进一步帮助研究人员理解和将技术转化为现实世界的实施。
然而,无尽的整合和复杂性并不是眼组学的研究目标。开发AI模型所需的高专业技术知识目前是有限的。即使是利用现有算法的迁移学习,也需要机器学习经验才能在临床任务中取得满意的结果。这一限制目前将深度学习的应用限制在一个小但不断扩大的计算机科学家和工程师社区中。多学科团队可以开发用户友好的工具、标准化协议和数据共享平台,加速眼组学研究向临床实践的转化。
4.4. 支持新技术的需求:6G无线网络、物联网(IoT)和数字安全
包括第五代和第六代无线网络(5G和6G)、物联网(IoT)、大型语言模型(LLM)以及数字安全能力(如区块链)在内的数字创新,为医疗保健及其他领域创造了新的机遇生态系统。
5G无线通信有望满足大规模复杂网络连接的挑战,实现快速数据传输(Pons等,2023)。尽管具有潜力,但5G可能面临当前高成本、实施挑战以及安全性和可靠性方面的潜在限制。预计在未来十年内推出的6G可能会解决与数据收集和共享相关的计算能力有限、安全性和隐私挑战,这可能是将眼组学应用于更广泛人群的潜在解决方案。
在过去十年中,随着移动设备数量超过全球人口,设备之间的互联互通性显著增加。这推动了物联网的发展,物联网是一个由嵌入传感器并能够传输和处理数据的物理对象组成的网络,能够实现与其他机器或人类的通信,通常是自动化的。这种互联互通的生态系统有潜力改变医疗保健的交付方式,并加速眼组学融入日常临床实践。
4.5. 数据记录链接的需求
眼组学中的深度学习(DL)模型依赖于获取大量多样化的训练数据集,这些数据通常来源于前瞻性观察性队列研究或回顾性真实世界数据。在前者中,数据可以通过开放获取(例如MESSIDOR)或申请(例如英国生物样本库)提供给研究人员。对于后者,使用回顾性真实世界数据可能相当具有挑战性,因为原始数据收集与眼组学研究的具体需求之间可能存在潜在不匹配(例如全身健康结果)。此外,眼科医疗保健相对独立,可能不会常规收集全身健康信息。为了绕过这些挑战并扩大眼组学中DL的数据收集规模,研究人员正在转向链接常规收集的医疗保健数据(即数据记录链接)。这种方法作为一种可能的解决方案,用于挖掘现有的医疗保健数据以发现有价值的信息。
4.5.1. AlzEye数据链接
眼组学中数据记录链接的开创性例子是由Pearse和Siegfried领导的AlzEye研究。AlzEye是一个纵向数据集,通过隐私设计的第三方链接方法,将常规收集的英国国家医疗服务体系(NHS)数据中的视网膜照片和OCT扫描与医院入院的全身疾病数据链接起来。该研究将来自25万多名40岁及以上个体的超过200万张视网膜照片和扫描与NHS数据库链接,时间跨度为2008年1月1日至2018年4月1日。迄今为止,这些患者中约有1万人被记录为中风,约1.2万人心脏病发作,约1.3万人发展为痴呆。
4.5.2. 澳大利亚数据链接
眼组学的另一个成功数据链接项目是由澳大利亚眼科研究中心的He和Zhu领导的国家数据链接项目。该项目包括过去20年中在眼科医院和验光店就诊的18岁及以上参与者的视网膜图像,并与澳大利亚健康和福利研究所(AIHW)的数据链接。该项目促进了广泛眼部数据与更广泛的健康记录的整合,包括医疗和药物处方数据、医院入院数据以及国家死亡登记处的数据,增强了全面眼组学研究的潜力。
4.6. 提出的未来研究方向
4.6.1. 对其他全身状况预测的研究
眼组学推进了眼部健康与全身状况之间联系的理解。然而,除了心血管系统和神经系统之外,许多研究领域仍处于起步阶段。
视乳头水肿是一种病理性的变化,是颅内疾病中经常观察到的重要指标,具有临床意义。它与神经外科疾病密切相关。视乳头水肿的诊断检查包括神经影像学和腰椎穿刺。基于眼底照片的AI模型在检测视乳头水肿方面达到了超过90%的灵敏度,优于人类专家。
此外,甲状腺疾病与多种外眼表现相关,包括结膜充血、化学性结膜炎、眼睑回缩和眼球突出。新出现的证据表明,AI在治疗前诊断和评估甲状腺眼病方面具有价值。AI模型在诊断成像(CT或MRI眼眶)和外眼照片方面表现出高诊断准确性。
其他系统的疾病,如肝胆疾病、自身免疫疾病甚至精神疾病也表现出已建立的眼部表现。然而,在眼组学范围内对这些主题的研究仍然很少。
4.6.2. 对新成像方式的研究
纳入额外的成像方式,如外眼摄影,可以扩大眼组学的范围。外眼成像在甲状腺眼病等疾病中特别相关,其症状如眼睑回缩、眼球突出和眼周水肿是外部可见的。此外,一些眼部表现,如与胆固醇水平升高和动脉粥样硬化相关的黄斑瘤形成以及与阻塞性睡眠呼吸暂停相关的松软眼睑,可以通过外部观察到。谷歌在外部眼图像方面的最新研究表明了这种成像方式的潜力。谷歌的算法表明,外部眼图像可以轻松评估糖尿病视网膜病变、心血管风险因素和多个器官的生物标志物。更重要的是,外眼成像更容易通过智能手机捕捉。这为使用易于获取的设备而不是复杂的眼科设备进行眼组学研究提供了机会。
以往的眼组学研究常常忽略了视频的潜力。对于日常生活中疾病的自动筛查,最近的研究利用视频和照片特征训练具有长短期记忆的神经网络,取得了与传统评估相当的结果。基于眼动追踪的评估已经得到了很好的发展,使用显示器上的视频刺激来评估认知障碍,如自闭症谱系障碍(ASD)和阿尔茨海默病(AD)。通过视频可以检测到的参数,如扫视、瞳孔反应和眨眼率,可以提供关于人类情感状态的详细信息。其他便携式成像设备,如手持式OCT、眼底相机和便携式裂隙灯,可以在各种环境中使用,从偏远地区到初级保健诊所。这些设备促进了眼部生物标志物的非侵入性监测,能够早期检测眼部和全身状况,特别是在服务不足的人群中。此外,便携式成像设备生成的实时数据可以与人工智能和机器学习算法整合,提高诊断准确性和改善临床结果。
为了进一步探索眼组学的临床意义和日常应用,其他技术的进步,如可穿戴传感器和用于人工智能模型训练的联邦学习,将提供宝贵的支持。创新的可穿戴技术,包括体载和植入式传感器,极大地提高了生活质量。在葡萄糖监测、生理信号和身体运动等领域取得了显著进展。将健康数据与眼组学的整合将进一步阐明眼组学如何反映全身健康,增强其早期检测高风险疾病的能力。
联邦学习允许人工智能模型在分散的数据上进行训练,这意味着敏感的患者信息,如遗传、临床和眼部数据,保留在当地的医疗机构中。这在眼组学中尤其重要,因为它确保了数据隐私和安全,同时克服了多中心合作的挑战。通过将联邦学习与眼组学整合,人工智能模型可以从全球多样化的人群中学习,减少偏见并提高代表性。这种方法结合了广泛的眼部数据集(例如CFP、OCT、OCTA以及眼内液和泪液的测序数据)与全身健康数据(例如生物标志物、代谢数据和遗传信息),增强了人工智能模型的稳健性和普适性。
4.6.3. 对未来人工智能应用的研究
未来人工智能应用可能会从单纯的诊断转向预测全身状况的未来风险、全身状况的进展以及治疗指导。这种方法可以增强早期预防和个性化干预。例如,人工智能可能能够预测抗高血压药物对高血压的治疗反应,完善患者管理策略,最终实现更好的患者结果。因此,需要进一步的研究来探索眼组学应用的全部潜力,以改善人群健康。
4.6.4. 对未来人工智能模型的研究——基础模型、大型语言模型等
自2022年11月ChatGPT(OpenAI,美国)首次亮相以来,大型语言模型被认为在眼科的临床实践、医学教育和研究中具有显著提高效率和效果的潜力。最近,基于眼组学的大型语言模型作为远程分流患者的有价值工具出现,提供关于广泛眼部症状(例如视力模糊、眼部疼痛、发红)和特定眼部状况(例如青光眼、白内障、糖尿病视网膜病变)的信息并解答咨询。从实际角度来看,大型语言模型可以通过应用程序接口(API)与移动应用程序整合,或者直接连接到眼科医院网站,使寻求眼科护理的患者和医疗保健提供者受益。
大型语言模型整合到临床环境中的一个紧迫问题是围绕网络安全和数据隐私,特别是当软件需要在电子病历(EMR)数据上进行训练,或者直接嵌入到实时EMR系统中时。不仅是大型语言模型,所有人工智能研究和开放模型都涉及数据存储和处理层面的关键攻击和安全问题。区块链等数字安全能力是解决这些问题的关键。区块链是一种基于密码学、去中心化和共识原则的主流技术,它产生具有固有安全特性的数据结构。尽管目前在眼科领域对区块链的研究有限,但未来应用可能会彻底改变来自各个私立和公立机构的国际数据收集。这一进步可以改善患者护理,安全地管理流行病学数据、眼部图像和患者的多组学信息。
4.6.5. 对证据、验证、机制理解、政策的研究
为了最大化眼组学研究对医疗保健的影响,需要在关键领域进一步发展,包括但不限于基于证据的指南、前瞻性研究和真实世界实施,以及研究眼部与全身状况之间的生物机制。
眼组学的开发和实施需要基于证据的指南。这些指南应包括与参考标准的验证、数据采集和传输设备标准、数据分析协议、人员资质、质量保证措施、数据保护政策以及临床整合程序。标准化的协议和最佳实践对于在临床环境中一致和有效地应用至关重要。眼科医生、数据科学家、医疗保健政策制定者和其他利益相关者之间的合作对于开发这些指南至关重要,以确保标准化的数据收集、分析和临床整合。
迄今为止,直接比较最先进的眼组学方法与基于蛋白质组学或代谢组学的方法在全身疾病筛查、分级、监测和预测方面的研究有限。眼组学作为一种非侵入性、简单且快速的诊断策略,在推进个性化医疗和改善疾病预测方面具有巨大潜力。尽管现有研究主要集中在单一组学方式的应用上,但眼组学与其他组学的整合以及与蛋白质组学和代谢组学的比较分析仍相对未被充分研究。这一研究空白为探索如何结合不同的组学数据(如基因组学、转录组学、蛋白质组学和代谢组学)提供了机会,尤其是在眼组学的背景下,以提供对复杂疾病更全面的理解。此外,还需要关于利益相关者对眼组学的看法和接受度的定性研究,与传统和新兴技术相比。了解从临床医生到患者的利益相关者观点,可以促进眼组学在临床环境中的采用,并帮助识别其整合的障碍。
随着大规模多组学数据集的日益可用以及眼组学技术的快速发展,预计未来将推动更多的比较研究。随着这些技术的发展,它们将能够进行更精细的分析,并提供关于眼组学如何补充甚至超越其他组学方法在预测和诊断复杂疾病方面的见解。
此外,前瞻性验证研究对于建立眼组学的可靠性和临床效用至关重要,这对于获得医疗保健从业者的广泛接受和信任是必要的。通常,人工智能算法是在通过临床试验收集的图像上进行测试的,这些试验有严格的纳入和排除标准。人工智能算法的真实世界验证仍然需要在大规模、多样化的临床数据上进行测试,超越受控试验环境。需要一个灵活但严格且透明的验证框架来导航这一不断发展的领域,重点关注现实世界环境中的可重复性、可靠性、临床价值、可用性和成本效益。
研究工作还应集中在识别眼组学实施的促进因素和障碍。了解什么促进或阻碍了其采用可以为克服挑战的策略提供信息。此外,需要进一步的研究来深入探讨眼部与全身健康之间联系的生物机制。利用最先进的生物技术,如基因组学、蛋白质组学和代谢组学,未来的研究需要揭示眼组学中涉及的复杂生物途径。研究将眼部变化与全身疾病联系起来的病理生理过程可以增强我们对眼部和全身状况的理解,并指导针对性的干预措施。
05 结论
眼组学的研究随着时间的推移取得了显著进展。技术创新,特别是先进的视网膜成像技术和人工智能分析,彻底改变了我们评估视网膜健康及其与各种全身状况潜在联系的能力。眼组学为医疗保健的未来提供了巨大的发展空间,提供了一种新的非侵入性工具,用于替代评估重要器官健康的侵入性或昂贵测试,并能够早期诊断和干预主要的全身疾病。然而,仍有大量的探索机会。视网膜成像技术的进步、多模态数据整合和多学科合作对于释放眼组学的全部潜力至关重要。6G网络和数据记录链接等数据基础设施的进步也是扩大研究和部署机会的重要步骤。未来的研究应集中在扩大疾病预测范围、探索额外的成像方式以及基于证据的验证和机制理解。眼组学的综合方法有望解锁眼睛作为早期疾病检测、个性化医疗的有力工具的真正潜力,并最终改善健康结果。
文献地址:
Zhu, Z., Wang, Y., Qi, Z., Hu, W., Zhang, X., Wagner, S. K., ... Wong, T. Y. (2025). Oculomics: Current concepts and evidence. Progress in Retinal and Eye Research, 101350. https://doi.org/10.1016/j.preteyeres.2025.101350
声明:本文转载于<青白视角>,以上仅代表作者本人观点,仅用于学习交流,版权归原作者所有。