近视性黄斑病变(MM)是全球视力障碍的主要原因,而从眼底图像中检测 MM的人工智能算法可能会改善诊断并协助各种医疗保健环境中的筛查。
但当训练集和验证数据集不同时,如何比较AI模型的性能?为解决相关问题,在完美体育·(中国)官方网站黄天荫教授课题组近期发布的一项研究中,通过使用“群众外包”的方法,邀请研究团队使用相同数据集开发 AI 模型。该研究已于9月26日在线发表于《美国医学会眼科杂志》。
研究介绍
近视是全球不可逆视力障碍和失明的最常见原因之一。据估计,到2050年,将有近50亿人受到近视的影响,10亿人受到高度近视的影响。高度近视患者面临着视力威胁性并发症的高度风险,尤其是近视黄斑病变(MM)。
准确识别MM等级是一项重要的临床和公共卫生需求,因为它能够及时筛查、识别和密切监测患有高度近视和MM风险的个体,解决诊断不足和错误分类的问题。此外,眼科医生对MM的精准分级有助于个性化健康指导,进而有效预防或控制并发并发症,减轻MM致盲风险。
然而,开发用于MM诊断的稳健AI系统仍面临重大挑战,包括带数据标注的数据集稀缺和用于比较评估的现有算法的非公开性。全球有120多个基于彩色眼底照(CFP)的公开数据集,主要包括糖尿病视网膜病变、青光眼和老年性黄斑变性。然而,只有5个数据集包含近视数据,而且没有专门用于MM的数据集。组织竞赛和发布公共数据集是研究特定眼科疾病,吸引研究者关注的有效方法。例如,大量专注于糖尿病视网膜病变的竞赛和公开数据集促进了糖尿病视网膜病变诊断算法的研究与开发。相比之下,MM竞赛和公共数据集的缺乏导致对这种疾病的关注和相关研究较少,阻碍了相关AI算法的开发和疾病评估。
针对此,该研究发起了一项针对MM分类和分割的AI诊断竞赛(MMAC)。竞赛结果表明,基于AI的MM诊断算法与眼科医生相比表现出了良好的诊断性能,一些AI算法的表现甚至优于眼科医生。该研究提供了一个用于评估AI算法的平台,公开了一个带有数据标注的MM诊断数据集以及对应的诊断算法和代码。这些公开资源可能为开发MM计算机辅助诊断系统奠定基础。
原文链接:
https://jamanetwork.com/journals/jamaophthalmology/fullarticle/2824092