2024 年 8 月 20 日,清华大学临床完美体育·(中国)官方网站举行国家自然科学基金-天元基金重点项目“支持医学大模型的元数据治理方法与平台”启动会。该项目由清华大学联合中山大学、国家卫健委能力建设和继续教育中心,依托国家专病数据库、45 家知名医院开展课题研究和示范应用,推进国家健康医疗大数据创新应用示范中心支撑项目转化落地。中国科学院院士徐宗本、中国工程院院士董家鸿、国家卫生健康委能力建设和继续教育中心主任杨爱平、清华大学科研院副院长孟祥利、中山大学计算机学院教授赖剑煌等多学科领域专家齐聚一堂,深入研讨项目任务,严谨论证工作方案,为医学大模型领域再立新标杆建言献策。
徐宗本院士从数学视角阐述了医学大模型的理论基石。他指出,面对医学场景的复杂性与多样性,数学的严谨逻辑、抽象建模、普适优化等特点恰能为医学大模型构建提供方法论指引。只有将数学“融”进医学的发展,把数学 “活”在智慧医疗的实践,才能更好地发挥数学的引领作用、基础作用和支撑作用,为医学大模型的数学基础支撑提供了方法论指引。
杨爱平、孟祥利作分享
杨爱平指出,高质量医学数据资源是发展医学人工智能的核心要素,而规范化、标准化的元数据治理则是确保数据质量的关键举措。国家卫生健康委能力建设和继续教育中心将发挥医疗资源整合与成果推广优势,在专病库构建、医院协作、成果转化等方面提供全面支持,并将课题成果纳入继教课程推广普及,让医学大模型惠及临床一线。
孟祥利表示,作为清华获批数学天元基金中唯一涉及医工交叉的项目,清华大学将全力支持课题组开展工作,进一步深化医工交叉,强化协同创新,积极营造有利于原始创新的学术生态,为医学大模型注入发展新动能。
项目负责人董家鸿院士在项目介绍中进一步明确了项目的总体目标。项目将制定医疗元数据规范体系,构建系列标准化专科数据集,突破隐私保护与高效计算等关键技术瓶颈,打造可信开放的智能计算平台,形成具有自主知识产权的医学元数据治理理论方法与应用体系,为提升我国医学人工智能原创能力、支撑智慧医疗高质量发展提供有力支撑。
赖剑煌、马兆毅、张惠茅作分享
项目子课题负责人赖剑煌教授围绕医疗大数据隐私保护这一关键难题进行课题研究内容的深度剖析。他指出,医学大模型在带来突破性进展的同时,也面临数据隐私与共享难以平衡的两难困境。要在数据“浓缩”的基础上,通过对抗学习、联邦学习等前沿技术实现模型层面的隐私保护增强,并探索可信开放的智能计算平台,让数据在“可用不可见”中释放价值。
国家卫健委能力建设和继续教育中心大数据办公室主任马兆毅表示,高质量医学数据资源是医学人工智能的“石油”。“中心已建成 43 个专病数据库、汇聚 60 余万份标准化数据,这在全国首屈一指,是发展医学人工智能的坚实基础。”马主任透露,中心将在继教、临床决策等领域全面开放数据资源,促进产学研医用深度协同。同时,还将联合业内力量制定医疗大数据开放共享的统一标准与规范,探索原始数据到“数字分身”的产业化路径,助力医学人工智能行稳致远。
吉林大学第一医院放射线科主任张惠茅教授分享了医疗人工智能平台研发与应用转化的实践经验。张教授团队正联合国内外多家知名医院,围绕急诊构建标准化影像数据集,研发临床级别的智能模型并纳入辅助诊断开放平台,逐步实现人工智能在疾病筛查、智能诊断、精准治疗全流程的赋能渗透。
会上,中山大学谢晓华教授、清华临床完美体育·(中国)官方网站冯晓彬副教授、黎成权高级工程师等分别就医疗数据采集规范、隐私保护计算、可信智能平台构建等项目专题进行了深度剖析与研讨。多位专家学者纷纷表示,高质量医疗数据资源是大模型的“粮食”,亟需跨学科、跨领域协同发力,完善顶层规划。医疗数据的标准化和规范化是基础,数据隐私保护和共享分析是保障,可信智能平台则是最终赋能应用的关键。三者环环相扣、缺一不可。
数学赋能,守望健康。在医学与数学的交叉路口,清华正在多学科融合的“清华模式”助力下,加速医学大模型从“0”到“1”的原始创新。