12月4日下午6点,上海科技大学生物医学工程学院钱学骏课题组在Nature Biomedical Engineering在线发表了题为“A multimodal machine learning model for the stratification of breast cancer risk”的研究论文,实现了多层级乳腺癌风险预测,其预测能力超越了资深放射科医生,为更广泛的乳腺癌筛查和诊断提供了新的技术途径。鉴于该重要突破,Nature Biomedical Engineering杂志在同期发表了研究评述(Research Briefing)文章“Advancing breast cancer risk stratification using multimodal AI”,总结和点评了该研究的发现和意义。
在这项工作中,研究团队开发了一款专门面向乳腺癌风险分层的多模态人工智能系统BMU-Net模型(图1)。该模型巧妙融合了卷积神经网络在特征提取方面的高效性,以及Transformer在高层特征融合与跨模态整合方面的卓越性能。通过在大规模钼靶和超声数据集上进行迁移学习预训练,再结合多模态匹配数据集进行精细化调优,显著提升了模型的通用性和复用价值。创新性地采用随机掩码训练策略(图2),使BMU-Net能够灵活处理不同模态的输入数据,有效应对临床实践中因患者隐私保护等原因导致的数据缺失问题。
图1
图2
研究用5025名患者的19360张乳腺影像开展模型开发和测试工作。通过与资深放射科医生在158例钼靶检查和146例超声检查中的诊断结果进行对比,发现BMU-Net在肿瘤良恶性分类方面与专家水平相当,在组织病理学分级诊断方面(根据癌变风险设计的breast disease tree)超越了人类专家的表现。研究还证实,临床数据(尤其是年龄和体重指数)对乳腺癌风险精准分级具有重要意义,这与现有的乳腺癌风险因素研究相互印证。在包含187名患者的前瞻性多模态数据验证中,BMU-Net取得了90.1%的准确率,已接近病理学家通过活检切片分析获得的92.7%的准确率。
BMU-Net还特别关注了具有挑战性的BI-RADS 4类病例(癌症可能性介于2%至95%之间),尤其在处理BI-RADS 4a类病例(癌症可能性为2%至10%)这一诊断难度较大的不确定区间时,模型提供了极具价值的判断依据。如通过将BI-RADS 4a降级为BI-RADS 3,可帮助患者避免不必要的侵入性活检。
结合临床指标、钼靶与超声检查的黄金“组合拳”,是公认最经济有效和可行的乳腺癌筛查与诊断选择,也是现行临床的实际检查流程。研究团队构建的BMU-Net模型,为临床医生提供了多层级的乳腺癌风险评估工具,旨在改善患者生存质量,具有重要的临床和社会意义。
上海科技大学钱学骏教授为论文通讯作者,安徽医科大学第一附属医院裴静主任、韩春光医师为共同第一作者,钱学骏课题组包含梁止潆在内的多名研究生为共同作者,上海科技大学为第一完成单位、唯一通讯单位。上科大生医工学院创始院长沈定刚教授参与指导,上科大高性能计算平台对本文提供了算力支持。