近日,上海科技大学生命科学与技术学院刘雪松课题组在学术期刊Briefings in Bioinformatics(《生物信息学简报》)发表题为 “TLimmuno2: predicting MHC class II antigen immunogenicity through transfer learning”的论文。在该论文中,团队基于迁移学习理念开发一种预测II型MHC呈递新抗原免疫原性的工具TLimmuno2,为肿瘤的精准免疫治疗发展提供了新思路。
肿瘤是由体细胞基因组DNA变异所驱动的复杂疾病,基因组DNA变异编码的突变多肽能够成为肿瘤特异性的抗原,也被称为肿瘤“新抗原”(Neoantigen)。肿瘤新抗原是决定肿瘤细胞免疫原性的一个关键因素,也是肿瘤免疫治疗的最佳靶点之一,然而精确预测新抗原免疫原性的工具还很缺乏。
免疫识别过程中,抗原需要经过主要组织相容复合物(MHC)呈递给T细胞引起免疫反应。现有研究已经证明MHC II类分子相关的抗原呈递在肿瘤免疫中发挥了关键作用。目前II型MHC相关免疫原性的实验数据规模较小,这限制了II型MHC相关免疫原性预测工具的开发。
刘雪松团队创新性地基于迁移学习理念,开发了MHC II类新抗原免疫原性预测工具Tlimmuno2。该工具将非免疫原性直接相关的多肽-MHC亲和力数据中提取到的特征信息,迁移到免疫原性直接预测模型中。
该迁移学习人工智能模型很好地解决了实验数据规模较小的难题,在多个独立验证数据集中均取得优异的表现效果(图1)。该模型的构建为肿瘤新抗原识别提供了全新的工具。
图1. TLimmuno2的模型框架
肿瘤发生发展过程中,免疫细胞和肿瘤细胞之间的相互作用被称为免疫编辑,II型MHC呈递的新抗原是否存在免疫编辑相关的负选择是一个未解决的科学问题。
利用TLimmuno2,本研究发现在TCGA泛癌数据集中,II型MHC呈递新抗原存在显著的免疫编辑介导的负选择信号(图2)。这项分析结果从另一个侧面表明TLimmuno2能够辨识出真正具有免疫原性的抗原肽。
图2. TLimmuno2揭示肿瘤免疫编辑信号
上海科技大学生命学院2020级硕士研究生王光帅为本文第一作者。生命学院常任副教授刘雪松为通讯作者,上海科技大学为第一完成单位。本研究受到了上海科技大学高性能计算服务平台的支持。