9月9日,首届上海国际计算生物学创新大赛决赛结果揭晓。上海科技大学生命科学与技术学院及免疫化学研究所双聘助理教授白芳率三支队伍参赛,其中两支队伍以排名前五的成绩闯入决赛。GeminiMol团队拔得决赛头筹,荣获一等奖;冬旦之间团队荣获二等奖。颁奖典礼在2024浦江创新论坛·计算生物学创新论坛上举行。在本次大赛中跻身前5名的上海团队还将得到上海市“科技创新行动计划”计算生物学重点专项的立项支持。
获奖队伍合影
计算生物学是一门利用计算机技术研究生物学的交叉学科。在新药发现领域,深度学习等人工智能技术可通过“干实验”(计算生物学实验)筛选化合物,取代传统的高通量化合物筛选。该方法能快速地从几十万个化合物中筛选出潜在活性分子,为生物学“湿实验”的药物发现提供源头分子,有望大幅节省成本、提高效率,孕育出更多的新药。
为了遴选一批创新能力较强的AI药物发现团队,去年12月,由上海市科委指导、市生物医药科技发展中心主办的首届上海国际计算生物学创新大赛·药物筛选AI算法“凌越”挑战赛启动。这项赛事以NMDA(N-甲基-D-天冬氨酸)离子通道为靶标,邀请全球5人以下团队和个人报名参赛,利用华为云提供的算力发现小分子调节剂。本次大赛吸引了342支团队共1329人报名,共提交了180份方案摘要、89个小分子化合物。
在比赛中,白芳带领课题组研究生,采用课题组发展的不同方法,分别设计了“纯AI算法”和“AI+物理模型”的两种化合物筛选策略,在大赛上取得了优异成绩。
一等奖GeminiMol团队
GeminiMol团队负责人王世航介绍,在药物科学领域,结构相似的分子往往展现出相似的生物活性和药效特性。利用了这一自然规律,团队通过大规模分子间的对比学习,力求最大限度建立药物分子结构与药效性质之间的精准关联模型,从而显著提升基于配体的药物发现效率。不仅助力了本次竞赛中活性化合物的识别,还可广泛应用于靶标识别、药物ADMET(吸收、分布、代谢、排泄和毒性)性质预测等多元化的药物研发任务中。同时,相较于传统的基于物理模型的活性分子发现方法,如经典的分子对接技术,在同等计算硬件资源条件下,GeminiMol方法在计算速度上至少提高两个数量级,可显著加速活性化合物的发现。
二等奖冬旦之间团队
而冬旦之间团队向评委提交了12个分子,6个经“湿实验”验证有活性,50%的命中率在业内引起了不小轰动。面对这次大赛中包含1800万个化合物的庞大数据库,团队对原有算法进行了改进,以适应在短时间内完成大规模数据库筛选的需求。团队负责人李世伟介绍了团队在预测上的独特方法——不依赖结构信息,而是利用最先进的蛋白质语言模型和AI技术进行预测,一方面有效减小了参数维度、节省计算时间,另外一方面也规避了本赛题涉及蛋白质无准确实验结构的限制。
本次上科大在大赛上的亮眼成绩,离不开上科大AI for Science专项计划、图书信息中心平台对计算生物学等前沿生命科学领域的大力支持,也得益于学校注重营造跨学科交流合作的创新氛围。此外生命学院、免疫化学研究所对科研人员及学生的科研提供了完善的激励机制与平台支撑。白芳长期深耕计算机辅助药物设计方法开发与应用研究,近年来引入人工智能算法,带领课题组开发出一系列AI驱动的药物设计新方法。这些算法已在白芳实验室网站免费开放,吸引了近20个国家的学术界或工业界用户使用,个别方法任务提交数高达12万以上,积极助力全球计算生物学发展。
获奖团队名单
团队名称:GeminiMol团队
主要成员:王世航、王林、周泳锜、杨皓、田思源
团队名称:冬旦之间团队
主要成员:李世伟、吴洒男、李宗全、马欣悦、徐超