上海科技大学信息科学与技术学院李权课题组(交互智能与可视分析实验室ViSeer LAB)聚焦于以人为中心的可解释性人工智能模型及其应用,并通过人机协同可视分析技术为解决重大社会问题提供决策支持工具。近日,课题组在可视化与计算机图形领域期刊《IEEE可视化与计算机图形学汇刊》(IEEE Transactions on Visualization and Computer Graphics, TVCG)及人机交互领域最有影响力的会议之一ACM计算机人因会议(ACM Conference on Human Factors in Computing,ACM CHI 2025)同期发表了六篇创新性研究成果。
面向在线游戏的显隐特征融合用户流失预测框架
蓬勃发展的在线游戏行业面临激烈竞争,为了预测玩家流失,业界依赖于专注于社交互动动态的机器学习(ML)模型。但传统机器学习模型普遍缺乏透明度,尽管可解释人工智能(XAI)技术能够解释模型决策,但在游戏行业应用仍有限,主要因为非技术专家(如产品经理和游戏设计师)在解读计算模型中的显性和隐性特征时面临困难。
图1:提出的解释显性和隐性特征的算法流程。
为解决这一问题,李权组提出了基于显性-隐性特征解耦的XAI框架,并开发了高效可视分析系统“Don’tGo”。该框架首次将游戏日志数据划分为显性特征(如玩家等级、性别、战斗评分)和隐性特征(如社交网络动态、行为序列模式),并通过多模态机器学习模型(AutoInt)实现高效融合。实验结果显示,该模型在F1值、AUC和准确率等指标上显著优于传统方法,尤其在捕捉用户流失动态时展现了更强的鲁棒性。为解决“黑箱”问题,团队结合SHAP值分析与反事实解释(Counterfactual Explanations),构建了双重可解释框架(图1)。论文提出的技术框架已开源(GitHub: DontGo-Framework)。
该研究由信息科学与技术学院李权课题组、网易游戏用户体验中心及香港科技大学合作完成,论文以“Deciphering Explicit and Implicit Features for Reliable, Interpretable, and Actionable User Churn Prediction in Online Video Games”为题发表在TVCG。信息科学与技术学院2022级硕士研究生王希元与2020级博士研究生谢莱鑫为共同第一作者,李权教授为通讯作者。
论文链接:https://doi.org/10.1109/TVCG.2025.3538768
从需求到解决方案:揭示可视分析中问题驱动的设计模式
可视分析将自动化的分析技术与交互式的可视化相结合,从而基于数据进行有效的理解、推理和决策。在实际中,研究人员与领域专家密切合作,以确定需求并选择恰当的解决方案来实现需求。由于目前研究人员初始考虑空间中往往缺乏指导,且可视分析社区中缺乏形式化且可共享的问题解决知识体系,导致最终得出的解决方案不理想。
图2:本研究A)对现有的分类框架进行补全,并基于此桥接需求和解决方案; B)将可视分析论文中的需求、数据和解决方案之间的关系概念化为知识图谱,并以互联的路径或子图展现设计模式。
为了解决此问题,李权组提出了一种创新的元分析框架。通过对220篇权威可视分析论文的系统性编码与知识抽取,构建了覆盖需求、数据与解决方案的三维拓扑结构(图2)。该框架突破了传统研究中需求与解决方案割裂的局限,首次实现了跨领域问题解决知识的结构化外化,为研究者提供了从需求抽象到技术落地的全局视角。该工具支持研究者按需求与数据类型筛选解决方案,实时生成子图与案例链接,为设计决策提供量化依据与跨领域参考。
该成果由信息科学与技术学院李权课题组及康奈尔大学合作完成,并以“From Requirement to Solution: Unveiling Problem-Driven Design Patterns in Visual Analytics”为题发表在TVCG。信息科学与技术学院2022级项目型硕士研究生吴宇辰为论文的第一作者,李权教授为通讯作者。
论文链接:https://doi.org/10.1109/TVCG.2025.3538768
通过临床推理推动基于问题的学习以提升医学教育中的鉴别诊断能力
在现代医学教育中,基于问题的学习(PBL)作为一种以学生为中心的教学方法,旨在通过模拟真实的临床诊断场景,提升学生的实践能力和解决问题的技巧。现有研究虽然在提高PBL的真实性和沉浸感方面取得了一定进展,但在构建逻辑推理链和证据支持的临床推理方面仍有不足,制约了学生临床推理能力的提升。
为此,李权组开发了e-MedLearn系统,这是一个以学生为中心的PBL系统,旨在支持更高效的应用和实践基于证据的临床推理。该系统不仅提供了丰富的临床案例和数据支持,还具有互动性和实时反馈功能,使学生能够在真实的临床场景中进行实践和学习。为了验证e-MedLearn系统的有效性,实证研究结果表明,e-MedLearn系统显著提升了PBL学习体验,在提高学生的临床推理能力和自主学习能力方面表现尤为突出。
图3:使用e-MedLearn进行案例分析的过程,在案例选择之后,包含以下几个步骤:(a)展示初步的病例数据,探索证据,形成初步的诊断思路。(b)利用检查或测试的数据进行诊断分析,并更新诊断思路。(c)考虑预后并评估分析结果,反思思路以总结学习问题。(d)在诊断列表中记录并更新诊断。(e)在思维导图中记录并回顾分析过程中的想法。
该研究由上海科技大学信息科学与技术学院李权课题组和上海临床研究中心姜畅医师合作完成,并以“Advancing Problem-Based Learning with Clinical Reasoning for Improved Differential Diagnosis in Medical Education”为题以全文收录(Full Paper Track)形式被ACM CHI 2025接收。信息科学与技术学院2023级硕士研究生徐源松为论文的第一作者,李权教授和上海临床研究中心姜畅医师为共同通讯作者。 ACM CHI为CCF-A类会议,2025年Full Paper Track共收到5,020份完整投稿,经过论文委员会的修改和重新提交流程,最终接收了1,249篇论文,接收率为25.1%。
支持从碎片化线索进行游戏故事解读和叙事推断
在现代电子游戏领域,游戏叙事的深度与开放性激发了玩家的创造力,促使他们通过视频、论坛等多种形式分享对游戏故事的独特解读。然而,面对游戏世界中纷繁复杂的叙事线索,如何高效地组织与分析这些内容,成为创作者和研究者面临的重大挑战。
图4:ClueCart 共集成了左侧的线索分类查询,和右侧的叙事推断功能。
针对这一问题,李权组开发了ClueCart,一款专为游戏叙事分析设计的创新工具(https://cluecart.github.io/ClueCart/ )(图4)。ClueCart通过结合文献综述、用户调研和协作设计工作坊,深入探索了叙事线索的分类与组织需求。在此基础上,研究团队提出了一个完善的叙事线索分类体系,并设计了一套高效的游戏线索收集方法。实验结果表明,ClueCart在用户感知、功能支持和故事解读效率等方面均优于传统工具。研究团队计划进一步扩展ClueCart的功能,探索其在跨媒介叙事分析中的应用潜力,同时开发更多支持玩家参与叙事创作的工具。
该研究成果由信息科学与技术学院李权课题组及香港科技大学(广州)计算媒体与艺术系合作完成,并以“ClueCart: Supporting Game Story Interpretation and Narrative Inference from Fragmented Clues”为题以Full Paper Track形式被ACM CHI 2025接收。信息科学与技术学院2022级硕士研究生王希元为论文的第一作者,李权教授为通讯作者。
创新医疗教育技术突破——CaseMaster系统创新病例汇报训练模式
在临床医学教育中,规范化的病例汇报(Oral Case Presentation)能力培养是医学生临床思维训练的核心环节。传统教学模式主要依赖教师示范和课堂演练,存在个性化指导不足、反馈周期长、标准化程度低等局限。现有的大多数数字化工具主要聚焦语音表达训练,对病例信息的结构化组织、诊断逻辑链的构建等关键能力的支持仍显薄弱,导致学生在自主准备过程中常常出现信息筛选失焦、证据链断裂等问题。
图5:使用CaseMaster进行病例汇报训练的过程包括以下步骤:(a)审阅患者名单,(b)聚焦于特定患者,(c)通过预设活动和有序准备展示结构化且逻辑清晰的思维过程,(d)进行口头病例汇报,以及(e)突出一个有问题的解决方案,另一位用户就该汇报提供反馈。
针对这一挑战,李权组开发了创新型训练系统CaseMaster。该系统是一个以学生为中心的智能训练平台,旨在通过结构化的训练框架和精准的反馈机制,提升医学生的病例逻辑构建与循证表达能力。CaseMaster通过大语言模型(LLM)与结构化学习框架的深度整合,突破了传统训练方法的局限性,为医学生提供了闭环式智能训练解决方案。初步验证表明,系统能够有效提升病例汇报的结构化水平与诊断推理质量,尤其在关键信息筛选和逻辑链条的完整性方面,获得了教学专家的高度认可。未来的研究将重点开发与临床教学场景深度融合的智能辅助功能,通过优化训练模式与反馈机制,推动病例汇报能力培养向精准化、智能化方向转型。
该研究成果由上海科技大学信息科学与技术学院李权课题组与上海临床研究中心姜畅医师合作完成,并以“CaseMaster: Formulating a Probe for Oral Case Presentation Training with LLM Assistance”为题以最新突破(Late-Breaking Work Track,LBW Track)形式被ACM CHI 2025接收。信息科学与技术学院2023级博士研究生欧阳阳为论文的第一作者,李权教授为通讯作者。ACM CHI 2025 LBW Track共收到1,888份完整投稿,最终接收了620篇,接收率为32.83%。
虚拟现实异步共视技术突破:弹幕化身系统重塑视频社交体验
在传统的电视和视频观看场景中,亲友同步观看曾是社交互动的核心方式。现代快节奏的生活与时间差异推动异步共观模式(如弹幕评论)因此应运而生。但二维屏幕和纯文本交互依然面临社交临场感不足、情感传达受限等挑战。
近期,李权课题组在融合虚拟现实(VR)与弹幕技术方面取得突破性进展。课题组提出通过将传统弹幕转化为沉浸式虚拟形象,解决二维交互中实时性和情感深度不足的问题。用户调研显示,超过80%的受访者强烈期待在VR环境中实现更具临场感的异步共观功能。为此,课题组以亚洲流行的弹幕文化为灵感,设计了“虚拟弹幕形象”系统。该系统创新性地将文字评论转化为带有语音交互能力的虚拟角色,并将其同步嵌入VR观影环境中,成功突破了传统二维界面社交临场感不足的瓶颈,为异步视频共视体验树立了新的范式。课题组招募了13名具有VR设计经验的高校学生参与实验。用户反馈显示,虚拟形象的实时语音互动显著提升了社交临场感,并激发了更强的交流意愿。这一研究成果不仅为异步共观领域注入了新的活力,也为元宇宙时代的社交娱乐场景开辟了创新方向。
图6:弹幕虚拟化身系统的设计过程包括四个关键阶段:(a) 获取和处理原始弹幕数据;(b) 对评论进行处理和聚类,并将其映射到弹幕虚拟化身上,这些虚拟化身能够通过大型语言模型(LLMs)和非语言行为规则实现实时互动;(c) 弹幕虚拟化身形象选择面板;(d) 在虚拟现实(VR)环境中与弹幕虚拟化身共同观看视频的体验。
该研究由上海科技大学信息科学与技术学院李权课题组与中国人民大学合作完成,并以“Danmaku Avatar: Enabling Asynchronous Co-viewing Experiences in Virtual Reality via Danmaku”为题被ACM CHI 2025 LBW Track收录。信息科学与技术学院2023级硕士研究生窦小凤为论文第一作者,李权教授为通讯作者。