上海科技大学信息科学与技术学院李权课题组(交互智能与可视分析实验室ViSeer LAB)致力于开发先进的交互和可视分析技术,促进人、机器和数据之间的紧密互联,提升真实世界中涉及大量数据、复杂人工智能模型以及不同背景用户群体的数据探索效率,支持通用的数据科学工作流程的可视化设计、开发和评估。近日,课题组在人机协同及可视分析领域的研究成果被可视化与计算机图形学领域期刊IEEE Transactions on Visualization and Computer Graphics (TVCG) 正式接收。
基于人机协同的知识辅助标注:高效创建医疗文本语料库
医疗文本标注旨在从非结构化文本中提取有价值的标签信息,在医学研究中起着至关重要的作用。传统的标注数据生成方法通常依赖于严格的规则,可能无法适应新任务。虽然机器学习(ML)方法减轻了人工标注的工作量,但对于缺乏相关技术背景的研究人员来说,配置ML模型以满足特定的研究需求仍然具有挑战性。为了克服这些挑战,李权课题组提出了一种人机协作工作流程,无缝整合了可视聚类分析和主动学习技术,以支持不同粒度(批量/逐个)的文本标注。还提出了一种基于知识的文档嵌入网络,能够结合专家的见解,为医疗文本生成特定任务的嵌入,从而快速对齐到研究目标。
图| 人机协作工作流程策略性地采用了一种三阶段方法:模式探索、知识整合和实例标注。前两个阶段识别潜在模式,并进行初步的粗粒度标注,最后一个阶段则逐一进行细粒度标注。
课题组将上述工作流程整合到了一个名为KMTLabeler的交互式可视分析工具中,该工具配备了协调的多级视图和交互,支持领域专家有效探索、仔细探查和精确识别不同的数据标签。通过基于三个真实世界数据集的两项案例研究及一项对照用户研究,充分证明了 KMTLabeler 在提供医疗文本高效标注环境方面的有效性与可靠性。
图| KMTLabeler系统引入了知识驱动的人机协作工作流程,旨在加速医疗文本语料库的创建。
该研究成果由上海科技大学信息科学与技术学院李权课题组和复旦大学附属中山医院合作完成,并以“KMTLabeler: An Interactive Knowledge-Assisted Labeling Tool for Medical Text Classification”为题在线发表(https://ieeexplore.ieee.org/document/10540286)。信息科学与技术学院2021级项目型硕士研究生王鹤为论文的第一作者,李权为通讯作者。
可视分析驱动的基金经理选择:实现有效的投资决策
基金业绩在很大程度上依赖于管理者(基金经理)的专业能力。与普通投资者相比,基金经理可凭借其投资知识和专业技能获得更大的竞争优势,越来越多的投资者在投资时会考虑基金经理的能力。目前已有研究采用定量或定性的方法从业绩指标、个人特征和业绩持续性等多个层面来分析基金经理。但如何从一个庞大的候选空间中比较和选择基金经理仍然面临挑战。此外由于金融市场的不确定性,如何区分其业绩是源于技能还是运气同样也是一个挑战。为此,李权课题组分析了投资者在选择合适的基金经理时的需求,并提出了一个交互式可视分析系统FMLens来简化基金经理的选择过程。系统支持投资者从多个维度对基金经理的投资风格和能力进行有效地评估和解构,还支持对基金经理的历史业绩的系统性回顾、检查和比较。此外,系统还利用基于行业指数的回归方法来模拟基金仓位的每日变化,进而帮助刻画基金经理的持仓风格。通过两项案例研究和定性用户调研,证明了综合方法的有效性。
图| FMLens系统解构基金经理的投资风格和能力,旨在提高基金经理评估和选择的效率。
该研究成果由上海科技大学信息科学与技术学院李权教授、张海鹏教授,创业与管理学院洪苏婷教授,中汇信息技术(上海)有限公司、创新工场人工智能研究所和倍漾量化及香港科技大学计算机科学与工程系合作完成,并以“FMLens: Towards Better Scaffolding the Process of Fund Manager Selection in Fund Investments”为题在线发表(https://ieeexplore.ieee.org/document/10509776)。信息科学与技术学院2021级硕士研究生陈龙飞为论文的第一作者,李权为通讯作者。