围绕着近年来国家在计算机系统软硬件的“卡脖子”问题和“计算机系统软硬件自主可控”的战略布局,信息学院系统与安全中心(SSC)立足计算机系统底层前沿技术的探索和研究,为爆发式增长的各类应用需求以及学科间的交叉融合研究提供坚实的系统架构、算法、网络和安全等基础支撑。
系统与安全中心教学科研团队
近期,SSC先后在高性能计算领域顶级会议SC-2020、计算机操作系统领域顶级会议OSDI-2020和计算机系统结构领域顶级会议ISCA-2020上发表重要科研成果,实现了上海科技大学在计算机系统领域顶级会议零的突破。有别于理论与应用类的成果,计算机系统领域的研究工作,除了要求思路新颖之外,还需要在实体计算机系统上实现设计并开展验证和测试工作,具有设计开发测试周期长、实现难度大等特点。以上科研成果平均历时20个月,以数据存储、编译器和DRAM内存结构为三个切入点,针对计算机系统结构的问题提出了新思考,为计算机系统软硬件设计的新黄金时代积累自主可控研发经验。当前研究成果及持续工作在数据管理、算法和体系结构等方面具有借鉴意义,持续助力上科大牵头的大科学装置硬X射线自由电子激光(SHINE)、新型高性能计算系统、生命科学及医药医学研究等国家战略布局项目。
SC全称The International Conference for High Performance Computing, Networking, Storage, and Analysis,是国际高性能计算领域的顶级学术会议之一,每年投稿量不超过400篇,接受率20%左右。作为高性能计算领域的权威会议之一,每年全球TOP500超级计算机榜单通过SC发布,与超算相关的各大厂商和机构也会在SC进行布展,展示其最新产品与研发成果,同时SC每年还将举办国际大学生超算三大赛事之一的SCC (Student cluster competition)。
OSDI全称USENIX Symposium on Operating Systems Design and Implementation,是计算机操作系统领域乃至整个计算机系统领域的顶级学术会议之一,作为计算机系统学界和工业界风向标之一的OSDI,先后发布过MapReduce、BigTable、Ceph、TensorFlow等重量级研究成果。OSDI-2020共收到投稿398篇,最终接收70篇,接收率17.6%。
ISCA全称International Symposium on Computer Architecture,是计算机体系结构领域的顶级学术会议之一,是计算机架构领域提出新思想、新方法和新成果的主要平台,特别寻求具有前瞻性和新颖性的高水平论文。ISCA-2020共有421篇投稿,最终接收77篇,接受率18.2%。
殷树课题组硕士研究生张坚设计了一个名为BORA的文件系统中间层,首次从数据组织和有效数据获取效率的角度对bag进行了优化。BORA的原型系统先后部署在实验室单节点工作站和九节点PVFS并行文件系统集群,并最终部署在天河超级计算机存储子系统上。实际应用测试结果表明,相比于传统的bag操作,BORA将获取有效数据的性能提高了11倍。特别地,在机器人蜂群场景下,BORA大幅提升了天河超算存储子系统获取有效数据的I/O性能,并将同时打开上百个bag的时间缩短了3100倍,为机器人蜂群等复杂多变的海量多维度数据分析场景提供了有力的支持。
该研究成果以“BORA: A Bag Optimizer for Robotics Analysis”为题发表于高性能计算领域顶级会议SC-2020。
图(a) BORA结构框图; 图(b) BORA中核心部件container的机构图
此外,为了使深度神经网络任务能更高效地在以现有数据中心中广泛部署的大规模并行加速器上执行,范睿课题组硕士研究生谢志强与微软亚洲研究院(MSRA)合作,设计了一个名为RAMMER的神经网络编译器,以此试图解决传统深度学习框架下两层调度运行方法导致地硬件利用低效率。经实验验证,RAMMER在众多新型硬件上(NVIDIA GPU, AMD GPU, GraphCore IPU)都展示了显著的性能提升,相较于此前流行的深度学习框架与编译器(TensorFlow XLA,TVM),RAMMER在一些任务下实现了最高达20倍的性能增益,即使是同TensorRT这种硬件厂商自研商用的闭源生态相比,也实现了最高达3倍的加速。
该研究成果以“RAMMER: Enabling Holistic Deep Learning Compiler Optimizations with rTasks” 为题发表于计算机操作系统领域顶级会议OSDI-2020 。
图(a) 传统深度学习框架和编译器结构;图(b) RAMMER的框架和结构
除了研究生外,2015级本科生罗浩聪(SSC轮转学生)在ETH-Zurich实习期间,设计了一种名为CLR-DRAM的低功耗DRAM结构,用以平衡DRAM 芯片的容量-时延冲突,并降低调整的功耗开销。CLR-DRAM(容量-时延可重构DRAM)作为一种全新的DRAM架构,通过动态调整DRAM的容量-时延权衡来降低功耗开销。四核多程序工作负载的评估结果表明,相比于现有DRAM,CLR-DRAM在提高18.6%系统性能的同时降低了29.7%的功耗。CLR-DRAM设计为计算机系统动态适配多种内存容量和优化负载时延开辟了新的研究方向。
该工作以"CLR-DRAM: A Low-Cost DRAM Architecture Enabling Dynamic Capacity-Latency Trade-Off" 为题发表于计算机系统结构顶级会议ISCA-2020。
图(a):现有DRAM的Open-Bitline结构,图(b)(c):CLR-DRAM结构(两种模式)
以研促学,以学辅研,SSC在抓学生教学和科研的同时,非常鼓励学生将所掌握的知识进行实践转化。不少信息学子通过教授讲授的计算机系统结构、操作系统、编译原理、计算机网络、并行计算等课程,对计算机系统领域有了进一步认识,并产生了浓厚的兴趣,并在SSC教授们的鼓励下积极参加GeekPie_学生社团活动,并通过GeekPie_HPC等团体积极参与学校高性能计算平台的建设和升级,并作为主力成员参加各大科创赛事。值得一提的是,上述三篇计算机系统领域顶级会议的作者不少是GeekPie_HPC超算社团的主力成员。他们是SC-2020的作者荆玉琢(2016级本科)、宋延杰(2016级本科)、胡冠洲(2016级本科);OSDI-2020的作者谢志强(2015级本科);ISCA-2020的作者罗浩聪(2015级本科)。这些学生都曾分别代表上海科技大学征战了ASC’18、ISC’18、ASC’19、SC’19等国际大学生顶级超算赛事,并持续取得优异的成绩。
上海科技大学系统与安全中心在教学和研究过程中不断探索新的人才培养模式,逐步摸索出一套教学研相长的综合培养模式。通过教学和研究相互融合促进的方式,在夯实学生专业知识的基础上,进一步培养学生对于计算机各领域的研究兴趣,同时指导学生们找到合适自己的深造方向,鼓励他们在各方向上开展高水平的研究工作,通过实际行动践行为国家战略布局培养和储备人才的使命。
图:ASC’18 亚洲超算大赛,GeekPie_HPC首次亮相决赛,获得亚军和ePrice单项大奖。
左一:殷树,左二:沈喆奇,左三:谢志强,左四:Jack Dongara,右三:陈宸,右二:刘建中,右一:罗浩聪
图:ISC’18 国际超算大赛,GeekPie_HPC首次亮相该赛事,获得第四和FanFavor单项奖。
左一:殷树,左二:张迎冬,左三:元祎君,左四:陈宸,右四:刘建中,右三:沈喆奇,右二:罗浩聪,右一:谢志强
图:SC’19 超算大赛,GeekPie_HPC首次亮相该赛事,获得业内大咖的关注。
左一:宋延杰,左二:罗剑文,左三:沈喆奇,右三:荆玉琢,右二:杜嘉,右一:王乐童
图:SC’19超算大赛期间,美国阿贡国家实验室副主任、芝加哥大学教授Rick Stevens(左二)
亲临GeekPie_HPC参赛位,对同学们的工作表示赞赏。
GeekPie_HPC的核心成员毕业后正在或将继续从事计算机各类研究方向的深造学习。胡冠洲(2016级本科)前往威斯康辛麦迪逊大学(Wisconsin-Madison)全奖攻读博士学位,罗浩聪(2015级本科)前往苏黎世理工学院(ETH-Zurich)全奖攻读博士学位,丁鹏(2014级本科)前往芝加哥大学全奖攻读博士学位,周杨(2014级本科)前往纽约大学全奖攻读博士学位,陈宸(2014级本科)前往伊利诺伊大学芝加哥分校(UIC)访问并开始全奖攻读博士学位。
荆玉琢(2016级本科)获得约翰斯霍普金斯大学(JHU)全奖博士offer,沈喆奇(2016级本科)获得加州大学河滨分校(UCR)全奖博士offer,王乐童(2016级本科,女)获得加州大学河滨分校(UCR)全奖博士offer,元祎君(2014级本科)留校完成硕士阶段研究后将赴德国继续机器人相关的博士研究工作。
杜嘉(2016级本科,女)获得ARM实习机会,将前往卡内基梅隆大学(CMU)攻读硕士学位,罗剑文(2017级本科,EE专业)和宋延杰(2016级本科)留校攻读硕士学位,谢志强(2015级本科)获得微软亚洲研究员实习机会,现在上科大攻读硕士学位,刘建中(2014级本科)现在上科大攻读硕士学位。吕文涛(2014级本科)在上科大攻读硕士研究生期间即在人工智能领域开始创业。