随着高性能科学计算仿真模型和大规模图像重构软件在科研中发挥越来越大的作用,可复现性(reproducibility)对于文章结果的验证至关重要。上海科技大学GeekPie_HPC本科生超算队在国际大学生超算大赛(SC20超算大赛)中完成了对MemXCT新型X射线CT影像重建算法的重现,并在MS Azure云计算平台上使用不同数据集与实验参数设置,测试并验证了原论文的实验结果。
赛后,GeekPie_HPC接受并行与分布式系统领域期刊IEEE Transactions on Parallel and Distributed Systems 的邀请,基于MemXCT的重现工作撰写评论论文(Critique Paper)。该论文近期将通过Early Access的方式提供查阅,题为“Reproducibility: Performance Evaluation of MemXCT on Azure CycleCloud Platform”。
MemXCT是一种高分辨率重建X射线图像的三维成像技术,利用多级缓冲和两级伪希尔伯特排序实现了优化的稀疏矩阵向量乘法(SpMV),优化了数据通信、分区和访问。这种改进后的X射线图像算法使内存成为性能瓶颈,避免了传统方法的冗余计算。该工作由美国伊利诺伊大学(UIUC)、阿贡国家实验室(Argonne National Laboratory)和威廉玛丽学院(College of William& Mary)共同完成,发表于2019年SC大会,题为“MemXCT: Memory-Centric X-ray CT Reconstruction with Massive Parallelization”。MemXCT被SC20学生超算大赛组委会选定为复现赛题。
MemXCT示意图(图片来源MemXCT SC19论文)
上科大GeekPie_HPC代表队在SC20大赛期间基于Azure平台搭建的高新能计算集群上验证MemXCT的可运行性,进而测试MemXCT在不同硬件配置上的性能,利用网格搜索的方式调整缓冲区和块的大小,进而优化多级缓冲在CPU/GPU异构计算结构的运行效率, 同时完成MemXCT在单一硬件上的GFLOPS与有效内存带宽的测试。
在此基础上,上科大GeekPie_HPC代表队使用多个大型CT数据集验证MemXCT算法的扩展性。在验证MemXCT强扩展性的工作中,GeekPie_HPC运用了改变进程数和节点数的配比、优化数据集分割方案等多种手段完成相关测试,并量化展现了进程间通信损耗对算法性能的影响关系。
SC20大赛参赛队员杨易为作为队长及学生教练继续征战SC21大赛,带领全队取得全球总成绩排名第二,创造了上科大在SC国际大学生超算大赛的历史最好成绩。
上科大GeekPie_HPC SC20大赛成员(左起:徐子钧、柳煜辰、孟奕璇、徐开元、吴天元、杨易为)