近日,信息学院可重构与智能计算实验室哈亚军课题组在轻量级神经网络和快速傅立叶变换领域分别取得重要进展,相关成果以TAIT: One-Shot Full-Integer Lightweight DNN Quantization via Tunable Activation Imbalance Transfer和Bitwidth-Optimized Energy-Efficient FFT Design via Scaling Information Propagation为题被ACM/IEEE设计自动化会议(ACM/IEEE Design Automation Conference, DAC)接收。DAC会议是集成电路辅助设计(EDA)和嵌入式系统领域的国际最权威会议, 迄今已有超过50年历史,主要关注芯片、电路以及系统设计的新工具和新方法。该会议近两年的论文接收率为20%左右。
近年来,轻量级神经网络在自动驾驶、无人机目标探测、智能安防和人脸识别等边缘计算领域取得了非常广泛的应用。轻量级神经网络通过将传统卷积分解为逐通道卷积和逐像素卷积,极大地降低了参数量和计算量,但跟传统的量化算法结合时会有较明显的精度损失。
图 轻量级神经网络广泛应用在边缘计算场景下
哈亚军课题组研究发现,造成精度损失的重要因素是逐通道卷积的输出特征图层间差异较大。为此,课题组提出了可调激活不均衡转移(Tunable Activation Imbalance Transfer,TAIT)算法。该算法将特征图的层间差异部分转移到后一层的权重,在不明显增加后一层权重量化误差的条件下极大地降低特征图的量化误差。实验结果表明,该方法应用在神经网络MobileNetv2上可以取得已知的最佳结果:int8量化的精度损失仅为0.02%,在轻量级神经网络SkyNet上可以取得无损的结果。
图 激活不均衡转移示意图
该论文的第一作者是信息学院2019级博士研究生姜伟雄,哈亚军教授为通讯作者,上科大为第一完成单位。该想法于2020年5月提出,首先应用在2020届DAC-System Design Contest(DAC-SDC’20)中。该比赛的任务是在Xilinx Ultra96v2平台上实现高速、高准确率且低功耗的飞行器高空目标检测,评价指标综合考虑速度、精度以及能耗。得益于TAIT算法,哈亚军课题组以更低的量化位宽取得了更高的精度,最终从全世界80余支参赛队伍中脱颖而出获得亚军。而后研究团队进一步完善了理论及实验,将成果投稿DAC'21并被接收。
快速傅立叶变换(FFT)是数字信号处理(DSP)中最重要的算法之一,它可以加速离散傅立叶变换(DFT)并有效地处理离散信号,广泛用于数字信号处理以在时域和频域之间进行转换。哈亚军课题组发现快速傅立叶变换的一些应用场景(如压缩-解压场景,发射-接收场景)具有快速傅立叶变换(FFT)与逆快速傅立叶变换(IFFT)成对出现的特点,并且这两种变换在时间和空间上是分离的。这两个特点使得采取某种方式实现复杂度与计算量的转移成为可能。经过研究发现,对于定点硬件实现,动态范围的增长不可避免地发生在快速傅立叶变换操作的每个阶段,但是可以利用对称变换件的数据依赖关系,实现运算量的重新分配。为此,哈亚军课题组提出了缩放信息传播(Scaled Information Propagation, SIP)方法,以缓解动态范围增长的问题,该方法充分利用了位宽,并且比最新解决方案消耗的额外区域少得多。
图 FFT/IFFT系统示意图
在两个连续的变换操作中,缩放信息传播方法提取缩放信息并在前一个变换中做出缩放决策,然后在后一个变换中执行。哈亚军课题组在正交频分复用和全息视频压缩系统的硬件设计中实现了快速傅里叶变换以验证缩放信息传播方法。与最新技术相比,在要求1.02x10-7误码率的情况下,该方法可实现9.38%的能耗降低和8.36%的面积节省,并在需要全息视频压缩系统的信噪比为20 dB时,分别节省了33.47%的能耗和30.98%的面积。信息学院2020级博士研究生刘心哲、2018级博士研究生陈富鹏为该论文共同第一作者,哈亚军教授为通讯作者,上科大为第一完成单位,比利时微电子中心IMEC为合作单位。