中国团队研发出毫瓦级超低功耗类脑芯片

问芯科技吗 2024-06-03 02:50:08

通常情况下,AI 芯片的算力越强,其功耗也就越高。若将人类大脑看作是一个 AI 系统,能够运行极其繁杂和庞大的神经网络,但其总功耗仅为 20W 左右,功耗远小于现有的 AI 系统。

人脑具有较高的能效比,这主要得益于人脑拥有高效的能量利用机制和精细的调控能力,基于此,围绕人类大脑的低功耗特性开发新型 AI 系统是未来重要研究方向之一。

近日,由中国科学院自动化研究所李国齐、徐波等领导的研究团队开发出一款名为“Speck”的类脑神经形态片上系统(SoC),能够实现动态计算的“算法-软件-硬件”协同,在典型视觉场景任务下其功耗低至 0.7 mW,并且其静息功耗仅为 0.42 mW。

目前,这项研究成果已经以“Spike-based dynamic computing with asynchronous sensing-computing neuromorphic chip”为题发表在 Nature Communications 上。

图|(来源:Nature Communications)

自然界中有很多小昆虫能够实时跟踪物体、躲避障碍物,甚至能够完成推理、决策等,相较之下,人类大脑的结构更为复杂、功能更加强大。

人脑的一个重要功能是其能够根据需求动态分配资源,即可以实现“动态计算”,这种动态计算包含两个含义:在当没有输入时的能量消耗最小,能够随着输入的变化而变化。

针对 AI 发展所面临的“硬件和算法”两大瓶颈,这种“类脑智能”或许是一条破局之路。所谓类脑智能,其实是一种受大脑神经运行机制和认知行为机制启发,以计算建模为手段通过软硬件协同实现的机器智能,可让机器实现低功耗、高能效计算。

作为类脑智能的核心,“类脑芯片”借鉴大脑的信息处理方式,以神经元与神经突触为基本单元,模拟大脑神经元的功能特性、信号传递和学习方式,能够让计算机在低能耗情况下完成感知、学习、记忆、决策等任务。

图|Speck 类脑神经形态片上系统(来源:中国科学院自动化研究所)

在这项研究中,该团队提出了“神经形态动态计算”的概念,通过设计一种类脑神经形态系统 Speck 来实现基于大脑“注意力”机制的动态计算。

首先,在硬件层面,实现了“没有事件输入就不消耗能量”;其次,在算法层面,实现了“有事件输入时能够根据输入重要性程度来动态调整计算”,两者结合从而实现在典型视觉场景任务下的功耗仅为 0.7 mW。

图|类脑神经形态 SoC 系统 Speck 设计框架(来源:Nature Communications)

据论文介绍,Speck 采用全异步设计,将动态视觉传感器和类脑神经形态芯片集成在了同一个芯片上,是一款“异步感算一体”类脑神经形态 SoC,其尺寸大小为 6.1 mm × 4.9 mm,能够以微秒级的时间分辨率感知视觉信息。

需要注意的是,不同于先前全局时钟控制信号,以全异步方式设计的 Speck 从根本上避免了时钟空翻带来的功耗消耗,仅在有事件输入时才触发稀疏加法运算,并且其静息功耗非常低,仅为 0.42 mW。

图|受大脑注意力机制启发的神经形态计算动态框架(来源:Nature Communications)

脉冲神经网络(Spiking Neural Network,SNN)是源于生物启发的新一代人工神经网络模型,借鉴了生物启发的局部非监督(比如脉冲时序依赖可塑性、局部稳态调节等)、全局弱监督(比如基于能量的函数优化等)的生物优化方法,包含具有时序动力学特性的神经元节点、稳态-可塑性平衡的突触结构、功能特异性的网络环路等,具有时空信息表征、异步事件信息处理、网络自组织学习等能力。

针对脉冲神经网络存在的一些挑战,比如,在时间维度中难以根据输入重要性调整其脉冲发放等“动态失衡”的问题,研究团队设计出基于大脑“注意力”机制的神经形态脉冲动态计算框架,能够在多种粒度上实现对不同的输入进行有区分地动态响应。

试验结果显示,在 DVS128 Gesture 数据集上,融合脉冲动态计算的 Speck 在提升任务性能(任务精度提升约 9%)的同时,还显著降低了功耗(平均功耗从 9.5 mW 降低至 3.8 mW)。这表明,注意力机制的引入让脉冲神经网络具备“动态计算”能力,能够根据输入重要性调整其脉冲发放模式进而解决“动态失衡”的问题。

为了有效地为各种动态视觉应用部署算法及模型,Speck 还提供了一个完整的软件工具链,包括数据管理、模型模拟、主机管理等。这种神经形态硬件和应用程序之间的协作概括了“动态计算”的本质,也使得 Speck 在具有严格功耗和延迟要求的应用场景中具有明显优势,比如移动设备、物联网等。

图|Speck 融合了注意力脉冲动态计算(来源:Nature Communications)

总的来说,这项研究展示了类脑芯片在动态计算中的潜力,在延迟、准确性、功耗控制方面更具优势,为神经形态计算的发展拓展了一条新路径,并推进了向现实世界的应用。

“这项研究证实了高、低抽象层次大脑机制的融合能进一步激发类脑计算潜力,为未来将大脑进化过程中产生的各种高级神经机制融合到神经形态计算带来了启发。”这篇论文的通讯作者、中国科学院自动化研究所研究员李国齐表示。

另据了解,时识科技(SynSense)也参与此次研究,该公司成立于 2017 年,是一家横跨“感知与计算”两界的类脑科技公司,专注于类脑智能的技术研究与产品开发等,聚焦边缘计算应用场景提供超低功耗、超低延时的全栈式解决方案。

参考资料:

1.https://doi.org/10.1038/s41467-024-47811-6

2.http://www.ia.cas.cn/xwzx/kydt/202405/t20240529_6967499.html

3.https://www.synsense.ai/zh-hans/about-us/

4.https://www.synsense.ai/zh-hans/products/speck-2/

5.https://www.synsense.ai/zh-hans/neuromorphic-technology/

0 阅读:28

问芯科技吗

简介:感谢大家的关注