集成电路从处理的信号种类来看,可以分为两大类,即模拟电路和数字电路。模拟电路处理的是连续的模拟信号,而数字电路则是处理离散化的数字信号。在自然界中,信号都是以模拟信号的形式存在(例如,在无线传输系统中,无线信号就是一种典型的模拟信号),而数字信号则主要存在于人工的电子系统中。而模拟和数字信号之间的互相转换就是通过混合信号(mixed-signal)电路完成。
混合信号电路系统中通常既包括模拟电路,又包括数字电路,而且我们看到混合电路系统中数字电路成分比重正在变得越来越大(下文会详述这一点)。混合信号系统的应用非常广泛,包括信号互联(以太网、USB接口等)、音频系统、无线通信系统等等。混合信号集成电路应用虽广泛,但是在混合信号系统发展的历程中,每一段时间都会有一个主要应用来驱动其技术发展。这样的驱动型应用需要满足几个条件:
1.首先,从应用角度,驱动型应用必须有足够大的市场,而且市场增量必须足够快,来确保整个行业界有足够兴趣来投入研发以满足应用的需求。
2.其次,从技术角度,驱动型应用对于技术的需求足够高,当前的技术并不能完全满足应用的需求;同时技术进步对于驱动型应用本身也会造成影响,例如随着混合信号系统技术指标的进步,驱动型应用可以提供更好的用户体验。
当驱动型应用满足这两个条件的时候,它就会让业界投入技术研发,并且带动技术进步。
对于混合信号集成电路系统来说,21世纪前15年的驱动型应用显然是无线通信系统。从市场来看,2000-2015年是无线通信市场蓬勃发展的阶段,而无线通信射频芯片中,混合信号集成电路扮演着极其重要的角色:例如,混合信号系统的数模转换器(ADC)的信噪比-采样率之间的折衷关系将会直接决定整个射频芯片的前端架构并且进一步决定芯片功耗和灵敏度等重要指标。而在2015年之后,随着人工智能的崛起,我们看到了高速互联正在成为混合信号集成电路技术发展的主要推动力。
人工智能与混合信号集成电路
人工智能无疑是当前最火的技术,同时也是半导体领域最大的市场之一。人工智能模型的具体运行中包括两个环节,即训练和推理。训练过程中,需要大量的数据并且通过梯度反向传播算法来获得人工智能模型的权重;而在训练阶段结束之后,模型就可以部署并开始根据用户输入来运行推理。
在大模型时代,无论是人工智能大模型的训练还是人工智能模型推理都需要在云端数据中心完成。尤其是在今天大模型越来越大的潮流中,训练和推理几乎都无法在单机上完成,而需要在云端数据中心的多台服务器上进行分布式计算。在大语言模型领域,模型训练动辄需要上百台服务器来实现,而且预计未来分布式计算的规模会越来越大。
在分布式计算中,数据互联扮演着极其重要的作用。在分布式计算系统中的每台计算机完成单步计算后,需要把每台计算机中的结果汇总到一起;另外在一些分布式计算的框架中,也需要每台计算机能有能力直接去访问存放在其他计算机上的数据。事实上,目前分布式计算中的主要瓶颈是数据互联。理论上,分布式计算的性能和分布式系统中的计算机数量应当是线性关系;然而,由于存在数据互联的开销,因此分布式计算性能和计算机数量往往达不到线性关系,而且随着人工智能大模型时代分布式系统越来越大,数据互联的开销越来越大。换句话说,数据互联已经成为了人工智能大模型时代最急需解决的问题。
而解决数据互联的重任就落到了混合信号系统上。数据互联的物理层是一个典型的混合信号系统:在接收端,混合信号电路需要把接收到的信号(往往经过了大量的信道衰减和干扰)进行处理,会付出原本的信号,并且转换成数字信号。在发送端,混合信号系统需要能根据信道的特性对于发送的信号做相关的处理,来确保经过信号衰减后接收端仍然能较好地恢复数据。
因此,人工智能大模型让分布式计算成为必须,而分布式计算的性能瓶颈需要混合信号集成电路来解决。如前所述,人工智能成为混合信号集成电路的驱动型应用,因为它满足了:
1.应用的市场足够大:人工智能已经成为目前整个社会最受关注的应用,其市场容量之大毋庸置疑,而当混合信号集成电路成为人工智能的重要赋能技术时,芯片公司有足够的动力去投入研发。
2.对于技术的驱动力足够:从技术角度,人工智能对于数据互联的需求对于技术有非常高的挑战性,如何保证在不同的互联距离上,以最低的功耗实现最大的数据带宽,是人工智能对于混合信号系统最大的挑战。这样的需求,又进一步细化成了不同的接口:例如224G下一代以太网标准,实现超高带宽互联的光互联(随着共封装光学的发展,光学接口又进一步获得了更大的市场动能),中短距离的加速卡间互联等。在这些互联接口中,对于混合信号系统的驱动力来说,尤其以中长距离的互联(包括以太网和光互联)为重要,我们预计未来该领域的混合信号系统技术会快速发展,而且这将会成为混合信号集成电路领域最热门的方向。
混合信号系统用于数据互联的技术路线
从产品需求上来说,根据互联距离,基本可以分成短距离互联(例如使用在chiplet上),中距离互联(用于同一台服务器中不同加速卡互联)以及长距离互联(用于不同服务器间互联)。从混合信号电路技术上来说,这些不同的互联需求也构成了整个技术谱系。
首先,超短距离(包括封装内的数据互联)对于高级封装技术至关重要,它的带宽和面积开销决定了chiplet系统可以扩展到多大的规模。由于超短距离互联的信号衰减比较小,对于混合信号集成电路系统来说,超短距离主要的需求是成本考虑,如何增加互联密度(或者说在尽可能小的面积内完成电路),但是这并不会成为电路设计技术演进的主要推动力。
其次,从中距离互联开始,信道造成的信号衰减和干扰的重要性越来越大,为了补偿信号衰减造成的影响,混合信号系统中开始用到越来越多的相关技术。这些技术包括:
在接收端,使用信道均衡(equalization)技术,即根据预测的信道衰减和干扰,在接收端使用类似CTLE(连续时间线性均衡器)或者模拟FIR这样的技术,以模拟电路为主,辅以数字电路设计,消除这些影响。在发送端,根据预测的信道特性,在发送的信号中加入可以抵消这类信道影响的成分。预计在未来,中距离互联会继续增加调制复杂度(例如PAM-4,PAM-6,甚至更高)以提升信道利用率,为了能满足复杂调制的需求,中距离互联的混合信号电路中会继续沿着目前的技术路线演进,即继续优化模拟前端电路的性能,并且配以更加复杂的数字电路技术来提升性能。当目前的模拟前端+数字增强的路线不够时,预计会进一步演进到目前长距离互联使用的技术。
长距离互联预计会是混合信号集成电路系统技术演进的前沿方向,极有可能会引入最尖端的技术,同时相关技术可能会慢慢被中等距离互联所采用。长距离互联一方面得到了人工智能技术最多的关注(因为它决定了分布式计算的数据互联开销,这又进一步决定了分布式计算的效率,而分布式计算效率是目前人工智能大模型训练和部署的关键),另一方面又是技术挑战最大的,而且从信道类型来看,也存在着光互联和铜绞线互联两种方案在互相竞争。从混合信号集成电路技术来说,我们今年看到了技术路线图上重要的一步,即越来越多的接收端走向了基于ADC+DSP的方案。
事实上,ADC+DSP的方案可以认为是之前的模拟信号均衡技术的更进一步。在中距离互联常用的模拟信号均衡技术中,通过在模拟电路中加入相应的频域响应元素(例如加入电感或者反馈电容以消除信道衰减,或者在模拟域对信号做延迟和叠加以近似FIR滤波的效果)来实现均衡;但是这样模拟信号的信道均衡往往无法处理响应非常复杂的信道,而且处理的灵活性也比较有限。为了能更好地处理复杂的信道(这样的处理对于长距离互联来说是至关重要的),需要采用ADC+DSP的方案。在这个方案中,接受信号首先经过较为简单的模拟信道均衡和信号处理,之后就使用高速采样的ADC采样成为数字信号,然后在数字域使用DSP来进行进一步信道均衡和滤波,从而能处理更复杂的信道。在ADC+DSP方案中,核心的要点就是ADC需要在实现高采样率的条件下,同时不能消耗太大的功耗。
随着混合信号集成电路设计的发展,ADC的性能(采样率,信噪比和功耗)也在提升,而在今天,使用ADC+DSP方案来应对长距离互联已经成为一个可行甚至主流的方案。在ISSCC 2023中,高性能光互联相关论文还是全部采用模拟信道均衡的方法,而在ISSCC 2024中,已经至少有一般的论文在使用ADC+DSP的方案。随着这样的方案成为主流,一方面我们会看到它会进一步推动混合信号设计领域一个核心模块——ADC的性能迭代,从而推动整个混合信号集成电路设计的发展;而另一方面,它会推动混合信号设计和数字设计进一步结合,未来我们预计会看到基于数字算法来提升混合信号设计的性能,而且这样的“尽早数字化,在数字域处理问题”的思路可能也会在混合信号设计甚至其他集成电路设计领域中得到更多的应用。