如何选择正确的存储器?| 半导体行业观察

admin发布

来源:本文由半导体行业观察(ID:icbank)翻译自「semiengineering」,作者 ANN STEFFORA MUTSCHLER,谢谢。

谈到设计存储器时,没有哪种规格适合所有人。而且,考虑到大量的内存类型和使用场景,系统架构师必须非常清楚他们的应用的系统需求。

首先需要决定的是,是将存储器置于逻辑芯片上,作为SoC的一部分,还是将其作为片外存储器。

eSilicon公司业务和企业发展副总裁Patrick Soheili表示:“延迟和吞吐量的折中至关重要,而且功耗成本巨大。每次你从一个平面移动到另一个平面时,它的系数是100X。这也适用于片上存储器vs片外存储器。如果你能挨个芯片地把它连在一起,那就最好了。”

出于上述原因和其他原因,芯片制造商的第一选择是在逻辑芯片上放置大量的RAM或flash。但在大多数情况下,这还不够。即使是过去被定义为带有片上存储器的处理单元的微控制器,也已经开始为高端应用添加片外辅助存储器。

Cadence公司DDR、HBM、flash/storage和MIPI IP的产品营销总监Marc Greenberg表示:“如果逻辑芯片上的存储器大小超过了可以较低价格生产的界限,使用片外存储器显然会是更好的选择。多个制造商都有基于SPI(串行外设接口)总线的一系列低成本、低功耗的存储器,包括汽车速度等级的存储器。SPI总线正在提高速度并增加宽度。”

事实上,Cadence看到了很多对200MHz的Octal-SPI IP接口的需求——包括控制器和PHY芯片。

为了更好地理解人们如何看待汽车或其他应用中存储器的功耗设计,我们不妨后退一步,试着去了解存储器的速度和功耗同整体带宽的关系。Synopsys公司DesignWare Analog和MSIP解决方案事业部高级市场总监Navraj Nandra表示:“在应用需求方面,当人们在提升微处理器/CPU性能时需要同步提升存储器容量和存储器带宽。但即使这是应用所要求的,你也很难二者同时兼得。”

存储器中需要在带宽、延迟、功耗、容量和成本之间找到平衡点。Nandra表示,工程师有时会忘记成本部分,但是它推动了很多决策点。

必须考虑存储器的容量和速度,每种存储器都有不同的折中。如果应用是由速度或吉比特每秒的带宽驱动的,那么HBM可能是一种方法,因为它比DDR存储器的带宽要高得多。如果应用以容量问题为主,例如存储器接口可容纳多少GB的存储空间,那么DDR可能是更好的选择。

Nandra表示:“DDR提供容量,HBM提供带宽。如果问题是关于功耗的问题,那么低功耗DDR比HBM或GDDR更好。使用GDDR或HBM可以获得更高的性能。使用DDR和LPDDR可以省电。”

嵌入式存储器

如果存储器作为SoC的一部分,那么则需要在架构上多加考虑。

ARM公司的研究员Rob Aitken表示:“如果你考虑泄漏功耗,例如,SRAM的泄漏主要是位单元。外围也有所贡献,但你可以在设计过程中忽略它。如果你有一定数量的位单元,就会有一定的泄漏,所以你必须从那一点开始并解决它。有一些电路设计技巧可以让你摆脱其中的一些问题,这通常是以牺牲性能为代价的,而这往往这取决于你有多大的决心,。其中一些包括对各种描述进行有效的偏置或功率控制,以及上述方法组合使用,以此来减少泄漏功耗。”

在这一点上,很重要的一点是要理解,如果需要一定数量的位,并且存在这么大的泄漏,系统架构师必须找出哪些配置最适合他们的各种存储器。Aitken表示:“考虑的因素包括位线长度等。一般来说,位线越短,存储器越快。这是因为SRAM读取的工作方式,本质上,单个位单元必须释放位线,当它释放的电荷足够时,读出放大器会触发,并说,‘哦,这里有一个信号。’因此,需要释放的位线越多,所需要的转换时间就越长。”

幸运的是,对于任何给定的内存配置,我们可以在一系列可能性中做出选择。

Aitken解释说:“我可以拥有很多短位线或少量较长位线的存储器,而这些字数和位数仍然完全相同。这就是这些列在存储器中的排列方式。所以这个架构层次可以实现,存储器生成器器可以让你做到这一点。你可以边玩边说,‘我希望使用8列多路复用器’,即8位线到每个输出位,因为它提供了速度和功耗的良好平衡。或者你可以说,这实际上比你需要的速度快,所以你可以使用4列多路复用器,因为它提供了更好的功耗和良好的速度。作为一名SoC架构师,你会经历这种实验,看看最佳实现方式是什么,而且它们也会以不同的形式融入到平面布置图中,因为其中一些更偏向正方形,有些更偏向矩形。”

成本很重要

虽然功耗在一段时间内主导了许多设计决策,但成本是这个等式中的另一个关键因素。

Aitken表示:“从存储器的角度看,你在考虑是否想要更多的面积,这相当于更高的成本。有一些二阶折中方案对于大容量存储器很重要,比如位单元面积与外围面积的比例。一旦你选择了一个比值,位单元区域就基本上固定了。但是它的周边区域可以变得更大或更小,这通常会使它更快或功耗更低。当你这样做的时候,是否会给SoC增加成本,取决于你有多少个给定的对象。通常,当你观察SoC时,有几个非常大的对象支配该区域,因此周边区域或性能的小改动会对这些对象产生巨大的影响。有很多对象并不重要,即使它们的大小翻倍,也没有人会注意到。其次,还有另一类型通常是体系结构中的较小但很重要对象,这些对象具有某种最终性能要求、或超低电压、或芯片的某些重要方面。在这些情况下,面积和成本通常不那么重要,更重要的是它需要符合速度标准、或泄漏功耗标准、或任何其他主导标准。”

汽车市场的优先考虑因素

这在汽车市场尤其重要,因为成本是决定使用哪些组件的关键因素。

Rambus公司产品管理高级总监Frank Ferro表示:“功耗很重要,但在其他一些市场上,它并没有成为一个超级关键因素。功耗对每个人来说都很重要,但汽车系统实际上是成本与带宽之间的折中。如果我必须对它们进行排名,我会说性能和价格不分上下,而功耗则远不及前两者重要。”

汽车是当今芯片设计的热门市场之一。对于自动驾驶汽车而言,正在汽车中部署的传感器的数量正在迅速增加,而对于一辆汽车来说,要做到不同程度的驾驶员辅助功能,需要把多个传感器获得的数据输入到复杂的逻辑电路中加以处理。由于需要处理的数据量很大,因此在使用视觉和雷达的情况下,这些数据将通过传感器网络进行传输。

Ferro表示:“芯片制造商正在研究能够处理高于100 Gbps或更高带宽的存储器系统,这样可以适用于不同级别的驾驶辅助汽车,并最终实现自动驾驶汽车。为了做到这一点,存储器选择的数量开始缩减,以便为你提供必要的带宽来处理所有即将进入的数据。”

Ferro表示:“早期的ADAS系统设计包括DDR4和LPDDR4,因为这些是当时可用的。两者都有优点和缺点。DDR4显然是最便宜的选择,而且应用在产量最高的产品中。它们当然非常划算,而且工程师非常熟悉它们。在DDR4上进行错误校正更简单,也更容易理解。当然LPDDR4也是一个可以使用的选项。”

展望未来,Ferro希望各种类型的存储器能够共存于不同的系统中。“如果他们偏重成本导向,那么他们将会关注DDR,甚至是LPDDR4。但如果他们偏重带宽导向,那么他们将会关注像HBM或GDDR之类的东西。这实际上是你在架构设计阶段中所做的事情。有不同的ADAS级别以及系统和时间表所需的级别,因为出货时间很重要。如果你今年有一个系统出货,它的解决方案将会不同于明年或后年开发的系统。这些就是我们在上市时间和成本上所需要考虑的事情。”

其次,在高性能方面,从系统设计的角度来看,带宽与功率的折中是关键挑战。Ferro表示:“如何以合理的功耗和面积预算获得更大的带宽?例如,如果你拥有HBM,从功耗和面积的角度来看,它非常高效,因为它使用3D堆叠技术,所以从功率效率的角度来看,HBM非常棒。从面积的角度看,HBM堆叠占用了相对较小的空间,因此从功耗性能角度来看,这是一个非常好的解决方案。你可以获得很高的密度,你可以在一个小面积内获得强大的性能,而且功耗很低。”

其他人对此表示同意。三星公司HBM产品营销经理Tien Shiah表示:“GDDR在GPU上比DRAM快,但HBM没有比较过。HBM是使用微孔栅格阵列的最快存储器形式。您可以拥有4个或8个高堆叠,它可以提供1024个I/O,超过8个通道,每个通道128位。这是标准显卡的I/O总线宽度的四倍。每个引脚可以达到2Gbps,在1.2V时可达到2.4Gbps。”

如何选择正确的存储器?| 半导体行业观察
图1:三星的HBM2 DRAM 5 (来源:三星)

外部存储器的吞吐量非常高。但在这里,主要需要权衡各种开销。

Ferro表示:“你将为HBM付出更多的钱,所以如果你能承担高成本,这是一个很好的解决方案。如果你无法承受高成本,那么其他公司正在考虑的是,他们能在一块电路上挤进多少DDR或LPDDR,并将它们并排放置,试图用更传统的解决方案来逼近某些HBM的性能。”

看懂存储器

由于存储器市场服务有许多不同的应用,所以在设计中清楚地了解如何合理的使用存储器是很困难的。了解各种可选方案将对此有所帮助。

西门子公司Mentor事业部的IP部门的董事总经理Farzad Zarrinfar表示:“基本上,你可以观察自己的芯片,然后设想它可以用于几个关键的垂直市场。一些垂直市场可能是智能手机、高性能计算、汽车、物联网、虚拟现实、混合现实等等。你会发现芯片技术是不同的。没有一种芯片技术能解决所有问题。例如,物联网对功耗和成本敏感,人们可以利用超低功耗的40nm或28nm的工艺,如ULP或HPC+。这对于物联网来说非常合适。而在汽车行业,使用28nm及以下工艺生产的芯片需求量很大。”

内存综合器(Memory Compiler)的选择是另一个难题,大多数存储器提供商都为它们的存储器产品提供综合器。Zarrinfar表示:“智能综合器可以帮助提供解决方案,因为它可以根据不同的需求进行优化。例如,某些应用可能需要超低动态功耗,而汽车则有自己的要求,而且我们在这里唯一的不变就是变化。行业正在发展。对于安全性,温度等级以及其他一些考虑事项,有着非常明确的要求。”

所有这些需求都会影响存储器设计,而这正是工程团队需要考虑的。

Zarrinfar表示:“当我们设计存储器的时候,我们有特定的目标,可能是+125℃或+150℃的环境,这可以转化为结温。我们有基于目标市场的市场需求文档。然后我们知道我们需要什么样的设计。然后你需要有来自半导体代工的模型,规定我们拥有的模型的范围。汽车温度迫使半导体代工厂增加传统的工作温度范围。虽然不是每个流程节点和类型都支持每种模型的每个替换,但必须进行充分的验证,以确保各种组合能够达到预期的结果。”

最后,预计对存储器更大带宽、更少延迟、更低功耗和更低成本下的更大容量的需求的将会不断增加。面对着今天各种可用的存储器类型,无论是独立的存储器芯片的还是嵌入式存储器,系统架构师必须随时改进理想存储器方案的选项,以适应特定的应用场景。

致谢:本文由电子科技大学低功耗集成电路与系统研究所黄乐天老师和陈家豪同学协助校对。特此感谢!

原文链接:semiengineering.com/how