IP新锐芯耀辉多点破局DDR PHY技术瓶颈-EDN 电子技术设计

 近几年，云计算、5G、物联网、人工智能等产业的迅速发展使得对内存的需求大增。作为内存技术的关键模块，DDR PHY的市场需求也在高速增长。本文从新锐IP企业芯耀辉的角度，谈谈DDR PHY，以及芯耀辉在DDR PHY上的技术突破，助力服务芯片设计企业。

引言

近几年，云计算、5G、物联网、人工智能等产业的迅速发展使得对内存的需求大增。作为内存技术的关键模块，DDR PHY的市场需求也在高速增长。本文从新锐IP企业芯耀辉的角度，谈谈DDR PHY，以及芯耀辉在DDR PHY上的技术突破，助力服务芯片设计企业。DiWednc

什么是DDR PHY

DDR PHY是DRAM和内存控制器通信的桥梁，它负责把内存控制器发过来的数据转换成符合DDR协议的信号，并发送到DRAM；相反地，其也负责把DRAM发送过来的数据转换成符合DFI协议的信号并发送给内存控制器。DDR PHY和内存控制器统称为DDR IP，他们保证了SoC和DRAM之间的数据传输，如图1所示。DiWednc

DiWednc

图1 DDR PHY和内存控制器在SoC中的作用DiWednc

DDR IP市场需求强劲

作为重要的接口IP，DDR IP的市场需求强劲。据IP Nest机构预测，2015-2024年全球接口类IP保持16%的平均年复增长率。未来几年，在5大类接口IP（USB、PCIe、DDR、D2D&Ethernet、MIPI）市场份额上，DDR IP将持续保持前三的市场份额。DiWednc

目前在DDR IP的市场上，国际厂商占据较高的市场份额，而国内IP企业占比很小，究其原因，主要是由于DDR PHY具有较高的技术门槛，要在这类PHY上实现突破并不容易。DiWednc

首先与其说DDR PHY是一个芯片技术，不如说DDR PHY是一门系统工程。DDR的数据传输采用并行多位、单端突发的传输模式，对电源完整性PI（Power Integrity，电源完整性）和信号完整性SI（Signal Integrity，信号完整性）的要求很高。另一方面，DDR可以说是对训练(Training)要求最多的接口。各种训练是否获得最佳的结果直接影响DDR工作的可靠性。对于PHY开发人员来说，既要懂物理层的设计，也要懂训练算法的设计，只有这样才能开发出可靠的产品，然而这又无形中抬高了设计的门槛。最后，如何实现高速的单端信号传输，是DDR IO设计的一大考验。DiWednc

多点着力，攻克DDR PHY技术瓶颈

作为一家专注于半导体IP研发和服务的高科技公司，芯耀辉科技看准了企业的需求和市场机遇，通过可靠的SI和PI分析、优化的训练算法设计、高性能的IO设计等一系列技术创新，成功突破了DDR PHY的技术瓶颈。DiWednc

关键技术点一：可靠的SI和PI分析指导

DDR数据传输的特点是：多位并行传输，单端数据突发模式。目前SoC可以集成多达72位（DDR4带ECC）的DDR接口，多位并行传输在封装和PCB上的布线是非常复杂的，很多走线有一定等长要求，同时还要尽量减小线间串扰，所以合格的封装和PCB设计是一大挑战。另外突发模式的传输，SSO（Simultaneous Switching Output）噪声也会严重影响DDR的性能。所以DDR稳定的工作需要可靠的SI和PI分析。DiWednc

在芯片开发早期，确定好芯片的PAD规划和封装规划，对于设计后期优化DDR的SI和PI性能至关重要。芯耀辉在系统级芯片设计早期、IO准备阶段就开展SI和PI的分析，提前帮助客户规划，以确保集成的DDR PHY的量产性能。如下图2所示为芯耀辉的SI和PI流程示意图。DiWednc

DiWednc

图2 芯耀辉SI和PI流程示意图DiWednc

另外，芯耀辉团队还开发出了一套特殊码流分析技术。通过该技术，在设计阶段可以高效地分析封装和PCB设计是否满足DDR眼图的要求，可以快速定位缺陷，并指导客户优化完善。图3给出了一个实际合作案例，展示了系统设计最终完成后的眼图质量。DiWednc

DiWednc

图3 芯耀辉LPDDR4X-3733仿真写数据眼图DiWednc

关键技术点二：高可靠性训练设计

DDR系统的稳定工作离不开各种训练。在启动的时候需要做初始化的CA Training，Write Leveling，Read Leveling和Write Eye Training等一系列训练，对于DDR4、LPDDR4及以上的更高协议，还需要VREF的二维训练。基于纯硬件的方式无法提供复杂的训练范式。例如JEDEC的DDR4协议里面规定了DRAM只能提供简单的01010101等范式，这对于高速DDR的训练是不足够的，因为这些范式频率单一，无法反映数据通道衰减带来的码间串扰（ISI）。另外，不同范式在终端的反射也会不一样。所以如果采用JEDEC规定的简单范式来训练DDR，特别是在较高速率下，不能得到一个最优化的训练结果。DiWednc

芯耀辉的DDR PHY采用基于固件的训练方法，可以设置不同的范式，如PRBS范式、特殊设计的扫频范式等。显然此类范式能更全面的反映数据通道特性，因为它包含了高频、中频、低频信息，以及长0和长1带来的码间串扰等问题，可以保证获得更优的训练结果。DiWednc

初始化的训练完成之后，芯片内部温度和电压会随着工作状态和环境温度的变化而变化，此温度和电压的变化会让训练的结果偏移理想值，使得DDR的读写裕量减小，严重的情况还会造成读写数据错误。芯耀辉开发了一种可以动态检测芯片内部温度和电压变化的技术，通过实时补偿各种训练结果，保证数据的读写具有足够的裕量，确保DDR工作的稳定性。DiWednc

关键技术点三：高性能DDR IO设计

信号码间串扰和走线的阻抗不匹配带来的信号反射严重影响数据通信。为了保证DDR数据读写的可靠性，在DDR IO设计中，芯耀辉采用了FFE（前向反馈均衡）和DFE（判决反馈均衡）技术。DiWednc

FFE前端预均衡

FFE前端预均衡是在DDR TX端采用的技术。因为数据通道有衰减，使得信号高频部分被抑制较大，低频部分被抑制较小，所以在RX端看到的眼图眼高和眼宽均比较小。FFE的思想就是减小低频分量的能量，使得信号的高频低频部分在信道之后达到均衡。图4展示了FFE原理，如果信号有0->1的或者1->0的变化，则输出满强度(Full Strength)的信号，如果信号是连续的1或者0，则输出均衡强度的信号(EQ Strength)。DiWednc

DiWednc

图4 FFE前端预均衡原理示意图DiWednc

图5展示了在RX端，数据速率是6400Mbps时，关闭FFE和打开FFE的仿真示意图。可以看到，打开FFE的眼图质量明显好于关闭FFE的眼图质量。DiWednc

DiWednc

图5 芯耀辉仿真效果示意图(6400Mbps)，左图没有打开FFE，右图打开FFEDiWednc

芯耀辉采用可编程的前端预均衡方案，通过设置不同参数可以获得不同的均衡效果，以适应各种应用场景的需要。DiWednc

自适应算法支持的接收端DFE(判决反馈均衡)

信号的码间串扰可通过脉冲响应(pulse response)示意图理解，如下图6所示。DiWednc

DiWednc

图6 经过信道的脉冲响应DiWednc

当脉冲信号经过信道时，因为高频衰减和信道反射，会形成一个拖尾的波形，前一个bit的信号会影响将来bit的信号质量。DFE的原理是：判断之前几个bit的信号是1或者0，然后通过加权和反馈相加，减弱前bit信号的拖尾影响，以达到改善当前bit信号质量的目的。相比于CTLE等均衡技术，DFE不会放大噪声信号，因此固态技术协会在JEDEC79-5规范中正式引入了DFE技术，目的就是为了增强接收端的能力。DiWednc

图7是常见的4 tap DFE架构，也是JEDEC规范推荐的架构之一。因为DQS的上升沿和下降沿均会采样DQ，所以采样电路分为上下两个数据通路。两个数据通路的4个采样值经过加权系数处理后会反馈到每一个数据通路对应的求和器(∑)，从而减去这4个之前信号对当前信号的ISI影响。这种结构采用了两个求和器，会加大DQ_Buf端的负载。另外4个采样值均需要直接反馈到两个求和器，会使得芯片内部连线比较复杂，影响高速性能。图8是DFE的另一种架构，这种结构通过MUX选择两路数据通路的采样值，并把选择后的值送到求和器进行EQ处理。因为只用到了一个求和器，减小了芯片内部的连线复杂性，最重要的是减小了DQ_Buf端的负载，提升了高速性能。DiWednc

DiWednc

图7 常见的4-tap DFE架构DiWednc

DiWednc

图8 另一种常见的4-tap DFE架构DiWednc

DFE各级tap的加权系数可以通过手动设置，前提条件是要得到信道的参数，这样做不适合产品的大规模量产，因为对不同的产品来说，它的IO特性、信道参数是有随机偏差的，同样的一套设置不能保证每个产品都有最佳的DFE性能。通过自适应训练得到DFE各级tap的系数是目前主流的方式。芯耀辉的DDR PHY提供了一套特殊的固件训练机制，DFE的各级tap的反馈系数可以通过训练快速得到，自适应程度高，可保证每一颗芯片都有更优的DFE性能，有效减小码间串扰和反射造成的影响。DiWednc

关键技术点四：支持多频点的快速频率切换技术实现低功耗设计

DDR是SoC系统中的功耗大户，如何减小DDR的功耗一直是DDR技术革新的动力和方向之一。最直接的方法就是降低供电电压，而这正是DRAM规范的演进之路。另一方面，从DDR4和LPDDR4开始，DRAM规范定义了POD IO架构（针对DDR4和DDR5）、LVSTL IO架构（针对LPDDR4和LPDDR5）和数据总线倒置(DBI)技术，能有效地减小IO端的功耗。DiWednc

以上降低功耗的方法是JEDEC规范限定的技术，芯耀辉还开发出一种动态频率切换技术，能有效降低系统总功耗。该技术在DRAM初始化的时候可以训练多达多个频率点的配置，并保存相关训练结果。当系统确定不需要DRAM工作在高频率时，可以通知DDR控制器，然后DDR控制器会通知DFI，并让DRAM进入自刷新状态，之后频率切换就会自动在DFI和DDR PHY内部进行，频率切换完成之后DDR控制器则会让DRAM退出自刷新，这样DDR就可以切换到一个较低的工作频率，从而降低功耗。相较于同类产品，该技术最大特点是整个过程无需固件接入，在新的频率点无需重新做训练，从而快速稳定地实现频率切换。DiWednc

总结

未来，市场对DDR PHY的需求持续增长，在先进制程上的需求更加突出。芯耀辉较早切入了基于FinFET工艺的IP开发，通过不断的技术创新，成为目前少数能提供先进制程、优越性能，稳定可靠的DDR PHY的本土企业之一。DiWednc

百尺竿头，更进一步，芯耀辉人必将以提供高性能的接口类IP，高品质的设计服务为己任，奋发图强，助力携手合作广大芯片设计公司及晶圆代工厂，推出更优秀的产品，助力提升中国芯片产业的发展。DiWednc

阅读全文，请先

EDA/IP/IC设计缓存/存储技术产业前沿

上一篇： 【示波器旅行指南 | 工程师如何开启一场说走就走的旅行？】之二：惬意“乘机”不动怒 下一篇： 新一代DDR5 DIMM的五大亮点

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

超薄硅晶圆的演进史让我们一起了解一下历史上是如何通过技术进步和制造工艺的改进，开发出高精度的超薄硅晶圆的···
盘点CES 2025上基于Arm架构的AI创新和技术亮点近期在美国拉斯维加斯举行的 CES 2025 再次彰显了其作为展示最新科技创新的重要平台。今年展会上所呈现的众多前沿产品和新的发布将推动各个行业的变革与发展···
PCI Express Gen5：自动化多通道测试本文将重点介绍用于x16测试的RF开关配置。这些开关型号最多支持18条通道（PCIe最大通常为x16），也可支持更低的通道数···
芯耀辉：从传统IP到IP2.0，AI时代国产IP机遇与挑战齐飞 2024年，集成电路行业在变革与机遇中持续发展。面对全球经济的新常态、技术创新的加速以及市场需求的不断变化，集成电路企业如何在新的一年里保持竞争力并实现可持续发展？
Ceva 推出具有下一代蓝牙高数据吞吐量和 IEEE 802. 交钥匙集成式硬件和软件平台 IP 结合了功能齐全的蓝牙双模和下一代高数据吞吐量，以及适用于 Thread/Zigbee/Matter 的 IEEE 802.15.4标准，并包含了Ceva采用台积电 12nm 技术实现的最先进无线电···
用于电路分析和设计的Spice仿真指南–第14部分：评估用在电子仿真软件提供的众多功能中，.MEAS指令是分析和量化仿真电路行为的一个相当强大的工具···
用于电路分析和设计的Spice仿真指南–第13部分：温度管在本文中，我们将探讨SPICE如何管理温度以及仿真其影响的主要技术···
用LM337改造，让PWM DAC获得1.5 A输出能力 DAC是一种低功耗设备，其功率和电流输出能力仅限于毫瓦和毫安范围。当然，从根本上讲，它们没有理由不与合适的功率输出级配合使用，这确实也是常见的实际做法。不过，为了好玩，这个设计实例采用了不同的供电方式···
帕特·基辛格退休：工程师CEO的回归也救不回英特尔？在执掌英特尔三年多之后，魅力十足、雄心勃勃的英特尔首席执行官Pat Gelsinger下台了，这家摇摇欲坠的美国半导体巨头开始寻找继任者···
Arm年度技术大会：2025年底预计将有1,000亿台具备AI能力近日，作为 Arm 一年一度的技术盛会，2024 年度技术大会（Arm Tech Symposia 2024）在上海和深圳成功举办。这次的大会十分特殊，以往 Arm 年度技术大会往往会专注于特定的应用市场，而今年的大会只聚焦于一个领域——AI···
瑞萨推出包括先进可编程14位SAR ADC在内的全新Analog 全新产品几乎适用于任何应用，大幅减少元件数量、BOM成本和占板空间···
EDA/IP与IC设计：引领芯片产业变革的未来引擎（下午场）国际集成电路展览会暨研讨会(IIC Shenzhen 2024)期间举办的“EDA/IP与IC 设计论坛”汇聚了全球行业专家，共同探讨未来发展趋势、挑战与最佳实践，为推动行业创新与发展贡献力量。

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

IP新锐芯耀辉多点破局DDR PHY技术瓶颈

引言

什么是DDR PHY

DDR IP市场需求强劲

多点着力，攻克DDR PHY技术瓶颈

关键技术点一：可靠的SI和PI分析指导

关键技术点二：高可靠性训练设计

关键技术点三：高性能DDR IO设计

FFE前端预均衡

自适应算法支持的接收端DFE(判决反馈均衡)

关键技术点四：支持多频点的快速频率切换技术实现低功耗设计

总结