迎接PCIe 6.0! 慧荣科技: SSD主控日益复杂 我自有妙招应对

  • 2025-07-17 06:08:05
  • 754

近日在南京举办的2025全球闪存峰会上,慧荣科技企业级储存事业部产品行销应用部资深协理周宗廉先生发表演讲,阐述了在AI浪潮的新时代中,慧荣的企业级存储技术是如何演进的,并在会后接受了快科技的采访。

虽然如今几乎人人言必称AI,但事实上,AI已经发展了几十年,也经历了翻天覆地的变化。

早在1966年,MIT麻省理工AI实验室就设计了第一个聊天机器人ELIZA,代码只有200行,可以逐字分析人类输入的内容,再重组回复,仿佛和真人聊天。

如今的AI人机交互,背后是几十上百亿参数的大模型,而且逐渐变得无所不能。

当然,现代AI负载对于硬件性能的要求也是空前的,不仅仅是CPU处理器、GPU加速器,更离不开强大的内存与存储支撑,SSD的快速发展可以说正逢其时。

慧荣的企业级存储解决方案名为MonTitanTM,不是单一芯片,而是包含SSD主控芯片、参考硬件设计、企业级固件的平台化完整方案。

周宗廉先生解释说,慧荣专注于IC设计,自己并不生产SSD成品,因此MonTitanTM平台本质上是为客户提供参考设计,提供坚实的技术与设计基础,使客户可以更轻松地基于此开发自己的产品,专注于产品定义和市场推广。

慧荣MonTitanTM平台的首款产品是SM8366。

它支持PCIe 5.0、双端口、NVMe 2.0、OCP 2.5等各种企业级特性、安全功能,支持最大256TB闪存容量。

顺序读取性能超过14GB/s,随机性能更是超过350万IOPS,能在更快的时间内完成大型模型或者图像化神经网络训练,可以说是真正的企业级主控。

SM8388是慧荣MonTitanTM平台的新成员,支持八通道闪存、最大128TB容量、SCA界面,并延续了SM8366的各种优势。

面向未来,慧荣还准备好了PCIe 6.0 SSD主控方案“SM8466”。

它突破性敌采用台积电4nm先进制程,支持单个x4或者两个x2端口,支持最多16个闪存通道和512TB闪存容量,可搭配DDR5-7200规格的大容量高频缓存,还支持NVMe 2.0+。

性能方面更是突飞猛进,顺序读取能做到28GB/s甚至是逼近30GB/s,4K随机性能也翻番到了700万IOPS。

在接受采访时,周宗廉先生表示,AI时代对于存储提出了新的、更苛刻的需求,一是极致性能,就像NVIDIA提出的要求往往非常夸张,二是多租户保障,这也是CSP云服务厂商的核心诉求,慧荣的MonTitan?平台就致力于满足以这两方面为代表的各种需求。

SM83366主控在设计之初,理念就非常清晰,这是一颗面向PCIe 5.0的芯片,因此整个内部架构设计的出发点,就是确保I/O吞吐能力可以匹配PCIe 5.0的高带宽,必须有能力处理庞大的数据流,为此内部构建了多个专用的高效加速引擎,并做了大量有关数据流控制等方面的优化。

同时,慧荣深入研究了市场上现有相关主控产品的内部架构,并针对性地设计了相应的处理机制,包括如何高效处理来自前端的命令队列、如何根据闪存Plane数量进行并行处理等等,从而确保前端的PCIe 5.0带宽可以被后端闪存充分利用,避免出现瓶颈。

对于模组厂商等直接客户,慧荣SM8366的关键价值在于特别优化的固件架构,使其可以更容易、更高效地使用慧荣主控芯片进行产品设计和量产,降低开发难度和成本。

对于CSP等终端客户,极致的性能、能效等技术创新都可以大大提升用户体验,尤其是Performance Shaping多租户性能保障技术,可以从硬件层面精细化地隔离和保障不同租户获得相应的、有保障的服务质量,比传统软件层面的控制更加精准,这是很多CSP非常看重的地方。

不得不说,如今设计一款优秀的PCIe SSD主控是越来越难了,涉及制程、架构、固件、算法等多方面的综合协调与平衡,既要强大的性能、丰富的功能,还要控制功耗、发热和成本。

周宗廉先生认为,其中的关键点可以分为三个层面:

一是先进制程的选择。

采用更先进的制程,比如6nm、5nm甚至是4nm,就能显著降低功耗,因为先进制程的漏电率更低,尤其是高温下漏电飙升的问题可以得到更好的控制,这对功耗优化至关重要,当然,先进制程的成本是非常高昂的。

二是成本控制方法。

为了平衡高昂的制造成本,慧荣的核心策略是最大化减少设计迭代和改版次数,这意味着在芯片流片(Tape-out)前,必须进行极其充分和严谨的系统级验证,所以慧荣在仿真、加速验证等方面投入了大量资源,力求在早期发现并解决问题,避免昂贵的流片失败或改版,这就可以大大节约整体成本。

三是芯片架构设计。

在主控芯片内部,慧荣实现了精细化的功耗管理,比如通过动态开关(Power Gating)等技术,根据不同的工作负载状态,精准地开启或关闭特定的处理引擎,避免不必要的功耗浪费。

总结来说,打造一颗优秀主控的平衡点在于:通过选择先进制程获得能效优势;投入巨量资源在前期验证上,确保一次成功或最少改版,以摊薄高昂的设计和制造成本;在架构设计上追求高效和智能化功耗管理。

前边说过,慧荣已经拿出了PCIe 6.0 SSD主控设计方案,存储行业预计PCIe 6.0 SSD今年就有望登场,2026年开始部署,2028年左右进入普及阶段。

再下一代的PCIe 7.0标准规范刚刚也已经公布,SSD预计要到2028年才会出现,2029年开始部署。

未来进入PCIe 6.0、PCIe 7.0时代,SSD主控设计必然进一步复杂化,挑战更加严峻。

周宗廉先生认为,挑战主要来自两方面,一是技术挑战,PCIe 6.0/7.0本身的技术复杂度就是一个巨大挑战,包括信号完整性、速度,这就涉及芯片、系统到PCB设计的方方面面。

二是非技术挑战,主要就是成本控制,比如支持PCIe 6.0/7.0的制程需要更加先进,这就会导致设计和制造成本变得极其高昂。

对此,慧荣的应对策略的核心是确保一次成功,最大限度减少设计迭代,因此需要在芯片流片前进行前所未有的、极其充分和严格的系统级验证,发现并解决潜在问题。

另外,慧荣在PCIe 5.0主控时代良好的积累,也将是应对PCIe 6.0/7.0挑战中至关重要的。

周宗廉先生还强调,芯片设计的成本极高,尤其是在先进制程下,因此慧荣的策略是尽量在可控的成本下,将芯片内部的各个引擎做到极致,并通过强大的固件层使,其能灵活适配各种不同的应用场景。

慧荣一直都是持续研究市场需求,结合内部专家的深度讨论和外部信息,在确信存在合理且可观的市场机会时,才会考虑投入相应的解决方案。

这就需要在“领先市场半步”和“避免过度冒险”之间找到最好的平衡点,也需要满足更严苛的性能、功耗、集成度要求,确保产品在未来5-10年甚至更长时间内保持技术领先。

比如在PCIe 5.0主控上,慧荣没有急于抢首发,而是选择了更成熟的时机,推出稳定可靠且的企业级SM8366和消费级SM2508,结果在性能、功耗发热上都表现十分优秀,都得到了市场的广泛接受。