0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

PCIe 7.0技术细节曝光

FPGA技术江湖 ? 来源:EETOP ? 2025-09-08 10:43 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

来源:EETOP

6 月 11 日 PCI SIG官宣 PCI Express 7.0(PCIe 7.0)规范最终版已制定完毕,但几乎没有公开任何技术细节。不过,在 7 月 16 日,PCI-SIG 通过 BrightTalk 公开了一些更详细的技术信息,下面就为大家介绍这些内容。

PCI Express 7.0 的设计目标

wKgZPGi-QweACzqsAAPNMCkQ4ow596.png

首先是PCI Express 7.0 的设计目标(图 1)。

图1:关注延迟(Latency)和带宽效率低下(Bandwidth Inefficiency)

从根本上来说,PCI Express 7.0 的带宽是 PCI Express 6.0 的两倍,并且具有向后兼容性,这一点没什么问题。但需要注意的是,与 PCI Express 5.0(即采用 NRZ 编码)相比,其带宽效率下降了不到 2%,同时延迟也有所增加(虽不到 10ns)。

不过,这其中约一半原因是由于实现了FLIT(帧单元),因此这并非 PCI Express 7.0 独有的问题,PCI Express 6.0 也存在类似情况(延迟方面还有其他因素,后文会提及)。

PCI Express 6.0 引入了 PAM4 编码,导致信号眼高(Eye Height)降至 NRZ 的约 1/3(图 2),PCI Express 7.0 也是如此。

b04b1c80-8c4d-11f0-8c8f-92fbcf53809c.jpg

图2:后续会展示 PCI Express 7.0 的眼图,其情况看起来相当严峻,让人不禁担心是否可行

如图1 所示,使用 PAM4 会导致眼高大幅降低,从而恶化误码率(BER)。为解决这一问题,若采用以太网中使用的强前向纠错(FEC)技术,会极大增加延迟(可达 100ns)。因此,PCI Express 7.0 仍沿用了 FLIT 技术,在将延迟开销降至最低的同时,将误码率控制在 1FIT 以下(图 3),这一点与 PCI Express 6.0 一致。

b0b13650-8c4d-11f0-8c8f-92fbcf53809c.jpg

图3:与 PCI Express 6.0 的指标对比后,差异便一目了然

PCI Express 7.0 新增了指标

值得注意的是,PCI Express 6.0 的指标仅包括重试概率(Retry Probability)和 FIT,而 PCI Express 7.0 新增了延迟(Latency)和带宽开销(Bandwidth Overhead),可见其设计已接近极限。

讲解中还提到了FLIT 模式的实现,但这与之前介绍的 PCI Express 6.0 的 FLIT 模式完全相同,这里便不再赘述。

不过,PCI Express 7.0 的重试概率本身翻了一倍(图 4)。

b10d0ab6-8c4d-11f0-8c8f-92fbcf53809c.jpg

图4:这是理所当然的,因为单位时间内的数据量翻倍,即使单位数据量的错误率相同,表面上错误发生的频率也会翻倍

即便如此,PCI Express 7.0 的 FIT 为 4.6×10???,足以满足低于 1FIT 的要求。

作为PCI Express 6.1 特性新增的 UIO

接下来谈谈无序I/O(Unordered IO,简称 UIO)。这是去年 10 月作为 PCI Express 6.1 的特性新增的功能。PCI Express 原本采用的是加载 - 存储访问(Load-Store Access)模式,或者说生产者 - 消费者(Producer-Consumer)模式。简单来说,当某个设备生成数据后,通过通知其他设备,使后者能够使用该数据。这里所说的设备不仅包括 PCI Express 设备,还包括根联合体(Root Complex)后端的 CPU。为保障这一机制,PCI Express 实现了 Posted(非应答)、Non-Posted(应答)、Completion(完成)等流控制(Flow Control)类别(图 05)。

b1675af2-8c4d-11f0-8c8f-92fbcf53809c.jpg

图5:这似乎与 PCI Express 原本作为 I/O 设备(因此应处于主机侧管理之下)的设计理念有关

通过信用(Credit,用于流控制的管理数据)来保障生产者 - 消费者的顺序(图 6)。

b1c38bd8-8c4d-11f0-8c8f-92fbcf53809c.jpg

图6:实际上,这种排序规则以层级结构为前提,因此也带来了一些问题,但这部分属于未来的工作,本次暂不讨论非层级结构

然而,这也导致了一个问题:即使多个传输同时进行,也必须按照顺序依次处理事务(图7、8)。

b2218f30-8c4d-11f0-8c8f-92fbcf53809c.jpg

图7:在 PCI Express 设备向 CPU 传输时,CPU 向内存写入数据后,必须 “随后” 写入 Write flag f。但实际上,由于缓存的存在,顺序可能会颠倒,而这属于违规行为

b2826fbc-8c4d-11f0-8c8f-92fbcf53809c.png

图8:同样,在 PCI Express 设备向 CPU 传输时,CPU 向内存的写入可能会乱序执行,因此事务未必会按顺序处理。但如果按照内存写入顺序发送完成事务,可能会与 PCI Express 的原始顺序不一致,因此完成事务必须符合 PCI Express 的顺序

如图8 所示,PCI Express 虽实现了放宽排序(Relaxed Ordering,简称 RO)功能,可在一定程度上缓解上述限制,但仅靠 RO 无法解决的情况正逐渐增多。

为此,新引入了无序I/O(UIO)机制(图 09)。

b2e2297a-8c4d-11f0-8c8f-92fbcf53809c.jpg

图9:与 PCI 的延迟事务类似,简单来说,就是可以乱序发送多个事务

简言之,这是一种去除上述限制、允许事务乱序完成的机制。利用这一机制,例如在双插槽(2 Socket)系统中,可提高传输效率(图 10)。

b341a51c-8c4d-11f0-8c8f-92fbcf53809c.jpg

图10:在这个例子中,CPU 0 后端的 PCIe 设备 A 向 CPU 1 传输数据。不支持 UIO 时需要执行 10 个处理步骤,而使用 UIO 只需 4 个

据PCI-SIG 介绍,UIO 的优势包括:即使在大规模系统中也易于扩展(图 11)等(图 12)。

b39e14be-8c4d-11f0-8c8f-92fbcf53809c.jpg

图11:从下图可以看出,即便是 CPU×2 + 多个 PCIe 设备 + PCIe 交换机这样的场景,访问开销也会大幅降低,可在与上图中简单场景(CPU×2 + PCIe 设备)相近的开销下使用

b4024aba-8c4d-11f0-8c8f-92fbcf53809c.jpg

图12:如前所述,非树形拓扑预计未来将支持

需要说明的是,UIO 仅能在 FLIT 模式下使用,不支持非 FLIT 模式。目前,UIO 仍属于可选功能,还存在一些问题,例如空闲时延迟增加、编程环境尚未完善、支持 UIO 的原子指令尚未定义等。因此,未来或许会逐渐向 UIO 过渡,但初期的 PCI Express 7.0 控制器 / 设备是否支持 UIO,还存在不确定性。

PCI Express 7.0 的物理层

接下来谈谈物理层。如前次报道所述,配合PCI Express 7.0,已发布了 Optical Aware Retimer(光感知重定时器)的 ECN(工程变更通知),而 ReDriver(重驱动器)的规范正在制定中,预计 2025 年末发布 ECN(图 13)。

b45e4568-8c4d-11f0-8c8f-92fbcf53809c.jpg

图13:从这张图来看,Optical Aware Retimer 或许是指可集成到光互联(OCI)中的重定时器

此外,关于CopperLink(铜缆连接),预计 2026 年末发布线缆规范(图 14)。

b4b9adae-8c4d-11f0-8c8f-92fbcf53809c.png

图14:这里的 “PCIe 7.0 CopperLink cable solution demonstrated”,想必是在 2025 年 PCI-SIG 开发者大会(DevCon 2025)的展示环节中演示的

下面总结一下电气层的情况(图15)。

b51c305a-8c4d-11f0-8c8f-92fbcf53809c.jpg

图15:误码率(BER)需控制在 1×10??以下,因为结合 FLIT 可实现低于 1FIT 的目标

PCB 损耗在 32GHz 时需控制在 1dB / 英寸以下,这一要求相当严格。而接收端采用 FFE(前馈均衡器)+DFE(判决反馈均衡器)的结构,也在预料之中。由于信号频率翻倍,所有损耗都会增加,这是不可避免的。但为了平衡损耗而控制 PCB 损耗,或许需要采用玻璃基板(图 16)。

b57d1fe6-8c4d-11f0-8c8f-92fbcf53809c.jpg

图16:通道长度其实与 PCI Express 6.0 相同。若不做任何改进、使用相同材料构建通道,损耗会增加,因此转向在 PCB 侧控制损耗的方针

此外,各种组件的要求也更加严苛。参考时钟的抖动需控制在0.067ps(图 17),而数据眼图若不使用二阶前导(2nd Pre-cursor),情况会相当严峻(图 18)。

b5de8448-8c4d-11f0-8c8f-92fbcf53809c.jpg

图17:不过,例如瑞萨电子(Renesas Electronics)已推出抖动低至 55fs 的锁相环(PLL)产品,因此虽严苛但并非不可能实现

b63c9f10-8c4d-11f0-8c8f-92fbcf53809c.jpg

图18:与图 2 对比,便能看出 PCI Express 7.0 的严苛程度

发送端参数如图19 所示,接收端参数如图 20 所示。

b69ff4ac-8c4d-11f0-8c8f-92fbcf53809c.jpg

图19:从这些数值可以看出,整体要求相当严苛。发射端均衡(Tx Equalization)仍保持 4 抽头,可能是因为转向由接收端解决问题

b7041892-8c4d-11f0-8c8f-92fbcf53809c.jpg

图20:眼高从 6mV 提升至 10mV,这想必是以使用发射端二阶前导(TX 2nd Pre-cursor)为前提。若不使用发射端二阶前导,能否达到 10mV,让人有些怀疑

合规眼宽(Compliance Eye Width)仅为 1.5625ps,这一数值十分惊人。而 PCI Express 6.0 仅需 16 抽头 DFE,PCI Express 7.0 则强化为 29 抽头 FFE+1 抽头 DFE,其升级幅度相当大。前文提到延迟最多增加约 10ns,这大半或许是由强化后的 FFE+DFE 导致的。

以上就是目前公开的PCI Express 7.0 相关信息。不得不说,其已接近电信号的极限。但正如之前的文章所述,PCI Express 7.0 预计 2028-2029 年左右投入市场。到那时,组件质量能否提升到足以轻松实现这一标准的水平,还是仍会处于勉强达标的状态,笔者目前也难以判断。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 带宽
    +关注

    关注

    3

    文章

    1001

    浏览量

    42507
  • PCIe
    +关注

    关注

    16

    文章

    1377

    浏览量

    86105
  • 眼图
    +关注

    关注

    1

    文章

    73

    浏览量

    21502

原文标题:太疯狂了!PCIe 7.0 技术细节曝光:眼图已到极限!

文章出处:【微信号:HXSLH1010101010,微信公众号:FPGA技术江湖】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    PCIe 7.0发布:16通道双向512GB/s,拥抱光纤未来

    电子发烧友网报道(文 / 吴子鹏)日前,PCI-SIG 宣布正式推出 PCIe 7.0 规范。PCIe 7.0 继续沿用自 PCIe 6.0
    的头像 发表于 06-13 00:07 ?6565次阅读
    <b class='flag-5'>PCIe</b> <b class='flag-5'>7.0</b>发布:16通道双向512GB/s,拥抱光纤未来

    PCIe 6.0 SSD主控芯片狂飙!PCIe 7.0规范到来!

    通道的带宽达到256 GB / s,并且延迟相比上一代更低。PCIe 6.0 采用 PAM4(四电平脉冲幅度调制)编码技术,将每个符号编码为四个不同的电平,在同一信号周期内可携带更多比特的数据,无需增加
    的头像 发表于 09-07 05:41 ?4595次阅读
    <b class='flag-5'>PCIe</b> 6.0 SSD主控芯片狂飙!<b class='flag-5'>PCIe</b> <b class='flag-5'>7.0</b>规范到来!

    PCIe 7.0 Samtec已为您准备好N种互连解决方案

    年光通信大会(OFC)现场演示内容,简要介绍了 六种Samtec连接器系统,均能运行于PCIe 7.0数据速率 。 演示细节 演示包含 板对板连接器组件
    的头像 发表于 09-04 11:38 ?598次阅读
    <b class='flag-5'>PCIe</b> <b class='flag-5'>7.0</b>   Samtec已为您准备好N种互连解决方案

    揭秘徐工新能源重卡的技术细节

    对于一台新能源重卡而言,无论在安全方面多做多少努力都不为过。徐工汽车将新能源重卡的“安全”筑入整车的结构设计中,融进控制系统每一个响应逻辑里,更深藏技术细节的每一行代码之后。
    的头像 发表于 08-11 11:45 ?517次阅读

    PCIe 8.0 规范公布:1TB/s 带宽、256GT/s 速率

    将使速率在 PCIe 7.0 的基础上翻倍至 256.0 GT/s,通过 x16 配置实现 1TB/s 的双向带宽。 ? 从 PCI-SIG 目前公布的细节来看,PCIe 8.0 首
    的头像 发表于 08-08 09:14 ?6518次阅读

    SMA连接器名称由来:SubMiniature Version A 的技术细节

    SMA连接器名称中的“SubMiniature Version A”,精准概括了其小型化、开创性的设计理念,而德索精密工业以卓越的技术细节和严谨的制造工艺,为SMA连接器的高性能连接提供了有力支撑,让这一经典连接器在射频与微波连接领域持续焕发新的光彩。
    的头像 发表于 06-24 11:30 ?270次阅读
    SMA连接器名称由来:SubMiniature Version A 的<b class='flag-5'>技术细节</b>

    PCIe 7.0最终版草案发布,传输速率128 GT/s,PCIe 6.0加速商业化

    ,这是PCIe 7.0规范正式版本发布前的最后一个草案版本,而正式版将于2025年晚些时候发布。 ? 其核心技术参数目标包括:传输速率128 GT/s,x16 配置下双向带宽达 512 GB/s;采用
    发表于 03-29 00:07 ?840次阅读

    索尼IP编码板:技术细节与应用探索

    索尼IP编码板的技术细节,并探讨其在不同领域的应用价值。 技术细节:卓越性能与高效传输 索尼IP编码板作为连接硬件与软件的桥梁,集成了精密的电路设计与先进的芯片技术。它不仅能够接收并处理来自传感器、摄像头等外部设备
    的头像 发表于 03-20 10:10 ?627次阅读

    是德科技PCIe 6.0发射机合规性测试解决方案

    随着 PCIe 6.0 标准刚刚进入市场,PCI-SIG 组织已着手推动下一代标准——PCIe 7.0,预计将在 2025 年正式发布,持该标准的设备预计将在 2026 年问世,而大规模商用
    的头像 发表于 03-06 11:29 ?1154次阅读
    是德科技<b class='flag-5'>PCIe</b> 6.0发射机合规性测试解决方案

    PCIe 7.0 互连— PCIe的尽头会是光吗?

    伴随大语言模型和相关训练系统迅猛增长、对非结构化数据处理的需求急剧上升,市场对算力的需求也是呈指数级增加。PCIe作为计算机和服务器中使用广泛的高速数据传输技术发展迅猛,今年4月份PCI-SIG已经
    的头像 发表于 02-10 10:03 ?556次阅读
    <b class='flag-5'>PCIe</b> <b class='flag-5'>7.0</b> 互连— <b class='flag-5'>PCIe</b>的尽头会是光吗?

    SONY编码板测试:技术细节与性能评估

    和信号转换,其性能优劣直接影响到整个产品的运行效率和稳定性。本文将深入探讨SONY编码板的测试过程,从技术细节到性能评估,全面解析这一关键组件的重要性。 一、SONY编码板概述 SONY编码板,作为连接硬件与软件的桥梁,集成了复
    的头像 发表于 01-15 16:37 ?527次阅读

    有关UV固化你不知道的技术细节

    UV固化技术中,光引发剂吸收UV光产生活性自由基触发聚合反应,包括链引发、增长、终止和交联。反应速率受UV光强、光引发剂浓度、单体类型等因素影响,UV固化技术具有快速固化特性。
    的头像 发表于 12-06 09:33 ?1148次阅读

    是德科技PCIe 7.0测试解决方案

    伴随大语言模型和相关训练系统迅猛增长、对非结构化数据处理的需求急剧上升,市场对算力的需求也是呈指数级增加。PCIe作为计算机和服务器中使用广泛的高速数据传输技术发展迅猛,今年4月份PCI-SIG已经批准 Draft 0.5版基础规范,目前0.7版本基础规范正在审核中,预计
    的头像 发表于 11-06 13:37 ?1028次阅读

    深入解析Zephyr RTOS的技术细节

    ,Zephyr OS在嵌入式开发中的知名度逐渐增加,新的微控制器和开发板都支持Zephyr。本文将深入讨论Zephyr RTOS的技术细节
    的头像 发表于 10-22 16:47 ?3208次阅读
    深入解析Zephyr RTOS的<b class='flag-5'>技术细节</b>