AMD EPYC Genoa 架构深解:96 核如何协调工作

YouTube
31:15 在 YouTube 打开

AMD EPYC Genoa 架构精讲 — Zen 4 CCD 设计与 Infinity Fabric

EPYC 产品线定位

AMD EPYC 第四代(代号 Genoa,型号 9004 系列)于 2022 年 11 月发布,覆盖范围从 8 核入门到 96 核旗舰:

SKU 系列核心数TDP定位
9754 / 9754S128 核(Bergamo)360W云原生超高密度
965496 核360W旗舰通用计算
955464 核360W平衡型
935432 核280W高频单线程
9174F16 核320W频率优先(金融/EDA)

CCD + IOD 芯片组合设计

Genoa 延续 AMD 的 Chiplet 策略,将处理器拆分为多个独立裸片(Die):

EPYC 9654 (96 核) 物理布局:

┌─────────────────────────────────────────────────┐
│                    封装基板(package)              │
│                                                  │
│  CCD  CCD  CCD    ┌─────────────┐   CCD  CCD  CCD │
│  [8c] [8c] [8c]   │             │   [8c] [8c] [8c] │
│                   │     IOD     │                  │
│  CCD  CCD  CCD    │  (I/O Die)  │   CCD  CCD  CCD │
│  [8c] [8c] [8c]   │   6nm TSMC  │   [8c] [8c] [8c] │
│                   └─────────────┘                  │
│     6 个 CCD × 8 核 = 48 核(左侧)                 │
│     6 个 CCD × 8 核 = 48 核(右侧)                 │
└─────────────────────────────────────────────────┘
共 12 CCD × 8 核 = 96 物理核心

为什么要分离 CCD 和 IOD?

  • 良率优势:小芯片良率远高于单片大芯片,降低成本
  • 工艺混搭:计算核心用 5nm 追求性能,I/O 电路用成熟 6nm 降低成本
  • 灵活扩展:砍 CCD 数量就能得到低端 SKU,复用 IOD

Infinity Fabric 互联

所有 CCD 与 IOD 之间通过 Infinity Fabric(IF) 高速总线连接:

# 查看 EPYC 系统的 NUMA 拓扑
numactl --hardware

# 典型双路 9654 输出:
# available: 8 nodes (0-7)
# node 0 cpus: 0-23 96-119    ← 单路物理节点 0
# node 1 cpus: 24-47 120-143  ← 单路物理节点 1
# ...(共 8 个 NUMA 节点,每路 4 个)

重要:Genoa 单路有 4 个 NUMA 节点(NPS4 模式),内存访问延迟与 NUMA 距离高度相关。数据库和 HPC 应用需要正确配置 NUMA 绑定。


DDR5 内存子系统

Genoa 是业界首批大规模部署 DDR5 的服务器平台:

参数规格
内存通道数12 通道(每路)
支持类型DDR5 RDIMM / LRDIMM / 3DS
最高速率DDR5-4800(原生)
最大容量6 TB(每路,使用 256GB 3DS LRDIMM)
单路带宽峰值~461 GB/s
# 检查当前内存频率与通道配置
dmidecode -t memory | grep -E "Speed|Bank|Type"

# 确认内存是否全通道运行(12 通道最佳性能)
ipmitool sdr type Memory

参考资料