AMD EPYC Genoa 架构深解:96 核如何协调工作
EPYC 产品线定位
AMD EPYC 第四代(代号 Genoa,型号 9004 系列)于 2022 年 11 月发布,覆盖范围从 8 核入门到 96 核旗舰:
| SKU 系列 | 核心数 | TDP | 定位 |
|---|---|---|---|
| 9754 / 9754S | 128 核(Bergamo) | 360W | 云原生超高密度 |
| 9654 | 96 核 | 360W | 旗舰通用计算 |
| 9554 | 64 核 | 360W | 平衡型 |
| 9354 | 32 核 | 280W | 高频单线程 |
| 9174F | 16 核 | 320W | 频率优先(金融/EDA) |
CCD + IOD 芯片组合设计
Genoa 延续 AMD 的 Chiplet 策略,将处理器拆分为多个独立裸片(Die):
EPYC 9654 (96 核) 物理布局:
┌─────────────────────────────────────────────────┐
│ 封装基板(package) │
│ │
│ CCD CCD CCD ┌─────────────┐ CCD CCD CCD │
│ [8c] [8c] [8c] │ │ [8c] [8c] [8c] │
│ │ IOD │ │
│ CCD CCD CCD │ (I/O Die) │ CCD CCD CCD │
│ [8c] [8c] [8c] │ 6nm TSMC │ [8c] [8c] [8c] │
│ └─────────────┘ │
│ 6 个 CCD × 8 核 = 48 核(左侧) │
│ 6 个 CCD × 8 核 = 48 核(右侧) │
└─────────────────────────────────────────────────┘
共 12 CCD × 8 核 = 96 物理核心
为什么要分离 CCD 和 IOD?
- 良率优势:小芯片良率远高于单片大芯片,降低成本
- 工艺混搭:计算核心用 5nm 追求性能,I/O 电路用成熟 6nm 降低成本
- 灵活扩展:砍 CCD 数量就能得到低端 SKU,复用 IOD
Infinity Fabric 互联
所有 CCD 与 IOD 之间通过 Infinity Fabric(IF) 高速总线连接:
# 查看 EPYC 系统的 NUMA 拓扑
numactl --hardware
# 典型双路 9654 输出:
# available: 8 nodes (0-7)
# node 0 cpus: 0-23 96-119 ← 单路物理节点 0
# node 1 cpus: 24-47 120-143 ← 单路物理节点 1
# ...(共 8 个 NUMA 节点,每路 4 个)
重要:Genoa 单路有 4 个 NUMA 节点(NPS4 模式),内存访问延迟与 NUMA 距离高度相关。数据库和 HPC 应用需要正确配置 NUMA 绑定。
DDR5 内存子系统
Genoa 是业界首批大规模部署 DDR5 的服务器平台:
| 参数 | 规格 |
|---|---|
| 内存通道数 | 12 通道(每路) |
| 支持类型 | DDR5 RDIMM / LRDIMM / 3DS |
| 最高速率 | DDR5-4800(原生) |
| 最大容量 | 6 TB(每路,使用 256GB 3DS LRDIMM) |
| 单路带宽峰值 | ~461 GB/s |
# 检查当前内存频率与通道配置
dmidecode -t memory | grep -E "Speed|Bank|Type"
# 确认内存是否全通道运行(12 通道最佳性能)
ipmitool sdr type Memory