浸没式液冷(Immersion Cooling)—AI 数据中心的散热新标准
随着生成式 AI(Generative AI)、大型语言模型(LLM)与高性能计算(HPC)快速发展,全球数据中心正面临前所未有的散热压力。过去以气冷(Air Cooling)为主的数据中心架构,已逐渐难以应付高密度 GPU 与 AI 服务器所产生的巨大热量。因此,「液冷(Liquid Cooling)」与「浸没式液冷(Immersion Cooling)」近年快速成为 AI 数据中心的核心技术趋势。
什么是浸没式液冷(Immersion Cooling)?
将整台服务器、主板、GPU、SSD 等 IT 设备,直接浸泡于「不导电」的绝缘冷却液(Dielectric Fluid)中,利用液体高效导热特性进行散热。液体带走热量的能力是气体的 1000 倍,且电力消耗量却只有气体的 10 分之1。由于液体的导热效率远高于空气,因此能快速带走高热密度 AI 计算所产生的大量热能。相较于传统气冷架构,浸没式液冷初期建置价格较高,但具备最佳的散热效果,能够:
- 大幅降低散热能耗:传统数据中心的冷却系统约占总能耗的 40% - 50%,而浸没式液冷最高可节省 90% 的冷却能源消耗,使整体机房 IT 散热功耗降低约 50%
- 提升服务器密度
- 改善数据中心 PUE(Power Usage Effectiveness)
- 降低 Thermal Throttling,确保 AI 计算稳定
为什么 AI 数据中心必须导入液冷技术?
AI 计算正在推升前所未有的数据中心热密度。传统数据中心单一机柜(Rack)的功耗大约5–10kW;而AI 服务器机柜功耗已达 40-100kW,部分高密度配置甚至超过 120kW。以训练一次 GPT-3 模型为例,约需消耗 19 万度电。若能通过液冷技术将数据中心的 PUE 由 1.5 降至 1.1,约可节省 30%(即 5 万度)的耗电量。当热量暴增数倍,传统气冷架构将面临风量与噪音限制,以及热点(Hot Spot)无法排除等问题。因此,液冷技术已从过去的「选配」转变为 AI 数据中心的「必要基础建设」。
| 比较项目 | 传统气冷 (Air Cooling) | 浸没式液冷 (Immersion Cooling) |
| 散热介质与方式 |
冷空气循环对流 |
绝缘液体直接接触吸热 |
| 散热效率 |
较低,易受环境温度影响 |
极高,热传导速度快 |
| PUE 表现 |
通常> 1.5 |
可降至 1.02~1.1 |
| 适用场景 |
一般企业机房 |
AI 训练中心.HPC 计算.超大规模数据中心 |
液冷技术有哪些种类?
1. 冷水板液冷(Cold Plate Liquid Cooling)
运行原理:通过冷水板与高热组件(如 GPU、CPU)直接接触,利用接触传导将热量由冷水板中的液体传走
特点:
- AI 应用占比约 70~85%
- PUE 可达 1.1~1.15
- 安装相对简单,与现有架构兼容性高
- 适合多数企业级 AI 部署
2. 浸没式液冷(Immersion Cooling)
运行原理:组件直接浸泡于绝缘冷却液中,液体直接接触所有组件表面将热传走
- AI 应用占比约 5~15%
- PUE 可达 1.02~1.05,为目前最低
- 散热效率最高,适合极高密度部署
- 随着次世代 GPU(如 NVIDIA GB300)功耗持续攀升,导入占比将持续提升
浸没式液冷又可细分为:
-
单相浸没式液冷
-
两相/双相浸没式液冷

单相浸没式液冷
(Single-Phase immersion cooling)

两相/双相浸没式液冷
(Two-Phase immersion cooling)
为什么 SSD 也需要支持浸没式液冷?
在 AI 训练与推理工作负载中,SSD需做到:
- 训练数据集的高速读取
- 模型检查点(Checkpoint)的频繁写入
- TB 级参数文件的储存
- 高 IOPS 与高吞吐量需求
这使得SSD 在高负载下,同样会产生大量热能,成为 AI Server 中不可忽视的散热源。
传统 SSD 在液冷环境的挑战
传统 SSD 在浸没式环境中面临诸多材料兼容性风险,例如:
- 材料兼容性: 部分业界传统材料可能不适用于液冷环境。
- 组件稳定性: 部分组件在长时间浸没环境下可能出现稳定性问题。
- 散热结构适配: 传统气冷散热设计未必适合液冷环境。
因此,并非所有 SSD 都适合长期浸泡于液冷液中,需要专门针对浸没式环境进行设计与验证。
结语:为液冷时代准备好的企业级存储
随着 AI 模型参数与算力需求呈爆发式成长,未来数据中心全面走向「高密度、高效率、低碳排」已是不可逆的趋势。AI 时代的基础建设升级, 企业在导入浸没式液冷时,必须确保存储设备经过完整的液冷环境验证。
SSSTC针对浸没式冷却环境进行SSD兼容性优化,通过材料选用、组件保护与结构设计,强化耐腐蚀能力。产品涵盖SATA ER3、ER4系列,以及PCIe® U.2 PJ1、EJ5系列。以 ER3 产品为例,经投入 3M FC-40 氟化液进行整机测试,已成功通过严格的 3 年与 5 年浸泡可靠度验证。测试结果显示,其电容衰减率仅约 10~13%,符合小于 20% 的规范标准,助力数据中心优化电力使用效率(PUE)并提升整体系统可靠度。


PJ1 U.2 NVMe™ SSD
NAND Flash: 3D TLC NAND Flash
接口: PCIe® Gen4 x4
顺序读取: 最高 7,000 MB/s
顺序写入: 最高 4,200 MB/s

EJ5 U.2 NVMe™ SSD
NAND Flash: 3D TLC NAND Flash
接口: PCIe® Gen5 x4
顺序读取: 最高 14000 MB/s
顺序写入: 最高 7500 MB/s