数据中心步入“兆瓦级时代”,中国基础设施撑起算力新未来深度揭秘
如今,随着服务器功耗从数十千瓦攀升至数百千瓦,液冷市场开始爆发。TrendForce预计,液冷技术在AI数据中心的渗透率将从2024年的14%大幅提升至2026年的40%,并在未来数年持续增长。
4月8日,曙光数创在“液冷聚能·智算向新”2026战略发布会上,正式发布全球首个MW级相变浸没液冷整机柜及其基础设施整体解决方案(C8000 V3.0)。这一产品诞生背后,曙光数创看到了哪些趋势,这个解决方案有何亮点?曙光数创高级副总裁张鹏、曙光数创资深技术专家黄元峰向EEWorld进行了详细剖析。
液冷成为未来AI计算首选方案
英伟达预测,AI基础设施市场规模在2027年可能达到万亿美元级别。从其AI计算平台演进来看,单机柜功率密度持续攀升。
“高密部署是下一代AI计算的重要趋势,国内外新建数据中心的功率密度正快速上升。”黄元峰解释道,目前国际主流GPU功耗已达1.8kW,CPU超过650W。受制程影响,国产芯片功耗更高,预计到2027年,国产主流GPU功耗可能突破3000W,CPU突破1000W。
黄元峰强调,在这样的趋势下,液冷成为未来AI计算的首选方案,是未来AIDC发展中最具应用潜力的方向,前景广阔。

“我们认为,单机柜功率超过200kW时,采用两相浸没式液冷优势明显,全生命周期看成本更优且长期可收敛。”黄元峰表示,主要体现在四个方面:高功率下单位冷却成本递减、介质成本降至进口产品的30%以下、PUE≤1.04大幅节省电费,以及规模化集成带来的空间与配件成本优化。因此,相变浸没式液冷既高效又好用。
以中科曙光scaleX640超节点为例,这是全球首例已落地的兆瓦级AI解决方案,特点可概括为:高效散热、成本可控、省电节能、性能稳定、算力密度全球领先。
走进实际项目
那么,C8000 V3.0在实际机房中如何让液冷技术发挥出其最大价值。张鹏介绍,AIDC相对于传统的数据中心,完全是不同的物种。面向未来的AIDC机房设计,必须采用创新的设计理念,不能再以传统眼光看待新事物。具体来说,其在项目中设计主要涵盖四个方面:
第一是冷却,AIDC有三类冷却需求:高密度核心机房、通用计算区以及配套服务区域。C8000 V3.0可实现单机柜900kW以上的极致散热能力。
第二是供电,它是C8000 V3.0最重要的创新之一。团队设计了占地仅17平方米的中压直转系统,内置变压器和直流柜,可直接挂接电池。该装置支持“交直流互用”,3150kVA可输出交流或直流,以及240V、400V、800V等多种电压。核心机房下方开挖了160个孔洞,使高压线缆以最短距离接入计算机,替代了传统管井方案,节省成本约4000万元。这一布局将供配电系统尽量靠近机器,缩短低压线缆,减少用铜量。
第三是智能管理系统,曙光智创引入了“健康度”概念,实现故障预诊断。通过AI综合分析温度、流量、压力等参数,系统可提前判断换热器、冷媒、水泵等设备的健康状态,而不是等到故障发生才报警。同时,将全年运行数据输入AI模型进行学习,系统可自动给出更节能的运行参数。在实际运营中,AI调优可使冷却系统能耗再降低10%。
第四是余热利用方面,曙光数创也有自己的理解。张鹏指出,由于液冷排出的水温约为40~50℃,品位处在不高不低的状态,芯片允许的工作温度在80~90℃之间,受热阻限制,外部水温很难再提高。即便使用热泵升温,能耗反而得不偿失。因此,最现实的做法是直接为这40~50℃的热水寻找合适的应用场景。目前曙光数创已识别出十多个潜在场景,例如中水处理厂中用于分解有机物的菌落需要这种温度的热量,皮革厂烘干工序同样适用,此外还包括农业大棚等。
曙光数创高级副总裁张鹏 编辑
但余热利用的推广不能仅靠企业单打独斗,需要政府引导和政策支持,比如对实施余热利用的项目给予电费优惠等激励。张鹏将其概括为“算热联产”理念,目前数据中心占中国用电量约3%,远期有可能上升至30%,余热利用将变得愈发重要。
从芯片外围到芯片封装
“液冷只有走完最后一微米,算力的能量才能真正被释放。”张鹏表示,回顾多年的技术积累,芯片的热密度持续增大,目前的工作仍主要围绕芯片外围展开。未来,一个重要的趋势是向芯片内部发展。热量从底层电路传递到表面的短短几百微米,其热阻可占整个链路的三成。此前主要降低的是外围热阻,而未来的“最后一微米”将是行业突破的关键。
展望未来5~10年,一个值得突破的方向是芯片“封装”内部的热阻问题。黄元峰对此解释,目前液冷技术多在芯片外部做文章,但随着芯片功耗增大,封装本身带来的温差成为瓶颈,只有降低内部热阻,外部冷却的效率才能最大化。
来源:电子工程世界(EEWorld)返回搜狐,查看更多