如何从IT层面到物理基础设施层面,重新规划和设计智算中心?(二)‖《智算中心基础设施架构演进白皮书》解读

上次我们分享了关于智算中心的终端用户需求、芯片、机柜功率、负载特性这些颠覆性变革的演进,在智算中心的选址上提出了一些深度问题,这些问题有助于我们更好的理解和规划智算中心。

 

前文回顾:如何从IT层面到物理基础设施层面,重新规划和设计智算中心?(一)‖《智算中心基础设施架构演进白皮书》解读

 

接下来,我们将从智算中心的电气、制冷两个专业的演进进行一些解读,更多内容请阅读《智算中心基础设施架构演进白皮书》,文后有白皮书下载链接。

 

 

 

智算中心电气链路架构挑战及演进

 

电气系统作为数据中心的“动力引擎”,为整个数据中心提供强劲的动力支持,确保信息的安全、高效、稳定的运行。因此,智算中心的电气系统的架构演进至关重要,我们摘取了白皮书的部分内容进行分享解读。

 

 

1

 

“算电协同”演进

 

随着智算芯片密度的持续增加,机柜高密度化演进,园区的用电规模可以达到200MW,甚至攀升至300~500MW的水平,因此需要接入220kV甚至更高电压等级的电网,这对区域电网的压力呈指数级上升。

 

因此,相比于通算中心,智算中心的拓展瓶颈已经从机柜数量的物理空间问题,转变为能源供给问题,智算中心园区的算力容量上限不再是芯片算力的上限,而是发电厂和电网容量的上限。

 

面对电力能源接入的挑战,智算中心的演进趋势是向“算电协同”演进。通过整合调节资源,提升算力与电力协同运行,提高数据中心绿电占比,降低电网保障容量需求,探索光热发电与风电、光伏发电联营的绿电稳定供应模式。

 

 

图片来源:《电力与算力协同发展蓝皮书2024》

 

 

2

 

简化供电系统架构演进

 

在通算中心(传统数据中心)时代,为追求数据中心运营环境的极高可用性,2N配电架构是最常见的供电设计方案,这种架构以其建设简单、维护便捷的优势得到业内广泛认可,占据中国数据中心整体规划设计的主流。

 

但随着智算中心对算力需求的不断提升,以及对成本效益和空间效率的追求,供电设备占地面积大,供电效率低成为传统2N架构面临的主要问题,因此,简化配电架构设计以提升系统利用率、降低占地面积、最大程度地提升算力成为智算中心一大挑战。简化供电系统架构,比如DR架构和RR架构,在简化架构供电系统的利用率明显提升,DR/RR架构的建设成本和运行成本也比2N架构降低10%,配电设备数量和占地空间明显减少。如果需要更多的安全性考虑,2N+DR或RR的混合架构也是不错的选择。

 

 
 
 

 

 

 

 

3

 

智算负载分级供电演进

 

智算中心的训练业务负载属于可间断负载,因此,智算中心的训练业务负载对业务连续性、容错性和可用性的诉求发生改变,并不是所有负载都需要不间断电源和柴发后备电源。相较于昂贵的服务器成本,智算中心需要平衡后备电源供电的成本与服务器因断电损坏的潜在风险。

 

因此,智算中心在选择备电模型时,需要根据自身的风险承受能力进行决策,尤其是第三方租赁的智算中心,提供菜单式的分级供电可用性的服务等级协议(SLA)可能是一个可以平衡成本和风险的途径。

 

 

 

4

 

预制电力模组演进

 

根据通算中心(传统数据中心)的规划建设经验,单机柜功耗在2.5kW-5kW的情况下,供配电系统占地面积通常为IT设备占地面积的1/4左右;当单机柜功耗提升到8kW左右时,供配电系统占地面积将达到IT设备占地面积的1/2左右;当单机柜密度提升到16kW,供配电系统占地面积将与IT设备占地面积几乎相同。

 

因此,采用预制电力模组将中压柜、变压器、不间断电源UPS、高压直流(HVDC)、馈电等预制集成交付,可减少电力室面积高达40%,交付周期缩短70%,实现更高的利用率、可扩展性和更快的部署,将是智算中心电气链路演进的重要趋势之一。

 

 

 

5

 

 其它电气架构演进

 

其他方向的演进,比如,全直流供电、高密度UPS、不间断电源系统储备一体、智能母线等都是智算中心发展中架构演进的方向。

 

以全直流供电为例,全直流供电是为了解决智算中心的电力供给问题,降低智算中心配电占用面积,提升空间利用效率,同时高压直流(HVDC)、巴拿马电源以及固态变压器(SST)、10kV中压直流电源等直流解决方案不断涌现并逐渐发展成熟,在这些情况下,全直流供电逐渐发展成为了演进方向。

 

 

 

 

智算中心制冷系统架构演进

 

和电气系统一样,制冷系统同样非常重要。它就像是数据中心的“温度守护者”,精准守护着数据中心的温度,防止设备过热而中断运行,保障数据中心的持续稳定、安全、可靠的运行。

 

白皮书从芯片侧、机柜侧(风冷)、机柜侧(液冷)以及户外冷源测等维度进行梳理和分析,通过详实的图表,直观的给大家呈现出制冷技术的演进,供数据中心专业人士在规划设计时参考。下面仅做一些简单的节选。

 

图:制冷系统解决方案

 
 
 

图:用户关注要素技术路线对比

 

 

 

新能源、预制化及智算中心发展展望

 

随着全球对低碳越来越重视,而智算中心面临着电力能源需求持续增长的挑战,在此背景下,新能源无疑对智算中心的发展至关重要。白皮书在智算中心对新能源与储能的必然性、面临的挑战以及潜在的收益等方面进行了梳理分析,总结了当下新能源的一些应用方法,以及新能源的消纳面临哪些难题。

 

而预制化作为数据中心的“去工程化”的创新产品,在智算中心的发展中,也将发挥更加重要的作用。白皮书从电气预制化、制冷预制化两大专业的角度分析了预制化演进趋势,以及预制化发展面临哪些挑战。

 

白皮书的最后,是对智算中心的展望。为应对人工智能(AI)发展所带来的挑战,未来将会出现或已经出现的技术和设计方法,希望借此引发行业内对相关技术的探索,促进技术的发展。

 

数据中心行业的每一个进步都凝聚了行业内每一位同仁的智慧和努力,尤其在科技迅速发展的今天,任何时候都可能有一项新技术异军突起,因此白皮书的局限性在所难免,请各位读者和专家多包容和指正。

 

基于以上问题的深度思考,深知社(DeepKnowledge Community)携手维谛技术(Vertiv),通过对国内外近50位资深智算与超算专家进行深度访谈与调研,依托深知社全球动态知识库,精心编撰出这本具有系统性、前瞻性的白皮书:《智算中心(AIDC)机电架构演进(DCAE2024)白皮书》。

 

该白皮书为智算中心发展提供全面分析和预测,助力数据中心往智算中心的演进与突破。希望各位数据中心同行在阅读完这本白皮书之后,对于AIDC的演进趋势有更多、更深、更系统的理解。

 

扫描二维码下载《智算中心基础设施演进白皮书》

探索更多答案,迎接智算时代的到来!

 

 

 
 
 
 
 
 
 
 

DKC交流群邀请

深知社创立于2017年,是数据中心技术人员深度知识的交流、学习和分享虚拟社区平台。深知社提倡全球视野、交流分享、终身学习的知识理念,感兴趣的读者同学可以扫描下方二维码进群交流学习。

 

 

 

 

 
 
深 知 社
 
 

 

推荐阅读:

 

 

 

 

首页    白皮书解读    如何从IT层面到物理基础设施层面,重新规划和设计智算中心?(二)‖《智算中心基础设施架构演进白皮书》解读
《智算中心基础设施架构演进白皮书》官方解读二
设计
管理
运维
设备
电气
暖通
控制
碳中和
储能

深知社