新闻中心

企业新闻

新闻中心 企业新闻

ky开元-AI 机架功耗飙升,驱动数据中心电源与散热方案全面迭代

2025-11-03

在生成式 AI 的带动下,数据中心的单加速卡功耗从几年前的约 100W 快速上探至 1000W;随之而来的是机架级功率从传统的 20–30kW,提升到 100kW,并被多方机构与产业报告预测将向 数百千瓦/机架演进。这一跃迁使传统的 12V 架构、风冷与房级 UPS 体系逐渐逼近物理与运营极限,电源分配、冷却、备电与微电网正在迎来系统性重构。

机架功率的“新常态”

100kW 级机架正成为 AI 集群的现实门槛,网络设备商的技术简报亦给出“AI 驱动机架容量可达 100kW”的工程参考上限。更激进的前瞻方案已将单机架电力向 MW(兆瓦)级规划,并围绕 800V 直流母线展开联合研发。

能源研究机构同时提醒,若 AI 增长曲线维持现状,2030 年 AI 峰值功率或达 50GW 量级,对电网与选址提出全新约束。

架构升级一:从 12V 到 48V/高压直流(HVDC)

板/柜内配电电压提升成为第一选择:用 48V 替代 12V 可把母线电流降至 1/4,显著降低铜损与线缆截面需求,提升布线密度与可靠性。新一代 CRPS/OREV(OCP ORv3)电源与机架总线铜排(busbar),在 48V 体系下实现热插拔与盲插对接,缩短维护停机时间。

更高电压向上延伸:为缓解配电干线与列间配电损耗、支撑 100kW/机架,运营商正评估 380–800V 直流电源干线进入机房,至机架侧再降压到 48V/12V。工业电气企业已与加速器生态合作,以 800VDC 为 1MW 机架做预研。

架构升级二:电源电子从硅走向 GaN / SiC

在高电压、高频、高功率密度的目标下,GaN/SiC 功率器件逐步进入数据中心电源:

PFC 与一次侧变换采用 SiC,可在高压下保持更高效率与更低热耗;

二次侧/多相 DC-DC引入 GaN,有助于提升开关频率、缩小磁件与滤波器,电源功率密度与动态响应显著改善。

对于 48V→板级多轨的中间总线架构(IBA),高效率窄带隙器件叠加软开关与数字控制,可把关键转换级的峰值效率推向 97–98% 的区间(具体指标依厂商实现而异)。

架构升级三:从“房级 UPS”到“机架级直流备能”

传统房级 UPS 在高功率密度/高动态负载场景下难以最佳化;为此,**机架内置直流锂电备能(Rack-level DC UPS)**成为趋势:

靠近负载,减少配电链路级数与能量往返损耗;

与服务器/加速器的电源管理总线联动,可做细粒度峰谷协调与扰动抑制;

更易与 直流母线+可再生能源+储能系统(BESS) 组成本地直流微电网,提升可再生能源利用率并缓解上游电网冲击。

这类方案也便于未来与**液冷 CDU(冷板/冷却液分配单元)**的协同控制,实现“功热联动”的运行优化。

冷却范式:风冷极限与液冷分野

风冷增强:针对 30–60kW/机架,后门热交换器(RDHx)、通道封闭与高效风道仍可作为过渡方案,但当单卡上千瓦、机架 100kW 时,风冷在噪声、能效与热点治理上收益递减。

液冷成为主线:

直连式液冷(DLC)/冷板:热阻低、PUE 友好,已在 AI 训练集群批量落地;

浸没式液冷:对超高热流密度器件更具潜力,运维模式需与供配电改造协同规划。

冷却选择直接反向塑造电源形态:液冷让高密度电源模块更易就近散热,有利于 48V 高电流母线与板级多相变换器的布置。

机架形态与可维护性

电源搁板(Por:破高膙辚?f然揩襮嫛蟿F鸠5pep=k?确矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鹆黮}劷:q{|?e ?%坖D覑眤丬鲩M(缬s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫er Shelf)与并联系列:在 48V 架构下常见 3U/6U 电源搁板并联输出至铜排,支持热插拔、N+1/N+N 冗余、前后走线,并与 OCP ORv3 规范对齐以增强互换性。

可更换单元(FRU)与数字化维护:通过 PMBus/SMBus/以太网监控,电源健康状态、纹波、温度与老化指标实现全生命周期可视化与预测性维护,与调度器/编排平台配合做“功率感知”的作业调度。

选型参考与落地建议

先定热,再定电:按目标 kW/机架 与 W/器件 做热设计选型(风/液/浸没),再回推母线电压、搁板功率密度与 PDU/母线槽容量。

48V 为“必答题”,HVDC 为“加分项”:48V 是今天的现实工程解;若园区具备条件,评估 380–800VDC 进入列/架侧,可显著压降损耗与铜材成本。

功率器件代次升级:对 100kW/机架场景,把 SiC(一次侧)+GaN(二次侧) 作为优先路线,关注效率、功率密度与热设计的系统平衡。

就近备能与直流微电网:机架级 DC UPS 与园区级储能协同,结合 AI 任务的功率预测能力,形成削峰填谷与有序功率分配。

对标开放规范与互操作:优先采购满足 OCP ORv3 / CRPS 生态的电源与机柜部件,提高互换与维保效率。

电网与选址联动:对 100kW/机架、 10MW/机房的项目,选址应同时评估电网接入、冷源可获得性与水/能双 PUE 约束;必要时采用**园区级再电力化(On-site Generation)**与热回收方案。

-ky开元

分享