随着单芯片功耗突破千瓦级,热流密度攀升至1000W/cm²,传统风冷已无力应对。唯有构建“芯片微流道引热 + 智能流量调控送热 + MEMS风冷排热”的闭环系统,才能实现高效、稳定、绿色的散热闭环,释放极致算力。
英伟达在GTC 2024展示的NVIDIA DGX GB200 NVL72带有液冷模块和不带液冷模块的计算节点内部视图
热管理新挑战:从芯片到系统
当前,芯片级液冷技术——如英伟达最新推出的微流道嵌入式GPU——将散热前线推进至微米尺度,直面极端热流的冲击。微流道结构虽可迅速将热量从芯片核心导出,却仍面临一个根本性难题:若冷却液未能实现高效相变或持续循环,热量依然堆积于系统内部,无法真正排出。
因此,仅依靠微流道“引热”并不足够。若缺乏合理的冷媒选择与流量控制,液冷系统仍可能陷入“热饱和”,导致性能降频甚至硬件故障。真正的系统级散热,必须同时解决“引热、送热、排热”三个环节的协同问题。
“送热”中枢:智能流控与均衡监测
在液冷系统中,冷却液的高速流动与流量均衡直接决定散热效率。我们提出第一类解决方案:通过高精度流量传感器实时监测管路内的流体状态,实现动态调节与异常预警。该技术可确保冷却液均匀流经每一条微流道,避免局部过热,同时提升系统能效与可靠性——实际应用中,此类智能流控方案可降低泵系统能耗超过40%。
更重要的是,流量感知能力为系统提供了“智能触觉”,使其能够应对负载突变、气泡积聚、微泄漏等多重挑战,从而将液冷系统从“被动散热”提升为“主动热管理”。
“排热”终局:相变冷却与MEMS风冷协同
若冷却液在流道内未能实现相变,则需依靠远端散热装置完成最终的热量排出。我们提出第二类解决方案:采用相变冷却与MEMS风冷技术相结合的方式,在系统远端实现高效排热。
MEMS风扇凭借其毫米级厚度与高功率密度散热能力,可集成于冷板、散热鳍片或机箱壁面,对热点实施精准吹拂。在空间受限的边缘设备(如自动驾驶域控制器、机器人关节模组)中,MEMS风冷更是唯一可行的主动散热手段。
相变冷却则进一步提升了排热效率,使热量在远端集中释放,再通过MEMS风扇迅速排向大气,形成真正的“热出口”。
闭环协同:系统级散热的新蓝图
真正的散热闭环,需将三类技术无缝整合:
“引热”靠芯片微流道,迅速导出热量;
“送热”靠智能流控,保障流量均衡与系统稳定;
“排热”靠相变冷却与MEMS风冷,最终将热量排入环境。
这三者缺一不可。唯有闭环协同,才能在不同场景——无论是云端数据中心、边缘服务器,还是移动机器人——中实现最优散热效能,为Zettascale时代的算力释放奠定 thermal 基础。
在这场对抗热极限的系统中,我们正与芯片巨头并肩,共同构建下一代散热架构——智能、绿色、无处不在的“散热心脏”。