2026 技术展望|智算中心:空间级信息-物理-能源系统

文勇刚 博士
新加坡南洋理工大学 校长(讲席)教授

概述

        2026 年智算中心(AI Data Centers,AIDCs)将经历一场结构性蜕变。它们不再只是支撑计算任务的被动基础设施,而是逐步演化为智能化、自主化、具备能源感知能力的复杂系统;能够主动在计算、供电、制冷、碳排放与系统韧性等方面进行多目标协同优化。

 

这一蜕变将由三股力量共同驱动:

  1. AI负载的爆炸式增长;
  2. 日益严格的能源与可持续性发展约束;
  3. 社会对数字基础设施的依赖程度持续上升。

 

        这一轮变革的核心主题是系统智能(System Intelligence)。AI 不再只是运行在数据中心内部的工作负载,而正在成为数据中心自身的设计、控制与治理机制的核心手段。由此产生了一种全新范式:智算中心作为一个信息-物理-能源(Cyber-Physical-Energy)系统,在更广泛的场景乃至太空空间级别上协同工作,为发展提供所需要的算力服务和智能底座。

 

 

1. 从“基础设施”走向“操作系统”

        最根本的变化在于智算中心操作系统(AI Data Center Operating System,AIDC-OS) 的出现。传统的数据中心基础设施管理(DCIM)工具以及静态、基于规则和模型的控制算法,已无法胜任高度动态、高功率密度的 AI 计算环境。取而代之的,是由大语言模型(LLM)驱动的控制平台[1],统一进行工作负载协调、功率管理、热控制、碳优化以及系统韧性保障。

        在这一范式下,运营者不再直接操控具体参数,而是设定目标,例如性能指标、能耗预算、碳排放上限以及韧性阈值。智算中心操作系统则持续地进行感知、预测、仿真与执行,在信息层与物理层之间形成闭环,实现“自主优化”。数据中心由此在设计和运维层面实现“自我优化”,标志着从人工运维向智能治理的转变。

 

2. 闭环算力-电力-热力协同优化

        到2026年,智算中心优化不再是开环或各自为政的孤立过程。控制回路将跨越三个高度耦合域,形成闭环:
        • 算力测:AI 工作负载、模型规模扩展、调度与迁移
        • 电力测:电网交互、可再生能源、储能与碳排放
        • 热力测:系统散热、冷却和热回收

        实时感知与预测能力使系统能够持续反馈,从而使系统能够动态响应工作负载激增、热点、电网约束以及可再生能源波动。这种闭环协同优化[2]从根本上改变了 AIDC 行业实现高效、稳定与可持续的方式。

 

3. 算力网络(Computility Network):赋能计算成为流动资源

        随着 AI 工作负载可移植性的增强和时延容忍度方面的不断提高,智算中心正在演进为“算力网络”(Computility Network)。在这一模式中,计算、能源与制冷能力被虚拟化,并在不同地域的基础设施之间进行动态分配和迁移。

        在这一模式下,AI 工作负载将流向资源最优的区域,例如拥有充足可再生能源、更低碳排放强度、更大电力余量或更高系统韧性的地区。算力由此与固定地理位置解耦,转变为一种流动的、可交易的系统资源,其运作方式将类似于现代电力系统中的能源。

 

4. 绿色能源与智算中心的深度融合

        绿色能源的整合不再停留在采购层面,而是深入到智算中心的原生运行与控制之中。AI 训练与推理任务将越来越多地根据太阳能、风能、水能以及储能的可用性进行实时调整和自适应。智算中心不再是被动的能源消费者,而是可与电网交互的资产[3]:它主动塑造需求、吸收富余的可再生发电,并为电网稳定性做出贡献。

        这种智算与能源系统之间的深度协同,可以在不牺牲性能的前提下,实现全社会层面的实质碳减排;这让智算中心成为未来可持续能源生态系统的重要支撑。

 

5. 数字孪生作为实时控制基座

        数字孪生正从离线规划工具演进为实时的高保真运行沙盒[4]。这些孪生体持续映射物理智算中心,用于支持“假设性分析”、控制动作与系统变更验证、故障注入测试,以及预测性维护。

        无论是工作负载迁移、制冷调节还是电力重构,任何控制动作被执行之前,都会先在数字孪生空间中进行评估。这种机制大幅降低了运行风险,使智算中心大规模安全自治成为可能。

 

6. 多目标智能调度和优化

        2026 年智算中心调度器将天然具备多物理场、多目标特性。计算性能优化将与热安全、电力容量和碳排放进行联合考量。具备热感知和功率感知能力的调度将成为标准实践,减少热点、提升绿电比率,并延长基础设施使用寿命。

        这标志着智算中心从以性能为中心的调度,进入到系统级优化的新阶段。效率与可持续性成为系统内生属性,而非事后补救。

 

7. 数字韧性成为优先设计原则

        随着社会对 AI服务的依赖不断加深,数字韧性跃升为首要设计目标。智算中心将被设计为具备“优雅降级”能力、故障隔离能力,以及在级联故障中优先保障关键 IT 负载能力的数据中心。

        智算中心的运维目标不再是“零故障”(这在行星级规模下并不现实),而是转向为智能生存能力:系统能够在故障时自动防护、快速恢复,并在极端条件下维持关键功能。

 

8. 边缘-核心-太空的广泛存在

        人工智能基础设施正逐步突破传统陆地数据中心的边界。边缘站点、超大规模核心云、新兴的天基算力中心(Space Data Center)共同构成了一个连续的层级体系。太空计算[5] 由充足太阳能驱动,它在全球范围的推理服务、广播式智能服务,以及抵御陆地灾害方面具备独特优势。

        尽管其发展仍处于早期阶段,边缘-核心-太空的广泛存在代表了全球算力网络的重要战略延伸。

 

9. 具备治理能力的自治

        2026 年智算中心运营自动化水平将显著提升,但它同时必须配套具备可解释性(Explainability)、可审计性(Auditability)与人工监督机制。AI 系统负责提出行动方案并论证其合理性;人类专家负责制定政策、风险边界与伦理约束。这种“专家在环(human-on-the-loop)”的模式,将确保在拥有跨区域、跨经济体扩展自治能力的同时,始终具备信任基础与问责机制。

 

10. 新型散热系统的规模应用与精细化智能化治理

        随着AI算力密度的持续攀升,新型散热系统如浸没式液冷技术、辐射散热技术将逐步成为智算中心和天基算力中心的必要组成部分,其科学管理将成为数据中心运维体系的关键支柱。

        新型散热系统的科学管理不仅是技术挑战,更是实现智算中心高密度、高能效、高可靠运行的核心能力。液冷系统的科学管理也不再限于传统设备的监控与维护,而是发展为与算力调度、能源管理、热力学控制深度集成的智能子系统。

 

结论

        2026 年智算中心已不再是一栋建筑,甚至不再是一个园区,而是一个行星级的信息-物理-能源系统。在智能操作系统的治理下,智算中心依托绿色能源,分布于边缘场景、核心云算力与太空算力,并以数字韧性为核心设计目标。智算中心正在成为 AI 时代的基础设施。

        这种转型意味着研究范式、评价指标以及思维方式都要更新。我们必须从局部单点优化,转向为面向全局的系统级智能化优化。掌握这一范式转化的人才或者组织,将主导未来数字基础设施的格局。

 

参考文献:

  1. Minghao Li, Ruihang Wang, Xin Zhou, Zhaomeng Zhu, Yonggang Wen, Rui Tan, Huiwen Zheng and Stuart Kennedy, “ChatDC: Geometric-aware Data Center Digital Twin Generation via Large Language Models,” ACM Transactions on Internet of Things, In Press, October 2025.
  2. Ruihang Wang, Zhiwei Cao, Qingang Zhang, Rui Tan, Yonggang Wen, Stuart Kennedy and Justin Teoh, “Toward Multiphysics-Informed Machine Learning for Sustainable Data Center Operations,” IEEE Energy Sustainability Magazine, In Press, October 2025.
  3. Philip Colangelo, Ayse K. Coskun, Jack Megrue, et al, “AI data centers as grid-interactive assets,” Nature Energy, December 2025.
  4. Qingang Zhang, Wenjun Long, Ruihang Wang, Zhiwei Cao, Zhaoyang Wang, Yuejun Yan and Yonggang Wen, “CAPER: Dual-Level Physics-Data Fusion with Modular Metamodels for Reliable Generalization in Predictive Digital Twins,” Applied Energy, Vol. 398, November 2025.
  5. Ablimit Aili, Jihwan Choi, Yew Soon Ong and Yonggang Wen, “Development of carbon-neutral data centres in space”, Nature Electronics, Vol. 8, October 2025, pp.1016-1026.

 

 

作者简介:

        文勇刚博士现任新加坡南洋理工大学计算机与数据科学学院校长(讲席)教授,并担任副教务长(研究生教育)兼研究生院院长。他同时担任新加坡红点智能科技有限公司首席科学家。此前,他曾在新加坡南洋理工大学担任多项管理职务,包括:协理副校长(能力建设)(2023 年)、工程学院副院长(科研)(2018-2023 年)、南洋科技创业中心(NTC)代理主任(2017-2019 年),以及计算机科学与工程学院助理院长(创新)(2016-2018 年)。他的研究兴趣涵盖云计算、绿色数据中心、大数据分析、多媒体网络以及移动计算等方向。他是 IEEE 会士、新加坡工程院院士和 ACM 杰出会员。

        文博士于 2008 年获美国麻省理工学院(MIT)电子工程与计算机科学博士学位(辅修西方文学)。他已在顶级期刊与重要国际会议发表论文 350 余篇,其系统研究成果获得多项国际认可。他领头研究的“数据中心认知数字孪生(Cognitive Digital Twin for Data Centre)”成果斐然,荣获 2015 年数据中心动力学-亚太地区奖(数据中心行业的“奥斯卡奖”)、2016 年东盟 信息通信技术(ICT) 金奖、2020 年 IEEE TCCPS工业技术卓越奖、2021 年W. Media亚太云与数据中心技术领袖奖以及 2022 年新加坡计算机协会数字杰出科技领袖奖。他还曾获 2019 年南洋研究奖,以及 2016 年南洋创新创业奖(唯一获奖者),两项均为南洋理工大学的最高荣誉。此外,他是多项国际顶级期刊(2019 IEEE TCSVT、2015 IEEE Multimedia)与重要国际会议(2023 ASPLOS、2016/2013 IEEE Globecom)最佳论文奖的联合获得者。他现任 《IEEE多媒体会刊》(TMM)主编,曾当选 IEEE 通信学会多媒体通信技术委员会主席(2014-2016年)。