2026 年智算中心(AI Data Centers,AIDCs)将经历一场结构性蜕变。它们不再只是支撑计算任务的被动基础设施,而是逐步演化为智能化、自主化、具备能源感知能力的复杂系统;能够主动在计算、供电、制冷、碳排放与系统韧性等方面进行多目标协同优化。
这一蜕变将由三股力量共同驱动:
这一轮变革的核心主题是系统智能(System Intelligence)。AI 不再只是运行在数据中心内部的工作负载,而正在成为数据中心自身的设计、控制与治理机制的核心手段。由此产生了一种全新范式:智算中心作为一个信息-物理-能源(Cyber-Physical-Energy)系统,在更广泛的场景乃至太空空间级别上协同工作,为发展提供所需要的算力服务和智能底座。
1. 从“基础设施”走向“操作系统”
最根本的变化在于智算中心操作系统(AI Data Center Operating System,AIDC-OS) 的出现。传统的数据中心基础设施管理(DCIM)工具以及静态、基于规则和模型的控制算法,已无法胜任高度动态、高功率密度的 AI 计算环境。取而代之的,是由大语言模型(LLM)驱动的控制平台[1],统一进行工作负载协调、功率管理、热控制、碳优化以及系统韧性保障。
在这一范式下,运营者不再直接操控具体参数,而是设定目标,例如性能指标、能耗预算、碳排放上限以及韧性阈值。智算中心操作系统则持续地进行感知、预测、仿真与执行,在信息层与物理层之间形成闭环,实现“自主优化”。数据中心由此在设计和运维层面实现“自我优化”,标志着从人工运维向智能治理的转变。
2. 闭环算力-电力-热力协同优化
到2026年,智算中心优化不再是开环或各自为政的孤立过程。控制回路将跨越三个高度耦合域,形成闭环:
• 算力测:AI 工作负载、模型规模扩展、调度与迁移
• 电力测:电网交互、可再生能源、储能与碳排放
• 热力测:系统散热、冷却和热回收
实时感知与预测能力使系统能够持续反馈,从而使系统能够动态响应工作负载激增、热点、电网约束以及可再生能源波动。这种闭环协同优化[2]从根本上改变了 AIDC 行业实现高效、稳定与可持续的方式。
3. 算力网络(Computility Network):赋能计算成为流动资源
随着 AI 工作负载可移植性的增强和时延容忍度方面的不断提高,智算中心正在演进为“算力网络”(Computility Network)。在这一模式中,计算、能源与制冷能力被虚拟化,并在不同地域的基础设施之间进行动态分配和迁移。
在这一模式下,AI 工作负载将流向资源最优的区域,例如拥有充足可再生能源、更低碳排放强度、更大电力余量或更高系统韧性的地区。算力由此与固定地理位置解耦,转变为一种流动的、可交易的系统资源,其运作方式将类似于现代电力系统中的能源。
4. 绿色能源与智算中心的深度融合
绿色能源的整合不再停留在采购层面,而是深入到智算中心的原生运行与控制之中。AI 训练与推理任务将越来越多地根据太阳能、风能、水能以及储能的可用性进行实时调整和自适应。智算中心不再是被动的能源消费者,而是可与电网交互的资产[3]:它主动塑造需求、吸收富余的可再生发电,并为电网稳定性做出贡献。
这种智算与能源系统之间的深度协同,可以在不牺牲性能的前提下,实现全社会层面的实质碳减排;这让智算中心成为未来可持续能源生态系统的重要支撑。
5. 数字孪生作为实时控制基座
数字孪生正从离线规划工具演进为实时的高保真运行沙盒[4]。这些孪生体持续映射物理智算中心,用于支持“假设性分析”、控制动作与系统变更验证、故障注入测试,以及预测性维护。
无论是工作负载迁移、制冷调节还是电力重构,任何控制动作被执行之前,都会先在数字孪生空间中进行评估。这种机制大幅降低了运行风险,使智算中心大规模安全自治成为可能。
6. 多目标智能调度和优化
2026 年智算中心调度器将天然具备多物理场、多目标特性。计算性能优化将与热安全、电力容量和碳排放进行联合考量。具备热感知和功率感知能力的调度将成为标准实践,减少热点、提升绿电比率,并延长基础设施使用寿命。
这标志着智算中心从以性能为中心的调度,进入到系统级优化的新阶段。效率与可持续性成为系统内生属性,而非事后补救。
7. 数字韧性成为优先设计原则
随着社会对 AI服务的依赖不断加深,数字韧性跃升为首要设计目标。智算中心将被设计为具备“优雅降级”能力、故障隔离能力,以及在级联故障中优先保障关键 IT 负载能力的数据中心。
智算中心的运维目标不再是“零故障”(这在行星级规模下并不现实),而是转向为智能生存能力:系统能够在故障时自动防护、快速恢复,并在极端条件下维持关键功能。
8. 边缘-核心-太空的广泛存在
人工智能基础设施正逐步突破传统陆地数据中心的边界。边缘站点、超大规模核心云、新兴的天基算力中心(Space Data Center)共同构成了一个连续的层级体系。太空计算[5] 由充足太阳能驱动,它在全球范围的推理服务、广播式智能服务,以及抵御陆地灾害方面具备独特优势。
尽管其发展仍处于早期阶段,边缘-核心-太空的广泛存在代表了全球算力网络的重要战略延伸。
9. 具备治理能力的自治
2026 年智算中心运营自动化水平将显著提升,但它同时必须配套具备可解释性(Explainability)、可审计性(Auditability)与人工监督机制。AI 系统负责提出行动方案并论证其合理性;人类专家负责制定政策、风险边界与伦理约束。这种“专家在环(human-on-the-loop)”的模式,将确保在拥有跨区域、跨经济体扩展自治能力的同时,始终具备信任基础与问责机制。
10. 新型散热系统的规模应用与精细化智能化治理
随着AI算力密度的持续攀升,新型散热系统如浸没式液冷技术、辐射散热技术将逐步成为智算中心和天基算力中心的必要组成部分,其科学管理将成为数据中心运维体系的关键支柱。
新型散热系统的科学管理不仅是技术挑战,更是实现智算中心高密度、高能效、高可靠运行的核心能力。液冷系统的科学管理也不再限于传统设备的监控与维护,而是发展为与算力调度、能源管理、热力学控制深度集成的智能子系统。
结论
2026 年智算中心已不再是一栋建筑,甚至不再是一个园区,而是一个行星级的信息-物理-能源系统。在智能操作系统的治理下,智算中心依托绿色能源,分布于边缘场景、核心云算力与太空算力,并以数字韧性为核心设计目标。智算中心正在成为 AI 时代的基础设施。
这种转型意味着研究范式、评价指标以及思维方式都要更新。我们必须从局部单点优化,转向为面向全局的系统级智能化优化。掌握这一范式转化的人才或者组织,将主导未来数字基础设施的格局。
参考文献:
作者简介:
![]() |
文勇刚博士现任新加坡南洋理工大学计算机与数据科学学院校长(讲席)教授,并担任副教务长(研究生教育)兼研究生院院长。他同时担任新加坡红点智能科技有限公司首席科学家。此前,他曾在新加坡南洋理工大学担任多项管理职务,包括:协理副校长(能力建设)(2023 年)、工程学院副院长(科研)(2018-2023 年)、南洋科技创业中心(NTC)代理主任(2017-2019 年),以及计算机科学与工程学院助理院长(创新)(2016-2018 年)。他的研究兴趣涵盖云计算、绿色数据中心、大数据分析、多媒体网络以及移动计算等方向。他是 IEEE 会士、新加坡工程院院士和 ACM 杰出会员。 |
|
文博士于 2008 年获美国麻省理工学院(MIT)电子工程与计算机科学博士学位(辅修西方文学)。他已在顶级期刊与重要国际会议发表论文 350 余篇,其系统研究成果获得多项国际认可。他领头研究的“数据中心认知数字孪生(Cognitive Digital Twin for Data Centre)”成果斐然,荣获 2015 年数据中心动力学-亚太地区奖(数据中心行业的“奥斯卡奖”)、2016 年东盟 信息通信技术(ICT) 金奖、2020 年 IEEE TCCPS工业技术卓越奖、2021 年W. Media亚太云与数据中心技术领袖奖以及 2022 年新加坡计算机协会数字杰出科技领袖奖。他还曾获 2019 年南洋研究奖,以及 2016 年南洋创新创业奖(唯一获奖者),两项均为南洋理工大学的最高荣誉。此外,他是多项国际顶级期刊(2019 IEEE TCSVT、2015 IEEE Multimedia)与重要国际会议(2023 ASPLOS、2016/2013 IEEE Globecom)最佳论文奖的联合获得者。他现任 《IEEE多媒体会刊》(TMM)主编,曾当选 IEEE 通信学会多媒体通信技术委员会主席(2014-2016年)。 |
|