白皮书由中国科学技术信息研究所、新一代人工智能产业技术创新战略联盟等联合发布,聚焦人工智能计算中心从独立系统向算力网络演进的新趋势,剖析全球发展现状、国内建设特点与核心需求,提出网络化发展的路径与建议。
⠀
- 战略与政策支持
- 全球主要国家均将人工智能计算中心列为新型基础设施重点,美国、欧洲、日本、中国等加速布局,以抢占科技与产业制高点。
- 各国技术路线分化:美国依托 NVIDIA、Intel 等企业优势,聚焦超大规模计算中心;欧洲推进本土芯片研制与成熟技术并行;日本采用富士通等本土 IT 企业路线;中国坚持自主技术路线,以华为昇腾、寒武纪思元等国产芯片为主。
- 建设规模与成效
- 美国:橡树岭国家实验室 Summit 算力达 3.4 EFLOPS,阿贡国家实验室规划近 10E AI 算力的 Aurora 系统,覆盖医学、工程学等领域。
- 欧洲:意大利 Leonardo 系统算力 10 EFLOPS,瑞士 Alps 系统预计达 20 EFLOPS,支撑气候、生命科学等多领域研究。
- 中国:深圳鹏城云脑 Ⅱ、武汉人工智能计算中心等已投运,成都、南京等城市在建,北京、上海等多地规划中,形成 “政府主导、企业运营、应用导向” 的建设格局。
- 政府主导,自主创新
- 各地政府统筹规划,出台专项政策支持建设,立足自主技术路线应对卡脖子风险,保障产业健康发展。
- 鹏城云脑 Ⅱ 基于昇腾 AI 平台,算力达 E 级,支撑鹏程・盘古等大模型研发,创下多项世界记录。
- 企业主体,市场化运营
- 计算中心建设与运营同步启动,成立专门运营公司,开展算力调研、需求对接与生态孵化,实现 “上线即饱和” 运营。
- 武汉、南京等城市通过政策引导与市场调研,快速识别算力需求,孵化出多个行业创新方案。
- 应用导向,赋能产业
- 打造公共服务平台,汇聚科研、产业资源,推动产学研用融合,赋能遥感、智能音视频、医疗等特色领域。
- 武汉人工智能计算中心支撑武汉大学开发全球首个遥感影像专用 AI 框架,中科院自动化所发布跨模态大模型 “紫东・太初”。
- 适配 “大模型 + 大数据 + 大算力” 趋势
- 超大规模预训练模型算力需求从 PFLOPS 级升至 EFLOPS 级,2030 年 AI 计算总量预计达 105 ZFLOPS,需通过网络化汇聚算力与数据。
- 国内数据集建设分散,缺乏统一标准与流动机制,需算力网络打破数据孤岛。
- 满足区域产业赋能需求
- 各区域形成特色产业集群,需通过算力网络部署异地大模型,促进行业应用流动与快速迭代,支撑实体经济智能化转型。
- 契合 “双碳” 目标要求
- 人工智能计算中心能耗总量持续增长,存在业务波动导致的能耗闲置问题,需通过跨中心算力调度削峰填谷,提升能耗利用率。
- 核心概念与架构
- 概念:以新型网络技术连接各地计算中心,动态感知、调度算力资源,实现算力、数据、算法、应用的共享协同,是多资源深度融合的新范式。
- 架构:涵盖算网一体基础设施(计算与网络融合)、统一运营多维调度管理(调度 + 运营平台)、大规模分布式多方协同计算(异步训练、联邦学习等)三层。
- 核心作用:“一网络三汇聚”
- 算力汇聚:统筹调度跨区域算力,满足大模型训练需求,提升算力与能耗利用率。
- 数据汇聚:建立统一标准,实现数据安全流动与 “可用不可得”,扩充数据集规模与质量。
- 生态汇聚:开放大模型能力与创新成果,强化跨区域协作,加速产业聚合与标准形成。
- 演进方向:多样性算力网络
- 未来将连接高性能计算中心、一体化大数据中心,形成多样性算力网络,满足数字化技术交叉应用的广泛需求。
- 统筹高质量建设:发布算力需求清单,推动共建共享,避免重复建设。
- 有序推进算力网络:建立全国统一规划与管理机制,实现资源优化配置。
- 创新运营机制:成立算力网络联盟,制定开放规则与激励办法,促进数据共享。
- 加强核心技术攻关:聚焦算网融合、调度算法等关键技术,提升网络与计算协同效率。
- 推进标准化建设:统一算力感知、数据接口、资源协同等标准,提高基础设施通用性。
人工智能计算中心已进入网络化发展新阶段,算力网络将成为数字经济发展的智能基座。通过统筹规划、技术创新与生态协同,可实现算力、数据、生态的高效汇聚,支撑人工智能与实体经济深度融合,助力中国抢占全球人工智能产业制高点。