该报告由至顶智库联合多机构发布,聚焦通用人工智能(AGI)发展路径,从 AI 演进、关键领域、智能体技术、智能硬件、企业布局及未来路径六方面展开,呈现 2025 年全球 AI 发展全景。
⠀
AI 演进分为弱人工智能(任务专用,如深蓝、AlphaGo)、通用人工智能(AGI,跨域推理、自主学习,依赖世界模型与具身智能)、超级人工智能(超人类能力)三阶段。AGI 被定义为能在人类水平解决多领域复杂问题的系统,业内对其落地时间预测差异较大,Elon Musk 乐观认为 2026 年可期,Yann LeCun、Demis Hassabis 预计 2030-2035 年,Geoffrey Hinton 则保守至 2030-2045 年。
⠀
图谱涵盖应用硬件层(智能体、AI 手机 / 眼镜 / PC、具身智能等,涉及超 200 家企业 / 产品)、模型层(多模态基础模型 17 个、推理模型 25 个、开源模型 23 个)、基础设施层(AI 芯片 13 种、AI 服务器 5 类),形成全链条生态。2024-2025 年技术路线图显示,多模态模型(如 GPT-5、Gemini 2.5)、推理模型(DeepSeek-R1)、开源模型(Qwen3 系列)迭代加速,智能体与端侧大模型成为重点。
⠀
- 推理能力:通过思维链(CoT)、思维树(ToT)、思维图(GoT)等算法提升逻辑推理,混合专家架构(MoE)优化效率,模型蒸馏(如 DeepSeek-R1)实现轻量化部署。
- 强化学习:传统 RLHF(人类反馈)与简化 DPO(直接偏好优化)、RPO(奖励偏好优化)结合,主流模型(如 Llama 3、Qwen2)后训练均采用强化学习。
- 算力基建:美国 “星际之门” 计划投资 5000 亿美元,AWS、Microsoft 等 2025 财年资本开支超 750 亿美元;国内阿里、腾讯 2024 财年资本开支超 700 亿元,华为昇腾 384 超节点、浪潮元脑 SD200 等提升集群性能。
- 开源生态:Hugging Face 汇聚超 6000 个开源模型,国内阿里 Qwen3、DeepSeek-V3.1 等开源模型推动技术普惠,打破闭源垄断。
海外 NVIDIA Blackwell Ultra GPU 算力达 100 PFLOPs,Google TPU v5e 性能提升 30 倍;国内华为昇腾 910C、昆仑芯 P800、沐曦曦云 C600 实现国产化突破,在推理与轻量化训练场景规模化落地。
⠀
智能体具备记忆、自主规划、工具调用、任务执行四大能力,技术架构含感知(解析多模态输入)、认知(情感、记忆、世界模型等)、执行(工具调用与行动反馈)模块。多智能体系统通过主导智能体协同子智能体,实现任务并行处理,如 Anthropic 系统调用搜索、引证子智能体完成研究报告。
⠀
- 通用智能体:覆盖数据分析、旅游规划、内容创作等,如 ChatGPT Agent 可自主预约餐厅、生成 PPT。
- 行业智能体:金融领域(容联云容犀 Copilot)、医疗领域(Hippocratic AI Healthcare Agent)、工业领域(西门子 Industrial Copilot)等提升行业效率。
- 企业智能体:优化生产、研发、财务等流程,如联想法律智能体涵盖争议解决、合同管理等功能。
MCP 协议(Model Context Protocol)实现 AI 与工具无缝交互,降低开发门槛;A2A 协议(Agent2Agent Protocol)促进智能体横向协作,补充 MCP 纵向工具调用能力。
⠀
- AI 眼镜:Meta、夸克等推出产品,夸克 AI 眼镜支持导航、支付、翻译,融合阿里生态;Rokid Glasses 续航达 12 小时。
- AI 手机:苹果 Visual Intelligence 支持图像生成与视觉问答,小米自动导航提取地理位置并同步地图。
- AI PC:联想、华为等产品内嵌智能体(如联想天禧智能体),端侧部署大模型,保障数据隐私,联想 SD200 超节点支持万亿参数模型运行。
- 智能汽车:端到端自动驾驶依赖多模态大模型(如 Waymo EMMA),融合视觉、语言、动作能力,提升决策安全性。
- Deep Research:从任务拆解、信息搜索到交叉验证,生成专业报告,如 GPT-5 可自动搜集汽车行业数据并生成带引用的分析报告。
- AI 编程:OpenAI Codex、Anthropic Claude Code 支持多语言代码生成与跨文件编辑,国内通义灵码、文心快码强调工程化落地。
- NVIDIA:Blackwell 架构 GPU 算力领先,CUDA-X 生态支持全流程 AI 加速,NeMo+NIM 助力智能体开发,布局智能驾驶(DRIVE AGX)与具身智能(Isaac GR00T)。
- Google:Gemini 2.5 系列支持多模态处理,Gemini 2.5 Flash Image 提升图像编辑能力,A2A 协议促进智能体协作,形成 “硬件 – 平台 – 模型 – 应用” 生态。
- OpenAI:发布 ChatGPT Agent(整合深度研究与网页交互)、GPT-5(多模型协同,含 Pro/mini 版本),收购 io 公司布局 AI 硬件。
- 国内企业:阿里通义 Qwen3 系列 “开源 + 闭源” 并行;DeepSeek-V3.1 采用 MoE 架构,助力 60 余家央企数字化;明略科技 DeepMiner 智能体赋能商业数据分析。
- 世界模型:Google Genie 3、阿里混元 3D 世界模型可模拟物理环境,应用于自动驾驶、游戏生成。
- 多模态模型:整合文本、图像、视频,实现跨模态协同推理,覆盖视觉问答、可控生成。
- 持续强化学习:平衡稳定性与可塑性,实现动态环境知识迁移,分为策略、经验、动态、奖励导向四类方法。
- 非 Transformer 架构:Mamba-2、RWKV-7s 等在并行计算、推理效率上突破,液态神经网络(LFM)内存占用低,适合端侧部署。
- 具身智能:Figure AI Helix “双系统” 实现 “慢思考 – 快执行”,智源 RoboBrain 2.0 提升长时任务规划与空间理解能力。