报告由招商证券国际出品,聚焦 2025 年 AI 视频生成行业,核心呈现市场规模、技术演进、竞争格局与商业化路径,揭示中美双雄主导、技术与合规双轮驱动的行业发展格局。
⠀
- 市场潜力:2025 年全球市场规模约 8 亿美元,预计 2030 年可触达 400 亿美元,2025-2030 年 CAGR 达 118%;其中 B 端占 90%(360 亿美元),C 端占 10%(40 亿美元)。
- 核心优势:AI 视频生成成本仅 300 美元 / 分钟,远低于传统影视制作的 200 万美元 / 分钟,47% 的影视工作室受成本问题困扰,AI 替代空间广阔。
- 应用场景:覆盖影视娱乐、广告营销、电商、游戏、教育等领域,短视频创作、企业广告制作是当前核心需求,长视频、3D 交互等场景逐步拓展。
- 关键进展:从早期 4 秒模糊视频,迭代至 2025 年主流模型支持无限时长续写,物理一致性(肢体运动准确率 91%)、内容连贯性(跨场景剧情断裂率降至 8%)显著提升。
- 核心能力:实现音画同步生成、多镜头序列创作(远景 – 中景 – 特写)、多模态输入(文本 / 图像 / 语音),部分模型支持虚拟人、角色口型同步等高级功能。
- 成本优化:中国模型通过算法与架构优化(如阿里 MoE 架构),1080P 视频生成成本低至 0.04 美元 / 秒,显著低于美国模型(Sora 2 约 0.38 美元 / 秒)。
- 全球格局:中美形成双寡头竞争,全球 15 + 主流模型中,中国模型在文生视频(占比 56%)、图生视频(占比 72%)榜单中占据主导,快手 Kling 2.5 Turbo、字节 Seedance 等位列全球前三。
- 区域特点:
- 美国:谷歌 Veo 3、OpenAI Sora 2 领先,优势在于 3D 环境、高级音频等专业功能,资本支出密度达 24%-27%,技术投入更大。
- 中国:阿里 Wan、快手 Kling、百度 MuseSteamer 等成本优势显著,聚焦商业化落地,资本支出密度约 10%-13%,更注重效率优化。
- 头部玩家:国际端以 OpenAI、谷歌、Meta 为核心,国内端涵盖阿里、腾讯、字节、快手等互联网巨头,及 Minimax、爱诗科技等初创公司。
- 核心模式:采用 “C 端订阅 + B 端 API” 双轨制,C 端订阅价 8-30 美元 / 月,按视频数量、分辨率分级收费;B 端按 Token 计费(720P 约 0.18 美元 / 5 秒),高毛利、复购率高。
- 收入表现:Midjourney 2025 年估值 105 亿美元,ARR 达 5 亿美元;Runway 2025 年 ARR 预计 3 亿美元;国内 Minimax 估值 40 亿美元,快手 Kling 年化营收突破 1 亿美元。
- 生态绑定:头部厂商通过生态整合提升壁垒,如字节绑定剪映、抖音,谷歌集成 Vertex AI,阿里对接电商场景。
- 主要风险:技术迭代需高密度资本投入;版权归属模糊引发法律纠纷(如迪士尼起诉 Minimax);未成年人保护、地缘政治等监管压力;开源模型导致同质化竞争。
- 投资方向:
- 模型 + 生态提供商:谷歌、Meta、阿里、腾讯;
- 内容 / IP 所有者:Netflix、迪士尼、爱奇艺、阅文集团;
- UGC 内容平台:Roblox、哔哩哔哩、快手;
- AI 应用产品公司:多邻国、网易、美图。
- 行业趋势:技术上向长视频、3D 交互、多模态融合演进;商业化从工具订阅转向平台化 API 服务;竞争焦点从单一功能转向场景定制与生态整合。
- 核心结论:AI 视频生成行业进入规模化爆发前夜,中美凭借技术与成本优势主导市场。企业需平衡技术投入与合规风险,B 端商业化是短期核心增长点,C 端生态化是长期竞争关键。