2025年4月28日,由云计算标准与应用工业和信息化部重点实验室发起、全国信标委云计算和分布式平台分委会云建设与应用标准工作组主导的《企业级大模型私有部署及智算云应用调研结果》(以下简称《调研结果》)正式对外发布。该调研结果由AI Infra代表厂商云轴科技ZStack支持推动,覆盖金融、医疗、交通、科研等十余个行业,系统梳理了企业在AI大模型私有化部署中的需求、痛点及解决方案,为行业技术战略制定提供了数据支撑与实践参考。
《调研结果》显示,自DeepSeek开源大模型在今年引发市场热切关注以来,企业私有化部署意愿从33.25%跃升至88.75%,数据隐私与成本降低将驱动千行百业加速AI布局。《调研结果》同时揭示,算力资源调度与多种模型管理是现阶段大模型企业私有化部署的主要挑战;标准制定、国内硬件与智算云平台成为破局要点。
在调研过程中,工作组组织行业用户研讨会,邀请国家图书馆、中国科学院、中石油集团、中国建设银行等机构的专家共同参与,会上专家们结合所在领域实际需求提出多项针对性建议:金融行业需着重强化模型安全审计与合规性管理,以保障业务风险可控;医疗领域亟待解决多模态数据融合难题,并降低实时推理延迟,从而提升诊断效率;科研机构则呼吁建立开放共享的算力调度平台,以优化资源配置。专家们普遍认为,AI Infra平台的标准化与易用性是推动AI技术在各行业加速落地的核心要素,这恰好为两个月后 Gartner 给出的 AI Infra 官方定义提供了最佳注脚。
2025年 7 月,Gartner 发布报告《创新洞察:中国的人工智能基础设施》《Innovation Insight: AI Infrastructure In China》,指出AI Infra是 AI 模型从训练到推理,从概念验证到实际应用的关键基础支撑,并列出百度、火山引擎,云轴 ZStack 等14 家代表厂商,帮助首席信息官(CIO)以及基础设施和运营(I&O)领导者制定协调统一的AI基础设施战略,从而把握行业创新机会,应对挑战和风险。
Gartner 将AI Infra定义为“支持人工智能和机器学习工作负载开发、部署及管理所需的技术栈和基础系统。这一基础设施包含多种组件,它们协同工作,提供执行人工智能任务所需的计算能力、网络连接、存储空间、AI工程工具、中间件和库。通过提供人工智能基础设施,可以根据需求在最合适的地点部署人工智能工作负载,无论是在本地、公有云还是边缘计算环境中。”
从产业一线问卷到全球权威机构白皮书,AI Infra 在 90 天内完成“需求喷发—实践验证—框架升维”的三级跳。当金融、医疗、科研等关键行业的共性痛点被浓缩为“算力可调度、模型可治理、场景可落地”三条硬指标,当国产智算平台与开源大模型在同一技术栈里握手,AI 私有化部署已不再是“成本 vs 隐私”的单选题,而是一条有标准、有工具、有生态的确定性路径。