推理计算主导AI未来,智能体驱动市场爆发增长

2024-12-19 08:34:44 51VPN服务中心 11

随着AI PC、AI手机的推出以及Apple Intelligence等产品的不断迭代,基于小型语言模型运行的应用程序正在迅速普及,AI计算从云端向终端和边缘设备迁移的趋势愈发明显。Barclays最新的AI推理计算趋势报告指出,边缘查询占比预计将从2024年的1%提升至2025年的10%,并在2026年达到15%,到2028年这一比例将进一步增至25%。有专家预测,未来端侧AI的占比可能会达到50%。

企业推理需求的计算量在2026年约为 50亿EFLOPs

智能体(Agent)作为大语言模型能力的扩展,正逐步成为行业关注的焦点。智能体不仅弥补了大模型在操作和执行层面的不足,还具备记忆、规划、决策和执行等能力,为AI应用提供更丰富的交互和操作场景。Barclays报告指出,AI行业目前处于Chatbot与Copilot时代,2025至2026年将迈入Agent时代。谷歌于12月11日发布的Gemini 2.0便是这一趋势的有力佐证,该模型同时引入了一系列智能体,预示着智能体将成为大模型发展的下一阶段关键。

随着大模型的能力持续提升,端侧大模型和智能体的应用架构逐渐清晰,AI算力需求也将迎来显著变化。Barclays认为,推理计算将在未来的AI算力需求中占据主导地位。GPT-5等更先进的大模型和NVIDIA Blackwell GPU等新型基础设施的出现,将进一步推动AI应用的落地,特别是智能体系统的普及,可能带来爆发式增长。这一趋势将推动消费者和企业级AI市场加速腾飞。

报告预测,随着智能体的广泛部署,AI推理计算的需求比例将显著提高。推理计算可能占据AI算力市场30%的份额,并有望逐步超越训练计算。到2026年,如果消费者AI的日活跃用户(DAU)超过10亿,同时企业任务中智能体的渗透率超过5%,全球AI计算需求预计将达到1500亿EFLOPs,其中推理计算占比约75%,训练计算占25%。

在企业级应用方面,智能体的采用将进一步提升推理计算的需求。到2026年,企业级推理计算的需求预计约为50亿EFLOPs。随着新硬件的普及,例如从2024年开始部署的B200和企业广泛使用的H100,这部分需求将逐步得到满足,但仍有约30亿EFLOPs的需求需要通过新一代芯片来支撑。

综合来看,随着大模型能力的迭代升级和智能体应用的逐步深入,AI计算正在迈向以推理计算为主的新时代。边缘计算和端侧AI将进一步拓展应用边界,成为AI行业发展的重要驱动力。


服务热线

400-828-7558