服务热线
400-828-7558
在过去的两三年里,人工智能(AI)技术已经从实验室的研究走进了实际应用,迅速渗透到各行各业。从金融风控到智能制造,从医疗诊断到自动驾驶,AI大模型以惊人的速度进行着训练、部署和迭代。这一进展的背后,是对计算力的巨大需求——根据华为的预测,到2030年,AI计算能力将比2023年增长500倍,通用计算能力也将增长10倍。
这种巨大的需求促使算力基础设施面临前所未有的压力,而传统的数据中心架构显然无法满足这种急剧增长的计算需求。为了应对这一挑战,算力基础设施正在经历一场深刻的变革——传统的数据中心正向“智算”中心转型,网络、存储、供电和冷却等基础设施也必须与之同步升级。
随着AI技术的飞速发展,智算中心无疑成为了当前投资领域中的焦点。根据中国IDC圈的统计,仅2025年第一季度,就有165个智算中心的建设项目启动或已投产,许多项目的投资额超过了百亿元,算力规模更是突破了万P。
然而,随着这一热潮的涌现,业界仍然存在一个疑问:数据中心与智算中心到底有何不同?AI数据中心(AIDC)与传统数据中心(DC)有何区别?
根据工信部发布的《算力基础设施高质量发展行动计划》定义,算力中心指的是依托风、火、水、电等基础设施和IT软硬件设备,具备计算力、存储力和传输力的设施。其包括通用数据中心、智能计算中心(智算中心)、超级计算中心等。
智算中心专注于为人工智能应用提供算力支持。它通过大规模异构算力资源的使用(如CPU、GPU、FPGA、ASIC等),主要为深度学习模型的开发、训练和推理提供计算、数据和算法的支撑。智能计算中心的核心不仅是硬件设施,还涉及到软件平台的建设,能够提供从底层算力到顶层应用的全栈能力。
相比之下,传统数据中心主要服务于通用计算任务,核心目标是提供稳定和可扩展的计算及存储环境。然而,随着AI应用对计算力的需求持续上升,传统数据中心面临着如何提升效率、降低延迟、增强弹性等新的挑战,尤其是在大规模AI集群部署中,通信瓶颈、资源利用率低和运维复杂等问题日益严重,成为制约AI应用推广的重要障碍。
实际上,大规模智算集群的运行远比预想的要复杂得多。通信瓶颈、资源利用率低、故障响应慢等问题频频出现,使得“纸面算力”与“实际有效算力”之间存在着巨大的差距。业内人士透露,一些千卡级别的集群,训练效率甚至不如经过优化的几百卡系统。而所谓的“万卡集群”,在实际运营过程中也常因种种问题停运,成为业内的谈资。
关注了解更多+