AI或许虚无缥缈,承载AI算力的“物质基础”却有迹可循。随着AI模型、算力的指数级高速增长,数据中心这一物质基础同样亟需成长才能与之适配。
01
“算力”何时真正成为一种“力”?
在1956年的达特茅斯会议上,AI这一概念被首次提出,但经历了基础设施改良、深度与强化学习技术发展、Transformer模型引入、BERT模型引入等半个多世纪的发展,我们才真正意识到身处的这个时代将是“AI的时代”。
随着AI模型规模从几亿快速膨胀到数万亿并覆盖到当代科技与生活的方方面面,曾经实验室计算机中的学术性探索,如今已大举进入现实生活成为了真实可感的生产力。数据中心也不再意味着只是一个成本中心,而是一家真正的AI工厂,为企业产生真正的见解、创造真正的价值。
02
上层建筑影响物质基础?
当我们谈起AI的时候,往往会提到最近有多少算力的增长、模型扩张了多大,却会忽视了这份“枝繁叶茂”脚下的土壤。
据预测,在接下来的几年内,总AI工作负载将大幅提升;这意味着如果作为计算机操作的核心,AI的电力消耗将从约8%倍增到15-20%!与此同时,也将有50%的工作负载分散到边缘计算场景之中,无论是对中央数据中心还是小微数据中心,这都将会是一场“实力悬殊”的挑战。
算力提升带来的能源消耗一方面是电力成本与稳定性的挑战,同时越来越高密度的机柜也意味着热量在数据中心中的积蓄更加严重。也就是说,作为AI算力映射在现实世界的物理设施基础,如果数据中心不能在能源效率、制冷效率上跟上脚步,这一“容器”将会限制住“数字大脑”的发展,AI对于未来生产力的推动力自然也就无从谈起。
03
两种步伐,两手准备
正如之前所说,在数字世界中AI算力增长这一“谜面”之下埋藏的,是“高能耗需求”+“高密度制冷需求”这两个现实世界的谜底。想要让AI推动生产力这一步在未来走得顺畅,必须要在现在的物理设施基础上迈出稳固的一步。
为此,施耐德电气正与英伟达携手合作,将AI的前瞻性能力映射在物理基础设施和部署方式上,从电力系统与冷却能力角度植稳根基。
一方面,在电力系统上,作为能源管理与自动化领域的专家,施家有着整套创新、高效的电力系统解决方案适配AI数据中心不断增长的需求;
另一方面,在数据中心制冷角度,施家亦可借助互联互通的创新产品、技术与解决方案组合可以糅合更高的能源效率与制冷效率,并尽可能地降低能耗,赋能打造更加高效、更具韧性、更高适应性与更具可持续性的智能算力基础设施。
例如从CDU(Cooling Distribution Unit,冷却分配单元)这一液冷架构的关键出发:
施家推出了全新的冷板式液冷CDU系统,通过覆盖温度控制、流量控制、压力控制、流体处理、热交换与隔离的五大关键功能,并提供多种热交换方式与机柜内安装、落地式安装等多种型号,为高密度AI集群带来芯片性能和可靠性提升、能效更高、占用空间更小、总体拥有成本更低、噪音更低等多项优势。
与此同时,借助英伟达在网络、数据中心架构方面的经验与对行业更加清晰的前瞻性见解,施家与英伟达正携手搭建示范性的参考架构,融入更多智算中心从0到1或与时俱进改造的指导性“解题思路”,进行一次1+1>2的尝试。
智算中心参考设计
“世上本没有路”,帮助更广泛的行业生态系统与伙伴提前了解新技术的发展,并可以提前准备好基础设施,在算力增长与基础设施配套上做好同步的两手准备,“也就成了路”。
算力的增长与基础设施的完善正是AI数据中心发展的“一体两面”,凭借其在数据中心电力系统与制冷领域创新的解决方案,未来,施耐德电气将继续携手伙伴引领行业发展,不断优化解决方案,助力AI更好地推动生产力发展,为构建更加智能和可持续的世界贡献力量。
精彩评论