为什么说算力的尽头是电力?

当今,算力成为推动科技进步和社会发展的关键力量。然而,算力的实现并非毫无代价,其背后依赖着大量的计算设备和服务器。这些设备在运行过程中会消耗巨额的能量。无论是数据中心里的超级计算机,还是我们日常使用的智能手机、电脑等,当进行复杂的计算和数据处理时,都离不开电力的持续稳定供应。



算力的尽头是电力?



例如,在全球超级计算机Top 500榜单中排名前十的超级计算机,每小时消耗电量超过2万度,与一座小型城镇的耗电量相当。


以训练 AI 大模型为例,使用的主流算力芯片功耗较高,成千上万台服务器和芯片昼夜不停地运转会消耗大量电力:


据估计,训练 GPT-3使用了大约128.7万度的电力。GPT-3有1750亿个参数,训练过程大约需要3.14×10^23次浮点运算(flops)。


ChatGPT 响应一个请求平均耗电2.9瓦时,每天响应约2亿个需求消耗超过50万度电,相当于1.7万个美国家庭平均一天的用电量。


假设要训练一个千亿规模(1000亿参数)的大模型,用1PB数据进行训练,训练一次并在10天内完成。以英伟达 A100 GPU为例(其具有每秒19.5万亿次,即19.5×10^12flops的浮点运算能力),大约需要10830个英伟达 A100 GPU。如果每个 A100 GPU 的成本约为10000美元,那么仅 GPU 成本就约为1.083亿美元。此外还需考虑其他硬件成本(约占 GPU 成本的20%)、数据中心成本(约占 GPU 成本的10%)以及人力成本等。


据报道,OpenAI 训练 GPT-5 需要数万张英伟达 H100 芯片,每张芯片的最大功耗为700瓦,运行一小时就要耗电0.7度,那么整体的电力消耗将会巨大。如果这1万张H100 GPU在最大功耗状态下运行一小时,总共将消耗7000千瓦时的电能,而7000千瓦时的电量足以维持一家中型商业场所大约14至70天的用电需求。


可见,如果没有充足且稳定的电力供应,算力的发展将受到极大限制。一旦电力供应出现问题,整个计算过程都将受到影响甚至中断。在一些电力供应不稳定的地区,数据中心的运营就会面临很大的挑战,可能导致服务质量下降或者无法满足用户的算力需求。



如何解决电力供应问题?



为了保障算力的持续发展,解决电力供应和消耗相关的问题至关重要。以下是一些可能的解决途径:


一是提高能源利用效率。在计算设备和服务器的设计与制造中,采用更先进的节能技术,降低设备的能耗。例如,优化芯片架构,减少不必要的电路损耗;研发高效的散热系统,确保设备在低温环境下运行,从而降低能耗。


二是发展可再生能源。加大对太阳能、风能、水能等可再生能源的投入和利用,为数据中心和计算设施提供清洁、可持续的电力。比如,在适宜地区建设大规模的太阳能或风能发电场,专门为附近的数据中心供电。


三是优化数据中心的布局。将数据中心建在电力资源丰富且成本较低的地区,充分利用当地的电力优势。同时,通过合理的规划和设计,提高数据中心的能源管理水平。


四是采用分布式计算模式。减少对大型集中式数据中心的依赖,鼓励个人和企业通过分布式计算网络共享计算资源,从而降低整体的电力消耗。


五是研发新型的电池和储能技术。当电力供应不稳定时,依靠高效的储能设备保障计算设备的持续运行,减少电力中断带来的影响。



为解决电力能耗问题

我国出台了哪些政策?



为解决算力发展带来的电力能耗问题,我国出台了一系列政策,例如:


在2023年12月29日国家发展改革委等部门发布的关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见中,提出要统筹推动算力与绿色电力的一体化融合,促进数据中心节能降耗。


2023年10月8日,工业和信息化部等六部门印发了《算力基础设施高质量发展行动计划》,以推动算力基础设施的高质量发展,提高能源利用率和算力能效水平等。


2024年7月23日,国家发展改革委、工业和信息化部、国家能源局、国家数据局联合印发《数据中心绿色低碳发展专项行动计划》。该计划明确到2025年底,全国数据中心布局更加合理,整体上架率不低于60%,平均电能利用效率降至1.5以下,可再生能源利用率年均增长10%,平均单位算力能效和碳效显著提高。


其主要内容包括:强化“东数西算”规划布局,新建大型和超大型数据中心应优先布局在全国一体化算力网络国家枢纽节点数据中心集群范围内;全面清理各地区自行出台的高耗能行业电价优惠政策,推动建立统一的工业重点领域阶梯电价政策;将新建及改扩建数据中心可再生能源利用目标和方案作为节能审查重要内容,逐年提升新建数据中心项目可再生能源利用率,鼓励数据中心通过参与绿电绿证交易等方式提高可再生能源利用率,鼓励有关地区探索开展数据中心绿电直供。


同时,国家也在鼓励创新算力电力协同机制,支持国家枢纽节点地区利用“源网荷储”等新型电力系统模式,开展算力电力协同试点,探索分布式新能源参与绿电交易等,以提升数据中心集群电力供给便利度,降低用电损耗及算力成本等。


这些政策旨在推动算力基础设施的绿色低碳发展,优化布局,提高能源利用效率,采用先进散热技术,加强节能管理,并鼓励使用可再生能源等,以实现算力发展与节能减排的平衡。


总之,解决电力问题需要技术创新、政策支持以及行业协作等多方面的共同努力。只有这样,才能为算力的发展提供坚实可靠的电力保障,推动科技的不断进步和应用的广泛拓展。