一、引述
随着数据中心技术的发展与演进,新型数据中心不断涌现,如智能计算数据中心等。与传统数据中心相比,新型数据中心具有高技术、高算力、高能效、高安全等特征,更能有效支撑经济社会的数字转型。所谓智能计算数据中心,是指基于GPU、FPGA等芯片构建智能计算服务器集群,提供智能算力的基础设施。主要应用于多模态数据挖掘、智能化业务高性能计算、海量数据分布式存储调度、人工智能模型开发、模型训练和推理服务等场景。智能计算数据中心的新型数据中心的出现,得益于GPU、FPGA、NPU等芯片技术被引入到服务器中。
欲详细了解数据中心介绍的请进入。
图形处理单元(GPU,Graphics Processing Unit)是一种专门用于图形处理的芯片,它通常包含数百个小型处理核心,可以并行地执行大量数据密集型计算任务。GPU最初是为了处理3D图形而设计的,但现在已经广泛应用于科学计算、机器学习、人工智能等领域。GPU通常具有高吞吐量和并行性能,但功耗较高且需要大量数据并行化才能发挥最大性能。
欲更多了解英伟达的数据中心用GPU性能参数介绍的请进入。
现场可编程门阵列(FPGA,Field Programmable Gate Array)是一种可编程逻辑芯片,它可以被重新编程以执行特定的任务。FPGA由大量的可编程逻辑单元和可编程连接器组成,这些单元和连接器可以被重新配置以实现不同的电路功能。FPGA通常用于需要高度定制化、低功耗和低延迟的应用,例如数字信号处理、图像处理、网络加速、嵌入式系统等。
神经网络处理单元(NPU,Neural Processing Unit)是一种专门用于进行深度学习计算的芯片。它是近年来人工智能领域的热门技术之一,被广泛应用于各种人工智能应用中,如自动驾驶、人脸识别、智能语音等领域。目前,大多数NPU都需要与其他芯片(如CPU、GPU等)进行配合使用,才能完成整个计算任务。NPU是人工智能发展的重要组成部分,具有高效、低能耗、低延迟、稳定、可编程等优势。
二、关于算力的概念
1、算力的定义
算力(CP,Computational Power)是指计算设备或系统在单位时间内处理数据或执行计算任务的能力,是衡量计算效率的核心指标。其核心价值在于解决复杂问题、加速任务处理及支撑大规模计算需求。
数据中心的计算能力,是指数据中心的服务器通过对数据进行处理后实现结果输出的一种能力,是衡量数据中心计算能力的一个综合指标,数值越大代表综合计算能力越强。算力应是数据中心内所有服务器的算力加和,即:
CP = ∑CP服务器
2、算力的要素
算力(CP)的核心要素包括通用算力、智能算力和超级算力。通用算力(CPN,CP-Normal)即为通用计算能力的简称;智能算力(CPT,CP-Turbo)即为智能计算能力(也称高性能计算能力)的简称;超级算力(CPS,CP- Super)即为超级计算能力的简称。事实上,算力通常主要考核的是CPN和CPT。依据工信部《算力基础设施高质量发展行动计划》的要求,通用算力、智能算力和超级算力的含义详见下表2-2;而数据中心的算力(CP)应为:
CP = CP通用 + CP智能 + CP超级 = CPN + CPT + CPS
表 2-2:通用算力(CPN)、智能算力(CPT)和超级算力(CPS)的含义
3、算力的单位
算力(CP)最常用的单位是FLOPS(Floating-point Operations Per Second,每秒浮点运算次数)。事实上,FLOPS已成为各种设施(如计算机、超算机、服务器等)衡量计算性能的代名词。FLOPS是一个基本单位,它的更大的数值单位有k(千)、M(兆)、G(吉)、T(太)、P(拍)、E(艾)等,同样以103递增,它们之间的换算可详见下表1-3。据测算,1艾(E)每秒浮点运算次数(即1 E FLOPS)约为5台天河2A或者50万颗主流服务器CPU或者200万台主流笔记本的算力输出。
表 1-3:FLOPS数值单位间的换算
4、算力的等级评价
算力(CP)的等级评价采用单物理机架精度(FP32)能力,单位通常采用为FLOPS/架或TFLOPS/架。1 T FLOPS/架即平均单机架每秒执行1万亿次(T)浮点运算。我们知道,浮点运算的计算能力是需要考虑不同精度的浮点数的,在IEEE 754标准中定义了半精度(FP16)、单精度(FP32)和双精度(FP64)的概念,其含义请参见下表1-4。
表 1-4:浮点运算的精度:半精度、单精度和双精度
三、算效的概念
1、算效的定义
算效(CE,Computational Efficiency)是指数据中心算力与功率的比值,即“数据中心每瓦功率所产生的算力”,是同时考虑数据中心计算性能与功率的一种效率。数值越大,代表单位功率的算力越强,效能越高。若CP为以单精度浮点数(FP32)的数据中心的算力;PC IT为数据中心IT设备的整体功率,其单位为瓦(W),则算效CE的计算公式为:
CE = CP / PCIT
2、算效的单位
根据上述算效(CE)的定义,其单位应为FLOPS /W,即单位功率(W)的算力(FLOPS)。
3、算效的类型
根据上述算力(CP)的核心要素,算效(CE)也分为通用算效(CEN)和智能算效(CET),与CPN和CPT相对应。
4、算效的等级评价
算效(CE)的等级评价采用单精度(FP32)能力,单位通常采用为FLOPS/W或GFLOPS/W。1 GFLOPS/W即平均每瓦功率每秒执行十亿次(G)浮点运算。
四、数据中心算力与算效的指标要求
为了促使我国互联网数据中心(IDC)的规划、设计、建设、运维和评估的实施,我国在2023年发布了国家标准GB/T 43331《互联网数据中心(IDC)技术和分级要求》。该标准中对IDC的算力与算效规定了其指标要求。GB/T 43331是将IDC分级定级为5个等级,从第一级到第五级,第五级技术要求最高。那么IDC的每个等级应满足的算力与算效指标要求是不同的,具体汇列于下表4中。注意表中算力与算效的等级评价采用前述要求,即算力(CP)的评价单位为TFLOPS/架;算效(CE)的评价单位为GFLOPS/W。
表 4:GB/T 43331标准规定的不同等级IDC应满足的算力与算效指标
欲详细了解GB/T 43331国家标准具体内容的请进入。
欲进一步了解我国算力发展国家政策指引要求的请进入。