“算力猛兽”浪潮NF5468A5 GPU服务器开放试用免费申请
2022年7月21日 | by tgcode
近期,科技媒体对浪潮 NF5468A5 服务器进行了一系列专业测评,报告显示这款 GPU 服务器在典型的 AI 计算场景拥有超乎预期的卓越性能,在 MLPerf Training、MLPerf Inference、Alphafold2、NAMD、HPL、Stream 等各种典型应用评测中展示出了让人惊叹的领先性能,因而被媒体称赞为“算力猛兽”。浪潮信息官网显示,NF5468A5 正在进行“超值机型限免试用”活动,对算力有强大需求的用户都可以免费申请。
NF5468A5 是浪潮信息推出的一款面向 AI 训练、AI 推理、HPC、视频处理等多种应用场景的 GPU 服务器,在 4U 空间内搭载 2 颗 AMD EPYC 处理器,支持多达 8 张双宽加速卡,巧妙的分区散热设计有效实现 CPU 与 GPU 模组的分流,同时通过 PCIE 4.0 直连有效降低 CPU 和 GPU 间的通信延迟。该服务器支持高达 8T 的 DDR4 内存、409.6 GB/s的内存总带宽,并且提供了 8 个全高全长双宽 PCIe x16 的物理插槽。其强劲的处理器性能、巨大的内存容量和带宽、丰富的 IO 扩展,特别适合 AI 计算、云计算、HPC 以及企业各类业务的工作负载。
媒体对 NF5468A5 进行了一系列测评。其中 HPL 测试结果表明,NF5468A5 搭载 2 颗 AMD EPYC 7543 处理器,浮点计算速度为 2.69 TFLOPS,根据 AMD 平台理论浮点计算速度,处理器计算效率达到 93.74%。在 STREAM 测试中,由于采用多线程并行,实测结果内存带宽 373 GB/s,对比平台内存理论带宽,实测内存带宽效率同样达到惊人的 91.1%。
在 AI 训练性能测试中,浪潮 NF5468A5 搭配 8 张 NVIDIA A100 PCIE 40GB GPU,使用 MLPerf Training V1.0 代码训练卷积神经网络 ResNet50,每秒处理的图片数量可以达到 21486 张,单台机器 35 分钟即可完成 Resnet50 模型训练。参考最近几期 MLPerf 训练榜单,搭载 8 张 NVIDIA A100 40G GPU 卡的服务器的最好成绩是 36.2 分钟。可以说,在同等 GPU 配置的服务器中,浪潮 NF5468A5 的 ResNet50 训练性能是最好的。
在 AI 推理性能测试中,搭载 1 张 NVIDIA Tesla T4 GPU 的 NF5468A5,使用 MLPerf Inference Vtgcode1.0 代码,ResNet50 测试结果为每秒处理 5671.9 张图片,这份成绩也是非常出色的。同时,NF5468A5 能够很好地支持寒武纪 MLU270-S4 推理加速卡,Caffe 框架下的 ResNet18 计算性能每秒超过 7000 张图片。
同时,媒体还对浪潮信息自研的专用加速器 M10A 进行了性能测试,结果表明,浪潮 NF5468A5 搭配 1 张 M10A,可实现 480fps 1080P 视频的流畅转码,一张 M10A 的视频处理能力相当于一台双路服务器的性能。此外,NF5468A5 搭载 1 张 RTX3090 显卡,ETHASH 算法性能突破 100MH/s。
NF5468A5 在 HPC 应用性能方面同样有非常优秀的表现。媒体在 NF5468A5 平台上搭载了 2 颗 AMD Milan-X 7773X 运行常见的气象应用 WRF 和计算流体力学应用 OpenFOAM 进行性能基准测试。测试数据显示,WRF 测试其性能相比同平台搭载两颗 Rome 7742 处理器的计算性能提升 23%~34%;而在 OpenFOAM 测试中,其性能相比同平台 Rome 7742 处理器计算性能提升 34%~80%。
在最新一期评测中,媒体还对 NF5468A5 服务器在 AI+Science 应用场景的表现进行了全面的测评。测试选择了两项近期大热的应用 AlphaFold2 和 NAMD。评测结果发现,对于长度在 1000 以内的蛋白序列,结构预测的完整时间基本在半小时以内,意味着一台 NF5468A5 服务器一天可以完成至少 384 个 Alphafold2 蛋白序列的预测任务;对于分子动力学模拟来说,STMV 算例在 NF5468A5 上可以实现 90.6ns/day 的计算速度,一台服务器一天就能实现 100 万原子近 100ns 的模拟。浪潮 NF5468A5 GPU 服务器可以满足绝大多数科研团队在 AlphaFold2、NAMD 等科学应用领域的 AI 加速计算需求。
通过多次不同配置、不同场景的深度评测,媒体认为浪潮 NF5468A5 是一款性能强大、应用场景广泛的 GPU 服务器。该服务器硬件设计合理,可最大化发挥核心组件的性能优势,并通过分区散热设计保障服务器稳定运行。同时,NF5468A5 广泛兼容主流加速卡,以更灵活的计算架构最大程度地满足用户在图像识别、自然语言处理、语音识别等多场景应用需求。
文章来源于互联网:“算力猛兽”浪潮NF5468A5 GPU服务器开放试用免费申请
“源 1.0”大模型是浪潮信息发布的中文巨量模型,参数量高达 2457 亿,在中文语言能力理解和生成评测基准 CUGE 总榜中取得榜首,并获得语言理解(篇章级)、语言生成、对话交互、多语言、数学推理等 5 项评测最佳成绩。其中在数学推理评测中,源 1.0 …