MLPerf最新发榜,浪潮AI服务器囊括数据中心推理全部冠军

北京2022年4月7日 /美通社/ -- 2022年4月7日,全球权威AI基准评测MLPerf™公布最新AI推理(Inference)V2.0榜单,浪潮AI服务器以最高性能获得了数据中心(固定任务)的全部16项冠军。

MLPerf™由图灵奖得主大卫·帕特森(David Patterson)联合顶尖学术机构发起成立,是国际最权威 的AI性能基准评测,每年组织AI推理和AI训练测试各两次,以对迅速增长的AI计算需求与性能进行及时的跟踪测评。MLPerf™比赛通常分为固定任务(Closed)和开放优化(Open)两类任务,开放优化能力着重考察参测厂商的AI技术创新力,固定任务则因更公平地考察参测厂商的硬件系统和软件优化的能力,成为更具参考价值的AI性能基准测试。

本次是2022年MLPerf™的首次AI推理性能评测,旨在考察在各类AI任务中,不同厂商计算系统的推理速度和能力。本次评测中,在竞争最激烈的数据中心(固定任务)赛道,共有926项成绩提交,数量较上次比试翻倍,竞争非常激烈。

浪潮AI服务器创推理性能新纪录

本次MLPerf™AI推理性能评测涵盖使用广泛的六大AI场景,包括图像分类、自然语言理解、语音识别、目标物体检测、医学影像分割、智能推荐,每个场景采用最主流的AI模型作为测试任务,分别为ResNet50、BERT、RNNT、SSD-ResNet34、3D-Unet、DLRM。MLPerf™测试要求模型推理精度达到99%以上,对于自然语言理解、医学影像分割和智能推荐3个任务则设置99%与99.9%两种精度要求,以考察当提升AI推理精度要求时对计算性能的影响。

为更加贴近实际应用情况,MLPerf™推理测试在数据中心赛道下设置了离线(Offline)与在线(Server)两种模式。离线模式代表任务所需所有数据都在本地可用,典型场景如大批量医疗影像样本存于本地等待统一识别。在线模式则反映了大部分的即时AI应用,其数据和请求以突发和间歇的方式在线送达,例如用户在浏览购物网站时智能推荐的推理请求。

浪潮AI服务器此次表现出色,以最高性能包揽了此次MLPerf™数据中心(固定任务)赛道的全部16项冠军。

本次MLPerf™测试中,浪潮AI服务器在ResNet50模型任务中创造了每秒处理449,856张图片的性能纪录,相当于仅用2.8秒即完成ImageNet数据集128万张图片的分类;在3D-UNet模型任务中,创造了每秒处理36.25张医疗影像的新纪录,相当于在6秒内完成对KiTS19数据集207张3D医疗影像的分割;在SSD-ResNet34模型任务中,创造了每秒对11,081.9张图片完成目标物体识别及定位的新纪录;在BERT模型任务中,创造了平均每秒完成38,776.7个问答的性能纪录,在RNNT模型任务中,创造了每秒将155,811段语音转为文字的性能纪录,在DLRM模型任务中,则创造每秒实现2,645,980次点击预测的最佳性能纪录。

此外,本次MLPerf™评测还设有边缘推理赛道,浪潮面向边缘场景设计的AI服务器同样表现出色,在边缘固定任务赛道的全部17项任务中斩获了11项冠军。

随着AI应用在各个行业中的持续深化,更快的推理速度,将带来更高的AI应用效率与能力,加速产业智能化转型。相比半年前的MLPerf™AI推理榜单V1.1,浪潮AI服务器将图像分类、语音识别和自然语言理解任务的推理性能分别提升31.5%、28.5%及21.3%,意味着浪潮AI服务器在自动驾驶、语音会议、智能问答和智慧医疗等等场景中,能够更高效快速地完成各类智能任务。

全栈优化能力助推AI性能持续提升

浪潮AI服务器在MLPerf™基准评测中的出色表现,得益于浪潮信息卓越的AI系统设计能力和全栈优化能力。

本次参与测评的浪潮AI服务器NF5468M6J拥有出色的系统设计,以分层可扩展计算架构在业界率先实现对12颗NVIDIA A100 Tensor Core GPU的支持, 并以极佳的性能成绩一举揽获12项冠军。浪潮信息也是本次MLPerf™竞赛中可以唯一提供服务器支持8颗500W NVIDIA A100 GPU的厂商 ,并实现了风冷及液冷两种散热方式。在此次参赛的8颗GPU NVLink高端主流机型中,浪潮AI服务器在数据中心16个任务中斩获14项最佳成绩,展现出在高端机型中的领先优势。其中,NF5488A5是全球首批上市的A100服务器,在4U空间支持8颗第三代NVlink互联的NVIDIA A100 GPU 和2颗AMD Milan CPU。NF5688M6是面向大规模数据中心优化设计的具备极致 扩展能力的AI服务器,支持8颗A100 GPU和2颗Intel Icelake CPU,支持多达13张PCIe Gen4的IO扩展卡。

在硬件层面,浪潮AI服务器通过对CPU、GPU硬件性能的精细校准和全面优化,使CPU性能、GPU性能、CPU与GPU之间的数据通路均处于对AI推理最优状态;在软件层面,结合GPU硬件拓扑对多GPU的轮询调度优化使单卡至多卡性能达到了近似线性扩展;在深度学习算法层面,结合GPU Tensor Core 单元的计算特征,通过自研通道压缩算法成功实现了模型的极致 性能优化。

浪潮信息是全球领先的AI计算厂商,AI服务器市场份额全球第一 ,连续五年以超50%的市场份额稳居中国AI服务器市场第一 。浪潮信息致力于AI计算平台、资源平台和算法平台的研发创新,并通过元脑生态携手领先伙伴加速数实相融。

原创文章,作者:,如若转载,请注明出处:https://knewsmart.com/archives/66571

(0)
上一篇 2022年4月7日
下一篇 2022年4月7日

相关推荐

  • 复刻山姆和Costco,1688凭什么?

    撰文︱白丽 出品︱阿桶观察 勇砺商业评论 卷得不能再卷,是当下电商的真实写照。 2024年,电商的价格战内卷已经把压力传导至源头产业带,电商卖家逼着源头厂商提供更低的价格,造成很多偷工减料和降质减配的劣币驱…

    专栏 35分钟前
    6.2K
  • 丰巢没有安全感

    来源 | 伯虎财经(bohuFN)  作者 | 梦得  曾经“没人看好”的丰巢居然盈利了。 为了解决“最后一公里”难题,出现了众多的快递驿站和快递柜。虽然网上对驿站和快递柜吐槽颇多,但事实上,大家还是需要的。 以快递柜赛…

    专栏 35分钟前
    4.9K
  • 一夜之间,开学的大学生都在吃板面

    9月开学季,一款方便速食产品却在“嘴刁”的年轻群体中持续破圈,成为当代大学生入学的必备“神器”。 这正是今麦郎板面引发的一场板面“风暴”。谁也未曾料到,成立三十年的今麦郎,不但精准把握了“时代的胃口”,更是将…

    专栏 35分钟前
    6.4K
  • 倪叔观察:营销风口重回PC时代

    相信有些朋友看到这篇文章会有点懵逼。 什么?现在居然还有人提什么PC时代?还营销重回PC? 老粉都知道,倪叔不打诳语。没错,营销重回PC时代,可能是本年度迄今为止最令人意想不到的一个商业话题。 但是,这个话题…

    专栏 35分钟前
    5.5K
  • 闪回科技二度冲刺港股,深陷盈利困境,雷军看走眼了?

    一台手机的流通循环,起于产线,止于废弃。 废弃是消费电子产品生命周期的最后一步,但是过去没有产业链玩家会把这一步骤当作产业链的一环。而商业机会恰恰藏在这样“反常识”的领域。 中国循环经济协会的数据表明,…

    专栏 35分钟前
    6.7K
  • 又“复苏”又“变天”的出境游,是谁的“囊中之物”?

    今年的中秋节假期,出入境人数呈现新的高峰。这其中,海南出入境人员达1.6万人次,较去年同期增长85%,日均出入境人数超5900人次,单日出入境高峰超7600人次,海南各口岸出入境客流迎来“双向奔赴”。 图片来源于pixa…

    专栏 35分钟前
    6.6K
  • 放弃大闸蟹的中秋旺季机遇,徐记海鲜在想什么?

    秋风响,蟹脚痒。中秋前后,大闸蟹消费和销售的旺季就来了。送礼、聚餐,所有需求都聚在此时。 市场过热,乱象就会滋生。从阳澄湖的“洗澡蟹”问题,到蟹卡兑换骗局,大闸蟹几乎每年都会在这个时候占领热搜。 今年,…

    专栏 35分钟前
    6.3K
  • 中国CRM,步入「长期主义」河流

    在如今的2024年,销售易正在实现自己的底层进化,这种进化是关于边界,关于产品,关于生态,关于AI。  如果说在之前,销售易的产业势能伴随着的是自身的产品、服务、资本、市场需求等叠加的总和,那么如今,这家中…

    专栏 35分钟前
    6.3K
  • 云盘惊现陌生人照片?阿里云又双叒叕“翻车”了

    雷达财经鸿途出品 文|莫恩盟 编|深海 标榜“安全”的阿里云盘,却因为隐私安全方面的BUG“翻车”了。 9月14日,有多名用户反映,在阿里云盘创建一个图片类型的文件夹,可以看到其他用户的隐私照片。有网友对此感慨道,…

    专栏 35分钟前
    6.5K
  • 苹果的高光时刻,被华为截胡了?

    中秋之前的科技圈春晚,没能上演“火星撞地球”的大戏。苹果带来了史上最无聊的发布会,以往的科技惊艳感荡然无存,令这场“苹果VS华为”的正面对抗失色不少。 这也是市场的残酷性,如果不能持续掏出新鲜产品,很容易失…

    专栏 35分钟前
    5.9K

发表回复

登录后才能评论
联系我们
联系我们
分享本页
返回顶部