加入收藏 | 设为首页 | 会员中心 | 我要投稿 平顶山站长网 (https://www.0375zz.cn/)- 分布式云、数据处理、媒体处理、图像分析、基础存储!
当前位置: 首页 > 站长资讯 > 外闻 > 正文

AI训练和推理性能提高20倍

发布时间:2021-02-23 11:52:25 所属栏目:外闻 来源:互联网
导读:采用7nm工艺的NVIDIA Ampere架构,性能提升20% 早在GTC之前,关于NVIDIA Ampere架构的一些技术参数就开始陆续流出,例如采用7nm制造工艺、架构优化升级、能效比更高等等。GTC之后,Ampere架构的所有技术优势全面展现在眼前。根据资料显示,NVIDIA Ampere架构

采用7nm工艺的NVIDIA Ampere架构,性能提升20%

早在GTC之前,关于NVIDIA Ampere架构的一些技术参数就开始陆续流出,例如采用7nm制造工艺、架构优化升级、能效比更高等等。GTC之后,Ampere架构的所有技术优势全面展现在眼前。根据资料显示,NVIDIA Ampere架构采用了全新的7nm制造工艺,包含超过540亿个晶体管,这使其成为全球最大的7纳米处理器。此外,Ampere通过优化自身架构,不但具备更高的性能(NVIDIA发布的A100 GPU较一代产品,在AI训练和推理性能上提高20倍),而且能耗比更高,并且适合更多的场景应用。

从技术规格上来看,NVIDIA A100 GPU采用了NVIDIA Ampere架构,采用了第三代Tensor Core核心,加入了NVIDIA专为AI开发的全新TF32,能在无需更改任何代码的情况下,使FP32精度下的AI性能提高多达20倍。此外,Tensor Core核心现在支持FP64精度,相比于前代,其为HPC应用所提供的计算力比之前提高了多达2.5倍。

此外,A100 GPU采用了一种全新技术功能:多实例GPU -MIG,能够将单个A100 GPU分割为多达七个独立的GPU,为不同规模的工作提供不同的计算力,以此实现最佳利用率和投资回报率的最大化。另外,A100 GPU还采用了第三代NVIDIA NVLink ,使GPU之间的高速联接增加至原来的两倍,实现服务器的高效性能扩展。而结构化稀疏技术能够让性能提升了一倍。

正是借助以上技术,使得NVIDIA A100成为了AI训练和推理以及科学模拟、对话式AI、推荐系统、基因组学、高性能数据分析、地震建模和金融预测等各种高要求工作负载的理想选择。

除了核心架构的升级之外,采用了Ampere架构 的A100还在软件层面进行了优化。据了解,NVIDIA发布了多个软件堆栈更新,使应用程序开发者能够充分发挥A100 GPU创新技术的性能。这些更新包括了50多个新版本CUDA-X库,可用于加速图形、模拟和AI;CUDA 11;多模态对话式AI服务框架NVIDIA Jarvis;深度推荐应用框架NVIDIA Merlin;以及NVIDIA HPC SDK,其中包括能够帮助HPC开发者调试和优化A100代码的编译器、库和工具。


(编辑:平顶山站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读