AI训练和推理性能提高20倍

发布时间：2021-02-23 11:52:25 所属栏目：外闻来源：互联网

导读：采用7nm工艺的NVIDIA Ampere架构，性能提升20% 早在GTC之前，关于NVIDIA Ampere架构的一些技术参数就开始陆续流出，例如采用7nm制造工艺、架构优化升级、能效比更高等等。GTC之后，Ampere架构的所有技术优势全面展现在眼前。根据资料显示，NVIDIA Ampere架构

采用7nm工艺的NVIDIA Ampere架构，性能提升20%

早在GTC之前，关于NVIDIA Ampere架构的一些技术参数就开始陆续流出，例如采用7nm制造工艺、架构优化升级、能效比更高等等。GTC之后，Ampere架构的所有技术优势全面展现在眼前。根据资料显示，NVIDIA Ampere架构采用了全新的7nm制造工艺，包含超过540亿个晶体管，这使其成为全球最大的7纳米处理器。此外，Ampere通过优化自身架构，不但具备更高的性能(NVIDIA发布的A100 GPU较一代产品，在AI训练和推理性能上提高20倍)，而且能耗比更高，并且适合更多的场景应用。

从技术规格上来看，NVIDIA A100 GPU采用了NVIDIA Ampere架构，采用了第三代Tensor Core核心，加入了NVIDIA专为AI开发的全新TF32，能在无需更改任何代码的情况下，使FP32精度下的AI性能提高多达20倍。此外，Tensor Core核心现在支持FP64精度，相比于前代，其为HPC应用所提供的计算力比之前提高了多达2.5倍。

此外，A100 GPU采用了一种全新技术功能：多实例GPU -MIG，能够将单个A100 GPU分割为多达七个独立的GPU，为不同规模的工作提供不同的计算力，以此实现最佳利用率和投资回报率的最大化。另外，A100 GPU还采用了第三代NVIDIA NVLink ，使GPU之间的高速联接增加至原来的两倍，实现服务器的高效性能扩展。而结构化稀疏技术能够让性能提升了一倍。

正是借助以上技术，使得NVIDIA A100成为了AI训练和推理以及科学模拟、对话式AI、推荐系统、基因组学、高性能数据分析、地震建模和金融预测等各种高要求工作负载的理想选择。

除了核心架构的升级之外，采用了Ampere架构的A100还在软件层面进行了优化。据了解，NVIDIA发布了多个软件堆栈更新，使应用程序开发者能够充分发挥A100 GPU创新技术的性能。这些更新包括了50多个新版本CUDA-X库，可用于加速图形、模拟和AI;CUDA 11;多模态对话式AI服务框架NVIDIA Jarvis;深度推荐应用框架NVIDIA Merlin;以及NVIDIA HPC SDK，其中包括能够帮助HPC开发者调试和优化A100代码的编译器、库和工具。

（编辑：平顶山站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

巴西新建南极科考船拟	俄外交部正改善电子签
Shopee与Lazada 东南亚	韩国核聚变反应堆30秒