Article / 文章中心

NVIDIA Tesla GPU系列P4、T4、P40以及V100参数性能对比

发布时间:2022-02-08 点击数:4238

一、关于NVIDIA TESLA系列GPU具体介绍如下:

NVIDIA TESLA V100

NVIDIA Tesla V100选用NVIDIA Volta架构,十分适合为要求极为苛刻的双精度核算作业流程供给加快,并且还是从P100晋级的理想途径。该GPU的渲染功能比Tesla P100提升了高达80%,借此可缩短规划周期和上市时刻。

Tesla V100的每个GPU均可供给125 teraflops的推理功能,配有8块Tesla V100的单个服务器可完成1 petaflop的核算功能。

NVIDIA TESLA P40

The Tesla P40能够供给高达2倍的专业图形功能。Tesla P40能够对安排中每个vGPU虚拟化加快图形和核算(NVIDIA CUDA® 和 OpenCL)作业负载。支撑多种行业标准的2U服务器。

Tesla P40可供给出色的推理功能、INT8精度和24GB板载内存。

NVIDIA TESLA T4

NVIDIA Tesla T4的帧缓存高达P4的2倍,功能高达M60的2倍,关于使用NVIDIA Quadro vDWS软件敞开高端3D规划和工程作业流程的用户而言,不失为一种理想的解决方案。凭仗单插槽、半高外形特性以及低至70瓦的功耗,Tesla T4堪称为每个服务器节点完成最大GPU密度的绝佳之选。

NVIDIA TESLA P4

Tesla P4可加快任何外扩型服务器的运转速度,能效高达CPU的60倍。


二、NVIDIA Tesla GPU系列P4、T4、P40以及V100

NVIDIA Tesla系列GPUP4、T4、P40以及V100功能标准参数对比表,阿里云GPU云服务器供给的实例GN4(Nvidia M40)、GN5(Nvidia P100)、GN5i(Nvidia P4)及GN6(Nvidia V100),也会根据NVIDIA Tesla GPU系列。

云服务器 Tesla T4:世界领先的推理加快器 Tesla V100:通用数据中心 GPU 适用于超高效、外扩型服务器的 Tesla P4 适用于推理吞吐量服务器的 Tesla P40
单精度功能 (FP32) 8.1 TFLOPS 14 TFLOPS (PCIe) 15.7 teraflops (SXM2) 5.5 TFLOPS 12 TFLOPS
半精度功能 (FP16) 65 TFLOPS 112 TFLOPS (PCIe)125 TFLOPS (SXM2)
整数运算才能 (INT8) 130 TOPS 22 TOPS* 47 TOPS*
整数运算才能 (INT4) 260 TOPS
GPU 显存 16GB 32/16GB HBM2 8GB 24GB
显存带宽 320GB/秒 900GB/秒 192GB/秒 346GB/秒
体系接口/外形标准 PCI Express 半高外形 PCI Express 双插槽全高外形 SXM2/NVLink PCI Express 半高外形 PCI Express 双插槽全高外形
功率 70 W 250 W (PCIe) 300 W (SXM2) 50 W/75 W 250 W
硬件加快视频引擎 1 个解码引擎,2 个编码引擎 1 个解码引擎,2 个编码引擎 1 个解码引擎,2 个编码引擎