NVIDIA T4 Tensor Core GPU 是先进的推理加速器。搭载 NVIDIA Turing Tensor Core的T4提供的多精度推理性能,以加速现代人工智能的各种应用。T4封装在节能的小型70瓦PCle 中,可针对横向扩展服务器进行优化,并且旨在实时提供先进的推理。
NVIDIA T4 是强大的加速器,适用于所有AI推理工作负载T4搭载NVIDIA Turing Tensor 核心,能够提供多精度推理性能,以加速各式各样的现代AI应用程序。
优势与特点
适用于服务器的 TESLA 数据中心GPU
利用NVIDIATESLAGPU 更快速地处理要求最严格的高性能计算(HP)和超大规模数据中心工作负载。现在,数据科学家和研究人员可以在能源勘探和深度学习等应用场合中解析 PB 级的数据,速度比使用传统CPU快几个数量级。TESLA加速器亦有能力以前所未有的超快速度运行更大型的模拟。此外,TESLA 还能为虚拟桌面、应用程序和工作站提供超高性能和用户密度。
NVIDIA GPU 训练与推理
随着在线视频数量的指数级增长,对高效搜索和从视频中获取见解的解决方案的需求也持续增长。T4为AI视频应用程序提供突破性的性能,配备专用硬件转码引擎,可带来上一代GPU解码性能的两倍。T4可解码多达38个全高清视频流,便于将可扩展的深度学习集成到视频管道中,以提供创新、智能的视频服务。
NVIDIA加速器的特性和优势
NVIDIA T4引入Turing Tensor Core 技术并在各个层面上都进行了创新,针对横向扩展服务器进行优化并且旨在实时提供先进的推理。
GPU架构 | NVIDIA Turing 架构 |
CUDA Cores | 2560 |
Tensor Cores | 320 |
单精度性能 | 8.1TFLOPS |
混合精度 | 65 TFLOPS |
INT8 | 130TOPS |
INT4 | 260TOPS |
记忆体频宽 | 300G B/S |
GPU显存 | 16GB GDDR6 |
显示端口 | 4个DisplayPort 1.4端口 |
最大功耗 | 250W |
系统接口 | X16Pcle Gen3 |
计算API | CUD ANVIDIA Tensor.ONNX |
散热 | 被动冷却 |
ECC | 支持 |