开创无限可能的性能表现
NVIDIA RTX™ 2000 Ada Generation 是一款强大的半高型 GPU,为更多专业人士带来了 RTX 的强大功能。借助实时光线追踪、AI 加速计算和高性能图形,RTX 2000 重新定义了紧凑型工作站的功能。它采用 NVIDIA Ada Lovelace GPU 架构,结合了 22 个第三代 RT 核心、88 个第四代 Tensor 核心、2,816 个 CUDA® 核心以及支持 ECC 的 16GB GDDR6 内存。RTX 2000 在速度、效率和功能方面有突破性的表现,满足要求严苛的视觉计算工作流程,使创作者、设计师和工程师能够通过这款紧凑型动力来源,实现新的生产力和创新水平。
性能特点
NVIDIA Ada Lovelace 架构 NVIDIA RTX™ 2000 Ada Generation 是一款功能强大的双插槽、半高设计 GPU 解决方案,可为小型工作站的主流应用程序提供高性能实时光线追踪、AI 加速计算和专业图形渲染,采用设计紧凑、功能强大高效的外形尺寸。 NVIDIA Ada Lovelace 架构以主要的 SM 增强功能为基础,单精度和推理运算下与先前的Ampere 架构相比,提供更多的核心、更高的时钟速度和更大的L2 缓存,来实现更高的图形性能、增强的光线追踪运算、张量矩阵操作和并发处理。 | NVIDIA CUDA 核心 与上一代相比,基于 NVIDIA Ada Lovelace 架构的 CUDA 核心提供超过 1.5 倍的单精度浮点 (FP32) 吞吐量,为 3D 模型开发等图形工作流程和计算机辅助工程 (CAE)桌面仿真等计算工作负载,提供了显著的性能提升。RTX 2000 支持两个 FP32 主数据路径,使 FP32 操作峰值加倍。 | |
第三代 RT 核心 结合第三代光线追踪引擎,基于 NVIDIA Ada Lovelace 架构的 GPU 提供令人难以置信的光线追踪渲染性能。RTX 2000 可以渲染具有物理准确的阴影、反射和折射的复杂专业模型,使用户能够实时洞察设计结果。基于 RTX 2000 的系统与利用 NVIDIA OptiX、Microsoft DXR 和 Vulkan 光线追踪等 API 的应用程序协同工作,将为真正的交互式设计工作流程提供强大的动力,以提供实时反馈,进而实现高效的生产力水平。与上一代产品相比,RTX 2000 的光线追踪速度提高了 65%,该技术还可以加快光线追踪的渲染速度,从而以更高视觉精度更快地获得结果。 | 第四代 Tensor 核心 RTX 2000 专为神经网络训练和推理功能核心的深度学习矩阵运算而构建,包括增强的 Tensor Core,可加速更多数据类型,并且支持 Fine-Grained Structured Sparsity 功能,与上一代相比,张量矩阵运算可提供超过 1.5 倍的吞吐量。新的 Tensor Core 将加速新的 FP8 精度模式。独立的浮点和整数数据路径允许使用计算和寻址计算的组合更有效地执行工作负载。 | |
第四代 PCIe PCI Express Gen 4 (PCIe Gen 4),提供的带宽是 PCIe Gen 3 的两倍,提高了 CPU 内存的数据传输速度,适用于 AI 和数据科学等数据密集型任务。RTX 2000 Ada Generation 采用全长 PCIe Gen 4 x8 的接口。 | 更高速的 GDDR6 显存 RTX 2000 Ada Generation 采用 16GB GDDR6 显存,运行频率为7GHz。RTX 2000 具有比上一代更大的显存,可提供理想的显存大小来处理对延迟敏感的专业应用程序中的数据集和模型。 | |
显存上的纠错码 (ECC) 显存上的纠错码 (ECC)可侦测并修正内存中的数据损坏,满足关键任务应用程序的严格数据完整性要求,同时为工作站提供不受影响的计算精确度和可靠性。 | 第五代NVDEC引擎 NVDEC 非常适合用于实时解码的转码和视频播放应用。硬件加速解码支持以下视频编解码器:MPEG-2,VC-1,H.264(AVCHD),H.265(HEVC),VP8,VP9,和 AV1 视频格式。 | |
第八代 NVENC引擎 NVENC 可以承担最苛刻的 4K 或 8K 视频编码任务,以释放图形引擎和 CPU 进行其他运作。RTX 2000 提供比软件 x264 编码器更好的编码质量。RTX 2000 采用 AV1 视频编码,比 4K HDR 的 H.264 编码效率高 40%。AV1 将在相同的比特率带宽下提供更好的质量。 | 图形抢占 像素等级抢占提供更精细的控制,对时间相关的工作支持更佳,例如 VR 动态追踪。 | |
计算抢占 指令等级抢占提供对计算工作更精细的控制,以避免长时间执行的应用程序独占系统资源或超时。 | NVIDIA RTX IO 与使用 Microsoft 新的 DirectStorage for Windows API 的传统存储 API 相比,基于 GPU 的无损耗解压缩性能提高了多达 100 倍和 20 倍,且 CPU 使用率更低。 RTX IO 以更有效的压缩形式将数据从存储设备移至 GPU,并改善了I / O性能。 |
GPU 架构 | NVIDIA Ada Lovelace 架构 |
CUDA 并行处理核心 | 2816 |
NVIDIA Tensor 核心 | 88 |
NVIDIA RT 核心 | 22 |
单精度性能1 | 12 TFLOPS |
RT Core 性能1 | 27.7 TFLOPS |
Tensor 性能1 | 191.9 TFLOPS2 |
GPU 显存 | 16 GB GDDR6 具 ECC 功能 |
显存位宽 | 128-bit |
显存带宽 | 224 GB/s |
最大功耗 | 70W |
系统接口 | PCI Express 4.0 x8 |
显示接口 | mDP 1.4 (4) |
外形规格 | 2.7” H x 6.6” L, 双插槽 |
产品重量 | 296g (短挡板) |
散热方式 | 主动式 |
NVENC | NVDEC | 1x | 1x (+AV1 编码和解码) |
1基于 GPU 加速频率的峰值数据量
2使用新的稀疏性功能得到更有效率的 TOPS / TFLOPS