带来无限可能的性能表现
各行各业正在拥抱加速计算和人工智能来应对巨大的改变并释放变革的可能性。 生成式人工智能正在重塑专业人士从设计、工程到娱乐和医疗保健等各领域的创造和创新的方式。 NVIDIA RTX™ 5000 Ada Generation 采用第三代 RTX 技术,实现了生成式 AI 的突破,彻底改变了生产力并提供了前所未有的创意可能性。
NVIDIA RTX 5000 Ada Generation 专为当今的专业工作流程而打造,它基于 NVIDIA Ada Lovelace 架构构建,结合了 100 个第三代 RT 核心、400 个第四代 Tensor 核心和 12,800 个 CUDA® 核心以及 32GB 显存,可加速渲染、AI、图形和计算工作负载。RTX 5000 Ada 所驱动的工作站可帮助您在当今要求苛刻的商业环境中取得成功。
性能特点
NVIDIA Ada Lovelace 架构 NVIDIA RTX™ 5000 Ada Generation 是表现最平衡的工作站 GPU,可在优化的功耗范围内提供高性能实时光线追踪、AI 加速计算和专业图形渲染。基于 Ada Lovelace GPU 的主要 SM 增强功能,NVIDIA Ada Lovelace 架构强化了光线追踪运算、张量矩阵运算以及 FP32 和 INT32 运算的并行处理能力。 | NVIDIA CUDA 核心 与上一代相比,基于 NVIDIA Ada Lovelace 架构的 CUDA 核心提供超过 2 倍的单精度浮点 (FP32) 吞吐量,为 3D 模型开发等图形工作流程和计算机辅助工程 (CAE)桌面仿真等计算工作负载,提供了显著的性能提升。RTX 5000 支持两个 FP32 主数据路径,使 FP32 操作峰值加倍。 | |
第三代 RT 核心 结合第三代光线追踪引擎,基于 NVIDIA Ada Lovelace 架构的 GPU 提供令人难以置信的光线追踪渲染性能。 RTX 5000 可以渲染具有物理准确的阴影、反射和折射的复杂专业模型,使用户能够实时洞察设计结果。基于 RTX 5000 的系统与利用 NVIDIA OptiX、Microsoft DXR 和 Vulkan 光线追踪等 API 的应用程序协同工作,将为真正的交互式设计工作流程提供强大的动力,以提供实时反馈,进而实现前所未有的生产力水平。 与上一代产品相比,RTX 5000 的光线追踪速度提高了 2 倍。该技术还可以加快光线追踪运动模糊的渲染速度,从而以更高的视觉精度更快地获得结果。 | 第四代 Tensor 核心 RTX 5000 专为神经网络训练和推理功能核心的深度学习矩阵运算而构建,包括增强的 Tensor Core,可加速更多数据类型,并且支持 Fine-Grained Structured Sparsity 功能,与上一代相比,张量矩阵运算可提供超过 5 倍的吞吐量。新的 Tensor Core 将加速两种新的 TF32 和 BFloat16 精度模式。 独立的浮点和整数数据路径允许使用计算和寻址计算的组合更有效地执行工作负载。 | |
更高速的 GDDR6 显存 RTX 5000 采用 32GB GDDR6 显存,可提供光线追踪、渲染和 AI 工作负载等所需的吞吐量。 RTX 5000 提供大容量显存,可处理延迟敏感的专业应用程序中较大的数据集和模型。 | 第四代 PCIe RTX 5000 支持 PCI Express Gen 4,它提供的带宽是 PCIe Gen 3 的两倍,提高了 CPU 内存的数据传输速度,适用于 AI 和数据科学等数据密集型任务。 | |
显存上的纠错码 (ECC) 符合关键性任务应用程序对数据完整性的严格需求,同时为工作站提供无可比拟的计算精确度和可靠性。 | 第五代NVDEC引擎 NVDEC 非常适合用于实时译码的转码和视频播放应用。硬件加速译码支持以下视频编译码器:MPEG-2,VC-1,H.264(AVCHD),H.265(HEVC),VP8,VP9,和 AV1 视频格式。 专业视频编辑可以实现 8K/60 的视频编码。 | |
第八代 NVENC引擎 NVENC 可以承担最苛刻的 4K 或 8K视频编码任务,以释放图形引擎和 CPU 进行其他运作。RTX 5000 提供比软件 x264 编码器更好的编码质量。RTX 5000 采用 AV1 视频编码,比 4K HDR 的 H.264 编码效率高 40%。AV1 将在相同的比特率带宽下提供更好的质量。 | 图形抢占 像素等级抢占提供更细微的控制,对时间相关的工作支持更佳,例如 VR 动态追踪。 | |
计算抢占 指令等级抢占提供对计算工作更精细的控制,以避免长时间执行的应用程序独占系统资源或超时。 | RTX IO 使用 Microsoft 新的 DirectStorage for Windows API,与传统存储 API 相比,可将基于 GPU 的无损解压缩性能提高 100 倍,CPU 利用率降低 20 倍。 RTX IO 以更高效、压缩的形式将数据从存储设备移动到 GPU,并提高 I/O 性能。 |
GPU 架构 | NVIDIA Ada Lovelace |
CUDA 并行处理核心 | 12800 |
NVIDIA Tensor 核心 | 400 |
NVIDIA RT 核心 | 100 |
单精度性能1 | 65.3 TFLOPS |
RT Core 性能1 | 151 TFLOPS |
Tensor 性能1 | 1044.4 TFLOPS2 |
GPU 显存 | 32 GB GDDR6 支持 ECC |
显存位宽 | 256-bit |
显存带宽 | 576 GB/s |
最大功耗 | 250W |
系统接口 | PCI Express 4.0 x16 |
显示接口 | DP 1.4 (4) |
外形规格 | 4.4” H x 10.5” L 双宽度 |
产品重量 | 1079.7g |
散热方式 | 主动式风扇 |
支持 vGPU 软件3 | NVIDIA vPC/vApps, NVIDIA RTX Virtual Workstation |
支持 vGPU 模式 | 1GB, 2 GB, 3 GB, 4 GB, 6 GB, 8 GB, 12 GB, 16 GB, 24 GB |
NVIDIA® 3D Vision® 与 3D Vision Pro | 支持3-pin mini DIN |
同步输出 | 支持 Quadro Sync II |
NVLink 互连技术 | 不支持 |
外部电源连接器 | 1x 16-pin CEM5 PCIe |
NVENC | NVDEC | 2x | 2x (+AV1 编码与解码) |
1基于 GPU 加速频率的峰值数据量
2使用新的稀疏性功能得到更有效率 TOPS / TFLOPS
3 RTX 5000 Ada Generation 的显示接口默认启用. 当使用 vGPU 软件时, 显示接口无法使用. vGPU 软件预计 2023 Q3 开始支持