精巧设计. 强大的效能
NVIDIA RTX™ 技术从根本上改变了电脑绘图,融合了实时光线追踪、人工智能以及高阶图形和计算的能力,推动了视觉计算的下一波创新浪潮。 NVIDIA Ampere 架构是第二代 NVIDIA RTX— 为专业工作流程提供更高水平的能力和效能,以加快决策、上市和解决方案的时间。
NVIDIA RTX A2000 凭借强大的低结构双插槽 GPU 设计,将 RTX 的强大功能带给更多专业人士,为您的桌面提供即时光线追踪、AI 加速计算和高性能绘图。 VR ready RTX A2000 基于 NVIDIA Ampere 架构,结合了 26 个第二代 RT 核心、104 个第三代 Tensor 核心和 3,328 个下一代 CUDA® 核心和支持纠错码 (ECC) 的 6GB GDDR6 内存,更是此产品区间的另一个行业首创。 借助 NVIDIA RTX A2000,设计更大、渲染更快、工作更出色。
性能特点
NVIDIA Ampere 架构 NVIDIA RTX A2000 是功能最强大的双插槽、低结构 设计GPU 解决方案,提供高性能即时光线追踪、AI 加速计算和专业图形渲染,所有这一切都在紧凑的设计中,具有无与伦比的性能。NVIDIA Ampere 架构基于 Turing GPU 的主要 SM 增强功能,增强了光线追踪运算、张量矩阵运算以及 FP32 和 INT32 运算的并发执行。 | CUDA 核心 与前一代相比,基于 NVIDIA Ampere 架构的 CUDA 核心带来高达 2.7 倍的单精度浮点 (FP32) 吞吐量,为图形工作流程(例如 3D 模型开发和计算)提供了显着的性能改进,例如桌面仿真计算器辅助工程(CAE)。RTX A2000系列绘图卡支持两个FP32 主数据路径,使峰值 FP32 运算增加一倍。 | |
第二代RT核心 结合第二代光线追踪引擎,基于 NVIDIA Ampere 架构的 GPU 提供令人难以置信的光线追踪渲染性能。NVIDIA 首次将 RT Cores 引入低结构外形设计的 GPU。 单个 RTX A2000 板卡可以渲染具有物理精确的阴影、反射和折射的复杂专业模型,使用者能够实时洞察 , 与利用 NVIDIA OptiX、Microsoft DXR 和 Vulkan 光线追踪等 API 的应用程序协同工作。基于 RTX A2000系列绘图卡的系统将为真正的交互式设计工作流程提供动力,为前所未有的生产力提供实时回馈。与上一代相比, RTX A2000系列绘图卡的光线追踪速度提高了 5 倍以上。该技术还可以加快光线追踪运动模糊的渲染速度,进而以更高的视觉精度获得更快的结果。 | 第三代Tensor核心 RTX A2000专为深度学习矩阵算术而构建,是神经网络训练和推理功能的核心,它包括增强的Tensor核心,可加速更多数据类型,并包括新的细粒度结构化稀疏性功能,与. 上一代相比可为Tensor矩阵提供高达2倍的吞吐量运算。新的Tensor核心将加速两种新的TF32和BFloat16精度模式。独立的浮点和整数数据路径可结合使用运算和寻址计算来更有效地执行工作负载。 | |
PCle Gen 4 RTX A2000支援PCI Express Gen 4,该PCI Express Gen 4提供了PCle Gen 3的两倍带宽,进而提高了从CPU内存执行AI和数据科学等数据密集型任务的数据传输速度。 | 更高速的GDDR6内存 内建 6GB 或 12GB GDDR6内存,RTX A2000系列绘图卡提供理想的内存占用,以处理延迟敏感的专业应用程序和批量处理数据集和模型。 | |
绘图记忆体上的错误修正码(ECC) 符合关键性任务应用程序对数据完整性的严格需求,为工作站提供无可比拟的计算精确度和可靠性。 | 第五代NVDEC引擎 NVDEC非常适合用于实时译码的转码和视频播放应用。下面视频编译码器都支持硬件加速译码: MPEG-2, VC-1, H.264 (AVCHD) ,H.265 (HEVC) ,VP8, VP9,和AV1。 | |
第七代 NVENC引擎 NVENC可以执行最苛刻的4K或8K视频编码任务,以释放图形引擎和CPU进行其他运作。与软件式的x264编码器相比,RTX A2000提供更好的编码质量。 | 图形抢占 像素等级抢占提供更细微的控制,对时间相关的工作支持更佳,例如VR动态追踪。 | |
计算抢占 指令等级抢占提供对计算工作更精细的控制,以避免长时间执行的应用程序独占系统资源或超时。 | NVIDIA RTX IO 与使用Microsoft新的DirectStorage for Windows API的传统储存API相比,基于 GPU的无损耗解压缩性能提高了多达100倍和20倍,且CPU使用率更低。RTX IO以更有效的压缩形式将数据从存储设备移至GPU,并改善了I/ O性能。 |
GPU 架构 | NVIDIA Ampere |
CUDA 并行处理核心 | 3,328 |
NVIDIA Tensor 核心 | 104 |
NVIDIA RT 核心 | 26 |
单精度效能1 | 8 TFLOPS |
RT Core 效能1 | 15.6 TFLOPS |
Tensor 效能1 | 63.9 TFLOPS2 |
GPU 内存 | 6 GB GDDR6 | 12 GB GDDR 皆具ECC功能 |
内存接口 | 192-bit |
内存带宽 | 288 GB/s |
最大功耗 | 70 W |
绘图总线 | PCI Express 4.0 x 16 |
显示连接器 | mDP 1.4 (4) |
板型 | 2.713" H x 6.6" L 双插槽 |
产品重量 | 294g (短挡板) |
散热方式 | 主动式 |
NVENC | NVDEC | 1x | 1x (+AV1 解码) |
1 峰值数据量基于GPU加速频率
2 使用新的稀疏性功能得到更有效率TOPS / TFLOPS