NVIDIA Ampere 架构 NVIDIA RTX A2000 是功能强大的双插槽、低结构 设计GPU 解决方案,提供高性能即时光线追踪、AI 加速计算和专业图形渲染,所有这一切都在紧凑的设计中,具有无与伦比的性能。NVIDIA Ampere 架构基于 Turing GPU 的主要 SM 增强功能,增强了光线追踪运算、张量矩阵运算以及 FP32 和 INT32 运算的并发执行。 |
| CUDA 核心 与前一代相比,基于 NVIDIA Ampere 架构的 CUDA 核心带来高达 2.7 倍的单精度浮点 (FP32) 吞吐量,为图形工作流程(例如 3D 模型开发和计算)提供了显着的性能改进,例如桌面仿真计算器辅助工程(CAE)。RTX A2000系列绘图卡支持两个FP32 主数据路径,使峰值 FP32 运算增加一倍。 |
第二代RT核心 结合第二代光线追踪引擎,基于 NVIDIA Ampere 架构的 GPU 提供令人难以置信的光线追踪渲染性能。NVIDIA 首次将 RT Cores 引入低结构外形设计的 GPU。 单个 RTX A2000 板卡可以渲染具有物理精确的阴影、反射和折射的复杂专业模型,使用者能够实时洞察 , 与利用 NVIDIA OptiX、Microsoft DXR 和 Vulkan 光线追踪等 API 的应用程序协同工作。基于 RTX A2000系列绘图卡的系统将为真正的交互式设计工作流程提供动力,为前所未有的生产力提供实时回馈。与上一代相比, RTX A2000系列绘图卡的光线追踪速度提高了 5 倍以上。该技术还可以加快光线追踪运动模糊的渲染速度,进而以更高的视觉精度获得更快的结果。 |
| 第三代Tensor核心 RTX A2000专为深度学习矩阵算术而构建,是神经网络训练和推理功能的核心,它包括增强的Tensor核心,可加速更多数据类型,并包括新的细粒度结构化稀疏性功能,与. 上一代相比可为Tensor矩阵提供高达2倍的吞吐量运算。新的Tensor核心将加速两种新的TF32和BFloat16精度模式。独立的浮点和整数数据路径可结合使用运算和寻址计算来更有效地执行工作负载。 |
PCle Gen 4 RTX A2000支援PCI Express Gen 4,该PCI Express Gen 4提供了PCle Gen 3的两倍带宽,进而提高了从CPU内存执行AI和数据科学等数据密集型任务的数据传输速度。 |
| 更高速的GDDR6内存 内建 6GB 或 12GB GDDR6内存,RTX A2000系列绘图卡提供理想的内存占用,以处理延迟敏感的专业应用程序和批量处理数据集和模型。 |
绘图记忆体上的错误修正码(ECC) 符合关键性任务应用程序对数据完整性的严格需求,为工作站提供无可比拟的计算精确度和可靠性。 |
| 第五代NVDEC引擎 NVDEC非常适合用于实时译码的转码和视频播放应用。下面视频编译码器都支持硬件加速译码: MPEG-2, VC-1, H.264 (AVCHD) ,H.265 (HEVC) ,VP8, VP9,和AV1。 |
第七代 NVENC引擎 NVENC可以执行最苛刻的4K或8K视频编码任务,以释放图形引擎和CPU进行其他运作。与软件式的x264编码器相比,RTX A2000提供更好的编码质量。
|
| 图形抢占 像素等级抢占提供更细微的控制,对时间相关的工作支持更佳,例如VR动态追踪。 |
计算抢占 指令等级抢占提供对计算工作更精细的控制,以避免长时间执行的应用程序独占系统资源或超时。 |
| NVIDIA RTX IO 与使用Microsoft新的DirectStorage for Windows API的传统储存API相比,基于 GPU的无损耗解压缩性能提高了多达100倍和20倍,且CPU使用率更低。RTX IO以更有效的压缩形式将数据从存储设备移至GPU,并改善了I/ O性能。
|