NVIDIA Ampere 架构 NVIDIA RTX A1000 是功能强大的单插槽、半高设计的专业解决方案,适用于希望以紧凑高效的外形尺寸实现卓越性能的 CAD、DCC、金融服务行业 (FSI) 和可视化专业人士。 NVIDIA Ampere 架构以 Turing GPU 的主要 SM 增强功能为基础,增强了光线追踪运算、张量矩阵运算以及 FP32 和 INT32 运算的并发处理。 |
| NVIDIA CUDA 核心 与上一代相比,基于 NVIDIA Ampere 架构的 CUDA 核心的单 精度浮点(FP32) 吞吐量提高了2.7 倍,为图形和渲染工作流程(例如2D 图形、3D 模型开发、渲染)提供了显著的性能提升。 RTX A1000 支持两个 FP32 主数据路径,使 FP32 运算峰值加倍。 |
第二代 RT 核心 基于 NVIDIA Ampere 架构的 GPU 结合了第二代光线追踪引擎,可提供令人难以置信的光线追踪渲染性能。 NVIDIA 首次将 RT 核心引入半高、单插槽外形设计的 GPU 中。 单一 RTX A1000可以渲染具有物理准确的阴影、反射和折射的复杂专业模型,使用户能够实时洞察设计结果。基于 RTX A1000 的系统与利用 NVIDIA OptiX、Microsoft DXR 和 Vulkan 光线追踪等 API 的应用程序协同工作,将为真正的交互式设计工作流程提供强大的动力,以提供实时反馈,进而实现高效的生产力水平。 与上一代产品相比,RTX A1000 的渲染性能提高了 3 倍(Arnold 渲染器)。该技术还可以加快光线追踪运动模糊的渲染速度,从而以更高视觉精度更快地获得结果。
|
| 第三代 Tensor 核心 RTX A1000 专为现代工作流程而打造,包含增强型 Tensor Core,作为 Ampere GPU 架构的一部分,可加速更多数据类型。与上一代产品相比,可提供高达 3 倍的生成式 AI 性能。 第三代 Tensor Core 将加速 TF32 和 BFloat16 精度模式。 独立的浮点和整数数据路径允许使用计算和寻址计算的组合更有效地执行工作负载。 |
第四代 PCIe RTX A1000 支持 PCI Express Gene 4,提供的带宽是 PCIe Gen 3 的两倍,提高了 CPU 内存的数据传输速度,适用于 AI 和数据科学等数据密集型任务。
|
| 更高速的 GDDR6 显存 RTX A1000 采用 8GB GDDR6 显存和更快的显存带宽,提供理想的显存大小来处理对延迟敏感的专业应用程序中的大量数据集和模型。 |
第五代 NVDEC 引擎 NVDEC 非常适合用于实时解码的转码和视频播放应用。硬件加速解码支持以下视频编解码器:MPEG-2,VC-1,H.264(AVCHD),H.265(HEVC),VP8,VP9,和 AV1 视频格式。
|
| 第七代 NVENC 引擎 NVENC 可以承担 4K 或 8K 视频编码任务,以释放图形引擎和 CPU 进行其他运算。RTX A1000 提供比软件 x264 编码器更好的编码质量。 |
图形抢占 像素等级抢占提供更精细的控制,对时间相关的工作支持更佳,例如 VR 动态追踪。
|
| 计算抢占 指令等级抢占提供对计算工作更精细的控制,以避免长时间执行的应用程序独占系统资源或超时。 |
NVIDIA RTX IO 与使用 Microsoft 新的 DirectStorage for Windows API 的传统存储 API 相比,基于 GPU 的无损耗解压缩性能提高了多达 100 倍和 20 倍,且 CPU 使用率更低。 RTX IO 以更有效的压缩形式将数据从存储设备移至 GPU,并改善了I / O性能。
|
|
|