安全平衡、出色的性能
随着NVIDIA Ampere架构的推出,我们将下一代NVIDIA RTX带给了数百万专业人士。NVIDIA Ampere架构具有增强的即时光线追踪,加速的AI,先进的绘图和运算功能以及逼真的VR,使艺术家、设计师、工程师和科学家能够将不可能变为可能。随着RTX技术的采用持续不断,如今RTX技术加速了60多个世界领先的专业应用,专业人员获得前所未有的设计、建造和娱乐能力。
NVIDIA RTX A5000可提供专业人士将其最大胆的创意变为现实所需的功能、性能和可靠性。借助24 GB的GPU内存,您使用的应用程序将获得更快的性能。因此,您可以以更高的像真度和互动性处理更大的模型、渲染、数据和场景,从而释放出无限的潜力,从桌面上获得无限的创造力。
性能特点
NVIDIA Ampere 架构 NVIDIA RTX A5000是功能最强大的工作站GPU,可提供高性能的即时光线追踪,Al加速计算和专业图形渲染。基于TuringGPU主要增强SM功能 ,NVIDIA Ampere架构亦强化光线追踪运算,Tensor矩阵运算以及FP32和INT32运算的平行执行。 | CUDA 核心 NVIDIA的Ampere架构的CUDA核心带来高达2倍的单精度浮点(FP32),相比上一代的吞吐量,为显卡提供了显著的效能改进工作流程,如3D模型的开发和计算的工作负载,例如仿真计算器辅助工程(CAE)。RTXA5000启用两个FP32主要数据路径,从而使FP32峰值运算次数增加了一倍。 | |
第二代RT核心 结合第二代光线追踪引擎,NVIDIA Ampere GPU架构提供了令人难以置信的光线追踪渲染效能。单片RTX A5000卡可以渲染具有物理上准确的阴影,反射和折射的复杂专业模型,从而使用户能够立即洞察设计结果。基于RTX A5000的系统将与利用NVIDIAOptiX,MicrosoftDXR和Vulkan光线跟踪等API的应用程序协同工作,将为真正的交互式设计工作流提供强大的动力,以提供实时回馈,从而实现前所未有的生产力水平。与前一代产品相比,RTX A5000的光线追踪速度提高了2倍。这项技术还可以加快光线追踪运动模糊的渲染速度,以更快的速度获得更高的视觉准确性。 | 第三代Tensor核心 RTX A5000专为深度学习矩阵算术而构建,是神经网络训练和推理功能的核心,它包括增强的Tensor核心,可加速更多数据类型,并包括新的细粒度结构化稀疏性功能,与. 上一代相比可为Tensor矩阵提供高达2倍的吞吐量运算。新的Tensor核心将加速两种新的TF32和BFloat16精度模式。独立的浮点和整数数据路径可结合使用运算和寻址计算来更有效地执行工作负载。 | |
PCle Gen 4 RTX A5000支持PCI Express Gen 4,该PCI Express Gen 4提供了PCle Gen 3的两倍带宽,进而提高了从CPU内存执行AI和数据科学等数据密集型任务的数据传输速度。 | 更高速的GDDR6内存 内建24GB GDDR6内存,与上一代产品相比,在光线跟踪,渲染和AI工作负载方面的吞吐量提高了71%。RTX A5000提供了业界最大的绘图内存空间,可以处理对延迟敏感的专业应用程序中的最大数据集和模型。 | |
绘图记忆体上的错误修正码(ECC) 符合关键性任务应用程序对数据完整性的严格需求,为工作站提供无可比拟的计算精确度和可靠性。 | 第五代NVDEC引擎 NVDEC非常适合用于实时译码的转码和视频播放应用。下 面视频编译码器都支持硬件加速译码: MPEG-2, VC-1, H.264 (AVCHD) ,H.265 (HEVC) ,VP8, VP9,和AV1。 | |
第七代 NVENC引擎 NVENC可以执行最苛刻的4K或8K视频编码任务,以释放图形引擎和CPU进行其他运作。与软件式的x264编码器相比,RTX A5000提供更好的编码质量。 | 图形抢占 像素等级抢占提供更细微的控制,对时间相关的工作支持更佳,例如VR动态追踪。 | |
计算抢占 指令等级抢占提供对计算工作更精细的控制,以避免长时间执行的应用程序独占系统资源或超时。 | NVIDIA RTX IO 与使用Microsoft新的DirectStorage for Windows API的传统储存API相比,基于 GPU的无损耗解压缩性能提高了多达100倍和20倍,且CPU使用率更低。RTX IO以更有效的压缩形式将数据从存储设备移至GPU,并改善了I/ O性能。 |
GPU 架构 | NVIDIA Ampere |
CUDA 并行处理核心 | 8,192 |
NVIDIA Tensor 核心 | 256 |
NVIDIA RT 核心 | 64 |
单精度效能1 | 27.8 TFLOPS |
RT Core 效能1 | 54.2 TFLOPS |
Tensor 效能1 | 222.2 TFLOPS2 |
GPU 内存 | 24 GB GDDR6 with ECC |
内存接口 | 384-bit |
内存带宽 | 768 GB/s |
最大功耗 | 230 W |
绘图总线 | PCI Express 4.0 x 16 |
显示接口 | DP 1.4 (4)3 |
板型 | 4.4" H x 10.5" L |
产品重量 | 1.025 kg |
散热方式 | 主动式 |
支持 vGPU 软件4 | NVIDIA® Virtual PC/Virtual Applications (vPC/vApps), NVIDIA RTX® Virtual Workstation (vWS), NVIDIA Virtual Compute Server (vCS) |
外部电源连接器 | 1x 8-pin PCle |
同步输出 | 支持 Quadro Sync II |
NVLink 互连技术 | 112.5 GB/s (双向) |
1、峰值数据基于GPU加速频率
2、使用新的稀疏性功能得到更有效率TOPS / TFLOPS
3、RTX A5000的显示接口在使用vGPU软件时无法使用
4、在即将发布的NVIDIA虚拟GPU(vGPU)版本中将提供对RTX A5000 GPU的虚拟化支持