产品中心
服务热线
0531-62327605
怡然开放合作
面向全国诚招合作伙伴
点击咨询
京东店铺
点击购买
40915_1M
40915_2M
40915_4M
NVIDIA RTX™ A4000
  • NVIDIA Ampere GPU 架构

  • 6,144 NVIDIA® CUDA® 核心

  • 192 NVIDIA® Tensor 核心

  • 48 NVIDIA® RT 核心

  • 16GB GDDR6 内存

  • 高达 448GB/s 内存带宽

  • 最大功耗: 140W

  • 绘图总线: PCI-E 4.0 x16

  • 主动式散热

  • 显示接口: DP 1.4 (4)

精巧设计. 强大的效能

NVIDIA Ampere架构建立在NVIDA RTX的功能之上,可提供下一代加速视觉运算。随着数以百万计的专业人员继续在任何地方工作,他们依靠各种设备来提供有效工作所需的功能和性能。

NVIDIA的RTX A4000是强大的单槽GPU ,为专业人士提供即时光线追踪,AI-加速计算和高性能绘图效能。 RTX A4000建立在NVIDIA Ampere架构之上,结合了48个第二代RT 核心,

192个第三代Tensor 核心,6,144个CUDA 核心以及16 GB的图形内存。 因此,您可以在桌式工作站上设计下一代产品,设计未来的城市景观,并创建明天的沉浸式娱乐体验。 凭借适用于各种工作站机箱的高能效,单插槽PCIe外形尺寸,您可以无限制地完成出色的工作。


性能特点

NVIDIA Ampere 架构

NVIDIA RTX A4000是功能强大的工作站GPU,可提供高性能的即时光线追踪,Al加速计算和专业图形渲染。基于TuringGPU主要增强SM功能 ,NVIDIAAmpere架构亦强化光线追踪运算,Tensor矩阵运算以及FP32和INT32运算的平行执行。

 


CUDA 核心

NVIDIA的Ampere架构的CUDA核心带来高达2倍的单精度浮点(FP32),相比上一代的吞吐量,为显卡提供了显著的效能改进工作流程,如3D模型的开发和计算的工作负载,例如仿真计算器辅助工程(CAE)。RTXA5000启用两个FP32主要数据路径,从而使FP32峰值运算次数增加了一倍。

第二代RT核心

结合第二代光线追踪引擎,NVIDIA Ampere GPU架构提供了令人难以置信的光线追踪渲染效能。单片RTX A4000卡可以渲染具有物理上准确的阴影,反射和折射的复杂专业模型,从而使用户能够立即洞察设计结果。基于RTX A4000的系统将与利用NVIDIAOptiX,MicrosoftDXR和Vulkan光线跟踪等API的应用程序协同工作,将为真正的交互式设计工作流提供强大的动力,以提供实时回馈,从而实现前所未有的生产力水平。与前一代产品相比,RTX A4000的光线追踪速度提高了2倍。这项技术还可以加快光线追踪运动模糊的渲染速度,以更快的速度获得更高的视觉准确性。

 


第三代Tensor核心

RTX A4000专为深度学习矩阵算术而构建,是神经网络训练和推理功能的核心,它包括增强的Tensor核心,可加速更多数据类型,并包括新的细粒度结构化稀疏性功能,与. 上一代相比可为Tensor矩阵提供高达2倍的吞吐量运算。新的Tensor核心将加速两种新的TF32和BFloat16精度模式。独立的浮点和整数数据路径可结合使用运算和寻址计算来更有效地执行工作负载。

PCle Gen 4

RTX A4000支援PCI Express Gen 4,该PCI Express Gen 4提供了PCle Gen 3的两倍带宽,进而提高了从CPU内存执行AI和数据科学等数据密集型任务的数据传输速度。



更高速的GDDR6内存

内建24GB GDDR6内存,与上一代产品相比,在光线跟踪,渲染和AI工作负载方面的吞吐量提高了71%。RTX A4000提供了业界最大的绘图内存空间,可以处理对延迟敏感的专业应用程序中的最大数据集和模型。

 

绘图记忆体上的错误修正码(ECC)

符合关键性任务应用程序对数据完整性的严格需求,为工作站提供无可比拟的计算精确度和可靠性。



第五代NVDEC引擎

NVDEC非常适合用于实时译码的转码和视频播放应用。下面视频编译码器都支持硬件加速译码: MPEG-2, VC-1, H.264 (AVCHD) ,H.265 (HEVC) ,VP8, VP9,和AV1。

 

第七代 NVENC引擎

NVENC可以执行最苛刻的4K或8K视频编码任务,以释放图形引擎和CPU进行其他运作。与软件式的x264编码器相比,RTX A4000提供更好的编码质量。



图形抢占

像素等级抢占提供更细微的控制,对时间相关的工作支持更佳,例如VR动态追踪。

 

计算抢占

指令等级抢占提供对计算工作更精细的控制,以避免长时间执行的应用程序独占系统资源或超时。



NVIDIA RTX IO

与使用Microsoft新的DirectStorage for Windows API的传统储存API相比,基于 GPU的无损耗解压缩性能提高了多达100倍和20倍,且CPU使用率更低。RTX IO以更有效的压缩形式将数据从存储设备移至GPU,并改善了I/ O性能。


 

 


显示特性

NVIDIA® Quadro® Mosaic 技术

将桌面和应用程序从单一工作站扩展到最多4个GPU和16个显示器,同时提供完整的效能和影像质量。


image 

DisplayPort 1.4a

支持最多四个 5K 屏幕 @ 60Hz,或每卡两个 8K 显示器。RTX A4000 支持 HDR 色彩,包括 4K @ 120Hz 10/12b HEVC 解碼以及高达 4K @ 60Hz 10b HEVC 编码。 每个 DisplayPort 连接头可驱动 4096x2160 @ 120 Hz 的超高分辨率及 30-bit 色彩。

 


NVIDIA® RTX™ 桌面管理软件

终端用户可获得前所未有的桌面体验控制权,从而在单个大型显示器或多显示器环境中提高生产率,特别是在当前大型,宽屏显示器时代。

 

OpenGL四缓冲立体支持

为专业应用程序提供流畅与身历其境的 3D 立体体验。

 


支援超高分辨率桌面

在最大 32K 桌面大小的高解析度显示器上获得更多 Mosaic 拓扑选择。

 

专业3D立体同步

在最大 32K 桌面大小的高分辨率显示器上获得更多 Mosaic 拓扑选择。

 


NVIDIA® Quadro Sync II

在单一系统的 8 个 GPU 中同步最多 32 个显示器的显示和画面输出 (透过两张 Sync II 适配卡连接),减少建立高阶影像可视化环境所需的机器数量。


GPU 架构

NVIDIA Ampere

CUDA 并行处理核心

6,144

NVIDIA Tensor 核心

192

NVIDIA RT 核心

48

单精度效能1

19.2 TFLOPS

RT Core 效能1

37.4 TFLOPS

Tensor 效能1

153.4 TFLOPS2

GPU 内存

16 GB GDDR6 with ECC

内存接口

256-bit

内存带宽

448 GB/s

最大功耗

140 W

绘图总线

PCI Express 4.0 x 16

显示接口

DP 1.4 (4)

板型

4.4" H x 9.5" L 单槽

产品重量

500 g

散热方式

主动式

外部电源连接器

1x 6-pin PCle

同步输出

支持 Quadro Sync II

主图_004