NVIDIA L20 Tensor Core GPU 基于NVIDIAAda Lovelace 架构构建,能够为光线追踪和基于 AI 的神经图形提供革命性的性能。该架构显著提高了 GPU 性能基准,更代表着光线追踪和神经图形的转折点。致力于打造出色的游戏与创作、专业图形、A1和计算性能。
优势和特点
第四代 Tensor Core
NVIDIA Tensor Core 推动并加快了 A| 技术的变革,包括 NVIDIA DLSS 以及可让帧率更大幅提升的全新 NVIDIA DLSS 3。凭借英伟达在 Hopper H100 数据中心GPU 上首次推出的全新 FP8 Transformer 引擎,Ada 的全新第四代 TensorCore 拥有不可思议的飞快速度,可将吞吐量提升 4 倍,达到1.4 Tensor-peta-FLOPS。
第三代 RT Core
NVIDIA 发明的 RT Core 在视频游戏中实现了实时光线追踪。这种搭载在 GPU 上的特殊核心专为处理性能需求密集的光线追踪工作负载而设计。Ada 架构采用的第3代 RTCore 不仅将光线与三角形求交性能提高了一倍,还将 RT-TFLOP 峰值性能提高了一倍之多。新款 RT Core 还配备全新 Opacity Micromap(OMM)引擎和 Displaced Micro-Mesh(DMM)引擎。OMM 引擎可大幅提升对 alpha 测试纹理进行光线追踪的速度,此类纹理通常应用于树叶、颗粒和围栏。DMM 引擎能够以近乎 9 倍的速度构建光线追踪边界体积层次结构(BVH),而所占用的显存只有之前的二十分之一。从而实现几何复杂场景的实时光线追踪。
着色器执行重排序
高级光线追踪技术需要计算同一场景中数百万条光线照射在诸多不同类型材质上的效果,这就使得着色器只能低效地处理一系列截然不同的工作负载。(在渲染 3D 场景时,着色器用于计算恰当的亮度、暗度和颜色级别。每一款现代游戏都需要使用到着色器。)
GPU架构 | NVIDIA Ada Lovelace 架构 |
GPU 显存 | 48 GB GDDR6 W/ECC |
GPU 显存带宽 | 864 GB/s |
INT8lFP8 Tensor Core | 239 239 TFLOPS |
BF16lFP16 Tensor Core | 119.5 119.5TFLOPS |
TF32 Tensor Core | 59.8 TFLOPS |
FP32 | 59.8 TFLOPS |
最大功耗 | 275W |
RT Core | N/A |
L2 Cache | 96 MB |
Form Factor | 2-slot FHFL 3 NVENC(+AV1)3 NVDEC 4 NVJPEG |
Media Engine | PCle Gen4 x16: |
Interconnect | 64 GB/s |
散热 | 被动冷却 |