NVIDIA L40S 为数据中心赋予出色的 AI 和图形性能
L40S
生成式 AI 正在推动转型变革,为各行各业开辟领域迎来新的机遇。要借助 AI 实现转 型,企业需要更多的计算资源、更大的规模和更为广泛的功能来满足不断增长的多种复 杂工作负载的需求。
NVIDIA L40S GPU 是一款适用于数据中心的功能强大的通用型 GPU,可为下一代 AI 应用提供端到端加速服务 ‒ 从生成式 AI 以及模型训练和推理到 3D 图形、渲染和视 频应用。
加速下一代工作负载
生成式 AI
大语言模型(LLM)训练和推理
NVIDIA Omniverse™ Enterprise
渲染和 3D 图形
串流和视频内容
微调 LoRA(GPT-40B、GPT-175B):global trainbatch size :128 (序列),序列长度:256 (tokens )。NVIDIA HGX™ A100(8 片 A100) 与搭载了 4 片 L40S GPU 两套系统对比。性能参 数基于预发行版本,可能会发生变化。
Stable Diffusion v2.1。相对加速用于生成 512x512分辨率的图像。NVIDIA HGX A100 (8 片A100)与搭载了 4 片 L40S GPU 两套系统对比。性能参数基于预发行版本, 可能会发生变化。
由 NVIDIA Ada Lovelace 架构提供支持
第四代 Tensor Core
针对结构化稀疏和优化的 TF32 格式提供硬件支持, 为 AI 和数据科学模型训练提供 开箱即得的性能提升。可利用 DLSS 技术加速 AI 增强型图形功能,从而在特定应用中 提供更高的分辨率和更出色的性能。
第三代 RT Core
增加的吞吐量以及并发光线追踪和着色功能可提升光线追踪性能,从而加快产品设计以 及建筑、工程和施工工作流程的渲染。借助硬件加速的动态模糊和令人惊叹的实时动 画,查看逼真的设计。
Transformer 引擎
Transformer 引擎可显著加速 AI 性能,并提高训练和推理的显存利用率。凭借 Ada Lovelace 第四代 Tensor Cores 的强大功能,Transformer 引擎可以智能扫描 Transformer 架构神经网络的各个层,并在 FP8 和 FP16 精度之间自动重铸,从而 提供更快的 AI 性能并加速训练和推理。
数据中心就绪
L40S GPU 针对全天候企业数据中心运营进行了优化,并由 NVIDIA 提供设计、构 建、测试和支持,以确保更大限度地实现出色的性能、耐用性和正常运行时间。L40S GPU 符合最新的数据中心标准,支持网络设备构建系统 (NEBS) 3 级标准,并采用了 信任根技术的安全启动功能,可为数据中心提供额外的安全保护层。
技术规格
GPU 架构 | NVIDIA Ada Lovelace 架构 |
GPU 显存 | 支持 ECC 的 48GB GDDR6 |
显存带宽 | 864GB/ 秒 |
连接接口 | PCIe 4.0 x16:64GB/s 双向 |
NVIDIA Ada Lovelace 架构 基于 CUDA® 核心 | 18,176 |
NVIDIA 第三代 RT Core | 142 |
NVIDIA 第四代 Tensor Core | 568 |
RT Core 性能 TFLOPS | 209 |
FP32 TFLOPS 单精度浮点运算能力 | 91.6 |
TF32 Tensor Core TFLOPS | 183 I 366* |
BFLOAT16 Tensor Core TFLOPS | 362.05 I 733* |
FP16 Tensor Core | 362.05 I 733* |
FP8 Tensor Core | 733 I 1,466* |
INT8 Tensor TOPS 峰值运算能力 | 733 I 1,466* |
INT4 Tensor TOPS 峰值运算能力 | 733 I 1,466* |
外形规格 | 11.2厘米 (高) x 26.7厘米 (长) ,双插槽 |
显示端口 | 4 x DisplayPort 1.4a |
最大功耗 | 350W |
电源接口 | 16 针 |
散热 | 被动 |
vGPU 软件支持 | 是 |
支持的 vGPU 配置文件 | 查看 vGPU 许可指南 |
NVENC I NVDEC | 3x l 3x (包括 AV1 编码和解码) |
使用信任根进行安全启动 | 是 |
NEBS | 3 级标准 |
MIG 支持 | 否 |
支持 NVIDIA® @ NVLink® | 否 |
* 采用稀疏技术
深圳市南山区南头街道马家龙社区南山大道3186号明江大厦C单元
(联系就说在DAV音视工程网上看到的)
sales@anycoms.com
深圳九州互联科技有限公司(九州互联Anycoms)是一家网络通信光交换和传输产品的研发、制造商。九州互联Anycoms产品涉及波分光传输、OTN智能光网络、光学放大器、光学保护、光学器件产品系列等。九州互联专注于光传输和连接方面的创新。九州互联对光学和网络设备的了解使Anycoms能够成为您的优质供应商,提供100Mb到200G的光学传输和连接解决方案。九州互联为您提供提高网络效率的创新解决方案。