NVIDIA L40S GPU_深圳市捷易科技有限公司

NVIDIA L40S GPU可为您提供突破性的多工作负载性能体验。精心设计的 L40S GPU 将强大的 AI 计算性能与出色的图形和媒体加速功能相结合，旨在为新一代数据中心工作负载提供支持。从生成式 AI 和大型语言模型（LLM）推理与训练，到 3D 图形、渲染和视频，都能应对自如。

第四代 Tensor Core

针对结构化稀疏和优化的 TF32 格式提供硬件支持，为更快的 AI 和数据科学模型训练提供开箱即得的性能提升。可利用DLSS技术加速 AI 增强型图形功能，从而在特定应用中提供更高的分辨率和更出色的性能。

第三代 RT Core

增加的吞吐量以及并发光线追踪和着色功能可提升光线追踪性能，从而加快产品设计以及架构、工程和施工工作流程的渲染。可利用硬件加速的动态模糊技术提供令人惊艳的实时动画效果，以帮助了解逼真设计的实际效果。

CUDA Core 核心

加速单精度浮点（FP32）吞吐量和更高的能效可显著提升 3D 模型开发和计算机辅助工程（CAE）仿真等工作流程的性能。可使用增强的 16-bit Math Capability（BF16）支持混合精度工作负载。

Transformer 引擎

Transformer 引擎可显著加速 AI 性能，并提高训练和推理的内存利用率。凭借 Ada Lovelace 第四代 Tensor Core 的强大功能，Transformer 引擎可以智能地扫描转换器架构神经网络的各个层，并在 FP8 和 FP16 精度之间自动重铸，从而提供更快的 AI 性能并加速训练和推理。

效率和安全性

L40S GPU 针对全天候企业数据中心运营进行了优化，经过 NVIDIA 的精心设计、构建、测试和支持，可确保更大限度地提高性能、耐用性和正常运行时间。L40S GPU 符合新数据中心标准，支持网络设备构建系统（NEBS）3 级标准，并且采用了信任根技术实现安全启动，可为数据中心提供额外的安全保护。

DLSS 3

依靠 NVIDIA DLSS 3 的加持，L40S GPU 可以支持超快渲染和更高帧率，使画面有如行云流水。这项突破性的帧生成技术利用深度学习及 Ada Lovelace 架构和 L40S GPU 中的新一代硬件创新（包括第 4 代 Tensor Core 和光流加速器）来提升渲染性能，在提高每秒帧数（FPS）的同时显著降低延迟。

注：与 NVIDIA 产品相关的图片或视频（完整或部分）的版权均归 NVIDIA Corporation 所有。