什么是NVIDIA 机密计算？使用 NVIDIA 机密计算提高安全性详解

发布时间： 2024-08-22 10:33

最近，NVIDIA 在 Hopper 架构中引入了一项开创性的安全功能，以保护敏感数据、AI 模型和应用程序。这项名为NVIDIA 机密计算的新功能提供了一种基于硬件的解决方案，可以安全地处理正在使用的数据和代码，防止未经授权的访问和修改。

无论是部署在本地、边缘还是云端，敏感数据都容易受到外部攻击和内部威胁。NVIDIA 机密计算可确保您最关键的数据和代码安全无虞，同时享受 NVIDIA H200 和 H100 Tensor Core GPU 的先进加速。

NVIDIA 机密计算

了解 NVIDIA 机密计算

简单来说，“机密计算”（CC）通过在基于硬件且经过证明的可信执行环境（TEE）中执行计算来保护正在使用的数据。

NVIDIA H200 和 H100 GPU 在 CPU 上配备 CVM（机密虚拟机）TEE，锚定在片上信任根 (RoT) 中。在 CC-On 模式下启动时，将启用硬件保护以确保代码和数据的机密性和完整性。这里的“机密性”是指防止攻击者访问数据或代码，“完整性”是指防止在执行过程中进行修改。

工作原理

1、信任链：安全且经过测量的启动序列建立了信任链。

2、安全连接：SPDM（安全协议和数据模型）会话促进与 CPU TEE 中的驱动程序的安全连接。

3、证明报告：经过加密签名的证明报告可验证系统完整性。

4、GPU 认证：必须认证 GPU 为支持机密计算的合法 NVIDIA GPU，涉及设备唯一私钥和经过认证的公钥。GPU 不得因 CC 被吊销，并且必须验证认证报告。

5、安全通道建立：验证成功后，CVM 中的 NVIDIA 驱动程序使用会话密钥与 GPU 硬件 TEE 建立安全通道，以传输数据、执行计算并检索结果。CVM 和 GPU 之间的通信通过 CVM 外部的共享内存区域进行，并采用 AES-GCM 加密以防止主机系统读取此通信。

6、内存管理：GPU 将所有输入复制并解密到其内部内存，以纯文本形式运行所有内容，同时阻止直接访问。性能计数器被禁用以防止旁道攻击。

此过程将机密计算环境从 CVM（或安全区域）扩展到 GPU，并具有证明、加密通信和内存隔离。

好处和积极影响

NVIDIA 机密计算具有多项显著优势：

基于硬件的安全性和隔离：在任何环境中实现虚拟机 (VM) 的完全隔离 - 本地、边缘或云中。整个工作负载都通过内置硬件防火墙进行保护，可提供前所未有的保护。
通过设备认证实现可验证性：确保只有经过授权的最终用户才能部署数据和代码，以便在 H200 或 H100 的 TEE 中执行。设备认证可验证 NVIDIA GPU 的真实性，确保固件完整性和正确更新。
防止未经授权的访问：敏感数据、AI 工作负载和知识产权受到保护，始终保持机密性和完整性。未经授权的实体（包括虚拟机管理程序、云提供商、主机操作系统以及任何具有物理访问权限的人）在执行期间被阻止查看或修改 AI 应用程序和数据。
无需更改应用程序代码：机密计算功能可无缝运行，无需更改 GPU 加速工作负载的代码。

支持机密计算的 GPU 可实现多种用例，其中安全性、隐私性和法规遵从性至关重要。例如，即使在共享或远程基础设施上大规模分布和部署，也可以保护专有 AI 模型的知识产权。

隐私和机密性在 AI 训练和推理过程中得到保护，尤其是在医疗、金融和公共部门等数据敏感且受监管的行业。促进多方之间的安全协作，以在参与站点之间构建和改进 AI 模型，适用于医学成像、药物开发和欺诈检测等用例。组织、政府和个人可以将 AI 工作负载外包给云提供商，同时确保免受底层基础设施的保护。

随着对 GPU 资源的需求不断激增，尤其是对于人工智能和机器学习应用的需求，确保这些资源的安全性和易于访问变得至关重要。

捷智算平台的去中心化架构旨在使全球尚未开发的 GPU 资源的访问变得民主化，并高度强调安全性和用户便利性。让我们来揭秘捷智算平台如何保护您的 GPU 资源和数据，并确保去中心化计算的未来既高效又安全。

企业如何轻松租用 GPU 服务器？租用 GPU 服务器最全指南

哪些GPU适用于 AI 项目？2024年适用于 AI 推理任务的5大GPU推荐

热门产品