最近,NVIDIA 在 Hopper 架构中引入了一项开创性的安全功能,以保护敏感数据、AI 模型和应用程序。这项名为NVIDIA 机密计算 的新功能提供了一种基于硬件的解决方案,可以安全地处理正在使用的数据和代码,防止未经授权的访问和修改。
无论是部署在本地、边缘还是云端,敏感数据都容易受到外部攻击和内部威胁。NVIDIA 机密计算可确保您最关键的数据和代码安全无虞,同时享受 NVIDIA H200 和 H100 Tensor Core GPU 的先进加速。
了解 NVIDIA 机密计算
简单来说,“机密计算”(CC)通过在基于硬件且经过证明的可信执行环境(TEE)中执行计算来保护正在使用的数据。
NVIDIA H200 和 H100 GPU 在 CPU 上配备 CVM(机密虚拟机)TEE,锚定在片上信任根 (RoT) 中。在 CC-On 模式下启动时,将启用硬件保护以确保代码和数据的机密性和完整性。这里的“机密性”是指防止攻击者访问数据或代码,“完整性”是指防止在执行过程中进行修改。
工作原理
1、信任链:安全且经过测量的启动序列建立了信任链。
2、安全连接:SPDM(安全协议和数据模型)会话促进与 CPU TEE 中的驱动程序的安全连接。
3、证明报告:经过加密签名的证明报告可验证系统完整性。
4、GPU 认证:必须认证 GPU 为支持机密计算的合法 NVIDIA GPU,涉及设备唯一私钥和经过认证的公钥。GPU 不得因 CC 被吊销,并且必须验证认证报告。
5、安全通道建立:验证成功后,CVM 中的 NVIDIA 驱动程序使用会话密钥与 GPU 硬件 TEE 建立安全通道,以传输数据、执行计算并检索结果。CVM 和 GPU 之间的通信通过 CVM 外部的共享内存区域进行,并采用 AES-GCM 加密以防止主机系统读取此通信。
6、内存管理:GPU 将所有输入复制并解密到其内部内存,以纯文本形式运行所有内容,同时阻止直接访问。性能计数器被禁用以防止旁道攻击。
此过程将机密计算环境从 CVM(或安全区域)扩展到 GPU,并具有证明、加密通信和内存隔离。
好处和积极影响
NVIDIA 机密计算具有多项显著优势:
基于硬件的安全性和隔离:在任何环境中实现虚拟机 (VM) 的完全隔离 - 本地、边缘或云中。整个工作负载都通过内置硬件防火墙进行保护,可提供前所未有的保护。
通过设备认证实现可验证性:确保只有经过授权的最终用户才能部署数据和代码,以便在 H200 或 H100 的 TEE 中执行。设备认证可验证 NVIDIA GPU 的真实性,确保固件完整性和正确更新。
防止未经授权的访问:敏感数据、AI 工作负载和知识产权受到保护,始终保持机密性和完整性。未经授权的实体(包括虚拟机管理程序、云提供商、主机操作系统以及任何具有物理访问权限的人)在执行期间被阻止查看或修改 AI 应用程序和数据。
无需更改应用程序代码:机密计算功能可无缝运行,无需更改 GPU 加速工作负载的代码。
支持机密计算的 GPU 可实现多种用例,其中安全性、隐私性和法规遵从性至关重要。例如,即使在共享或远程基础设施上大规模分布和部署,也可以保护专有 AI 模型的知识产权。
隐私和机密性在 AI 训练和推理过程中得到保护,尤其是在医疗、金融和公共部门等数据敏感且受监管的行业。促进多方之间的安全协作,以在参与站点之间构建和改进 AI 模型,适用于医学成像、药物开发和欺诈检测等用例。组织、政府和个人可以将 AI 工作负载外包给云提供商,同时确保免受底层基础设施的保护。
随着对 GPU 资源的需求不断激增,尤其是对于人工智能和机器学习应用的需求,确保这些资源的安全性和易于访问变得至关重要。
捷智算平台的去中心化架构旨在使全球尚未开发的 GPU 资源的访问变得民主化,并高度强调安全性和用户便利性。让我们来揭秘捷智算平台如何保护您的 GPU 资源和数据,并确保去中心化计算的未来既高效又安全。