基于SGX的隐私保护机器学习的介绍与实践

播放视频

视频文档

基于SGX的隐私保护机器学习的介绍与实践

下载 35

英特尔AI实践日

发布于

1543

人观看

#信息技术

英特尔SGX技术是隐私计算中一个高效的方法，随着CPU上不断增强SGX的功能，越来越多的安全应用在数据保护，数据传输及程序运行的时候会采用SGX来实现，包括像联邦学习这样相对复杂的AI应用，本次分享将介绍英特尔SGX技术的基本原理以及在机器学习中隐私保护中的案例与实践。

图层2.png

俞巍

英特尔亚太和中国区数据中心AI销售和技术支持部人工智能架构师

曾在半导体行业从事图像处理，模式识别，机器学习等开发和研究工作10多年，2017年加入英特尔后支持并参与金融，医疗，互联网和制造业等多个行业的多个AI研究及应用落地项目。

展开查看详情

1 .基于的隐私保护机器学习的介绍与实践俞巍英特尔人工智能方案架构师

2 .法律声明 • 关于性能和基准测试程序结果的更多信息，请访问www.intel.com/benchmarks。 • 在特定系统的特殊测试中测试组件性能。硬件、软件或配置的差异将影响实际性能。当您考虑采购时，请查阅其他信息来源评估性能。关于性能和基准测试程序结果的更多信息，请访问www.intel.com/benchmarks。 • 英特尔技术特性和优势取决于系统配置，并可能需要支持的硬件、软件或服务得以激活。产品性能会基于系统配置有所变化。没有任何产品或组件是绝对安全的。更多信息请从原始设备制造商或零售商处获得，或请见intel.com。 • 预测或模拟结果使用英特尔内部分析或架构模拟或建模，该等结果仅供您参考。系统硬件、软件或配置中的任何差异将可能影响您的实际性能。 • 英特尔并不控制或审计第三方数据。请您审查该内容，咨询其他来源，并确认提及数据是否准确。 • 优化声明：英特尔编译器针对英特尔微处理器的优化程度可能与针对非英特尔微处理器的优化程度不同。这些优化包括 SSE2、SSE3 和 SSSE3 指令集和其他优化。对于非英特尔微处理器上的任何优化是否存在、其功能或效力，英特尔不做任何保证。 • 本产品中取决于微处理器的优化是针对英特尔微处理器。不具体针对英特尔微架构的特定优化为英特尔微处理器保留。请参考适用的产品用户与参考指南，获取有关本声明中具体指令集的更多信息。 • 本文中提供的所有信息可在不通知的情况下随时发生变更。关于英特尔最新的产品规格和路线图，请联系您的英特尔代表。 • 本文并未（明示或默示、或通过禁止反言或以其他方式）授予任何知识产权许可。 • 描述的产品可能包含可能导致产品与公布的技术规格有所偏差的、被称为非重要错误的设计瑕疵或错误。一经要求，我们将提供当前描述的非重要错误。 • 英特尔、英特尔标识以及其他英特尔商标是英特尔公司或其子公司在美国和/或其他国家的商标。其他的名称和品牌可能是其他所有者的资产。 ©英特尔公司版权所有

3 . 01 隐私保护机器学习介绍 02 SGX的介绍 03 英特尔软硬件对于SGX的支持 04 SGX的应用和实践目录 05 总结

4 .01 隐私保护机器学习介绍

5 .隐私保护机器学习 TEE 隐私保护机器学习是2021十大技术趋势之一 315 关注隐私的问题，曝光隐私泄露主要目的安全保护隐私 AI - 包括程序和数据安全安全加密各种计算打破数据壁垒机器学习负载 - 充分发挥数据潜力释放AI的潜能大数据 - 提高AI计算在安全保护下的效率

6 . 隐私保护机器学习重要应用-联邦学习联邦学习~= 分布式机器学习+安全 • 目标：数据使用权所有权分离 • 手段：数据不动模型动 • 问题：平衡高效性和准确性联邦学习IEEE P3652.1标准在2021年3月正式发布

7 .隐私保护机器学习总览 TEE 垂直行业 … 金融医疗互联网零售制造联邦学习 AI 模型数据运行态保护隐私保护机器学习应用高效 HE 隐私技术 TEE 可信计算空间 MPC 安全多方计算同态加密异构隐私 CPU FPGA GPU ASIC 计算平台 TEE

8 .02 SGX的介绍

9 . Intel® Software Guard Extensions技术主流金牌系列EPC size = 128GB 128GB 128GB Enclave模式下可以访问EPC 预先分配EPC大小是2 SGX Regular non-EPC memory EPC • 复杂的应用可以完全跑在的指数倍 SGX的飞地上得到保护 8GB16GB 32GB 64GB 128G B BIOS设置EPC 32G，那么非 EPC内存是232G SGX Regular non-EPC EPC 32GB memory Enclave SGX 优点 Enclave ➢提供对机密性和完整性的增强保护 Enclave ➢飞地（Enclave）的远程认证和配置 Apps ➢易于学习开发 ➢显著减小受攻击面 Guest OS ➢对性能的影响最小化 Host OS / VMM 注: Enclave Page Cache (EPC)

10 .Intel® Software Guard Extensions技术应用程序在内存中的分布 SGX 典型工作流程不可信部分可信部分/飞地访问控制 1.应用程序分为可信和不可信 Create Enclave Execute 2.创建并运行可信部分于可信内存中的飞地 Return Call Trusted Func. SSN: 999-84-2611 m8U3bcV#zP49Q 3.可信函数在飞地里运行的代码访 (etc.) 问的数据是明文 4.飞地里的数据还是在可信内存区域里，从不可信区域里看到的飞地 Privileged System Code 里的数据是密文 OS, VMM, BIOS, SMM, …

11 .03 英特尔软硬件对于SGX的支持

12 . 在数据中心 Intel® SGX EPC 的增长带来的提升可扩展性性能更大的飞地，最显著改善高可达1TB 3rd Gen Intel Xeon Scalable Processors 保护工作从飞地易部署的生态系 Intel® Xeon® Intel® SGX Card Intel® Xeon® E 卸载到硬件加速统的各种服务 Single Socket uses 3 Xeon E3 Mehlow-Refresh 512GB EPC per socket 器 E3: 128MB EPC 3 x 128MB EPC 256MB EPC (2 socket = up to 1TB EPC) 2018 2019 2020 2021 Larger memory enclaves to support Data Center workloads For additional information see: www.intel.com/trustsgx 注: Enclave Page Cache (EPC)

13 . 从TEE/SGX到应用的软件栈添加Guest OS/Lib OS层简化软件在SGX的移植和开发 ▪ 无需修改相应的模块代码，即可在SGX环境中执行 ▪ 在不受信任的主机接口上执行加密和语义检查，只需提供清单文件来配置应用程序环境和隔离策略，其余都可由Guest OS来自动完成 ▪ 作为英特尔® SGX 重要的开源兼容性工具，Graphene 可以通过对动态加载库，动态链接、多进程抽象以及文件认证等的支持，使用户可在 Graphene SGX 环境中直接运行原始应用 ▪ 在深度学习方法中常用的Tensorflow, Pytorch, OpenVINO™ 工具套件、 Analytic Zoo平台等，都可在这一环境中便捷地运行

14 .通过Analytic Zoo部署Trusted Cluster Serving 用户输入 In SGX enclave web Inference Engine 响应 model model Cluster Serving / TensorFlow 基于Graphene-SGX 的Trusted Cluster Serving ▪ 所以的模块运行在SGX的飞地里 ▪ 对于所有的通讯的安全传输使用TLS ▪ 加载加密的模型 (基于OpenVINO™ 和TensorFlow)

15 .04 SGX的应用和实践

16 . 为深度学习插上机密计算的翅膀百度 PaddlePaddle 借助英特尔 SGX 等技术进化为机密深度计算平台深度学习全功能 PaddlePaddle 2.0 结合基于硬件的升级后英特 SGX 的将提供可直接安装机密计算能力， EPC 内存将从单路使用的广泛应用于 128MB 跃升至 musl 预编译版本医疗、金融 512 GB 随着数据量和数据等众多领域格式的丰富，深度学习正在展现出超越传统机器学习的优势。同时，为打破数据提供方、基于硬件的英特尔® SGX 技术通过内存中的“飞地”(enclave) 保护数据建模方与使用方之间的割裂，机密百度 MesaTEE 内存安全可信计算平台，基于英特尔® SGX 技术，全部使用计算势在必行。内存安全的 Rust 语言开发 PaddlePaddle 百度 PaddlePaddle 借助 MesaTEE 实现了在嵌入式 TEE 环境中的运行，将二者有机结合，并保留了完整的深度学习功能响应了业界趋势，能在医疗、金融等 PaddlePaddle 与 MesaTEE 的联动众多领域大展拳脚。英特尔® SGX 软件防护扩展技术新一代英特尔® 至强® 可扩展处理器

17 . 隐私计算助力云-边协同 - 平安科技蜂巢基于英特尔® SGX 等技术保护边缘端隐私安全云端基于SGX和蜂巢隐私计算训练模型，并通过“飞基于硬件的英特尔 SGX 技术通过内存中的“飞地”之间构建的安全通道向边缘端推送最新模型地”(enclave) 保护数据随着数据来源增广，数据量骤增，蜂巢利用基于硬件的英特尔® SGX 技术，通过内存所有的服务都依赖中的“飞地”(enclave) 保护边端数据，保护边缘离于云会导致计算量线模型，安全进行联邦预测。爆炸，延迟增加等蜂巢算子结合LibOS支持自定义模型联邦预测/训练问题，云-边协同是有效的解决方案。同时，边端设备常常处于缺乏监控的支持深度学习，机器学习多种模型多种场景的应用，环境中，因此边端助力金融，医疗，车联网等领域模型，数据的安全也尤为重要。英特尔® SGX 软件防护扩展技术新一代英特尔® 至强® 可扩展处理器隐私安全云-边-终服务架构

18 . 填补数据应用与隐私保护之间的鸿沟 Analytics-Zoo Narwhal借助英特尔 SGX 等技术实现端到端的隐私保护机器学习和联邦学习打破金融行业数据孤岛，实现数据赋能 Narwhal Narwhal提供的联邦金融行业为了满足日能够让现有大数据和AI 益严格的监管和不断学习功能，能够帮金融应用直接运行在发展的业务，急需解行业客户在保护用户隐 enclave中，实现安全决大数据和AI应用中私的前提下，打破数据大数据分析 AI应用联邦学习可信的数据分析和机器随着大数据和AI技术的隐私保护以及数据孤岛，实现联合建模学习发展，金融行业对数孤岛问题据隐私和安全愈加重 Analytics-Zoo Narwhal 视，监管力度也在不隐私保护断加强。如何在数据 Analytics-Zoo Narwhal借助SGX和LibOS实现端到端的隐私保护机器学习和分析和AI应用中保护 Intel® SGX 联邦学习应用应用用户隐私，已成为金融行业关注的热点。 LibOS LibOS 基于SGX LibOS让现有业务应用无需更改即可运行在 “飞地”(enclave)中 Narwhal基于Intel 飞地飞地飞地 SGX实现了隐私保护的机器学习和联邦学基于硬件的英特尔 SGX 技术通过内存中的“飞地”(enclave) 保护数据习，能有效填补隐私大规模数据保护和数据应用中的鸿沟，帮助金融行业 Analytics-Zoo Narwhal 客户打破数据孤岛，英特尔® SGX 软件防护扩展技术实现数据赋能。新一代英特尔® 至强® 可扩展处理器

19 .为深度学习插上机密计算的翅膀蚂蚁集团和英特尔打造端到端Privacy Preserving Machine Learning解决方案英特尔SGX 2.0和英特尔DL Boost技术基于Analytics Zoo的端到端大数据AI的PPML架构 Occlum LibOS提供为基于SGX的端到端分端到端PPML解决方了可信硬件执行环境，布式安全深度学习负载案，为蚂蚁集团提供了兼得数据安全和高性能提供了200%的性能加数据安全隐私保护的大计算速数据AI平台 Privacy Preserving Machine Learning能够充分保护机器学习/ 深度学习中的用户数据和模型，在金融，医疗，推荐等诸多应英特尔®开源的Analytics Zoo提供了统一的大数据和AI计算平台，实现了端到端的Privacy Preserving Machine Learning解决方案用有广泛需求。英特尔® oneAPI Deep Neural Network Library (oneDNN) 通过Intel® 基于英特尔SGX DL Boost技术加速深度学习工作负载的性能 2.0，蚂蚁集团的蚂蚁集团开源的 Occlum提供了基于Intel® SGX的内存安全，支持多 Occlum和英特尔开进程的Library OS, 支持运行深度学习工作负载源的Analytics Zoo实软件栈（从上到下依次）包括：现的大数据AI安全计 • 应用负载算平台可以构建端到 • 端到端大数据AI平台端，分布式的高性能 • 计算框架 PPML应用。英特尔® DL • 安全特性 Boost 英特尔® SGX

20 . 英特尔至强可扩展处理器助力富数科技Avatar系统 ® ® 富数科技Avatar系统正在基于新一代英特尔至强可扩展处理器开发，集成富数科 ® ® 技自研算法，硬件定向加速，可助力精准营销、智能风控、联合资产定价等场景。 Local Data1 Enclave3 X3 Share Mask Share Local Data2 Local Data3 Data share X Data share Y Enclave1 Enclave2 guest host X1 Share X2 Share 助力Avatar 提升联邦学习训练性能助力Avatar MPC组件抗合谋攻击安全英特尔® SGX 软件防护扩展技术新一代英特尔® 至强® 可扩展处理器

21 .05 总结

22 .总结 i. 联邦学习和模型保护是隐私保护机器学习上重要的应用 ii. SGX是隐私保护机器学习中高效的隐私保护技术 iii. 新一代英特尔至强可扩展处理器支持的SGX的EPC容量提升 ® ® 3~4个数量级，支持多达1TB的容量 iv. SGX可以通过lib OS来简化开发，支持复杂而且依赖多的应用

23 .谢谢！

2点赞

2收藏

35下载