数据增强风险被低估，新算法“降服”维数依赖

发布时间：2021-04-01 10:42:12 所属栏目：动态来源：互联网

导读：如今，数据是推动人工智能创新的核心要素。但数据的安全和隐私问题限制了数据充分释放其潜能。一直以来，微软都倡导打造负责任的人工智能，并正在开发和利用多种技术以提供更强大的隐私保护、确保数据安全。本文将为大家介绍微软亚洲研究院在机器学习隐私研

如今，数据是推动人工智能创新的核心要素。但数据的安全和隐私问题限制了数据充分释放其潜能。一直以来，微软都倡导打造负责任的人工智能，并正在开发和利用多种技术以提供更强大的隐私保护、确保数据安全。本文将为大家介绍微软亚洲研究院在机器学习隐私研究的最新进展，以及讨论在深度学习中的隐私攻击与保护。

今天，数据已成为推动人工智能创新的燃料，但同时也是组织和个人所拥有的宝贵资产。因此，只有在充分保护数据安全和隐私的前提下，云计算和人工智能的连接才有可能释放出数据的全部潜能，实现数据效能的共享。

众所周知，在存储和传输过程中加密数据早已是行业标准。而机密计算（Confidential Computing）则可以进一步保护计算过程中使用的数据，降低恶意软件、内部攻击和恶意或疏忽管理员等漏洞的风险。此前的文章“ 如何在机器学习的框架里实现隐私保护？ ” ，已经对机密计算做过一些介绍，包括可信执行环境、同态加密、安全多方计算，和联邦学习。这些技术构成了保护隐私的组合套件，通过将它们一起使用，能够对不同场景构建合适的隐私和安全解决方案。

机密计算主要研究计算过程中数据的保护与攻击方法。那么发布计算结果会暴露数据隐私吗？比如，发布一个训练好的深度神经网络模型会暴露它的训练数据吗？如何控制和降低计算结果中隐私暴露的风险？下面我们将对这些问题展开探讨。

训练好的模型真的会泄露隐私吗？

直观上来说，这是一个很难回答的问题：一方面训练好的神经网络一定和训练数据有关系，互信息大于零；另一方面，从模型参数中恢复训练数据是一个求反问题，想要实现精确恢复非常困难。一个相对较容易的概念是成员推断（Membership Inference, MI）——给定一个训练好的模型，判断某一个特定样本是否来自训练集（如图1所示）。如果成员推断准确率很高，那么模型泄露隐私的风险就会相对较大

（编辑：PHP编程网 - 黄冈站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

从历史到技术突破一文	四川诺恒信通科技有限
最新报告供应链问题依	国家工业互联网大数据