加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 黄冈站长网 (http://www.0713zz.com/)- 数据应用、建站、人体识别、智能机器人、语音技术!
当前位置: 首页 > 站长资讯 > 动态 > 正文

数据增强风险被低估,新算法“降服”维数依赖

发布时间:2021-04-01 10:42:12 所属栏目:动态 来源:互联网
导读:如今,数据是推动人工智能创新的核心要素。但数据的安全和隐私问题限制了数据充分释放其潜能。一直以来,微软都倡导打造负责任的人工智能,并正在开发和利用多种技术以提供更强大的隐私保护、确保数据安全。本文将为大家介绍微软亚洲研究院在机器学习隐私研

如今,数据是推动人工智能创新的核心要素。但数据的安全和隐私问题限制了数据充分释放其潜能。一直以来,微软都倡导打造负责任的人工智能,并正在开发和利用多种技术以提供更强大的隐私保护、确保数据安全。本文将为大家介绍微软亚洲研究院在机器学习隐私研究的最新进展,以及讨论在深度学习中的隐私攻击与保护。

今天,数据已成为推动人工智能创新的燃料,但同时也是组织和个人所拥有的宝贵资产。因此,只有在充分保护数据安全和隐私的前提下,云计算和人工智能的连接才有可能释放出数据的全部潜能,实现数据效能的共享。

众所周知,在存储和传输过程中加密数据早已是行业标准。而机密计算(Confidential Computing)则可以进一步保护计算过程中使用的数据,降低恶意软件、内部攻击和恶意或疏忽管理员等漏洞的风险。此前的文章“ 如何在机器学习的框架里实现隐私保护? ” ,已经对机密计算做过一些介绍,包括可信执行环境、同态加密、安全多方计算,和联邦学习。这些技术构成了保护隐私的组合套件,通过将它们一起使用,能够对不同场景构建合适的隐私和安全解决方案。

机密计算主要研究计算过程中数据的保护与攻击方法。那么发布计算结果会暴露数据隐私吗?比如,发布一个训练好的深度神经网络模型会暴露它的训练数据吗?如何控制和降低计算结果中隐私暴露的风险?下面我们将对这些问题展开探讨。

训练好的模型真的会泄露隐私吗?

直观上来说,这是一个很难回答的问题:一方面训练好的神经网络一定和训练数据有关系,互信息大于零;另一方面,从模型参数中恢复训练数据是一个求反问题,想要实现精确恢复非常困难。一个相对较容易的概念是成员推断(Membership Inference, MI)——给定一个训练好的模型,判断某一个特定样本是否来自训练集(如图1所示)。如果成员推断准确率很高,那么模型泄露隐私的风险就会相对较大

(编辑:PHP编程网 - 黄冈站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读