隐私计算
名詞解析
随着大数据时代的到来,如何保护隐私数据和防止敏感信息泄露成为当前面临的重大挑战。在具体应用中,隐私即为数据,所有者不愿意被披露的敏感信息,包括敏感数据以及数据所表征的特性。含有隐私的信息在网络中传播的过程中,隐私感知、隐私保护、隐私分析都依赖于对隐私信息的定量化描述、隐私信息处理过程中形式化描述、隐私度量演化的公理化描述体系。
隐私计算
介绍
随着大数据时代的到来,如何保护隐私数据和防止敏感信息泄露成为当前面临的重大挑战。在具体应用中,隐私即为数据,所有者不愿意被披露的敏感信息,包括敏感数据以及数据所表征的特性。含有隐私的信息在网络中传播的过程中,隐私感知、隐私保护、隐私分析都依赖于对隐私信息的定量化描述、隐私信息处理过程中形式化描述、隐私度量演化的公理化描述体系。隐私计算模型是研究基于多维度的隐私定义、刻画及演化理论构建的计算模型,可利用信息论、博弈论、优化理论、计算复杂性理论等工具,给出隐私的量化定义,建立一整套隐私信息处理过程中隐私变换的描述和计算规则,揭示隐私度量、隐私泄露收益损失比、隐私保护与分析复杂性代价以及隐私保护效果之间的内在联系,为隐私保护技术提供一套科学的、体系化的理论工具。
隐私计算的概念
隐私计算是面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄漏代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。
隐私计算涉及6个因素 (X,S,R,C,φ,∑) 。X为隐私信息集合,其概率分布的定义对于隐私度量紧密相关;S为信息所有者集合;R为信息接收者集合(信息接收者拥有其知识背景、兴趣点、主观感受和理解力等);C为隐私泄露收益损失比;φ为信息利用时的约束条件集合(包括含时间、空间、所用设备等环境条件);∑为对隐私信息操作的集合,隐私感知、隐私保护、隐私分析、隐私信息的交换和二次传播、隐私信息更新等都可定义为对隐私信息集合的特定操作,将其抽象为符号化的描述,根据取值集合上定义的隐私度量可以定义隐私运算的规则,形成隐私计算的公理化体系。
隐私计算模型
隐私计算模型的核心是刻画隐私度量I、隐私保护复杂性代价E、隐私保护效果G以及隐私泄露收益损失比C 4个量之间的关系,其中:
隐私计算模型的研究范围为:1)隐私信息产生:用户在使用互联网服务过程中产生的图片、位置、兴趣爱好、电话号码等各类文本、图像或音视频等隐私信息;2)隐私感知:从包含隐私的信息中构建隐私变量集合,或从变量集合中确定变量的取值或取值范围,产生隐私元数据,对隐私进行标记和编码,确定隐私变量的概率分布,从而对隐私变量中隐私度量的大小进行计算,为实施隐私保护提供支撑;3)隐私保护:根据隐私感知得到的数据及其标记,选用相应隐私保护方法,包括密码学方法、信息隐藏方法和数据扰乱方法;4)隐私发布:研究隐私信息在公众网络中传播的隐私计算机制;5)隐私信息存储:主要研究隐私保护之后的数据高效存储,使数据如何分类、组织、快速检索、判断不同方案的隐私保护信息的同源去重、同源同系统/同源不同系统的一致性维护;6)隐私信息的融合处理:研究设计一套协议和封装描述方法,可根据不同的隐私属性、场景、隐私信息等级来自适应地选择不同的隐私保护措施,充分发挥现有隐私保护技术;7)隐私交换:研究新型的代理重加密、防密钥泄漏、跨系统交换的访问控制以及追责等机制来完成不同信息系统间的隐私信息交互;8)隐私分析:从施加隐私保护方案的数据中提取隐私信息取值或确定其取值范围的过程,是隐私保护的逆过程;9)隐私销毁:在不再需要隐私信息,或隐私信息所有者希望终止隐私信息传播的场景下,需要将隐私数据永远不可逆删除或销毁的确定性删除技术。
综上,研究者提出的隐私保护技术仅是隐私计算模型的部分内容,但不足以涵盖隐私计算模型。为此,需要分析归纳泛在网络和大数据环境下信息服务演化规律,提炼隐私保护的需求。研究基于多维度的隐私定义、刻画及演化理论,构建隐私计算模型,为隐私保护技术提供一套科学的、体系化的理论工具。