团体标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211134287.8 (22)申请日 2022.09.19 (71)申请人 广州图灵科技有限公司 地址 510000 广东省广州市天河区高普路 1033号501室 (72)发明人 周涛 何兴国 赖春媚  (51)Int.Cl. G06F 21/62(2013.01) G06F 17/18(2006.01) (54)发明名称 一种基于差分隐私的数据发布方法 (57)摘要 本发明公开了一种基于差分隐私的数据发 布方法, 涉及隐私保护技术领域, 其特点是安全 性高, 合理添加噪声保证了数据的安全性, 又不 失数据可用性。 本发明包括如下步骤: 实现差分 隐私算法; 直方图发布; 数据交互架构。 本发明能 在不影响数据整体发布的情况下, 对发布数据进 行合理加噪, 通过降低个体数据的真实性来防止 隐私数据在发布过程中遭到泄露的问题, 并在此 基础上保证 了发布数据的可用性。 权利要求书1页 说明书4页 附图2页 CN 115510477 A 2022.12.23 CN 115510477 A 1.一种基于 差分隐私的数据发布方法, 其特 征是, 包括如下步骤: S1、 实现差分隐私算法; S2、 直方图发布; S3、 数据交 互架构。 2.根据权利要求1所述的一种基于差分隐私的数据发布方法, 其特征在于: 所述S1中, 实现差分隐私算法, 具体为根据所给的数据集设计相 应的差分隐私保护, 算法使用数据扰 动的原理, 对数据 表进行随机扰动, 并且该模型对隐私保护强度进 行了量化分析, 可以根据 实际应用场景对隐私保护强度进行调整。 3.根据权利要求1所述的一种基于差分隐私的数据发布方法, 其特征在于: 所述S2中, 直方图发布是对数据集的分析, 该数据集根据其中一个数据属 性的值将数据集拆分为 “条 柱”, 并计算每 个条柱中的行 数。 4.根据权利要求1所述的一种基于差分隐私的数据发布方法, 其特征在于: 所述S3中, 数据交互架构需根据实现环境 不同分为交 互式数据发布和非交 互式数据发布两种。 5.根据权利要求4所述的一种基于差分隐私的数据发布方法, 其特征在于: 交互式数据 发布指在交互式环境下, 用户向数据管理者提出查询请求, 数据管理者根据查询请求对数 据集进行操作并将结果进 行干扰后反馈给用户, 用户不能看到原始数据集全貌从而保护数 据集中的个 体隐私。 6.根据权利要求4所述的一种基于差分隐私的数据发布方法, 其特征在于: 在非交互式 环境下, 数据管理者发布一个原始数据集的 “发布”版本, 用户可对该版本的数据集自行进 行所需的查询操作。 7.根据权利要求6所述的一种基于差分隐私的数据发布方法, 其特征在于: 由数据 管理 者发布的原 始数据集“发布”版本, 是一个不精确的数据集。权 利 要 求 书 1/1 页 2 CN 115510477 A 2一种基于差分隐私的数据发布方 法 技术领域 [0001]本发明涉及隐私保护技 术领域, 具体涉及一种基于 差分隐私的数据发布方法。 背景技术 [0002]21世纪人类已经进入了大数据时代, 信息技术的高速发展使得各类数据的发布、 采集、 存储和分析变得方便快捷。 例如, 医院电子病例记录病 人基本信息、 疾病信息及药物 购买记录; 金融业务服务会记录客户私有信息及交易行为; 人口普会查记录市民的家庭住 址及收入情况。 这些数据的收集和发布都会直接给个人隐私造成威胁, 如果数据拥有者直 接发布隐含的敏感信息而不采用合 适的数据保护技 术, 将可能造成个人的隐私泄 露。 [0003]如何发布和分析而又不泄露隐私信息是隐私保护技术的主要目的, 针对数据的隐 私保护问题, 国内外已经具备了一些研究成果。 例如, 数据匿名化可通过删除数据集的标识 符属性 (如姓名、 ID号等) 能够在一定程度上保护个人隐私; 基于分组的隐私保护模型通过 对记录的准标识符进行泛化、 压缩处理使得所有记录被划分到若干个等价类, 每个等价类 中的记录具有相同的准标识符值, 从而实现将一个记录隐藏在一组记录中。 但无论是数据 匿名化的方法还是基于 分组的隐私保护方法, 都可以通过对数据 表多次不同条件的查询或 是重构源数据导 致隐私信息在发布过程中遭 到泄露。 [0004]随着数据发布等应用需求的出现和发展, 如何安全地保护隐私数据不被 泄露已成 当下亟需解决的问题。 为此, 本发明提供了一种基于 差分隐私的数据发布方法。 发明内容 [0005]本发明所要解决的是现有的隐私保护方法中可通过多次不同条件查询或重构数 据源从而导 致隐私泄 露的问题, 从而提供一种基于 差分隐私的数据发布方法。 [0006]为解决上述问题, 本发明是通过以下技 术方案实现的: 一种基于 差分隐私的数据发布方法, 包括如下步骤: S1、 实现差分隐私算法; S2、 直方图发布; S3、 数据交 互架构。 [0007]优选地, 实现差分隐私算法, 具体为根据所给的数据集设计相应的差分隐私保护, 算法使用数据扰动的原理对数据 表进行随机扰动, 使得攻击者无论具有任何背景知识都无 法识别任何一条数据表中的数据, 并且该模型对隐私保护强度进行了量化分析, 可根据实 际应用场景对隐私保护强度进行调整。 [0008]优选地, 直方图发布, 具体为对数据集的分析, 该数据集根据其中一个数据属性的 值将数据拆 分为“条柱”, 并计算每个条柱中的行数。 例如, 直方图可能会计算数据集中达到 特定教育水平的人数。 单个行不可能同时具有属 性的两个值, 因此以这种 方式定义条柱可 以保证它们不相交。 因此, 直方图发布满足了并行组合的要求, 并且我们可以使用差 分私有 机制来释放所有"条柱 "计数, 总隐私预算仅为 ϵ。说 明 书 1/4 页 3 CN 115510477 A 3

.PDF文档 专利 一种基于差分隐私的数据发布方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于差分隐私的数据发布方法 第 1 页 专利 一种基于差分隐私的数据发布方法 第 2 页 专利 一种基于差分隐私的数据发布方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:11:14上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。