团体标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211143576.4 (22)申请日 2022.09.20 (71)申请人 成都比特信安科技有限公司 地址 610000 四川省成 都市中国 (四川) 自 由贸易试验区成都高新区云华路333 号8栋6层 (72)发明人 吴鸿钟 李世亮 汪广锐 张桂银  (74)专利代理 机构 北京睿博行远知识产权代理 有限公司 1 1297 专利代理师 计小玲 (51)Int.Cl. G06F 21/62(2013.01) (54)发明名称 一种利用矩阵替换实现数据脱敏的方法 (57)摘要 本发明提供了一种利用矩阵替换实现数据 脱敏的方法, 包括: 步骤1: 获取待脱敏数据, 并确 定待脱敏数据的数据类型组合, 来从组合数据库 中调取数据编码策略; 步骤2: 按照数据编码策略 对待脱敏数据进行数据编码, 构建得到待脱 敏矩 阵; 步骤3: 分析待脱敏矩阵中每个待脱敏元素的 脱敏系数以及脱敏属性, 并按照脱敏系数以及脱 敏属性, 对需替换的元素进行替换, 得到脱敏数 据。 通过确定待脱敏数据的数据类型, 来调取编 码策略构建矩阵, 并根据矩阵中元素的系数与属 性, 进行元素替换, 得到脱敏数据, 便于对数据的 有效保护。 权利要求书3页 说明书10页 附图1页 CN 115422594 A 2022.12.02 CN 115422594 A 1.一种利用矩阵替换实现数据脱敏的方法, 其特 征在于, 包括: 步骤1: 获取待脱敏数据, 并确定所述待脱敏数据的数据类型组合, 来从组合数据库中 调取数据编码策略; 步骤2: 按照所述数据编码策略对所述待脱敏数据进行数据编码, 构建得到待脱敏矩 阵; 步骤3: 分析所述待脱敏矩阵中每个待脱敏元素的脱敏系数以及脱敏属性, 并按照所述 脱敏系数以及脱敏属性, 对需替换的元 素进行替换, 得到脱敏 数据。 2.如权利要求1所述的利用矩阵替换实现数据脱敏的方法, 其特征在于, 获取待脱敏数 据之前, 包括: 对输入界面进行第一 提取, 同时, 对输入界面上的输入信息进行第二 提取; 根据第一提取结果, 确定所述输入界面的隐私输入项, 并分别确定每个隐私输入项的 预设隐私性; 根据第二 提取结果, 确定每 个隐私输入项的填选准确性; 其中, 表示基于第二提取结果确定的对应隐私输入项的输入信息; 表示对应隐 私输入项的标准信息; 表示基于第二提取结果确定的对 应隐私输入项的有效信息, 且有 效信息的信息量小于对应输入信息的信息量; 表示针对对应隐私输入项的输入信息 的第一参考系数; 表示针对对应隐私输入项的有效信息的第二参考系数; 表示对应 隐私输入项的填选准确性; 基于输入项‑隐私性‑权重映射表, 获取与所述预设隐私性匹配的允许脱敏权 重; 基于输入项‑准确性‑权重映射表, 获取与所述 填选准确性匹配的允许脱敏权 重; 根据预设隐私性以及填选准确性, 确定对应隐私输入项的允许脱敏值 ; 其中, 表示对应隐私输入项与预设隐私性相关的允许脱敏权重; 表示对应隐 私输入项与填选准确性相关的允许脱敏权 重; 当所述允许脱敏值大于预设值时, 将对应隐私输入项的输入信息作为待定数据; 基于所有 待定数据, 组合成待 脱敏数据。 3.如权利要求1所述的利用矩阵替换实现数据脱敏的方法, 其特征在于, 获取待脱敏数 据, 并确定所述待 脱敏数据的数据类型组合, 包括: 对所述待 脱敏数据进行 数据聚类分析, 获取 得到若干 子数据; 将每个子数据分别输入到数据判别模型中, 获取得到对应子数据匹配的类型类别概 率; 筛选最大概 率对应的类型作为对应子数据的主 要数据类型;权 利 要 求 书 1/3 页 2 CN 115422594 A 2基于所有 主要数据类型, 构建得到所述待 脱敏数据的数据类型组合。 4.如权利要求3所述的利用矩阵替换实现数据脱敏的方法, 其特征在于, 基于所有主要 数据类型, 构建得到所述待 脱敏数据的数据类型组合, 包括: 按照与每个子数据所对应的主要数据类型一致的概率值进行由大到小排列, 得到数据 集合; 对所述数据集合中的同类型第二数据进行第一标定, 确定同类型的分布位置, 并统计 对应同类型的第一 概率值; 统计所述数据集 合中所有第二数据的总概 率值; 基于第一概率值以及总概率值, 确定对应同类型的第 一比值, 同时, 确定每个第 二数据 的概率值基于总概 率值的第三比值; 确定同类型中每 个第二数据的概 率值基于对应同类型的第一 概率值的第二比值; 根据第一比值、 第二比值以及第三比值, 构建对应 每个第二数据的第一数组; 按照所述第一数组, 分别向对应的第二数据设置参 考标签, 构建得到数据类型组合。 5.如权利要求4所述的利用矩阵替换实现数据脱敏的方法, 其特征在于, 来从组合数据 库中调取 数据编码策略, 包括: 确定所述组合数据库中存在的每 个子数据的参 考标签以及主 要数据类型; 同时, 还确定对应子数据基于 输入隐私项的总隐私性; 按照每个子数据的参考标签、 主要数据类型以及总隐私性, 确定对应子数据的调取因 子; 基于所有调取因子, 获取 得到调取组合命令; 按照所述调取组合命令, 从所述组合数据库中, 调取 数据编码策略。 6.如权利要求1所述的利用矩阵替换实现数据脱敏的方法, 其特征在于, 按照所述数据 编码策略对所述待 脱敏数据进行 数据编码, 构建得到待 脱敏矩阵, 包括: 获取所述数据编码策略的编码流 程以及每 个编码流 程对应匹配的待编码数据; 按照所述编码流程对对应待编码数据进行数据编码, 并分析每个编码流程对应的数据 编码结果的行列显示 位置; 基于所有行列显示位置, 确定上下边界以及左右边界, 并进行编码补齐处理, 构建得到 待脱敏矩阵。 7.如权利要求1所述的利用矩阵替换实现数据脱敏的方法, 其特征在于, 分析所述待脱 敏矩阵中每 个待脱敏元素的脱敏系数以及脱敏属性, 包括: 获取所述待脱敏矩阵中的每 个待脱敏元素的编码信息; 将所述编码信息 输入到信息分析模型中, 获取 得到所述编码信息的编码保护指标; 基于所述编码保护指标, 确定对应待 脱敏元素的脱敏系数; 同时, 对所述编码保护指标进行保护类型划分, 分别计算每 个划分结果的总类型权 重; 筛选总类型权重大于预设权重的最终划分类型, 并基于类型 ‑属性数据库, 调取得到脱 敏属性。 8.如权利要求7所述的利用矩阵替换实现数据脱敏的方法, 其特征在于, 按照所述脱敏 系数以及脱敏属性, 对需替换的元 素进行替换, 得到脱敏 数据, 包括: 基于所述脱敏系数以及脱敏属性, 确定对应待 脱敏元素的脱敏级别;权 利 要 求 书 2/3 页 3 CN 115422594 A 3

.PDF文档 专利 一种利用矩阵替换实现数据脱敏的方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种利用矩阵替换实现数据脱敏的方法 第 1 页 专利 一种利用矩阵替换实现数据脱敏的方法 第 2 页 专利 一种利用矩阵替换实现数据脱敏的方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:10:31上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。