(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202211180060.7
(22)申请日 2022.09.27
(65)同一申请的已公布的文献号
申请公布号 CN 115268799 A
(43)申请公布日 2022.11.01
(73)专利权人 武汉烜旭软件科技有限公司
地址 430000 湖北省武汉市经济技 术开发
区2MA地块办公及生产用房 (东方工业
园5号-6号楼) (集- HCY-5#314)
(72)发明人 童娜
(74)专利代理 机构 武汉瑞创星知识产权代理事
务所(普通 合伙) 42274
专利代理师 易滨
(51)Int.Cl.
G06F 3/06(2006.01)G06F 21/45(2013.01)
G06F 21/60(2013.01)
G06F 21/62(2013.01)
G06F 40/194(2020.01)
G06F 40/284(2020.01)
G06F 40/289(2020.01)
(56)对比文件
CN 114722141 A,202 2.07.08
CN 114531220 A,202 2.05.24
CN 109274716 A,2019.01.25
US 20183 30120 A1,2018.1 1.15
王利鑫.“基于分词的中文 文本相似度计算
研究”. 《中国优秀硕士学位 论文全文数据库》
.2006,(第10期),
审查员 王垚
(54)发明名称
一种基于云服务的存储方法和装置
(57)摘要
本发明提供了一种基于云服务的存储方法
和装置, 其中包括: 通过第一文件找取相似的第
二文件, 利用第二文件对第一文件进行加密, 并
将加密后的密文上传至第二云服务端。 本发明的
有益效果: 实现了对重要文件的云服务加密存
储, 利用两个云服务端来实现对数据的共同加
密, 加密过程简单高效, 加密的可靠性得到了提
高。
权利要求书4页 说明书11页 附图2页
CN 115268799 B
2022.12.06
CN 115268799 B
1.一种基于云服 务的存储方法, 其特 征在于, 包括:
获取待存 储的第一文件;
利用预设的文本相似度算法从第一云服 务端找出与所述第一文件相近的第二文件;
对所述第二文件中的语句进行词汇、 短语以及单个字符的提取, 并基于各个元素在所
述第二文件中的位置进 行标注, 得到第一数据集; 所述元素为词汇、 短语以及单个字 符中的
任意一种;
对所述第一文件进行短语的识别, 得到多个暂时短语, 并判断各个所述暂时短语是否
属于所述第一数据集, 将属于所述第一数据集中的暂时短语记为 目标短语进行提取, 得到
目标短语集, 并对所述第一文件中的目标短语进行遮盖处 理, 得到遮盖后的第三文件;
对所述第三文件进行词汇的识别, 得到多个暂时词汇, 并判断各个所述暂时词汇是否
属于所述第一数据集, 将属于所述第一数据集中的暂时词汇记为 目标词汇进行提取, 得到
目标词汇集, 并对所述第三文件中的目标词汇进行遮盖处 理, 得到遮盖后的第四文件;
对所述第四文件进行单个字符的提取, 并判断是否属于所述第一数据集, 将属于所述
第一数据集中的字符记为 目标字符进行提取, 得到第一字符集, 并将不属于所述第一数据
集中的字符记为暂时字符进行提取, 得到第二字符集;
根据所述目标短语集、 所述目标词汇集以及所述第 一字符集中的元素按照所述第 一数
据集中的标注进行编码, 以及对所述第二字符集中的元素按照预设的汉字编码器进行编
码, 并基于所述第一文件的顺序对编码后的代码进行排序, 得到第一代码;
将所述第一代码按照预设的加密算法进行加密, 得到第二代码, 将所述第二代码上传
至第二云服 务端进行存储。
2.如权利要求1所述的基于云服务的存储方法, 其特征在于, 所述利用预设的文本相似
度算法从第一云服 务端找出与所述第一文件相近的第二文件的步骤, 包括:
对所述第一文件进行词汇、 短语以及单个字符的提取并去重, 得到第二数据集, 其中,
所述第二数据集中包括三个级别的元素, 第一级别为单个字符, 第二级别为词汇, 第三个级
别为短语;
设置所述第一文件中第一级别的权重
, 根据公式
设置第二级
别的权重
以及第三级别的权重
; 其中, t=1或2,
表示与t相关的预设参数,
表示
第t个级别的预设参数;
根据预设的文本相似度算法
计算与多个对比文件
的相似度值, 其中,
表示第二数据集中的第i个元素, n表示第二数据集中元素的个数总
和,
表示对比文件中
对应的数量,
表示
对应级别的权
重, I表示第一文件, R表示对比文件,
表示相似度值;
根据所述相似度值的大小, 选取相似度值 最大的对比文件作为所述第二文件。
3.如权利要求1所述的基于云服务的存储方法, 其特征在于, 所述将所述第 一代码按照
预设的加密算法进行加密, 得到第二代码的步骤, 包括:权 利 要 求 书 1/4 页
2
CN 115268799 B
2根据所述第一代码的规模生成对应维数的可逆矩阵;
从预设的密钥集中筛 选出与所述可逆矩阵维数相同的密钥矩阵;
通过所述密钥矩阵对所述可逆矩阵进行矩阵运算得到加密矩阵; 其中,加密运算公式
为: M=P·A, M为加密矩阵, P为可逆矩阵, A为密钥矩阵。
4.如权利要求1所述的基于云服务的存储方法, 其特征在于, 所述对所述第 一文件进行
短语的识别, 得到多个暂时短语, 并判断各个所述暂时短语是否属于所述第一数据集, 将属
于所述第一数据集中的暂时短语记为 目标短语进行提取, 得到目标短语集, 并对所述第一
文件中的目标短语进行遮盖处 理, 得到遮盖后的第三文件的步骤之前, 还 包括:
从预设的数据库中读取隐私词汇集;
根据预设的查询函数和所述隐私词汇集 查询所述第一文件中的目标隐私词汇;
采用预设的非隐私词汇替换所述第 一文件中的目标隐私词汇, 得到替换后的第 一文件
用于执行对所述第一文件进行短语的识别, 得到多个暂时短语, 并判断各个所述暂时短语
是否属于所述第一数据集, 将属于所述第一数据集中的暂时短语记为 目标短语进行提取,
得到目标短语集, 并对所述第一文件中的目标短语进行遮盖处理, 得到遮盖后的第三文件
的步骤;
建立非隐私词汇与所述目标隐私词汇的对应表并上传至第三云服 务端。
5.如权利要求1所述的基于云服务的存储方法, 其特征在于, 所述将所述第 一代码按照
预设的加密算法进行加密, 得到第二代码, 将所述第二代码上传至第二云服务端进行存储
的步骤之后, 还 包括:
判断是否 接收到发起方获取 所述第一文件的获取指令;
若接收到所述获取指令, 则通过第 一云服务端的第 一验证方法向所述发起方进行第 一
次认证;
若第一次认证通过, 则将所述第二文件发送给 所述发起方;
基于所述第二文件触发所述第二云服 务端的第二次认证;
若所述第二次认证通过, 则将所述第二代码发送给 所述发起方;
基于所述第二代码和所述第二文件执 行解码指令, 得到所述第一文件。
6.一种基于云服 务的存储装置, 其特 征在于, 包括:
获取模块, 用于获取待存 储的第一文件;
寻找模块, 用于利用预设的文本相似度算法从第 一云服务端找出与 所述第一文件相近
的第二文件;
提取模块, 用于对所述第 二文件中的语句进行词汇、 短语以及单个字符的提取, 并基于
各个元素在所述第二文件中的位置进 行标注, 得到第一数据集; 所述元素为词汇、 短语以及
单个字符中的任意 一种;
短语识别模块, 用于对所述第 一文件进行短语的识别, 得到多个 暂时短语, 并判断各个
所述暂时短语是否属于所述第一数据集, 将属于所述第一数据集中的暂时短语记为目标短
语进行提取, 得到目标短语集, 并对所述第一文件中的目标短语进 行遮盖处理, 得到遮盖后
的第三文件;
词汇识别模块, 用于对所述第 三文件进行词汇的识别, 得到多个 暂时词汇, 并判断各个
所述暂时词汇是否属于所述第一数据集, 将属于所述第一数据集中的暂时词汇记为目标词权 利 要 求 书 2/4 页
3
CN 115268799 B
3
专利 一种基于云服务的存储方法和装置
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 02:10:47上传分享