(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202211154292.5
(22)申请日 2022.09.22
(65)同一申请的已公布的文献号
申请公布号 CN 115238065 A
(43)申请公布日 2022.10.25
(73)专利权人 太极计算机股份有限公司
地址 100191 北京市海淀区北四环中路21 1
号
(72)发明人 肖益 陈轮 韩国权 黄海峰
黄铁淳 周伟 程建润
(74)专利代理 机构 北京智桥联合知识产权代理
事务所(普通 合伙) 11560
专利代理师 金光恩
(51)Int.Cl.
G06F 16/335(2019.01)
G06F 16/35(2019.01)G06F 16/9535(2019.01)
G06F 16/958(2019.01)
G06F 40/205(2020.01)
G06F 40/253(2020.01)
G06K 9/62(2022.01)
G06N 20/20(2019.01)
(56)对比文件
CN 114625976 A,202 2.06.14
US 201901259 2 A1,2019.01.10
US 2021158099 A1,2021.0 5.27
CN 115049011 A,2022.09.13
CN 112836130 A,2021.0 5.25
CN 114117210 A,202 2.03.01
CN 110825970 A,2020.02.21
CN 111666401 A,2020.09.15
审查员 轩海珍
(54)发明名称
一种基于联邦学习的公文智能推荐方法
(57)摘要
本申请提供一种基于联邦学习的公文智能
推荐方法, 所述方法包括: 确定目标公文文本的
公文类型以及各公文子数据库对应的公文类型;
确定各公文子数据库对应的联邦学习架构; 将所
述联邦学习架构由联邦学习 聚合服务器广播给
所述各公文子数据库; 进行联邦学习训练后输出
所述目标 公文文本对应的公文推荐结果。 本发明
提供的公文智能推荐 方法, 采用联邦学习的架构
训练得到公文推荐模型, 克服了各 公文子数据库
数据不互通导致的训练语料缺失的问题; 同时基
于各公文子数据库语料数据的特点, 使得公文推
荐模型对公文文本共通的语法结构特征和各类
公文文本各自的特定语法结构特征均兼顾了学
习, 进而使得 公文推荐模型的推荐结果准确率较
高。
权利要求书2页 说明书10页 附图2页
CN 115238065 B
2022.12.20
CN 115238065 B
1.一种基于联邦学习的公文智能推荐方法, 其特 征在于, 所述方法包括:
确定目标公文 文本的公文类型以及各公文子数据库对应的公文类型;
根据所述目标公文文本的公文类型以及各公文子数据库对应的公文类型, 确定各公文
子数据库对应的联邦学习架构; 其中, 所述联邦学习架构包括各公文子数据对应的公文推
荐模型之间的横向联邦学习或纵向联邦学习关系;
将所述联邦学习架构由联邦学习聚合 服务器广播给 所述各公文子数据库;
所述各公文子数据库对应的公文推荐模型根据所述联邦学习架构进行联邦学习训练
后, 输出所述目标公文 文本对应的公文推荐结果;
其中, 所述根据所述目标公文文本的公文类型以及各公文子数据库对应的公文类型,
确定各公文子数据库对应的联邦学习架构, 具体包括:
将各公文子数据库根据对应的公文类型分为多个公文子数据库集 合;
确定所述多个公文子数据库集 合相对于目标公文 文本的公文类型的相似度权 重;
将各公文子数据库集合作为纵向联邦学习的节点、 并将每一公文子数据库集合内各公
文子数据库作为横向联邦学习的子节 点, 构建确定所述联邦学习架构; 其中, 所述 纵向联邦
学习的节点在所述联邦学习架构中的排序是根据所述相似度权重确定的, 相似度权重最小
的节点在所述联邦学习架构中距离联邦学习聚合 服务器最远。
2.根据权利要求1所述的公文智能推荐方法, 其特征在于, 所述将各公文子数据库根据
对应的公文类型分为多个公文子数据库集 合, 具体包括:
根据每一公文子数据库中主要公文文本的公文类型, 确定每一公文子数据库的主要类
型向量;
对每一公文子数据库中的所有公文文本提取公文关键词, 确定每一公文子数据库的主
要关键词向量;
根据各公文子数据库的主要类型向量和主要关键词向量, 将各公文子数据库进行聚
类, 得到多个公文子数据库集 合。
3.根据权利要求2所述的公文智能推荐方法, 其特征在于, 所述根据每一公文子数据库
中主要公文文本的公文类型, 确定每一公文子数据库的主 要类型向量, 具体包括:
根据每一公文子数据库中的各公文类型的公文文本的数量, 统计预设名次的排名靠前
的公文类型;
根据所述预设名次的排名靠前的公文类型, 确定该公文子数据库的主 要类型向量。
4.根据权利要求1所述的公文智能推荐方法, 其特征在于, 所述确定所述多个公文子数
据库集合相对于目标公文 文本的公文类型的相似度权 重, 具体包括:
根据每一公文子数据库集合中与目标公文文本的公文类型相同或相似的公文文本的
数量的占比, 确定该公文子数据库集 合相对于目标公文 文本的公文类型的相似度权 重。
5.根据权利要求4所述的公文智能推荐方法, 其特征在于, 所述公文类型的相似关系是
根据多个公文类型的公文 文本的语法结构特 征预计算得到的。
6.根据权利要求1所述的公文智能推荐方法, 其特征在于, 所述方法还包括, 所述各公
文子数据库对应的公文推荐模型的联邦学习训练过程如下:
对于所述联邦学习架构中每一横向联邦学习的子节点进行本地训练后, 将各自训练好
的公文推荐模型参数传递给 联邦学习聚合 服务器;权 利 要 求 书 1/2 页
2
CN 115238065 B
2所述联邦学习聚合服务器根据公文子数据库集合的信息将各子节点训练好的公文推
荐模型参数进 行横向聚合得到节点聚合参数, 并将所述节点聚合参数分别传输给所述联邦
学习架构中对应的纵向联邦学习的节点;
根据所述联邦学习架构中各纵向联邦学习的节点的排序, 依次将相邻 两个节点的节点
聚合参数根据相似度权重进行纵向聚合、 且将相似度权重合并后, 传输给下一节点, 直至所
有节点的节点聚合 参数依次完成纵向聚合;
所述联邦学习聚合服务器对纵向聚合后的节点聚合参数进行评估后, 进行下一轮联邦
学习, 直至所述公文推荐模型参数满足预设条件。
7.根据权利要求6所述的公文智能推荐方法, 其特征在于, 将相邻 两个节点的相似度权
重合并的步骤具体包括:
以所述相邻 两个节点对应的公文子数据库中公文文本的数量为权值, 对相邻 两个节点
的相似度权 重进行加权求和。
8.根据权利要求6所述的公文智能推荐方法, 其特征在于, 所述节点对应的相似度权重
保存在各公文子数据库对应的本地 服务器中。
9.根据权利要求6所述的公文智能推荐方法, 其特征在于, 在训练各公文子数据库对应
的公文推荐模型之前, 所述方法还 包括:
所述联邦学习聚合服务器将 公文推荐模型的初始结构和参数、 以及目标公文文本的公
文类型广播给 所述联邦学习架构的各子节点。权 利 要 求 书 2/2 页
3
CN 115238065 B
3
专利 一种基于联邦学习的公文智能推荐方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 02:11:29上传分享