专利 一种基于联邦学习的公文智能推荐方法

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202211154292.5 (22)申请日 2022.09.22 (65)同一申请的已公布的文献号申请公布号 CN 115238065 A (43)申请公布日 2022.10.25 (73)专利权人太极计算机股份有限公司地址 100191 北京市海淀区北四环中路21 1 号 (72)发明人肖益　陈轮　韩国权　黄海峰　黄铁淳　周伟　程建润　 (74)专利代理机构北京智桥联合知识产权代理事务所(普通合伙) 11560 专利代理师金光恩 (51)Int.Cl. G06F 16/335(2019.01) G06F 16/35(2019.01)G06F 16/9535(2019.01) G06F 16/958(2019.01) G06F 40/205(2020.01) G06F 40/253(2020.01) G06K 9/62(2022.01) G06N 20/20(2019.01) (56)对比文件 CN 114625976 A,202 2.06.14 US 201901259 2 A1,2019.01.10 US 2021158099 A1,2021.0 5.27 CN 115049011 A,2022.09.13 CN 112836130 A,2021.0 5.25 CN 114117210 A,202 2.03.01 CN 110825970 A,2020.02.21 CN 111666401 A,2020.09.15 审查员轩海珍 (54)发明名称一种基于联邦学习的公文智能推荐方法 (57)摘要本申请提供一种基于联邦学习的公文智能推荐方法，所述方法包括：确定目标公文文本的公文类型以及各公文子数据库对应的公文类型；确定各公文子数据库对应的联邦学习架构；将所述联邦学习架构由联邦学习聚合服务器广播给所述各公文子数据库；进行联邦学习训练后输出所述目标公文文本对应的公文推荐结果。本发明提供的公文智能推荐方法，采用联邦学习的架构训练得到公文推荐模型，克服了各公文子数据库数据不互通导致的训练语料缺失的问题；同时基于各公文子数据库语料数据的特点，使得公文推荐模型对公文文本共通的语法结构特征和各类公文文本各自的特定语法结构特征均兼顾了学习，进而使得公文推荐模型的推荐结果准确率较高。权利要求书2页说明书10页附图2页 CN 115238065 B 2022.12.20 CN 115238065 B 1.一种基于联邦学习的公文智能推荐方法，其特征在于，所述方法包括：确定目标公文文本的公文类型以及各公文子数据库对应的公文类型；根据所述目标公文文本的公文类型以及各公文子数据库对应的公文类型，确定各公文子数据库对应的联邦学习架构；其中，所述联邦学习架构包括各公文子数据对应的公文推荐模型之间的横向联邦学习或纵向联邦学习关系；将所述联邦学习架构由联邦学习聚合服务器广播给所述各公文子数据库；所述各公文子数据库对应的公文推荐模型根据所述联邦学习架构进行联邦学习训练后，输出所述目标公文文本对应的公文推荐结果；其中，所述根据所述目标公文文本的公文类型以及各公文子数据库对应的公文类型，确定各公文子数据库对应的联邦学习架构，具体包括：将各公文子数据库根据对应的公文类型分为多个公文子数据库集合；确定所述多个公文子数据库集合相对于目标公文文本的公文类型的相似度权重；将各公文子数据库集合作为纵向联邦学习的节点、并将每一公文子数据库集合内各公文子数据库作为横向联邦学习的子节点，构建确定所述联邦学习架构；其中，所述纵向联邦学习的节点在所述联邦学习架构中的排序是根据所述相似度权重确定的，相似度权重最小的节点在所述联邦学习架构中距离联邦学习聚合服务器最远。 2.根据权利要求1所述的公文智能推荐方法，其特征在于，所述将各公文子数据库根据对应的公文类型分为多个公文子数据库集合，具体包括：根据每一公文子数据库中主要公文文本的公文类型，确定每一公文子数据库的主要类型向量；对每一公文子数据库中的所有公文文本提取公文关键词，确定每一公文子数据库的主要关键词向量；根据各公文子数据库的主要类型向量和主要关键词向量，将各公文子数据库进行聚类，得到多个公文子数据库集合。 3.根据权利要求2所述的公文智能推荐方法，其特征在于，所述根据每一公文子数据库中主要公文文本的公文类型，确定每一公文子数据库的主要类型向量，具体包括：根据每一公文子数据库中的各公文类型的公文文本的数量，统计预设名次的排名靠前的公文类型；根据所述预设名次的排名靠前的公文类型，确定该公文子数据库的主要类型向量。 4.根据权利要求1所述的公文智能推荐方法，其特征在于，所述确定所述多个公文子数据库集合相对于目标公文文本的公文类型的相似度权重，具体包括：根据每一公文子数据库集合中与目标公文文本的公文类型相同或相似的公文文本的数量的占比，确定该公文子数据库集合相对于目标公文文本的公文类型的相似度权重。 5.根据权利要求4所述的公文智能推荐方法，其特征在于，所述公文类型的相似关系是根据多个公文类型的公文文本的语法结构特征预计算得到的。 6.根据权利要求1所述的公文智能推荐方法，其特征在于，所述方法还包括，所述各公文子数据库对应的公文推荐模型的联邦学习训练过程如下：对于所述联邦学习架构中每一横向联邦学习的子节点进行本地训练后，将各自训练好的公文推荐模型参数传递给联邦学习聚合服务器；权　利　要　求　书 1/2 页 2 CN 115238065 B 2所述联邦学习聚合服务器根据公文子数据库集合的信息将各子节点训练好的公文推荐模型参数进行横向聚合得到节点聚合参数，并将所述节点聚合参数分别传输给所述联邦学习架构中对应的纵向联邦学习的节点；根据所述联邦学习架构中各纵向联邦学习的节点的排序，依次将相邻两个节点的节点聚合参数根据相似度权重进行纵向聚合、且将相似度权重合并后，传输给下一节点，直至所有节点的节点聚合参数依次完成纵向聚合；所述联邦学习聚合服务器对纵向聚合后的节点聚合参数进行评估后，进行下一轮联邦学习，直至所述公文推荐模型参数满足预设条件。 7.根据权利要求6所述的公文智能推荐方法，其特征在于，将相邻两个节点的相似度权重合并的步骤具体包括：以所述相邻两个节点对应的公文子数据库中公文文本的数量为权值，对相邻两个节点的相似度权重进行加权求和。 8.根据权利要求6所述的公文智能推荐方法，其特征在于，所述节点对应的相似度权重保存在各公文子数据库对应的本地服务器中。 9.根据权利要求6所述的公文智能推荐方法，其特征在于，在训练各公文子数据库对应的公文推荐模型之前，所述方法还包括：所述联邦学习聚合服务器将公文推荐模型的初始结构和参数、以及目标公文文本的公文类型广播给所述联邦学习架构的各子节点。权　利　要　求　书 2/2 页 3 CN 115238065 B 3

专利 一种基于联邦学习的公文智能推荐方法

专利一种基于联邦学习的公文智能推荐方法