团体标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211013476.X (22)申请日 2022.08.23 (71)申请人 北京天融信网络安全技 术有限公司 地址 100085 北京市海淀区上地 东路1号院 3号楼四层 申请人 北京天融信科技有限公司   北京天融信软件 有限公司 (72)发明人 姚剑文  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 刘攀 (51)Int.Cl. G06F 40/295(2020.01) G06F 40/126(2020.01) G06F 16/35(2019.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 信息提取方法、 装置、 电子设备及存 储介质 (57)摘要 本申请提供一种信息提取方法、 装置、 电子 设备及存储介质, 涉及自然语言处理技术领域。 该方法通过多标签分类模型提取待识别信息的 模式提示信息, 该模式提示信息包括待识别信息 的实体类别、 关系类别以及事件关键词, 然后利 用信息识别模型基于模式提示信息从待识别信 息中提取所需的目标信息, 该目标信息包括待识 别信息中属于实体类别的实体信息、 属于关系类 别的关系信息以及属于事件关键词的事件信息, 由于模式提示信息可用于指导信息识别模型自 适应地完成目标信息的提取, 所以可使得信息识 别模型能够基于模式提示信息自适应地从待识 别信息中完整地提取所需的目标信息, 效率高且 准确性高。 权利要求书2页 说明书8页 附图1页 CN 115293165 A 2022.11.04 CN 115293165 A 1.一种信息提取 方法, 其特 征在于, 所述方法包括: 利用多标签分类模型提取待识别信 息的模式提示信 息, 所述模式提示信 息包含所述待 识别信息的实体 类别、 关系类别以及事 件关键词; 利用信息识别模型基于所述模式提示信 息从所述待识别信 息中提取所需的目标信 息, 所述目标信息包括所述待识别信息中属于所述实体类别的实体信息、 属于所述关系类别的 关系信息以及属于所述事 件关键词的事 件信息。 2.根据权利要求1所述的方法, 其特征在于, 所述利用信 息识别模型基于所述模式提示 信息从所述待识别 信息中提取 所需的目标信息, 包括: 利用信息识别模型基于所述模式提示信息和所述待识别信息生成属于所述模式提示 信息的多个词, 所述多个词所 形成的信息为从所述待识别 信息中所提取的目标信息 。 3.根据权利要求2所述的方法, 其特征在于, 所述利用信 息识别模型基于所述模式提示 信息和所述待识别 信息生成属于所述模式提 示信息的多个词, 包括: 利用信息识别模型将所述模式提 示信息与所述待识别 信息进行拼接, 获得拼接信息; 利用所述信 息识别模型对所述拼接信 息进行编码, 获得所述拼接信 息对应的隐藏表示 向量; 利用所述信息识别模型基于所述隐藏表示向量 生成属于所述模式提 示信息的多个词。 4.根据权利要求3所述的方法, 其特征在于, 所述信息识别模型包括编码器和解码器, 所述利用所述信息识别模型对所述拼接信息进行编 码, 获得所述拼接信息对应的隐藏表示 向量, 包括: 利用所述编码器对所述 拼接信息进行编码, 获得 所述拼接信息对应的隐藏表示向量; 所述利用所述信息识别模型基于所述隐藏表示向量生成属于所述模式提示信息的多 个词, 包括: 利用所述 解码器基于所述隐藏表示向量 生成属于所述模式提 示信息的多个词。 5.根据权利要求3所述的方法, 其特征在于, 所述利用信 息识别模型将所述模式提示信 息与所述待识别 信息进行拼接, 获得拼接信息, 包括: 利用信息识别模型将所述模式提示信 息放在所述待识别信 息之前进行拼接, 获得拼接 信息。 6.根据权利要求1所述的方法, 其特征在于, 所述多标签分类模型为fasttext语言模 型。 7.根据权利要求1 ‑6任一所述的方法, 其特征在于, 所述待识别信息为网络安全信息, 所述目标信息为网络安全威胁信息 。 8.一种信息提取装置, 其特 征在于, 所述装置包括: 提示信息获取模块, 用于利用多标签分类模型提取待识别信息的模式提示信息, 所述 模式提示信息包 含所述待识别 信息的实体 类别、 关系类别以及事 件关键词; 目标信息提取模块, 用于利用信 息识别模型基于所述模式提示信 息从所述待识别信 息 中提取所需的目标信息, 所述目标信息包括所述待识别信息中属于所述 实体类别的实体信 息、 属于所述关系类别的关系信息以及属于所述事 件关键词的事 件信息。 9.一种电子设备, 其特征在于, 包括处理器以及存储器, 所述存储器存储有计算机可读 取指令, 当所述计算机可读取指 令由所述处理器执行时, 运行如权利要求 1‑7任一所述的方权 利 要 求 书 1/2 页 2 CN 115293165 A 2法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时运行如权利要求1 ‑7任一所述的方法。权 利 要 求 书 2/2 页 3 CN 115293165 A 3

.PDF文档 专利 信息提取方法、装置、电子设备及存储介质

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 信息提取方法、装置、电子设备及存储介质 第 1 页 专利 信息提取方法、装置、电子设备及存储介质 第 2 页 专利 信息提取方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:13:29上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。