团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211013476.X (22)申请日 2022.08.23 (71)申请人 北京天融信网络安全技 术有限公司 地址 100085 北京市海淀区上地 东路1号院 3号楼四层 申请人 北京天融信科技有限公司 北京天融信软件 有限公司 (72)发明人 姚剑文 (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 刘攀 (51)Int.Cl. G06F 40/295(2020.01) G06F 40/126(2020.01) G06F 16/35(2019.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 信息提取方法、 装置、 电子设备及存 储介质 (57)摘要 本申请提供一种信息提取方法、 装置、 电子 设备及存储介质, 涉及自然语言处理技术领域。 该方法通过多标签分类模型提取待识别信息的 模式提示信息, 该模式提示信息包括待识别信息 的实体类别、 关系类别以及事件关键词, 然后利 用信息识别模型基于模式提示信息从待识别信 息中提取所需的目标信息, 该目标信息包括待识 别信息中属于实体类别的实体信息、 属于关系类 别的关系信息以及属于事件关键词的事件信息, 由于模式提示信息可用于指导信息识别模型自 适应地完成目标信息的提取, 所以可使得信息识 别模型能够基于模式提示信息自适应地从待识 别信息中完整地提取所需的目标信息, 效率高且 准确性高。 权利要求书2页 说明书8页 附图1页 CN 115293165 A 2022.11.04 CN 115293165 A 1.一种信息提取 方法, 其特 征在于, 所述方法包括: 利用多标签分类模型提取待识别信 息的模式提示信 息, 所述模式提示信 息包含所述待 识别信息的实体 类别、 关系类别以及事 件关键词; 利用信息识别模型基于所述模式提示信 息从所述待识别信 息中提取所需的目标信 息, 所述目标信息包括所述待识别信息中属于所述实体类别的实体信息、 属于所述关系类别的 关系信息以及属于所述事 件关键词的事 件信息。 2.根据权利要求1所述的方法, 其特征在于, 所述利用信 息识别模型基于所述模式提示 信息从所述待识别 信息中提取 所需的目标信息, 包括: 利用信息识别模型基于所述模式提示信息和所述待识别信息生成属于所述模式提示 信息的多个词, 所述多个词所 形成的信息为从所述待识别 信息中所提取的目标信息 。 3.根据权利要求2所述的方法, 其特征在于, 所述利用信 息识别模型基于所述模式提示 信息和所述待识别 信息生成属于所述模式提 示信息的多个词, 包括: 利用信息识别模型将所述模式提 示信息与所述待识别 信息进行拼接, 获得拼接信息; 利用所述信 息识别模型对所述拼接信 息进行编码, 获得所述拼接信 息对应的隐藏表示 向量; 利用所述信息识别模型基于所述隐藏表示向量 生成属于所述模式提 示信息的多个词。 4.根据权利要求3所述的方法, 其特征在于, 所述信息识别模型包括编码器和解码器, 所述利用所述信息识别模型对所述拼接信息进行编 码, 获得所述拼接信息对应的隐藏表示 向量, 包括: 利用所述编码器对所述 拼接信息进行编码, 获得 所述拼接信息对应的隐藏表示向量; 所述利用所述信息识别模型基于所述隐藏表示向量生成属于所述模式提示信息的多 个词, 包括: 利用所述 解码器基于所述隐藏表示向量 生成属于所述模式提 示信息的多个词。 5.根据权利要求3所述的方法, 其特征在于, 所述利用信 息识别模型将所述模式提示信 息与所述待识别 信息进行拼接, 获得拼接信息, 包括: 利用信息识别模型将所述模式提示信 息放在所述待识别信 息之前进行拼接, 获得拼接 信息。 6.根据权利要求1所述的方法, 其特征在于, 所述多标签分类模型为fasttext语言模 型。 7.根据权利要求1 ‑6任一所述的方法, 其特征在于, 所述待识别信息为网络安全信息, 所述目标信息为网络安全威胁信息 。 8.一种信息提取装置, 其特 征在于, 所述装置包括: 提示信息获取模块, 用于利用多标签分类模型提取待识别信息的模式提示信息, 所述 模式提示信息包 含所述待识别 信息的实体 类别、 关系类别以及事 件关键词; 目标信息提取模块, 用于利用信 息识别模型基于所述模式提示信 息从所述待识别信 息 中提取所需的目标信息, 所述目标信息包括所述待识别信息中属于所述 实体类别的实体信 息、 属于所述关系类别的关系信息以及属于所述事 件关键词的事 件信息。 9.一种电子设备, 其特征在于, 包括处理器以及存储器, 所述存储器存储有计算机可读 取指令, 当所述计算机可读取指 令由所述处理器执行时, 运行如权利要求 1‑7任一所述的方权 利 要 求 书 1/2 页 2 CN 115293165 A 2法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时运行如权利要求1 ‑7任一所述的方法。权 利 要 求 书 2/2 页 3 CN 115293165 A 3
专利 信息提取方法、装置、电子设备及存储介质
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 02:13:29
上传分享
举报
下载
原文档
(402.2 KB)
分享
友情链接
GB-T 42708-2023 金融网络安全威胁信息共享指南.pdf
DB22-T 1582-2012 工业企业能源计量数据管理规范 吉林省.pdf
SY-T 6246-2022 可控震源使用技术规范.pdf
GM-T 0056-2018 多应用载体密码应用接口规范.pdf
T-BSIA 006—2022 知识图谱时空特性构建技术规范.pdf
T-ZAWS 002—2023 弧焊设备 物联控制终端 模组 技术要求.pdf
GM-T 0031-2014 安全电子签章密码技术规范.pdf
GB-T 4356-2016 不锈钢盘条.pdf
GM-T 0014-2023 数字证书认证系统密码协议规范.pdf
专利 一种轴承质量检测装置及方法.PDF
GB-T 42129-2022 数据管理能力成熟度评估方法.pdf
GB-T 15731-2015 内河旅游船星级的划分与评定.pdf
GB-T 4754-2017 国民经济行业分类.pdf
DB43-T 2256-2021 信息技术应用创新工程建设规范第 13 部分:国产化信息系统运行维护规范 湖南省.pdf
GB-T 42731-2023 微电网技术要求.pdf
深信服 aTrust零信任技术白皮书V1.4 2022.pdf
GB-T 37565-2019 给水排水用格栅除污机通用技术条件.pdf
GM-T 0012-2020 可信计算 可信密码模块接口规范.pdf
关键信息基础设施安全保护条例-关基保护条例正式版.pdf
思度安全-DSMM-022 数据供应链安全管理规范V1.0.pdf
1
/
3
12
评价文档
赞助2.5元 点击下载(402.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。