团体标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211206614.6 (22)申请日 2022.09.30 (71)申请人 中国电子科技 集团公司第十 研究所 地址 610000 四川省成 都市金牛区茶店子 东街48号 (72)发明人 潘磊 戴礼灿 廖泓舟 谢达  周滨 高翔 陈伟晴 霍志浩  (74)专利代理 机构 成都九鼎天元知识产权代理 有限公司 51214 专利代理师 舒盛 (51)Int.Cl. G06F 16/31(2019.01) G06F 16/35(2019.01) G06F 16/33(2019.01) G06N 7/00(2006.01) (54)发明名称 一种面向多领域的复杂事 件要素抽取方法 (57)摘要 本发明提供一种面向多领域的复杂事件要 素抽取方法, 属于信息抽取技术领域, 解决了传 统要素抽取模 型应用领域单一, 对复杂事件的抽 取能力不足的问题; 包括要素抽取模 型的构建部 分和要素抽取模型的应用部分; 其中构建部分, 根据事件要素标签体系, 形成事件要素数据集, 使用事件要素数据集, 对预训练语 言模型进行要 素抽取任务的迭代训练, 训练完成后即得到要素 抽取模型; 应用部分, 将训练完成的要素抽取模 型面向多领域进行应用, 对多领域文本语料进行 事件检测, 得到事件句数据, 使用要素抽取模型 进行要素抽取工作, 对要素抽取工作的结果进行 确认后, 开展要素抽取模型的增量优化训练; 本 发明能够实现模型的跨域迁移应用和复杂事件 的要素抽取。 权利要求书2页 说明书7页 附图4页 CN 115510180 A 2022.12.23 CN 115510180 A 1.一种面向多领域的复杂事件要素抽取方法, 其特征在于: 包括要素抽取模型的构建 部分和要素抽取模型的应用部分; 所述要素抽取模型的构建部分, 根据事件要素标签体系, 形成事件要素数据集, 使用所 述事件要素数据集, 对预训练语言模型进行要素抽取任务的迭代训练, 训练完成后即得到 所述要素抽取模型; 所述要素抽取模型的应用部分, 将训练完成的要素抽取模型面向多领域进行应用, 对 多领域文本语料进行事件检测, 得到事件句数据, 使用所述要素抽取模型对所述事件句数 据进行要素抽取工作, 对要素抽取工作的结果进行确认后, 开展所述要素抽取模型 的增量 优化训练。 2.根据权利要求1所述的一种面向多领域的复杂事件要素抽取方法, 其特征在于: 所述 要素抽取模型为复杂事件要素抽取模型, 所述复杂事件要 素抽取模型的构建过程具体包括 如下步骤: S1、 建立事 件要素标签体系; S2、 获取复杂事 件句数据集; S3、 依据事件要素标签体系, 对复杂事件句数据集进行人工标注, 形成复杂事件要素数 据集; S4、 使用复杂事 件要素数据集, 对预训练语言模型进行训练, 得 出最优要素抽取模型; S5、 测试最优要素抽取模型的抽取结果准确率, 当准确率满足指标要求后, 即获得训练 完成的要素抽取模型, 完成复杂事 件要素抽取模型的构建。 3.根据权利要求2所述的一种面向多领域的复杂事件要素抽取方法, 其特征在于: 所述 步骤S1中, 对事件要素标签体系的建立, 通过参考序列标注任务的BIO标签定义方法, 定义 复杂事件句中存在的各类要素部分; 所述要素部分包括共有要素部分和多个子事件要素部分; 所述共有要素部分包括共同 主体、 共同客体、 共同时间、 共同地点和共同触发词, 所述子事件要 素部分包括子事件主体、 子事件客体、 子事件事件、 子事件地点和子事件触发词, 其中对于多个子事件, 所述子事件 要素部分采用相同的序号对要素组成进行统一编号。 4.根据权利要求3所述的一种面向多领域的复杂事件要素抽取方法, 其特征在于: 所述 复杂事件要 素抽取模型的构建过程的步骤S 3中, 进行人工标注, 具体为: 根据所述事件要 素 标签体系, 对所述复杂事件句数据集中的每一个复杂事件句中的每一个要素, 以人工方式 标为共有 要素部分或子事 件要素部分, 从而最终形成所述复杂事 件要素数据集。 5.根据权利要求2所述的一种面向多领域的复杂事件要素抽取方法, 其特征在于: 所述 步骤S4中, 复杂事件要 素数据集被划分为训练集、 验证集和测试集; 通过所述训练集对所述 预训练语言模型进行训练, 通过所述验证集从训练后的预训练语言模型中选出最优要 素抽 取模型; 所述 步骤S5中, 通过 所述测试集对所述 最优要素抽取模型进行准确率测试。 6.根据权利要求5所述的一种面向多领域的复杂事件要素抽取方法, 其特征在于: 所述 步骤S4中, 通过 所述训练集对所述预训练语言模型进行训练, 具体包括如下步骤: S4‑1、 将训练集中的人工标注前的复杂事件句数据集分割成多个特定大小的事件数据 组; S4‑2、 将一个事件数据组输入RoBERTa模型中, 获得此事件数据组中每个事件句的语义权 利 要 求 书 1/2 页 2 CN 115510180 A 2特征向量矩阵; S4‑3、 将语义特征向量矩阵输入线性分类器, 获得每个事件句中每个要素所对应的要 素标签概率, 形成要素 标签概率矩阵; S4‑4、 将要素标签概率矩阵输入CRF模型, 获得此事件数据组中每个事件句中每个要素 所对应的要素 标签; S4‑5、 对要素标签与人工标注后的真实标签计算对数似然比损失, 若损失值小于预设 阈值, 则判断当前事 件数据组训练是否 完成; S4‑6、 当前事件组数据训练完成后, 判断所有事件数据组训练是否完成, 若没有完成, 则更换下一组事件 数据组, 进 行从步骤S4 ‑2开始的操作; 若判断所有事件数据组训练完成, 则得到训练后的预训练语言模型。 7.根据权利要求6所述的一种面向多领域的复杂事件要素抽取方法, 其特征在于: 所述 步骤S4‑5中, 若损失值大于预设阈值, 则通过反向传播迭代当前事件组数据, 进行从步骤 S4‑2开始的操作, 直至得到损失值小于预设阈值的结果。 8.根据权利要求5所述的一种面向多领域的复杂事件要素抽取方法, 其特征在于: 通过 所述测试集对所述最优要素抽取模型进行准确 率测试, 将准确率值记为F1值, 准确 率的指 标要求值为85%, 当准确率测试结果的F1值达到指标要求值后, 得到训练完成的复杂事件 要素抽取模型, 实现复杂事件要素抽取模型 的构建, 并将所述复杂事件要素抽取模型面向 多领域进行应用。 9.根据权利要求8所述的一种面向多领域的复杂事件要素抽取方法, 其特征在于: 在准 确率测试过程中, 若准确 率测试结果的F1值未达到指标要求值, 则对所述最优要素抽取模 型进行人工修正后, 对其 开展与预训练语言模型相同训练过程的增量训练。 10.根据权利要求1所述的一种面向多领域的复杂事件要素抽取方法, 其特征在于: 使 用训练完成的要 素抽取模型面向多领域进 行应用时, 对不同领域的要 素抽取工作的结果进 行人工检查确认, 修正不正确的要素结果, 并将相应结果反馈至要 素抽取模型的构建部 分, 依据该领域文本语料, 对要素抽取模型开展增 量优化训练过程, 获得针对该领域优化更新 后具有实际应用价 值的要素抽取模型。权 利 要 求 书 2/2 页 3 CN 115510180 A 3

.PDF文档 专利 一种面向多领域的复杂事件要素抽取方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向多领域的复杂事件要素抽取方法 第 1 页 专利 一种面向多领域的复杂事件要素抽取方法 第 2 页 专利 一种面向多领域的复杂事件要素抽取方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:13:12上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。