专利 一种面向多领域的复杂事件要素抽取方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211206614.6 (22)申请日 2022.09.30 (71)申请人中国电子科技集团公司第十研究所地址 610000 四川省成都市金牛区茶店子东街48号 (72)发明人潘磊　戴礼灿　廖泓舟　谢达　周滨　高翔　陈伟晴　霍志浩　 (74)专利代理机构成都九鼎天元知识产权代理有限公司 51214 专利代理师舒盛 (51)Int.Cl. G06F 16/31(2019.01) G06F 16/35(2019.01) G06F 16/33(2019.01) G06N 7/00(2006.01) (54)发明名称一种面向多领域的复杂事件要素抽取方法 (57)摘要本发明提供一种面向多领域的复杂事件要素抽取方法，属于信息抽取技术领域，解决了传统要素抽取模型应用领域单一，对复杂事件的抽取能力不足的问题；包括要素抽取模型的构建部分和要素抽取模型的应用部分；其中构建部分，根据事件要素标签体系，形成事件要素数据集，使用事件要素数据集，对预训练语言模型进行要素抽取任务的迭代训练，训练完成后即得到要素抽取模型；应用部分，将训练完成的要素抽取模型面向多领域进行应用，对多领域文本语料进行事件检测，得到事件句数据，使用要素抽取模型进行要素抽取工作，对要素抽取工作的结果进行确认后，开展要素抽取模型的增量优化训练；本发明能够实现模型的跨域迁移应用和复杂事件的要素抽取。权利要求书2页说明书7页附图4页 CN 115510180 A 2022.12.23 CN 115510180 A 1.一种面向多领域的复杂事件要素抽取方法，其特征在于：包括要素抽取模型的构建部分和要素抽取模型的应用部分；所述要素抽取模型的构建部分，根据事件要素标签体系，形成事件要素数据集，使用所述事件要素数据集，对预训练语言模型进行要素抽取任务的迭代训练，训练完成后即得到所述要素抽取模型；所述要素抽取模型的应用部分，将训练完成的要素抽取模型面向多领域进行应用，对多领域文本语料进行事件检测，得到事件句数据，使用所述要素抽取模型对所述事件句数据进行要素抽取工作，对要素抽取工作的结果进行确认后，开展所述要素抽取模型的增量优化训练。 2.根据权利要求1所述的一种面向多领域的复杂事件要素抽取方法，其特征在于：所述要素抽取模型为复杂事件要素抽取模型，所述复杂事件要素抽取模型的构建过程具体包括如下步骤： S1、建立事件要素标签体系； S2、获取复杂事件句数据集； S3、依据事件要素标签体系，对复杂事件句数据集进行人工标注，形成复杂事件要素数据集； S4、使用复杂事件要素数据集，对预训练语言模型进行训练，得出最优要素抽取模型； S5、测试最优要素抽取模型的抽取结果准确率，当准确率满足指标要求后，即获得训练完成的要素抽取模型，完成复杂事件要素抽取模型的构建。 3.根据权利要求2所述的一种面向多领域的复杂事件要素抽取方法，其特征在于：所述步骤S1中，对事件要素标签体系的建立，通过参考序列标注任务的BIO标签定义方法，定义复杂事件句中存在的各类要素部分；所述要素部分包括共有要素部分和多个子事件要素部分；所述共有要素部分包括共同主体、共同客体、共同时间、共同地点和共同触发词，所述子事件要素部分包括子事件主体、子事件客体、子事件事件、子事件地点和子事件触发词，其中对于多个子事件，所述子事件要素部分采用相同的序号对要素组成进行统一编号。 4.根据权利要求3所述的一种面向多领域的复杂事件要素抽取方法，其特征在于：所述复杂事件要素抽取模型的构建过程的步骤S 3中，进行人工标注，具体为：根据所述事件要素标签体系，对所述复杂事件句数据集中的每一个复杂事件句中的每一个要素，以人工方式标为共有要素部分或子事件要素部分，从而最终形成所述复杂事件要素数据集。 5.根据权利要求2所述的一种面向多领域的复杂事件要素抽取方法，其特征在于：所述步骤S4中，复杂事件要素数据集被划分为训练集、验证集和测试集；通过所述训练集对所述预训练语言模型进行训练，通过所述验证集从训练后的预训练语言模型中选出最优要素抽取模型；所述步骤S5中，通过所述测试集对所述最优要素抽取模型进行准确率测试。 6.根据权利要求5所述的一种面向多领域的复杂事件要素抽取方法，其特征在于：所述步骤S4中，通过所述训练集对所述预训练语言模型进行训练，具体包括如下步骤： S4‑1、将训练集中的人工标注前的复杂事件句数据集分割成多个特定大小的事件数据组； S4‑2、将一个事件数据组输入RoBERTa模型中，获得此事件数据组中每个事件句的语义权　利　要　求　书 1/2 页 2 CN 115510180 A 2特征向量矩阵； S4‑3、将语义特征向量矩阵输入线性分类器，获得每个事件句中每个要素所对应的要素标签概率，形成要素标签概率矩阵； S4‑4、将要素标签概率矩阵输入CRF模型，获得此事件数据组中每个事件句中每个要素所对应的要素标签； S4‑5、对要素标签与人工标注后的真实标签计算对数似然比损失，若损失值小于预设阈值，则判断当前事件数据组训练是否完成； S4‑6、当前事件组数据训练完成后，判断所有事件数据组训练是否完成，若没有完成，则更换下一组事件数据组，进行从步骤S4 ‑2开始的操作；若判断所有事件数据组训练完成，则得到训练后的预训练语言模型。 7.根据权利要求6所述的一种面向多领域的复杂事件要素抽取方法，其特征在于：所述步骤S4‑5中，若损失值大于预设阈值，则通过反向传播迭代当前事件组数据，进行从步骤 S4‑2开始的操作，直至得到损失值小于预设阈值的结果。 8.根据权利要求5所述的一种面向多领域的复杂事件要素抽取方法，其特征在于：通过所述测试集对所述最优要素抽取模型进行准确率测试，将准确率值记为F1值，准确率的指标要求值为85％，当准确率测试结果的F1值达到指标要求值后，得到训练完成的复杂事件要素抽取模型，实现复杂事件要素抽取模型的构建，并将所述复杂事件要素抽取模型面向多领域进行应用。 9.根据权利要求8所述的一种面向多领域的复杂事件要素抽取方法，其特征在于：在准确率测试过程中，若准确率测试结果的F1值未达到指标要求值，则对所述最优要素抽取模型进行人工修正后，对其开展与预训练语言模型相同训练过程的增量训练。 10.根据权利要求1所述的一种面向多领域的复杂事件要素抽取方法，其特征在于：使用训练完成的要素抽取模型面向多领域进行应用时，对不同领域的要素抽取工作的结果进行人工检查确认，修正不正确的要素结果，并将相应结果反馈至要素抽取模型的构建部分，依据该领域文本语料，对要素抽取模型开展增量优化训练过程，获得针对该领域优化更新后具有实际应用价值的要素抽取模型。权　利　要　求　书 2/2 页 3 CN 115510180 A 3

专利 一种面向多领域的复杂事件要素抽取方法

专利一种面向多领域的复杂事件要素抽取方法