专利 事件共指消解方法、装置、终端及计算机可读存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211088370.6 (22)申请日 2022.09.07 (71)申请人粤港澳大湾区数字经济研究院（福田）地址 518045 广东省深圳市福田区福保街道市花路长富金茂大厦1号楼39楼 3901单元 (72)发明人杨海钦　叶俊鹏　 (74)专利代理机构深圳市君胜知识产权代理事务所(普通合伙) 44268 专利代理师李可 (51)Int.Cl. G06N 5/04(2006.01) G06N 20/00(2019.01) G06F 16/335(2019.01)G06F 16/35(2019.01) G06F 40/205(2020.01) (54)发明名称事件共指消解方法、装置、终端及计算机可读存储介质 (57)摘要本发明所提供的事件共指消解方法、装置、终端及计算机可读存储介质，所述事件共指消解方法包括：将目标事件输入预先训练的粗筛模型，在预先建立的存量事件库中检索得到与所述目标事件对应的候选事件池；构造所述目标事件与所述候选事件池中各个候选事件之间的事件对；将各个所述事件对输入预先训练的精筛模型，确定各个所述事件对中目标事件与候选事件之间的共指关系。本发明通过使用预先训练的粗筛模型进行检索，将原来的存量事件库缩小为候选事件池，降低了推理时的计算量，再通过预先训练的精筛模型，减少了上游模型误差的传播，提升了推理效果。权利要求书3页说明书11页附图5页 CN 115186820 A 2022.10.14 CN 115186820 A 1.一种事件共指消解方法，其特征在于，包括：将目标事件输入预先训练的粗筛模型，在预先建立的存量事件库中检索得到与所述目标事件对应的候选事件池；构造所述目标事件与所述候选事件池中各个候选事件之间的事件对；将各个所述事件对输入预先训练的精筛模型，确定各个所述事件对中目标事件与候选事件之间的共指关系。 2.根据权利要求1所述的事件共指消解方法，其特征在于，所述将目标事件输入预先训练的粗筛模型，在预先建立的存量事件库中检索得到与所述目标事件对应的候选事件池，包括：将目标事件输入预先训练的粗筛模型，对所述目标事件进行编码，得到所述目标事件对应的目标向量；获取预先建立的存量事件库，所述存量事件库中包括存量事件及与所述存量事件对应的存量向量，所述存量向量是利用预先训练的粗筛模型对所述存量事件进行编码得到；根据所述目标向量，在所述存量事件库中进行向量检索，得到向量表征池，所述向量表征池中包括与所述目标向量对应的所有目标存量向量；获取与所述目标存量向量对应的目标存量事件，将所述目标存量事件作为所述目标事件对应的候选事件，所有所述候选事件形成候选事件池；其中，所述目标事件和所述存量事件均是由上游的事件抽取模型抽取得到事件信息后，将所述事件信息拼接而成。 3.根据权利要求2所述的事件共指消解方法，其特征在于，将各个所述事件对输入预先训练的精筛模型，确定各个所述事件对中目标事件与候选事件之间的共指关系，包括：将每个所述事件对中的目标事件和候选事件进行文本拼接，得到各个事件对拼接文本；将每个所述事件对拼接文本输入预先训练的精筛模型，编码得到事件对的拼接向量；对所述拼接向量进行分类处理，得到概率评分结果，根据所述概率评分结果确定所述目标事件与所有所述候选事件之间的共指关系。 4.根据权利要求3所述的事件共指消解方法，其特征在于，对所述拼接向量进行分类处理，得到概率评分结果，根据所述概率评分结果确定所述目标事件与所有所述候选事件之间的共指关系之后，还包括：若所述目标事件与所述候选事件之间满足共指关系，则将所述目标事件与所述候选事件聚集为事件簇。 5.根据权利要求3所述的事件共指消解方法，其特征在于，对所述拼接向量进行分类处理，得到概率评分结果，根据所述概率评分结果确定所述目标事件与所有所述候选事件之间的共指关系之后，还包括：若所述目标事件与所述候选事件之间不满足共指关系，则将所述目标事件以及与所述目标事件对应的目标向量加入到所述存量事件库中，所述目标事件作为新的存量事件，所述目标向量作为新的存量向量。 6.根据权利要求1所述的事件共指消解方法，其特征在于，所述粗筛模型的训练步骤包括：权　利　要　求　书 1/3 页 2 CN 115186820 A 2获取第一训练集，利用自监督学习及对比学习训练初始粗筛模型，得到已训练的粗筛模型。 7.根据权利要求6所述的事件共指消解方法，其特征在于，所述获取第一训练集，利用自监督学习及对比学习训练初始粗筛模型，得到已训练的粗筛模型，包括：获取第一训练集，所述第一训练集中包括第一训练事件；将经遮盖字符处理的第一训练事件输入初始粗筛模型中，进行遮盖字符的预测，计算交叉熵损失；将构造为三元组的第一训练事件输入初始粗筛模型，利用Triplet损失函数进行对比学习训练，计算Triplet损失；将所述交叉熵损失与所述Triplet损失之和作为最终损失，当所述最终损失达到平稳，训练完成，得到已训练的粗筛模型。 8.根据权利要求6所述的事件共指消解方法，其特征在于，所述第一训练事件的事件文本表示为事件抽取模型抽取得到事件信息后，将所述事件信息拼接而成。 9.根据权利要求6所述的事件共指消解方法，其特征在于，所述精筛模型的训练步骤包括：获取第二训练集，所述第二训练集中包括第二训练事件；将所述第二训练事件输入已训练的粗筛模型，编码后得到所述第二训练事件对应的第二训练向量；根据所述第二训练向量在预先建立的存量训练事件池中进行向量检索，所述存量训练事件池中包括：存量训练事件，以及与所述存量训练事件对应的存量训练向量，所述存量训练向量是利用已训练的粗筛模型对所述存量训练事件进行编码得到；经向量检索后得到训练向量表征池，所述训练向量表征池中包括与所述第二训练向量对应的所有目标存量训练向量；根据各个所述目标存量训练向量得到对应的目标存量训练事件，将所述目标存量训练事件作为所述第二训练事件对应的训练候选事件，所有所述训练候选事件形成训练候选事件池；构造所述第二训练事件与各个训练候选事件之间的训练事件对；将经人工标注处理后的所述训练事件对输入初始精筛模型，对所述初始精筛模型进行训练；训练完成，得到已训练的精筛模型。 10.根据权利要求9所述的事件共指消解方法，其特征在于，所述存量训练事件的事件文本表示为上游的事件抽取模型抽取得到事件信息后，将所述事件信息拼接而成，所述第二训练集中的第二训练事件是在所述存量训练事件池中随机抽取得来。 11.根据权利要求10所述的事件共指消解方法，其特征在于，将所述第二训练事件输入已训练的粗筛模型，编码后得到所述第二训练事件对应的第二训练向量之前，还包括：预先在所述第二训练事件的事件文本表示中加入对应的原始文本、原始文本的前后字符，以及指示各要素的特殊字符，所述特殊字符的嵌入为随机初始化得来。 12.根据权利要求9所述的事件共指消解方法，其特征在于，对所述训练事件对进行人工标注的步骤包括：权　利　要　求　书 2/3 页 3 CN 115186820 A 3

专利 事件共指消解方法、装置、终端及计算机可读存储介质

专利事件共指消解方法、装置、终端及计算机可读存储介质