(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211088370.6
(22)申请日 2022.09.07
(71)申请人 粤港澳大湾区数字经济 研究院 (福
田)
地址 518045 广东省深圳市福田区福保街
道市花路长富金茂大厦1号楼39楼
3901单元
(72)发明人 杨海钦 叶俊鹏
(74)专利代理 机构 深圳市君胜知识产权代理事
务所(普通 合伙) 44268
专利代理师 李可
(51)Int.Cl.
G06N 5/04(2006.01)
G06N 20/00(2019.01)
G06F 16/335(2019.01)G06F 16/35(2019.01)
G06F 40/205(2020.01)
(54)发明名称
事件共指消解方法、 装置、 终端及计算机可
读存储介质
(57)摘要
本发明所提供的事件共指消解方法、 装置、
终端及计算机可读存储介质, 所述事件共指消解
方法包括: 将目标事件输入预先训练的粗筛模
型, 在预先建立的存量事件库中检索得到与所述
目标事件对应的候选事件池; 构造所述目标事件
与所述候选事件池中各个候选事件之间的事件
对; 将各个所述事件对输入预先训练的精筛模
型, 确定各个所述事件对中目标事件与候选事件
之间的共指关系。 本发明通过使用预先训练的粗
筛模型进行检索, 将原来的存量事件库缩小为候
选事件池, 降低了推理时的计算量, 再通过预先
训练的精筛模型, 减少了上游模型误差的传播,
提升了推理效果。
权利要求书3页 说明书11页 附图5页
CN 115186820 A
2022.10.14
CN 115186820 A
1.一种事 件共指消解方法, 其特 征在于, 包括:
将目标事件输入预先训练的粗筛模型, 在预先建立的存量事件库中检索得到与所述目
标事件对应的候选事 件池;
构造所述目标事 件与所述 候选事件池中各个候选事 件之间的事 件对;
将各个所述事件对输入预先训练的精筛模型, 确定各个所述事件对中目标事件与候选
事件之间的共指关系。
2.根据权利要求1所述的事件共指消解方法, 其特征在于, 所述将目标事件输入预先训
练的粗筛模型, 在预先建立的存量事件库中检索得到与所述 目标事件对应的候选事件池,
包括:
将目标事件输入预先训练的粗筛模型, 对所述目标事件进行编码, 得到所述目标事件
对应的目标向量;
获取预先建立的存量事件库, 所述存量事件库中包括存量事件及与 所述存量事件对应
的存量向量, 所述存量向量是利用预 先训练的粗筛模型对所述存量事 件进行编码得到;
根据所述目标向量, 在所述存量事件库中进行向量检索, 得到向量表征池, 所述向量表
征池中包括与所述目标向量对应的所有目标存量向量;
获取与所述目标存量向量对应的目标存量事件, 将所述目标存量事件作为所述目标事
件对应的候选事 件, 所有所述 候选事件形成候选事 件池;
其中, 所述目标事件和所述存量事件均是由上游的事件抽取模型抽取得到事件信息
后, 将所述事 件信息拼接而成。
3.根据权利要求2所述的事件共指消解方法, 其特征在于, 将各个所述事件对输入预先
训练的精筛模型, 确定各个所述事 件对中目标事 件与候选事 件之间的共指关系, 包括:
将每个所述事件对中的目标事件和候选事件进行文本拼接, 得到各个事件对拼接文
本;
将每个所述事 件对拼接文本 输入预先训练的精筛模型, 编码得到事 件对的拼接向量;
对所述拼接向量进行分类处理, 得到概率评分结果, 根据所述概率评分结果确定所述
目标事件与所有所述 候选事件之间的共指关系。
4.根据权利要求3所述的事件共指消解方法, 其特征在于, 对所述拼接向量进行分类处
理, 得到概率评分结果, 根据所述概率评分结果确定所述 目标事件与所有所述候选事件之
间的共指关系之后, 还 包括:
若所述目标事件与 所述候选事件之间满足共指关系, 则将所述目标事件与 所述候选事
件聚集为事件簇。
5.根据权利要求3所述的事件共指消解方法, 其特征在于, 对所述拼接向量进行分类处
理, 得到概率评分结果, 根据所述概率评分结果确定所述 目标事件与所有所述候选事件之
间的共指关系之后, 还 包括:
若所述目标事件与 所述候选事件之间不满足共指关系, 则将所述目标事件以及与 所述
目标事件对应的目标向量加入到所述存量事件库中, 所述 目标事件作为新的存量事件, 所
述目标向量作为 新的存量向量。
6.根据权利要求1所述的事件共指消解方法, 其特征在于, 所述粗筛模型的训练步骤包
括:权 利 要 求 书 1/3 页
2
CN 115186820 A
2获取第一训练集, 利用自监督学习及对比学习训练初始粗筛模型, 得到已训练的粗筛
模型。
7.根据权利要求6所述的事件共指消解方法, 其特征在于, 所述获取第一训练集, 利用
自监督学习及对比学习训练初始粗筛模型, 得到已训练的粗筛模型, 包括:
获取第一训练集, 所述第一训练集中包括第一训练事 件;
将经遮盖字符处理的第一训练事件输入初始粗筛模型中, 进行遮盖字符的预测, 计算
交叉熵损失;
将构造为三元组的第一训练事件输入初始粗筛模型, 利用Triplet损失函数进行对比
学习训练, 计算Triplet损失;
将所述交叉熵损失与所述Triplet损失之和作 为最终损失, 当所述最终损失达到平稳,
训练完成, 得到已训练的粗筛模型。
8.根据权利要求6所述的事件共指消解方法, 其特征在于, 所述第 一训练事件的事件文
本表示为事件抽取模型抽取 得到事件信息后, 将所述事 件信息拼接而成。
9.根据权利要求6所述的事件共指消解方法, 其特征在于, 所述精筛模型的训练步骤包
括:
获取第二训练集, 所述第二训练集中包括第二训练事 件;
将所述第二训练事件输入已训练的粗筛模型, 编码后得到所述第 二训练事件对应的第
二训练向量;
根据所述第 二训练向量在预先建立的存量训练事件池中进行向量检索, 所述存量训练
事件池中包括: 存量训练事件, 以及与所述存量训练事件对应的存量训练向量, 所述存量训
练向量是利用已训练的粗筛模型对所述存量训练事 件进行编码得到;
经向量检索后得到训练向量表征池, 所述训练向量表征池中包括与 所述第二训练向量
对应的所有目标存量训练向量;
根据各个所述目标存量训练向量得到对应的目标存量训练事件, 将所述目标存量训练
事件作为所述第二训练事件对应的训练候选事件, 所有所述训练候选事件 形成训练候选事
件池;
构造所述第二训练事 件与各个训练候选事 件之间的训练事 件对;
将经人工标注 处理后的所述训练事件对输入初始精筛模型, 对所述初始精筛模型进行
训练;
训练完成, 得到已训练的精筛模型。
10.根据权利要求9所述的事件共指消解方法, 其特征在于, 所述存量训练事件的事件
文本表示为上游的事件抽取模型抽取得到事件信息后, 将所述事件信息拼接而成, 所述第
二训练集中的第二训练事 件是在所述存量训练事 件池中随机抽取 得来。
11.根据权利要求10所述的事件共指消解方法, 其特征在于, 将所述第 二训练事件输入
已训练的粗筛模型, 编码后得到所述第二训练事 件对应的第二训练向量之前, 还 包括:
预先在所述第 二训练事件的事件文本表示中加入对应的原始文本、 原始文本的前后字
符, 以及指示各要素的特殊字符, 所述特殊字符的嵌入为随机初始化得来。
12.根据权利要求9所述的事件共指消解方法, 其特征在于, 对所述训练事件对进行人
工标注的步骤 包括:权 利 要 求 书 2/3 页
3
CN 115186820 A
3
专利 事件共指消解方法、装置、终端及计算机可读存储介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 02:13:21上传分享