团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211071561.1 (22)申请日 2022.09.02 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 杨韬 (74)专利代理 机构 深圳市深佳知识产权代理事 务所(普通 合伙) 44285 专利代理师 聂秀娜 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/35(2019.01) G06F 40/284(2020.01) G06F 40/295(2020.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种多文档阅读理解方法、 装置、 设备及存 储介质 (57)摘要 本申请实施例提供了一种多文档阅读理解 方法、 装置、 设备及存储介质, 用于获取抽取出相 同答案的答复文档之间的语义特征, 从而增加答 案重排序模 型中的排序效果, 提升多文档阅读理 解的准确性。 包括: 获取目标问题、 目标问题对应 的多个答复文档并建立答案抽取模型和答案重 排序模型; 调用答案抽取模型获取多个答复文档 对目标问题的预测答案集; 将预测答案集按照相 同预测答案进行分类得到至少一个答案集; 调用 答案重排序模型获取至少一个答案集对应的至 少一个答案表征集合; 调用答案重排序模型获取 答案表征集合对应的预测答案的预测分数; 根据 预测分数输出目标问题对应的最终答案。 本申请 可应用于人工智能领域。 权利要求书3页 说明书17页 附图8页 CN 115455160 A 2022.12.09 CN 115455160 A 1.一种多 文档阅读理解方法, 其特 征在于, 包括: 获取目标问题、 所述目标问题对应的多个答复文档, 并建立答案抽取模型和答案重排 序模型; 调用所述 答案抽取模型获取 所述多个答复文档对所述目标问题的预测答案集; 将所述预测答案集按照相同预测答案进行分类得到 至少一个答案集; 调用所述答案重排序模型获取所述至少一个答案集对应的至少一个答案表征集合, 所 述至少一个答案集中每个答案集对应一个预测答案, 所述至少一个答案表征集合中的答案 表征为所述预测答案的表征向量; 调用所述 答案重排序模型获取 所述答案表征集 合对应的预测答案的预测分数; 根据所述预测分数输出 所述目标问题对应的最终答案 。 2.根据权利要求1所述的方法, 其特征在于, 所述调用所述答案重排序模型获取所述至 少一个答案集对应的至少一个答案表征集 合包括: 调用所述答案重排序模型获取所述目标问题与第一答复文档集中各个答复文档的第 一输出向量集合, 所述第一答复文档集包括所述至少一个答案集中第一答案集对应的答复 文档; 从所述第一输出向量集合中选择所述第一答复文档集对应的预测答案的字符串进行 池化得到所述第一 答案集中各个预测答案的中间答案表征集 合; 对所述中间答案表征集合进行自注意力处理得到所述第一答案集对应的预测答案的 第一答案表征; 依此类推, 遍历得到所述至少一个答案集中各个答案集对应的预测答案的答案表征, 并归类为所述至少一个答案表征集合, 所述第一答案表征包含于所述至少一个答案表征集 合。 3.根据权利要求2所述的方法, 其特征在于, 所述调用所述答案重排序模型获取所述目 标问题与第一 答复文档集中各个答复文档的第一输出向量 集合包括: 将所述目标问题的每个字符与所述第 一答复文档集合中每个答复文档的每个字符, 利 用开始字符与间隔字符进行拼接得到第一词序列集 合; 将所述第一词序列集 合输入所述 答案重排序模型 得到所述第一输出向量 集合。 4.根据权利要求2所述的方法, 其特征在于, 所述对所述中间答案表征集合进行自注意 力处理得到所述第一 答案集对应的预测答案的第一 答案表征包括: 对所述中间答案表征集合中的每个中间答案表征进行自注意力处理得到自注意预测 分数集合; 对所述自注意预测分数集 合中进行归一 化处理得到归一 化预测分数集 合; 对所述归一化预测分数集合中的各个归一化预测分数进行加权求和得到所述第一答 案表征。 5.根据权利要求1至4中任一项所述的方法, 其特 征在于, 所述方法还 包括: 获取训练样本集、 并建立初始答案抽取模型和初始答案重排序模型, 所述训练样本集 包括问题样本集、 所述问题样本集对应的答复文档样本集; 利用所述训练样本集训练所述初始答案抽取模型和所述初始答案重排序模型得到所 述答案抽取模型和所述 答案重排序模型。权 利 要 求 书 1/3 页 2 CN 115455160 A 26.根据权利要求5所述的方法, 其特征在于, 所述初始答案抽取模型和所述初始答案重 排序模型共享相同的编 码层, 所述利用所述训练样本集训练所述初始答案抽取模型和所述 初始答案 重排序模型 得到所述 答案抽取模型和所述 答案重排序模型包括: 调用所述编码层获取 所述训练样本集对应的第二输出向量; 将所述第二输出向量输入所述初始答案抽取模型 得到第一损失值和训练答案集; 将所述训练答案集输入所述初始答案 重排序模型 得到第二损失值; 利用所述第一损失值和所述第二损失值之和反向调整所述初始答案抽取模型和所述 初始答案 重排序模型的权 重参数得到所述 答案抽取模型和所述 答案重排序模型。 7.根据权利要求6所述的方法, 其特征在于, 所述将所述输出向量输入所述初始答案抽 取模型得到第一损失值和训练答案集包括: 将所述输出向量输入所述初始答案抽取模型 得到所述训练答案集; 获取所述输出向量的训练答案集中每个训练答案对应的开始词的预测分数和结束词 的预测分数; 利用激活函数将所述开始词的预测分数转化为第 一概率值, 并利用所述激活函数将所 述结束词的预测分数转 化为第二概率值; 根据所述第一 概率值和所述第二 概率值得到所述第一损失值; 所述将所述训练答案集输入所述初始答案 重排序模型 得到第二损失值包括: 将所述训练答案集输入所述初始答案重排序模型得到训练答案集对应的训练答案表 征集合; 获取所述训练答案表征集 合中各个训练答案对应的训练预测分数集 合; 利用激活函数将所述训练预测分数集 合中的各个训练预测分数转 化为第三概率值; 利用交叉熵和所述第三 概率值得到所述第二损失值。 8.一种多 文档阅读理解模型, 其特 征在于, 包括: 获取模块, 用于获取目标问题、 所述目标问题对应的多个答复文档、 答案抽取模型和答 案重排序模型; 处理模块, 用于调用所述答案抽取模型获取所述多个答复文档对所述目标问题的预测 答案集; 将所述预测 答案集按照相同预测答案进行分类得到至少一个答案集; 调用所述答 案重排序模型获取所述至少一个答案集对应的至少一个答案表征集合, 所述至少一个答案 集中每个答案集对应一个预测答案, 所述至少一个答案表征集合中的答案表征为所述预测 答案的表征向量; 调用所述答案重排序模型获取所述答案表征集合对应的预测答案的预测 分数; 输出模块, 用于根据所述预测分数输出 所述目标问题对应的最终答案 。 9.一种计算机设备, 其特 征在于, 包括: 存 储器、 处理器以及总线系统; 其中, 所述存 储器用于存 储程序; 所述处理器用于执行所述存储器中的程序, 所述处理器用于根据程序代码中的指令执 行权利要求1至7中任一项所述的方法; 所述总线系统用于连接所述存储器以及所述处理器, 以使所述存储器以及所述处理器 进行通信。 10.一种计算机可读存储介质, 包括指令, 当其在计算机上运行时, 使得计算机执行如权 利 要 求 书 2/3 页 3 CN 115455160 A 3
专利 一种多文档阅读理解方法、装置、设备及存储介质
文档预览
中文文档
29 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 02:11:45
上传分享
举报
下载
原文档
(1.1 MB)
分享
友情链接
GM-T 0056-2018 多应用载体密码应用接口规范.pdf
中国联通 5G专网安全技术白皮书.pdf
GB-T 24533-2019 锂离子电池石墨类负极材料.pdf
GM-T 0001.1-2012 祖冲之序列密码算法:第1部分:算法描述.pdf
GB-T 41131-2021 科技馆展览教育服务规范.pdf
GB-T 34618-2017 蒸汽疏水系统在线阀门内漏温度检测方法.pdf
DB3305-T 149—2020 长三角G60科创走廊“一网通办”专窗管理规范 湖州市.pdf
DB23-T 3281—2022 信息化项目应用系统预上线管理规范 黑龙江省.pdf
SY-T 7678-2023 二氧化碳驱油田站内工艺管道施工技术规范.pdf
GB-T 17876-2010 包装容器 塑料防盗瓶盖.pdf
DB14-T 281-2021 水泵装置节能技术导则 山西省.pdf
GB-T 26060-2010 钛及钛合金铸锭.pdf
GB-T 41772-2022 信息技术 生物特征识别 人脸识别系统技术要求.pdf
GB-T 33319-2016 塑料 聚乙烯 PE 透气膜专用料.pdf
GB-T 22653-2008 液化气体设备用紧急切断阀.pdf
GBT 4109-2022 交流电压高于1000V的绝缘套管.pdf
GB-T 29157-2012 浮法玻璃生产生命周期评价技术规范 产品种类规则.pdf
T-ASCQ 001—2022 波束形成定向扩声系统技术规范.pdf
GM-T 0034-2014 基于SM2密码算法的证书认证系统密码及其相关安全技术规范.pdf
T-CEC 5067—2022 火力发电工程安全检查规程.pdf
1
/
3
29
评价文档
赞助2.5元 点击下载(1.1 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。