团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211387996.7 (22)申请日 2022.11.08 (71)申请人 阿里巴巴达摩院 (杭州) 科技有限公 司 地址 310023 浙江省杭州市余杭区五常街 道文一西路969号3幢5层516室 (72)发明人 杨浩 林俊旸 杨安 王鹏 周畅 杨红霞 (74)专利代理 机构 北京同钧律师事务所 16 037 专利代理师 柴海平 许怀远 (51)Int.Cl. G06F 16/34(2019.01) G06F 16/35(2019.01) G06F 40/289(2020.01) G06K 9/62(2022.01)G06F 16/332(2019.01) (54)发明名称 下游任务模型生成及任务执行的方法和设 备 (57)摘要 本申请提供一种下游任务模型生成及任务 执行的方法和设备。 本申请的方法, 通过获取所 述下游任务场景下的训练数据集, 并在预训练模 型的原有参数上增加下游任务执行参数, 在对预 训练模型进行微调训练过程中, 固定预训练模型 的原有参数, 只基于下游任务场景下的训练数据 集优化增加的少量下游任务执行参数, 从而可以 保留预训练模 型在预训练预语料中学习的知 识, 并且减少需要优化的参数数量, 在仅仅使用少量 样本的情况获得较好的微调训练效果, 能够减少 微调所有模 型参数带来的计算开销, 提高预训练 模型微调的效率, 实现预训练模型的快速微调, 提高下游任务模型的生成效率和性能。 权利要求书3页 说明书16页 附图8页 CN 115438176 A 2022.12.06 CN 115438176 A 1.一种下游任务模型生成方法, 其特征在于, 所述下游任务模型应用于自然语言处理 领域或计算机 视觉领域, 所述方法包括: 获取下游任务场景 下的训练数据集; 在预训练模型的原有参数 上增加下游任务执 行参数; 使用所述训练数据集调整所述预训练模型中的下游任务执行参数, 生成所述下游任务 的任务模型, 所述下游任务的任务模型用于执 行所述下游任务。 2.根据权利要求1所述的方法, 其特征在于, 所述在预训练模型的原有参数上增加下游 任务执行参数, 包括: 从设置的词表中选择多个词, 生成所述多个词的词向量; 根据所述多个词的词向量, 生成所述预训练模型中每层对应的下游任务执行参数, 每 层对应的下游任务执 行参数包 含至少一个词向量; 在所述预训练模型中每层的原有参数 上增加对应的下游任务执 行参数。 3.根据权利要求2所述的方法, 其特 征在于, 还 包括: 根据所述下游任务场景 下的训练数据集, 设置所述下游任务场景 下使用的词表。 4.根据权利要求2所述的方法, 其特征在于, 所述在所述预训练模型中每层的原有参数 上增加对应的下游任务执 行参数, 包括: 在所述预训练模型中每层的原有参数的前面 拼接对应的下游任务执 行参数。 5.根据权利要求1所述的方法, 其特征在于, 所述获取下游任务场景下的训练数据集, 包括: 获取所述下游任务场景 下的样本数据; 根据所述下游任务场景下任务模型的输入的格式信 息, 生成所述样本数据对应的输入 信息; 获取所述输入信息对应的标注数据, 所述输入信息及标注数据构成训练数据集。 6.根据权利要求5所述的方法, 其特征在于, 所述根据所述下游任务场景下任务模型的 输入的格式信息, 生成所述样本数据对应的输入信息, 包括: 获取所述下游任务场景下的输入提示模板, 所述输入提示模板根据所述下游任务场景 下任务模型的输入的格式信息确定; 根据所述样本数据和所述下游任务场景下的输入提示模板, 生成所述样本数据对应的 输入信息 。 7.根据权利要求1所述的方法, 其特征在于, 在生成所述下游任务的任务模型之后, 还 包括: 将所述下游任务的任务模型发送至用于执 行下游任务的电子设备。 8.根据权利要求1所述的方法, 其特征在于, 在生成所述下游任务的任务模型之后, 还 包括: 存储所述下游任务的任务模型; 响应于所述下游任务的执 行指令, 获取 所述下游任务的输入数据; 根据所述下游任务场景 下任务模型的输入的格式信息, 生成任务模型的输入信息; 将所述输入信息 输入所述下游任务的任务模型进行处 理, 得到下游任务处 理结果; 输出所述下游任务处 理结果。权 利 要 求 书 1/3 页 2 CN 115438176 A 29.根据权利要求1 ‑8中任一项所述的方法, 其特征在于, 所述预训练模型为预训练的语 言模型, 所述下游任务包括如下至少一种: 视觉问答任务, 用于根据输入的图像和问题, 从输入图像的视觉信息中确定问题的答 案; 图像描述任务, 用于生成输入图像的描述文本; 视觉蕴涵任务, 用于预测输入图像和文本在语义上的相关性; 指代表达与理解任务, 用于根据输入文本定位输入图像中与输入文本对应的图像区 域; 图像生成任务, 用于基于 输入的描述文本生成图像; 基于文本的情感分类任务, 用于预测输入文本的情感分类信息; 文本摘要任务, 用于生成输入文本的摘要信息 。 10.一种任务执行方法, 其特征在于, 应用于自然语言处理领域或计算机视觉领域, 所 述方法包括: 响应于下游任务执 行指令, 获取输入数据; 根据所述下游任务场景下任务模型的输入的格式信 息, 生成所述输入数据对应的输入 信息; 将所述输入信息输入训练好的任务模型进行处理, 得到任务处理结果, 所述任务模型 是通过在预训练模型的原有参数上增加下游任务执行参数, 基于所述下游任务场景下的训 练数据集对所述预训练模型中的下游任务执 行参数进行调整后得到的; 输出所述任务处 理结果。 11.一种视 觉问答任务执 行方法, 其特 征在于, 包括: 获取输入的图像和问题文本; 根据视觉问答任务场景下视觉问答任务模型的输入的格式信息、 所述图像和问题文 本, 生成视 觉问答任务模型的输入信息; 将所述输入信息输入视觉问答任务模型进行处理, 得到所述问题文本对应的答案文 本, 所述视觉 问答任务模型是通过在预训练模型 的原有参数上增加下游任务执行参数, 基 于所述视觉 问答任务场景下的训练数据集对所述预训练模型中的下游任务执行参数进行 调整得到的; 输出所述问题文本对应的答案文本 。 12.根据权利要求11所述的方法, 其特征在于, 所述根据视觉问答任务场景下的输入提 示模板、 所述图像和问题文本, 生成视 觉问答任务模型的输入信息, 包括: 对所述图像进行编码, 生成对应的图像向量, 并对所述问题文本进行编码, 生成对应的 文本向量; 根据所述视觉问答任务场景下的输入提示模板, 将所述图像向量与所述文本向量拼 接, 得到视觉问答任务模型的输入信息 。 13.一种电子设备, 其特 征在于, 包括: 处 理器, 以及与所述处 理器通信连接的存 储器; 所述存储器存储计算机执 行指令; 所述处理器执行所述存储器存储的计算机执行指令, 以实现如权利要求1 ‑12中任一项权 利 要 求 书 2/3 页 3 CN 115438176 A 3
专利 下游任务模型生成及任务执行的方法和设备
文档预览
中文文档
28 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 02:13:20
上传分享
举报
下载
原文档
(774.1 KB)
分享
友情链接
DB 6505-T 169—2023 法定计量检定机构服务规范 哈密市.pdf
GB-T 41339.2-2022 海洋生态修复技术指南 第2部分:珊瑚礁生态修复.pdf
法律法规 杭州市民用建筑节能条例2014-12-31.pdf
ISO IEC 27005-2022 信息安全、 网络安全和隐私保护-信息安全风险管理指南.pdf
freebuf 2019企业安全威胁统一应对指南.pdf
GB-T 39590.1-2020 机器人可靠性 第1部分:通用导则.pdf
GB-T 31167-2014 信息安全技术 云计算服务安全指南.pdf
DB4105-T 172—2021 家政服务 家庭清洁服务规范 安阳市.pdf
GB-T 3880.3-2012 一般工业用铝及铝合金板、带材 第3部分:尺寸偏差.pdf
OWASP ASVS应用安全验证标准 4.0.3 中文版.pdf
SN-T 4243-2015 铜精矿中金、银、铂、钯、砷、汞、镉、镓、铟、锗、硒、碲、铊、镧的测定 电感耦合等离子体质谱法.pdf
上海市网络安全事件应急预案 2019.pdf
GB-T 42260-2022 磷酸铁锂电化学性能测试 循环寿命测试方法.pdf
GB-T 18725-2008 制造业信息化 技术术语.pdf
GB-T 20201-2006 灌溉用聚乙烯(PE)压力管机械连接管件.pdf
T-ZZB 2358—2021 紫外光 UV 固化漆饰面人造板.pdf
DB65-T 4458-2021 南疆盐碱地土壤调理剂施用技术规程 新疆维吾尔自治区.pdf
GB/T 39468-2020 陆地定量遥感产品真实性检验通用方法.pdf
TTAF 077.18—2022 APP收集使用个人信息最小必要评估规范 第18部分:剪切板信息.pdf
GB-T 32146.2-2015 检验检测实验室设计与建设技术要求 第2部分:电气实验室.pdf
1
/
3
28
评价文档
赞助2.5元 点击下载(774.1 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。