团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211043497.6 (22)申请日 2022.08.29 (71)申请人 重庆长安汽车股份有限公司 地址 400023 重庆市江北区建新 东路260号 (72)发明人 陈浩 (74)专利代理 机构 上海光华专利事务所(普通 合伙) 31219 专利代理师 吴向青 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种文本匹配模型的训练方法、 装置、 设备 及介质 (57)摘要 本发明涉及文本检索技术领域, 提供一种文 本匹配模型的训练方法, 所述方法包括: 获取待 输入文本集数据; 在神经网络模型中建立约束 层, 生成约束权重矩阵; 将所述待输入文本输入 至神经网络模型中的编码层, 生成编码向量; 将 所述字符向量输入至神经网络模 型中的解码层, 生成解码向量; 对所述解码向量进行归一化处 理, 生成样 本数据集; 根据所述约束权重矩阵, 对 文本匹配模 型进行训练, 获得训练好的文本匹配 模型。 本发明能够缩小特征向量的存储内存, 降 低文本匹配模型的训练成本 。 权利要求书2页 说明书9页 附图4页 CN 115374250 A 2022.11.22 CN 115374250 A 1.一种文本匹配模型的训练方法, 其特 征在于, 所述方法包括: 获取待输入文本集数据, 所述待输入文本集数据包括多个待输入文本; 在神经网络模型中建立约束层, 生成约束权 重矩阵; 将所述待输入文本输入至神经网络模型中的编码层, 生成编码向量, 所述编码向量包 括多个字符向量; 将所述字符向量输入至神经网络模型中的解码层, 生成解码向量; 对所述解码向量进行归一 化处理, 生成样本数据集; 根据所述约束权 重矩阵, 对文本匹配模型进行训练, 获得训练好的文本匹配模型。 2.根据权利要求1所述的文本匹配模型的训练方法, 其特征在于, 所述待输入文本包括 多个字符。 3.根据权利要求1所述的文本匹配模型的训练方法, 其特征在于, 所述在神经网络模型 中建立约束层, 生成约束权 重矩阵的步骤 包括: 将起点编码设置为初始 节点; 从所述初始 节点出发, 将所述待输入文本中的所有字符依次串接起 来, 生成字符串; 将终点编码设置为结束节点; 将所述初始 节点通过所述字符串与所述结束节点相连, 生成约束权 重矩阵。 4.根据权利要求1所述的文本匹配模型的训练方法, 其特征在于, 所述将所述待输入文 本输入至神经网络模型中的编码层, 生成编码向量, 所述编码向量包括多个字符向量的步 骤包括: 将所述待输入文本 输入至神经网络模型中的编码层节点, 生成多个字符向量; 对多个所述字符向量依次进行矩阵处 理, 生成隐藏层向量; 对所述隐藏层向量进行编码处 理, 生成编码向量。 5.根据权利要求1所述的文本匹配模型的训练方法, 其特征在于, 所述将所述字符向量 输入至神经网络模型中的解码层, 生成解码向量的步骤 还包括: 将所述字符向量输入至神经网络模型中的解码层, 生成初始隐藏向量; 将所述初始隐藏向量进行加权处 理, 生成加权向量; 将所述加权向量输入至卷积层, 生成解码向量。 6.根据权利要求1所述的文本匹配模型的训练方法, 其特征在于, 所述对所述解码向量 进行归一 化处理, 生成样本数据集的步骤 包括: 在所述神经网络模型中设置 激活函数; 根据所述激活函数, 将所有所述解码向量转化为概率分布向量, 所有所述概率分布向 量构成一个样本数据集。 7.根据权利要求6所述的文本匹配模型的训练方法, 其特征在于, 所述概率分布向量的 概率和为一。 8.一种文本匹配模型的训练装置, 其特 征在于, 所述装置包括: 数据获取模块, 用于获取待输入文本集数据, 所述待输入文本集数据包括多个待输入 文本; 约束权重矩阵生成模块, 用于在神经网络模型中建立约束层, 生成约束权 重矩阵; 编码向量生成模块, 用于将所述待输入文本输入至神经网络模型中的编码层, 生成编权 利 要 求 书 1/2 页 2 CN 115374250 A 2码向量, 所述编码向量包括多个字符向量; 解码向量生成模块, 用于将所述字符向量输入至神经网络模型中的解码层, 生成解码 向量; 样本数据集 生成模块, 用于对所述 解码向量进行归一 化处理, 生成样本数据集; 文本匹配模型生成模块, 用于根据所述约束权重矩阵, 对文本匹配模型进行训练, 获得 训练好的文本匹配模型。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 一个或多个处 理器; 存储装置, 用于存储一个或多个程序, 当所述一个或多个程序被所述一个或多个处理 器执行时, 使得所述电子 设备实现如权利要求 1至7中任一项 所述的文本匹配模 型的训练方 法。 10.一种计算机可读存储介质, 其特征在于, 其上存储有计算机程序, 当所述计算机程 序被计算机的处理器执行时, 使计算机执行权利要求 1至7中任一项 所述的文本匹配模型的 训练方法。权 利 要 求 书 2/2 页 3 CN 115374250 A 3
专利 一种文本匹配模型的训练方法、装置、设备及介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 02:12:18
上传分享
举报
下载
原文档
(926.5 KB)
分享
友情链接
SN-T 2045-2022 进出口燃料油产品技术规范.pdf
德勤中国 数字化时代下的网络安全战略框架 .pdf
T-SMA 0031—2022 智能电力井盖监测模块检验规范 第 3 部分:气体.pdf
GM-T 0061-2018 动态口令密码应用检测规范.pdf
DB21-T 1799.3—2019 信息技术 信息服务管理规范 第3部分:IT系统运维 辽宁省.pdf
GB-T 20279-2015 信息安全技术 网络和终端隔离产权安全技术要求.pdf
DB3310-T 93-2022 公共数据授权运营指南 台州市.pdf
数世咨询 LLM驱动数字安全2024——AI安全系列报告.pdf
YD-T 面向云计算的安全运营中心能力要求 送审稿.pdf
GB-T 25069-2022 信息安全技术 术语.pdf
GB-Z 43510-2023 集成电路TSV三维封装可靠性试验方法指南.pdf
T-AHPCA 021—2021 聚乳酸可降解口罩.pdf
SAE_2001-01-2902_Factors Affecting Fuel System Certification Against Lightning Hazards.pdf
GB 9706.226-2021 医用电气设备 第2-26部分:脑电图机的基本安全和基本性能专用要求.pdf
T-ZSA 123—2022 磁悬浮飞轮储能本体技术规范.pdf
MZ-T 121-2018 护理床用桌子.pdf
DB3206-T 1019-2021 医疗保险 医疗服务大数据智能监控系统管理规范 南通市.pdf
GB-T 40660-2021 信息安全技术 生物特征识别信息保护基本要求.pdf
专利 敏感数据识别方法和装置.PDF
SN-T 0987.7-2013 出口危险货物中型散装容器检验规程 第7部分:纤维板中型散装容器.pdf
1
/
3
16
评价文档
赞助2.5元 点击下载(926.5 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。