专利 一种文本匹配模型的训练方法、装置、设备及介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211043497.6 (22)申请日 2022.08.29 (71)申请人重庆长安汽车股份有限公司地址 400023 重庆市江北区建新东路260号 (72)发明人陈浩　 (74)专利代理机构上海光华专利事务所(普通合伙) 31219 专利代理师吴向青 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种文本匹配模型的训练方法、装置、设备及介质 (57)摘要本发明涉及文本检索技术领域，提供一种文本匹配模型的训练方法，所述方法包括：获取待输入文本集数据；在神经网络模型中建立约束层，生成约束权重矩阵；将所述待输入文本输入至神经网络模型中的编码层，生成编码向量；将所述字符向量输入至神经网络模型中的解码层，生成解码向量；对所述解码向量进行归一化处理，生成样本数据集；根据所述约束权重矩阵，对文本匹配模型进行训练，获得训练好的文本匹配模型。本发明能够缩小特征向量的存储内存，降低文本匹配模型的训练成本。权利要求书2页说明书9页附图4页 CN 115374250 A 2022.11.22 CN 115374250 A 1.一种文本匹配模型的训练方法，其特征在于，所述方法包括：获取待输入文本集数据，所述待输入文本集数据包括多个待输入文本；在神经网络模型中建立约束层，生成约束权重矩阵；将所述待输入文本输入至神经网络模型中的编码层，生成编码向量，所述编码向量包括多个字符向量；将所述字符向量输入至神经网络模型中的解码层，生成解码向量；对所述解码向量进行归一化处理，生成样本数据集；根据所述约束权重矩阵，对文本匹配模型进行训练，获得训练好的文本匹配模型。 2.根据权利要求1所述的文本匹配模型的训练方法，其特征在于，所述待输入文本包括多个字符。 3.根据权利要求1所述的文本匹配模型的训练方法，其特征在于，所述在神经网络模型中建立约束层，生成约束权重矩阵的步骤包括：将起点编码设置为初始节点；从所述初始节点出发，将所述待输入文本中的所有字符依次串接起来，生成字符串；将终点编码设置为结束节点；将所述初始节点通过所述字符串与所述结束节点相连，生成约束权重矩阵。 4.根据权利要求1所述的文本匹配模型的训练方法，其特征在于，所述将所述待输入文本输入至神经网络模型中的编码层，生成编码向量，所述编码向量包括多个字符向量的步骤包括：将所述待输入文本输入至神经网络模型中的编码层节点，生成多个字符向量；对多个所述字符向量依次进行矩阵处理，生成隐藏层向量；对所述隐藏层向量进行编码处理，生成编码向量。 5.根据权利要求1所述的文本匹配模型的训练方法，其特征在于，所述将所述字符向量输入至神经网络模型中的解码层，生成解码向量的步骤还包括：将所述字符向量输入至神经网络模型中的解码层，生成初始隐藏向量；将所述初始隐藏向量进行加权处理，生成加权向量；将所述加权向量输入至卷积层，生成解码向量。 6.根据权利要求1所述的文本匹配模型的训练方法，其特征在于，所述对所述解码向量进行归一化处理，生成样本数据集的步骤包括：在所述神经网络模型中设置激活函数；根据所述激活函数，将所有所述解码向量转化为概率分布向量，所有所述概率分布向量构成一个样本数据集。 7.根据权利要求6所述的文本匹配模型的训练方法，其特征在于，所述概率分布向量的概率和为一。 8.一种文本匹配模型的训练装置，其特征在于，所述装置包括：数据获取模块，用于获取待输入文本集数据，所述待输入文本集数据包括多个待输入文本；约束权重矩阵生成模块，用于在神经网络模型中建立约束层，生成约束权重矩阵；编码向量生成模块，用于将所述待输入文本输入至神经网络模型中的编码层，生成编权　利　要　求　书 1/2 页 2 CN 115374250 A 2码向量，所述编码向量包括多个字符向量；解码向量生成模块，用于将所述字符向量输入至神经网络模型中的解码层，生成解码向量；样本数据集生成模块，用于对所述解码向量进行归一化处理，生成样本数据集；文本匹配模型生成模块，用于根据所述约束权重矩阵，对文本匹配模型进行训练，获得训练好的文本匹配模型。 9.一种电子设备，其特征在于，所述电子设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述电子设备实现如权利要求 1至7中任一项所述的文本匹配模型的训练方法。 10.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，当所述计算机程序被计算机的处理器执行时，使计算机执行权利要求 1至7中任一项所述的文本匹配模型的训练方法。权　利　要　求　书 2/2 页 3 CN 115374250 A 3

专利 一种文本匹配模型的训练方法、装置、设备及介质

专利一种文本匹配模型的训练方法、装置、设备及介质