专利 语言模型的训练方法、确定用户意图的方法和相关装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211226122.3 (22)申请日 2022.10.09 (71)申请人京东科技信息技术有限公司地址 100176 北京市北京经济技术开发区科创十一街18号院2号楼6层6 01 (72)发明人黎陈　俞晓光　宋双永　 (74)专利代理机构中原信达知识产权代理有限责任公司 1 1219 专利代理师张效荣　王志远 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/332(2019.01) G06F 40/35(2020.01) G06F 40/247(2020.01) G06K 9/62(2022.01) (54)发明名称语言模型的训练方法、确定用户意图的方法和相关装置 (57)摘要本发明公开了一种语言模型的训练方法、确定用户意图的方法和相关装置，涉及计算机技术领域。该方法的一具体实施方式包括：对原始文本进行数据增强和文本转换，生成原始训练样本、第一训练样本和第二训练样本；将原始训练样本作为第一聚类算法的输入，第一训练样本和第二训练样本作为第一对比学习算法和第二对比学习算法的输入，得到总体损失函数；以总体损失函数对语言模型进行训练。该实施方式能够提高语言模型的转换准确性，保证簇内距离较小并且簇间距离较大，可以有效的区分不同的簇，提高聚类算法的鲁棒性差，从而使得聚类的结果更加准确，降低找到符合条件的新意图来扩充意图库的难度，提升用户体验。权利要求书2页说明书13页附图4页 CN 115525762 A 2022.12.27 CN 115525762 A 1.一种语言模型的训练方法，其特征在于，包括：对原始文本进行数据增强和文本转换，生成原始训练样本、第一训练样本和第二训练样本；将所述原始训练样本作为第一聚类算法的输入，所述第一训练样本和所述第二训练样本作为第一对比学习算法和第二对比学习算法的输入，得到总体损失函数；以所述总体损失函数对所述语言模型进行训练。 2.根据权利要求1所述的方法，其特征在于，所述对原始文本进行数据增强和文本转换，生成原始训练样本、第一训练样本和第二训练样本，包括：对所述原始文本进行同义词替换或反向翻译，得到与所述原始文本对应的第一文本和第二文本；分别将所述原始文本、所述第一文本和所述第二文本输入至所述语言模型，生成所述原始训练样本、与所述原始训练样本对应的所述第一训练样本和所述第二训练样本。 3.根据权利要求1所述的方法，其特征在于，所述将所述原始训练样本作为第一聚类算法的输入，所述第一训练样本和所述第二训练样本作为第一对比学习算法和第二对比学习算法的输入，得到总体损失函数，包括：将所述原始训练样本输入至所述第一聚类算法，通过所述第一聚类算法的聚类结果计算第一损失函数；将所述第一训练样本和所述第二训练样本作为第一对比学习算法的输入，计算第二损失函数；将所述第一训练样本和所述第二训练样本作为第二对比学习算法的输入，计算第三损失函数；计算所述第一损失函数、所述第二损失函数、所述第三损失函数的和，得到所述总体损失函数。 4.根据权利要求3所述的方法，其特征在于，所述将所述第一训练样本和所述第二训练样本作为第一对比学习算法的输入，计算第二损失函数，包括：将所述第一训练样本和所述第二训练样本输入至所述第一对比学习算法的线性层，得到对应的所述第一训练样本的第一向量和所述第二训练样本的第一向量；将对应同一所述原始训练样本的所述第一训练样本的第一向量和所述第二训练样本的第一向量作为相似对，将不对应同一所述原始训练样本的所述第一训练样本的第一向量和所述第二训练样本的第一向量作为不相似对，计算各所述第一训练样本和各所述第二训练样本的第二子损失函数；计算所有所述第一训练样本和所有所述第二训练样本的第二子损失函数的平均值并除以2，得到所述第二损失函数。 5.根据权利要求3所述的方法，其特征在于，所述将所述第一训练样本和所述第二训练样本作为第二对比学习算法的输入，计算第三损失函数，包括：将所述第一训练样本和所述第二训练样本输入至所述第二对比学习算法的线性层，得到对应的所述第一训练样本的第二向量和所述第二训练样本的第二向量；将对应同一所述原始训练样本的所述第一训练样本的第二向量和所述第二训练样本的第二向量作为相似对，将不对应同一所述原始训练样本的所述第一训练样本的第二向量权　利　要　求　书 1/2 页 2 CN 115525762 A 2和所述第二训练样本的第二向量作为不相似对，计算各所述第一训练样本和各所述第二训练样本的第三子损失函数；计算所有所述第一训练样本和所有所述第二训练样本的第三子损失函数的平均值并除以2，得到所述第三损失函数。 6.一种利用权利要求1至5中任一项所述的语言模型的训练方法所训练的语言模型来确定用户意图的方法，其特征在于，包括：将用户问题输入至训练后的所述语言模型中，生成对应的用户问题向量；通过第二聚类算法对所述用户问题向量进行分类，生成一个或多个用户问题簇；分析所述用户问题簇，得到与所述问题簇对应的用户意图。 7.一种语言模型的训练装置，其特征在于，包括：训练样本生成模块，用于对原始文本进行数据增强和文本转换，生成原始训练样本、第一训练样本和第二训练样本；损失函数计算模块，用于将所述原始训练样本作为第一聚类算法的输入，所述第一训练样本和所述第二训练样本作为第一对比学习算法和第二对比学习算法的输入，得到总体损失函数；训练模块，用于以所述总体损失函数对所述语言模型进行训练。 8.一种利用权利要求7所述的语言模型的训练装置所训练的语言模型来确定用户意图的装置，其特征在于，包括：用户问题向量生成模块，用于将用户问题输入至训练后的所述语言模型中，生成对应的用户问题向量；用户问题簇生成模块，用于通过第二聚类算法对所述用户问题向量进行分类，生成一个或多个用户问题簇；分析模块，用于分析所述用户问题簇，得到与所述问题簇对应的用户意图。 9.一种电子设备，其特征在于，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1 ‑6中任一所述的方法。 10.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1 ‑6中任一所述的方法。权　利　要　求　书 2/2 页 3 CN 115525762 A 3

专利 语言模型的训练方法、确定用户意图的方法和相关装置

专利语言模型的训练方法、确定用户意图的方法和相关装置