(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211116183.4
(22)申请日 2022.09.14
(71)申请人 太保科技有限公司
地址 200010 上海市黄浦区中山 南路1号1 1
层(名义楼层)1 1V6室
(72)发明人 刘浪 武悦娇 任君翔
(74)专利代理 机构 北京集佳知识产权代理有限
公司 11227
专利代理师 张志梅
(51)Int.Cl.
G06F 16/33(2019.01)
G06F 16/35(2019.01)
G06K 9/62(2022.01)
(54)发明名称
一种意图匹配度分析模型的训练方法及装
置
(57)摘要
本申请公开了一种意图匹配度分析模型的
训练方法及装置, 方法包括: 获取样本数据集, 所
述样本数据集中包括多个样本数据, 一条样本数
据包括一个文本和一个意图, 所述样本数据具有
对应的样 本意图置信度; 将样 本数据输入初始模
型得到样 本数据对应的待定意图置信度; 利用所
述待定意图置信度与所述样本意图置信度的差
异调整所述初始模型得到意图匹配度分析模型,
所述意图匹配度分析模型用于分析文本与意图
的匹配度。 使用本申请公开的方法训练出的意图
匹配度分析模型可以分析出文本与意图的匹配
度, 即使是新的意图也可以通过分析匹配度进行
识别, 对零意图样本的意图进行分析识别, 提高
了意图识别的外延性。
权利要求书2页 说明书9页 附图4页
CN 115438153 A
2022.12.06
CN 115438153 A
1.一种意图匹配度分析模型的训练方法, 其特 征在于, 包括:
获取样本数据集, 所述样本数据集中包括多个样本数据, 一条样本数据包括一个文本
和一个意图, 所述样本数据具有对应的样本意图置信度, 所述样本意图置信度用于表示样
本数据中文本与意图的匹配程度;
将样本数据输入初始模型 得到样本数据对应的待定意图置信度;
利用所述待定意图置信度与所述样本意图置信度的差异调整所述初始模型得到意图
匹配度分析模型, 所述 意图匹配度分析模型用于分析文本与意图的匹配度。
2.根据权利要求1所述的方法, 其特 征在于, 所述分析文本与意图的匹配度包括:
获取多个待分析意图;
将待分析文本和所述多个待分析意图形成多个待分析数据, 一条待分析数据中包括所
述待分析文本和一个意图;
将待分析数据输入所述意图识别模型得到待分析数据对应的匹配度, 所述多个待分析
数据用于得到多个待分析 数据对应的匹配度;
根据所述多个待分析数据对应的匹配度确定所述待分析文本与所述多个待分析意图
的匹配度。
3.根据权利要求1所述的方法, 其特征在于, 所述初始模型包括: 参数数量大于预设参
数数量的初始模型。
4.根据权利要求3所述的方法, 其特 征在于, 所述方法进一 步包括:
将所述意图匹配度分析模型作为教师模型;
利用所述教师模型的特征提取层初始化学生模型的特征提取层, 所述学生模型的特征
提取层与所述教师模型的特 征提取层具有对应关系;
将样本数据输入所述学生模型得到样本数据对应的学生待定匹配度与特征提取层中
输出的学生特征匹配度, 所述学生特征匹配度有对应的教师特征匹配度, 所述教师特征匹
配度是通过 所述学生模型 特征提取层对应的教师模型 特征提取层获得的;
计算所述学生特 征匹配度与所述教师 特征匹配度的均方误差;
利用所述均方误差与所述学生待定匹配度得到学生匹配度;
利用所述学生匹配度与所述样本意图置信度的差异调整所述学生模型得到轻量级意
图匹配度分析模型。
5.一种意图匹配度分析模型的训练装置, 其特 征在于, 包括:
样本数据集获取模块, 用于获取样本数据集, 所述样本数据集中包括多个样本数据, 一
条样本数据包括一个文本和 一个意图, 所述样本数据具有对应的样本意图置信度, 所述样
本意图置信度用于表示样本数据中文本与意图的匹配程度;
待定意图置信度获取模块, 用于获取待定意图置信度, 将样本数据输入初始模型得到
样本数据对应的待定意图置信度;
模型调整模块, 用于调整初始模型, 利用所述待定意图置信度与所述样本意图置信度
的差异调整所述初始模型得到意图匹配度分析模型, 所述意图匹配度分析模型用于 分析文
本与意图的匹配度。
6.根据权利要求5所述的装置, 其特 征在于, 所述装置包括:
意图获取模块, 用于获取多个待分析意图;权 利 要 求 书 1/2 页
2
CN 115438153 A
2待分析数据生成模块, 用于生成待分析数据, 将待分析文本和所述多个意图形成多个
待分析数据, 一条待分析 数据中包括所述待分析文本和一个意图;
待分析数据匹配度生成模块, 用于生成待分析数据匹配度, 将待分析数据输入所述意
图识别模型得到待分析数据对应的匹配度, 所述多个待分析数据用于得到多个待分析数据
对应的匹配度;
分析结果确定模块, 用于确定意图匹配度分析结果, 根据所述多个待分析数据对应的
匹配度确定所述待分析文本与所述多个待分析意图的匹配度。
7.根据权利要求5所述的放置, 其特 征在于, 所述装置包括:
初始模型判断模块, 用于判断初始模型的参数 数量是否大于预设参数 数量。
8.根据权利要求5所述的装置, 其特 征在于, 所述装置进一 步包括:
教师模型确定模块, 用于确定教师模型, 将所述 意图匹配度分析模型作为教师模型;
学生模型初始化模块, 用于初始化学生模型, 利用所述教师模型的特征提取层初始化
学生模型的特征提取层, 所述学生模型的特征提取层与所述教师模型的特征提取层具有对
应关系;
学生匹配度获取模块, 用于获取学生匹配度, 将样本数据输入所述学生模型得到样本
数据对应的学生待定匹配度与特征提取层中输出的学生特征匹配度, 所述学生特征匹配度
有对应的教师 特征匹配度;
计算模块, 用于计算所述学生特 征匹配度与所述教师 特征匹配度的均方误差;
学生匹配度确定模块, 利用所述均方误差与所述学生待定匹配度得到学生匹配度;
学生模型调整模块, 用于调整学生模型, 利用所述学生匹配度与所述样本意图置信度
的差异调整所述学生模型 得到轻量级意图匹配度分析模型。
9.一种电子设备, 其特 征在于, 包括存 储器和处 理器, 其中:
所述存储器, 用于保存计算机程序;
所述处理器, 用于执行所述计算机程序, 以实现如权利要求1 ‑5任意一项所述的意图匹
配度分析模型的训练方法。
10.一种计算机可读存储介质, 其特征在于, 用于保存计算机程序, 其中, 所述计算机程
序被处理器执行时实现如权利要求1 ‑5任意一项所述的意图匹配度分析模型的训练方法。权 利 要 求 书 2/2 页
3
CN 115438153 A
3
专利 一种意图匹配度分析模型的训练方法及装置
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 02:12:00上传分享