团体标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211162738.9 (22)申请日 2022.09.23 (71)申请人 北京智谱华 章科技有限公司 地址 100084 北京市海淀区中关村东路1号 院6号楼6层6 03A (72)发明人 汪彦冰 张泽龙 陈亦舟  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 专利代理师 张润 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/35(2019.01) G06F 40/279(2020.01) G06F 40/35(2020.01) G06K 9/62(2022.01) (54)发明名称 一种基于多标签分类模型的STAR面试提问 方法及设备 (57)摘要 本发明提出一种基于多标签分类模型的 STAR面试提问方法及设备, 该方法通过 获取历史 面试对话数据, 进行数据预处理和标签分类, 得 到历史面试对话数据集, 用于训练面试对话标签 分类模型; 将实时的面试对话输入训练完成的对 话标签分类模 型, 以对实时的面试对话进行标签 分类, 将标签分类映射到STAR面试法的分类中, 按照STAR面试法的对话逻辑输出对应的实时面 试对话的下一轮提问会话。 通过本发明, 能够在 面试中的表现的更为专业, 更全面的掌握面试者 情况, 同时使整个面试逻辑具有更强的可解释 性。 权利要求书2页 说明书7页 附图2页 CN 115525745 A 2022.12.27 CN 115525745 A 1.一种基于多标签分类模型的STAR面试提问方法, 其特 征在于, 包括: 获取历史面试对话数据, 进行 数据预处 理和标签分类, 得到历史面试对话数据集; 构建面试对话标签分类模型, 将所述历史面试对话数据集作为训练集, 对所述面试对 话标签分类模型进行模型训练; 将实时的历史面试对话数据输入训练完成的所述面试对话标签分类模型中, 得到实时 历史面试对话的分类标签; 基于所述实时历史面试对话对应的分类标签, 映射到STAR面试方法中, 确定与实时历 史面试对话对应的分类标签对应的提问会话。 2.根据权利要求1所述的基于多标签分类模型的STAR面试提问方法, 其特征在于, 对历 史面试对话数据进行 数据预处 理的步骤 包括: 去除历史面试对话数据中的停用词; 识别所述历史面试对话数据中的提问部分, 提取提问部分的关键词; 识别所述历史面试对话数据中的回答部分, 提取回答部分的答案摘要; 将去除停用词后提取的提问部分的关键词和对应回答部分的答案摘要进行标签分类 标注, 得到的历史面试对话数据集按比例分配, 作为对所述面试对话标签分类模型 的训练 集和测试集。 3.根据权利要求1所述的基于多标签分类模型的STAR面试提问方法, 其特征在于, 所述 面试对话标签分类模型采用改进的广义线性模型, 在广义线性模型中增加全连接层, 得到 改进的广义线性模型。 4.根据权利要求1所述的基于多标签分类模型的STAR面试提问方法, 其特征在于, 所述 历史面试对话数据采用原始的面试场景ASR后的文本内容; 将去除停用 词后提取的提问部 分的关键词和对应回答部 分的答案摘要进 行标签分类标注时, 按照 STAR面试法的规则进 行 标签标注。 5.根据权利要求3所述的基于多标签分类模型的STAR面试提问方法, 其特征在于, 对所 述面试对话标签分类模型进行模型训练的步骤中, 将标注分类结果的, 作为训练集的历史 面试对话数据输入所述面试对话标签分类模型中, 通过调整模型参数和 函数, 使设定的损 失函数最小, 且模型输出 的分类结果与标注分类结果的比值达到指定比例阈值时, 对应的 模型作为 最优模型。 6.根据权利要求1所述的基于多标签分类模型的STAR面试提问方法, 其特征在于, 对所 述历史面试对话数据中提问部分进行关键词 提取时, 采用TF ‑IDF模型, 以每一场面试为单 位, 将对应面试场次中的问答内容的文本内容进行切分, 计算IDF, 以进 行关键词提取; 对 所 述历史面试对话数据中回答部分进行答案摘要提取时, 采用textRan k实现。 7.根据权利要求1所述的基于多标签分类模型的STAR面试提问方法, 其特征在于, 所述 STAR面试法将每一面试场次中的问答内容进行标签分类, 分为S(situation, 背景)、 T (task, 任务)、 A(action, 行动)和R(result, 结果)四个大类, 每一大类分为若干小类; 通过 所述面试对话标签分类模型, 对实时输入的对话内容进行标签分类, 将标签分类结果与 STAR面试法所述的小类进 行匹配, 将实时输入的对话内容划分至STAR面试法的四大类标签 所属的任意小类, 并按照所述STAR面试法输出与对应小类对应的面试问题。 8.一种基于多标签分类模型的STAR面试提问装置, 其特 征在于, 包括:权 利 要 求 书 1/2 页 2 CN 115525745 A 2数据处理模块, 用于获取历史面试对话数据, 进行数据预处理和标签分类, 得到历史面 试对话数据集; 模型训练模块, 用于构建面试对话标签分类模型, 将所述历史面试对话数据集作为训 练集, 对所述 面试对话标签分类模型进行模型训练; 标签分类模块, 用于将 实时的历史面试对话数据输入训练完成的所述面试对话标签分 类模型中, 得到实时历史面试对话的分类标签; 输出模块, 用于基于所述实时历史面试对话对应的分类标签, 映射到STAR面试方法中, 确定与实时历史面试对话对应的分类标签对应的提问会话。 9.一种电子设备, 包括: 至少一个处理器; 以及与 所述至少一个处理器通信连接的存储 器; 其中, 所述存储器存储有 可被所述至少一个处理器执行的指令, 所述指 令被所述至少一 个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑7中任一项所述的方法中的 各步骤。 10.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于 使所述计算机执 行根据权利要求1 ‑7中任一项所述的方法中的各步骤。权 利 要 求 书 2/2 页 3 CN 115525745 A 3

.PDF文档 专利 一种基于多标签分类模型的STAR面试提问方法及设备

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于多标签分类模型的STAR面试提问方法及设备 第 1 页 专利 一种基于多标签分类模型的STAR面试提问方法及设备 第 2 页 专利 一种基于多标签分类模型的STAR面试提问方法及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:11:06上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。