团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211162738.9 (22)申请日 2022.09.23 (71)申请人 北京智谱华 章科技有限公司 地址 100084 北京市海淀区中关村东路1号 院6号楼6层6 03A (72)发明人 汪彦冰 张泽龙 陈亦舟 (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 专利代理师 张润 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/35(2019.01) G06F 40/279(2020.01) G06F 40/35(2020.01) G06K 9/62(2022.01) (54)发明名称 一种基于多标签分类模型的STAR面试提问 方法及设备 (57)摘要 本发明提出一种基于多标签分类模型的 STAR面试提问方法及设备, 该方法通过 获取历史 面试对话数据, 进行数据预处理和标签分类, 得 到历史面试对话数据集, 用于训练面试对话标签 分类模型; 将实时的面试对话输入训练完成的对 话标签分类模 型, 以对实时的面试对话进行标签 分类, 将标签分类映射到STAR面试法的分类中, 按照STAR面试法的对话逻辑输出对应的实时面 试对话的下一轮提问会话。 通过本发明, 能够在 面试中的表现的更为专业, 更全面的掌握面试者 情况, 同时使整个面试逻辑具有更强的可解释 性。 权利要求书2页 说明书7页 附图2页 CN 115525745 A 2022.12.27 CN 115525745 A 1.一种基于多标签分类模型的STAR面试提问方法, 其特 征在于, 包括: 获取历史面试对话数据, 进行 数据预处 理和标签分类, 得到历史面试对话数据集; 构建面试对话标签分类模型, 将所述历史面试对话数据集作为训练集, 对所述面试对 话标签分类模型进行模型训练; 将实时的历史面试对话数据输入训练完成的所述面试对话标签分类模型中, 得到实时 历史面试对话的分类标签; 基于所述实时历史面试对话对应的分类标签, 映射到STAR面试方法中, 确定与实时历 史面试对话对应的分类标签对应的提问会话。 2.根据权利要求1所述的基于多标签分类模型的STAR面试提问方法, 其特征在于, 对历 史面试对话数据进行 数据预处 理的步骤 包括: 去除历史面试对话数据中的停用词; 识别所述历史面试对话数据中的提问部分, 提取提问部分的关键词; 识别所述历史面试对话数据中的回答部分, 提取回答部分的答案摘要; 将去除停用词后提取的提问部分的关键词和对应回答部分的答案摘要进行标签分类 标注, 得到的历史面试对话数据集按比例分配, 作为对所述面试对话标签分类模型 的训练 集和测试集。 3.根据权利要求1所述的基于多标签分类模型的STAR面试提问方法, 其特征在于, 所述 面试对话标签分类模型采用改进的广义线性模型, 在广义线性模型中增加全连接层, 得到 改进的广义线性模型。 4.根据权利要求1所述的基于多标签分类模型的STAR面试提问方法, 其特征在于, 所述 历史面试对话数据采用原始的面试场景ASR后的文本内容; 将去除停用 词后提取的提问部 分的关键词和对应回答部 分的答案摘要进 行标签分类标注时, 按照 STAR面试法的规则进 行 标签标注。 5.根据权利要求3所述的基于多标签分类模型的STAR面试提问方法, 其特征在于, 对所 述面试对话标签分类模型进行模型训练的步骤中, 将标注分类结果的, 作为训练集的历史 面试对话数据输入所述面试对话标签分类模型中, 通过调整模型参数和 函数, 使设定的损 失函数最小, 且模型输出 的分类结果与标注分类结果的比值达到指定比例阈值时, 对应的 模型作为 最优模型。 6.根据权利要求1所述的基于多标签分类模型的STAR面试提问方法, 其特征在于, 对所 述历史面试对话数据中提问部分进行关键词 提取时, 采用TF ‑IDF模型, 以每一场面试为单 位, 将对应面试场次中的问答内容的文本内容进行切分, 计算IDF, 以进 行关键词提取; 对 所 述历史面试对话数据中回答部分进行答案摘要提取时, 采用textRan k实现。 7.根据权利要求1所述的基于多标签分类模型的STAR面试提问方法, 其特征在于, 所述 STAR面试法将每一面试场次中的问答内容进行标签分类, 分为S(situation, 背景)、 T (task, 任务)、 A(action, 行动)和R(result, 结果)四个大类, 每一大类分为若干小类; 通过 所述面试对话标签分类模型, 对实时输入的对话内容进行标签分类, 将标签分类结果与 STAR面试法所述的小类进 行匹配, 将实时输入的对话内容划分至STAR面试法的四大类标签 所属的任意小类, 并按照所述STAR面试法输出与对应小类对应的面试问题。 8.一种基于多标签分类模型的STAR面试提问装置, 其特 征在于, 包括:权 利 要 求 书 1/2 页 2 CN 115525745 A 2数据处理模块, 用于获取历史面试对话数据, 进行数据预处理和标签分类, 得到历史面 试对话数据集; 模型训练模块, 用于构建面试对话标签分类模型, 将所述历史面试对话数据集作为训 练集, 对所述 面试对话标签分类模型进行模型训练; 标签分类模块, 用于将 实时的历史面试对话数据输入训练完成的所述面试对话标签分 类模型中, 得到实时历史面试对话的分类标签; 输出模块, 用于基于所述实时历史面试对话对应的分类标签, 映射到STAR面试方法中, 确定与实时历史面试对话对应的分类标签对应的提问会话。 9.一种电子设备, 包括: 至少一个处理器; 以及与 所述至少一个处理器通信连接的存储 器; 其中, 所述存储器存储有 可被所述至少一个处理器执行的指令, 所述指 令被所述至少一 个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑7中任一项所述的方法中的 各步骤。 10.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于 使所述计算机执 行根据权利要求1 ‑7中任一项所述的方法中的各步骤。权 利 要 求 书 2/2 页 3 CN 115525745 A 3
专利 一种基于多标签分类模型的STAR面试提问方法及设备
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 02:11:06
上传分享
举报
下载
原文档
(500.1 KB)
分享
友情链接
GB-T 14851-2009 电子工业用气体 磷化氢.pdf
GB-T 25341.2-2019 铁路旅客运输服务质量 第2部分:服务过程.pdf
GB-T 19668.4-2017 信息技术服务监理第4部分信息安全监理规范.pdf
GB-T 24627-2023 外科植入物用镍-钛形状记忆合金加工材.pdf
北京金融产业联盟 金融行业云原生安全体系研究报告 2024.pdf
GB-T 35274-2023 信息安全技术 大数据服务安全能力要求.pdf
GB T 17902.1-2023 信息技术 安全技术 带附录的数字签名 第1部分:概述.pdf
GB-T 26698-2022 考试用铅笔和涂卡专用笔.pdf
SL-T 247-2020 水文资料整编规范.pdf
GB-T 25068.5-2021 信息技术 安全技术 网络安全 第5部分:使用虚拟专用网的跨网通信安全保护.pdf
GB-T 37697-2019 露天煤矿边坡变形监测技术规范.pdf
GB-T 38114-2019 纳米技术 石墨烯材料表面含氧官能团的定量分析 化学滴定法.pdf
GB-T 37939-2019 信息安全技术 网络存储安全技术要求.pdf
GB50156-2021 2-汽车加油加气加氢站技术标准 GB 50156-2021.pdf
渗透测试战技101.pdf
NY-T 693-2020 澳洲坚果 果仁.pdf
GB-T 25052-2010 连续热浸镀层钢板和钢带尺寸、外形、重量及允许偏差.pdf
GB-T 4423-2020 铜及铜合金拉制棒.pdf
GB-T 25069-2022 信息安全技术 术语.pdf
JR-T 0083-2013 人身保险伤残评定标准及代码.pdf
1
/
3
12
评价文档
赞助2.5元 点击下载(500.1 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。