团体标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211126285.4 (22)申请日 2022.09.15 (71)申请人 华能国际电力股份有限公司 地址 100031 北京市西城区复兴门南大街 丙2号 申请人 西安热工 研究院有限公司 (72)发明人 刘骁 崔逸群 陈燕 白发琪  杨东 毕玉冰 刘超飞 王文庆  邓楠轶 朱召鹏 王艺杰 崔鑫  刘迪 肖力炀 朱博迪 董夏昕  介银娟  (74)专利代理 机构 北京三聚阳光知识产权代理 有限公司 1 1250 专利代理师 王娜(51)Int.Cl. H04M 3/22(2006.01) H04W 12/121(2021.01) G10L 25/48(2013.01) G10L 15/26(2006.01) G06F 16/35(2019.01) G06F 16/33(2019.01) (54)发明名称 一种语音检测模 型构建和语音识别方法、 装 置及电子设备 (57)摘要 本发明公开了一种语音检测模型构建和语 音识别方法、 装置及电子设备, 方法包括: 获取通 话语音样 本集; 对语音样本集中的语音样本进行 文本转化得到文本集; 对文本集进行目标静态特 征提取并将提取到的目标静态特征转换得到目 标静态特征向量; 利用文本集中的训练文本集以 及每一个训练文本对应的目标静态特征向量对 预设检测模型进行训练, 得到语音检测模型; 获 取待检测通话语音数据; 利用语音检测模型对待 检测通话语音数据对应的目标静态特征进行检 测, 根据检测结果判定待检测通话语音数据的类 型。 本发明通过语音检测模型判断通话语音是否 为诈骗电话, 对用户实时提示告警, 并将诈骗电 话号码加入黑名单, 提高了防范的便利性以及智 能化程度。 权利要求书2页 说明书7页 附图3页 CN 115499541 A 2022.12.20 CN 115499541 A 1.一种语音检测模型构建方法, 其特 征在于, 所述方法包括: 获取通话语音样本集, 所述通话语音样本集包括正常通话语音样本和非正常通话语音 样本; 对所述通话语音样本集中的通 话语音样本进行文本转 化得到对应的文本集; 对所述文本集进行目标静态特征提取并将提取到的目标静态特征进行向量转换得到 目标静态特 征向量; 利用所述文本集中的训练文本集以及训练文本集中每一个训练文本对应的目标静态 特征向量对预设检测模型进行训练, 得到语音检测模型。 2.根据权利要求1所述的语音检测模型构建方法, 其特征在于, 利用所述文本集中的训 练文本集以及训练文本集中每一个训练文本对应的目标静态特征向量对预设检测模型进 行训练, 得到语音检测模型之后, 所述方法还 包括: 利用所述文本集中的测试文本集对所述语音检测模型进行准确性测试; 当准确性测试结果不满足要求, 重新确定所述文本集中用于训练 的训练文本集的文本 数量并重新进行训练, 直至训练得到的语音检测模型的准确性满足要求。 3.根据权利要求1所述的语音检测模型构建方法, 其特征在于, 对所述通话语音样本集 中的通话语音样本进行文本转 化得到对应的文本集, 包括: 对所述通话语音样本集中的通 话语音样本进行 预处理; 对预处理后的语音 进行语音建模, 得到发音序列; 提取所述发音序列中的表达语言含义的特 征信息; 根据所述特 征信息进行最小 文本单元识别; 利用预设组合条件 对识别出的最小 文本单元进行组合操作得到文本集。 4.一种语音识别方法, 其特 征在于, 所述方法包括: 获取待检测通 话语音数据; 将所述待检测通 话语音数据转换为文本数据并进行目标静态特 征提取; 利用语音检测模型对所述待检测通话语音数据对应的目标静态特征进行检测, 所述语 音检测模型为利用如权利要求1 ‑3中任一项所述的语音检测模型构建方法构建得到; 根据所述语音检测模型的检测结果判定所述待检测通 话语音数据的类型。 5.根据权利要求 4所述的语音识别方法, 其特 征在于, 所述方法还 包括: 若所述待检测通话语音数据的类型为非正常通话语音, 向用户发送告警信 息并将所述 待检测通 话语音数据所属的手机号加入黑名单。 6.根据权利要求5所述的语音识别方法, 其特 征在于, 所述方法还 包括: 当检测到通 话请求时, 对所述 通话请求对应的手机号进行检测; 当检测到手机号在所述 黑名单中, 停止响应所述 通话请求; 当检测到手机号不在所述黑名单中, 响应所述通话请求并利用所述语音检测模型对通 话过程进行检测。 7.一种语音检测模型构建装置, 其特 征在于, 所述装置包括: 样本获取模块, 用于获取通话语音样本集, 所述通话语音样本集包括正常通话语音样 本和非正常通 话语音样本; 文本转化模块, 用于对所述通话语音样本集中的通话语音样本进行文本转化得到对应权 利 要 求 书 1/2 页 2 CN 115499541 A 2的文本集; 静态特征提取模块, 用于对所述文本集进行目标静态特征提取并将提取到的目标静态 特征进行向量 转换得到目标静态特 征向量; 模型训练模块, 用于利用所述文本集中的训练文本集以及训练文本集中每一个训练文 本对应的目标静态特 征向量对预设检测模型进行训练, 得到语音检测模型。 8.一种语音识别装置, 其特 征在于, 所述装置包括: 语音获取模块, 用于获取待检测通 话语音数据; 静态特征提取模块, 用于将所述待检测通话语音数据转换为文本数据并进行目标静态 特征提取; 语音检测模块, 用于利用语音检测模型对所述待检测通话语音数据对应的目标静态特 征进行检测, 所述语音检测模型为利用如权利要求1 ‑3中任一项所述的语音检测模型构建 方法构建得到; 语音判断模块, 用于根据所述语音检测模型的检测结果判定所述待检测通话语音数据 的类型。 9.一种电子设备, 其特征在于, 包括: 至少一个处理器; 以及与所述至少一个处理器通 信连接的存储器; 其中, 所述存储器存储有 可被所述至少一个处理器执行的指 令, 所述指 令 被所述至少一个处理器执行, 以使所述至少一个处理器执行如权利要求1 ‑3任一所述的语 音检测模型构建方法的步骤, 或如权利要求 4-6中任一项所述的语音识别方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现如权利要求1 ‑3中任一项所述的语音检测模型构建方法的步骤, 或如 权利要求 4-6中任一项所述的语音识别方法的步骤。权 利 要 求 书 2/2 页 3 CN 115499541 A 3

.PDF文档 专利 一种语音检测模型构建和语音识别方法、装置及电子设备

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种语音检测模型构建和语音识别方法、装置及电子设备 第 1 页 专利 一种语音检测模型构建和语音识别方法、装置及电子设备 第 2 页 专利 一种语音检测模型构建和语音识别方法、装置及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:13:01上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。