专利 一种语音检测模型构建和语音识别方法、装置及电子设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211126285.4 (22)申请日 2022.09.15 (71)申请人华能国际电力股份有限公司地址 100031 北京市西城区复兴门南大街丙2号申请人西安热工研究院有限公司 (72)发明人刘骁　崔逸群　陈燕　白发琪　杨东　毕玉冰　刘超飞　王文庆　邓楠轶　朱召鹏　王艺杰　崔鑫　刘迪　肖力炀　朱博迪　董夏昕　介银娟　 (74)专利代理机构北京三聚阳光知识产权代理有限公司 1 1250 专利代理师王娜(51)Int.Cl. H04M 3/22(2006.01) H04W 12/121(2021.01) G10L 25/48(2013.01) G10L 15/26(2006.01) G06F 16/35(2019.01) G06F 16/33(2019.01) (54)发明名称一种语音检测模型构建和语音识别方法、装置及电子设备 (57)摘要本发明公开了一种语音检测模型构建和语音识别方法、装置及电子设备，方法包括：获取通话语音样本集；对语音样本集中的语音样本进行文本转化得到文本集；对文本集进行目标静态特征提取并将提取到的目标静态特征转换得到目标静态特征向量；利用文本集中的训练文本集以及每一个训练文本对应的目标静态特征向量对预设检测模型进行训练，得到语音检测模型；获取待检测通话语音数据；利用语音检测模型对待检测通话语音数据对应的目标静态特征进行检测，根据检测结果判定待检测通话语音数据的类型。本发明通过语音检测模型判断通话语音是否为诈骗电话，对用户实时提示告警，并将诈骗电话号码加入黑名单，提高了防范的便利性以及智能化程度。权利要求书2页说明书7页附图3页 CN 115499541 A 2022.12.20 CN 115499541 A 1.一种语音检测模型构建方法，其特征在于，所述方法包括：获取通话语音样本集，所述通话语音样本集包括正常通话语音样本和非正常通话语音样本；对所述通话语音样本集中的通话语音样本进行文本转化得到对应的文本集；对所述文本集进行目标静态特征提取并将提取到的目标静态特征进行向量转换得到目标静态特征向量；利用所述文本集中的训练文本集以及训练文本集中每一个训练文本对应的目标静态特征向量对预设检测模型进行训练，得到语音检测模型。 2.根据权利要求1所述的语音检测模型构建方法，其特征在于，利用所述文本集中的训练文本集以及训练文本集中每一个训练文本对应的目标静态特征向量对预设检测模型进行训练，得到语音检测模型之后，所述方法还包括：利用所述文本集中的测试文本集对所述语音检测模型进行准确性测试；当准确性测试结果不满足要求，重新确定所述文本集中用于训练的训练文本集的文本数量并重新进行训练，直至训练得到的语音检测模型的准确性满足要求。 3.根据权利要求1所述的语音检测模型构建方法，其特征在于，对所述通话语音样本集中的通话语音样本进行文本转化得到对应的文本集，包括：对所述通话语音样本集中的通话语音样本进行预处理；对预处理后的语音进行语音建模，得到发音序列；提取所述发音序列中的表达语言含义的特征信息；根据所述特征信息进行最小文本单元识别；利用预设组合条件对识别出的最小文本单元进行组合操作得到文本集。 4.一种语音识别方法，其特征在于，所述方法包括：获取待检测通话语音数据；将所述待检测通话语音数据转换为文本数据并进行目标静态特征提取；利用语音检测模型对所述待检测通话语音数据对应的目标静态特征进行检测，所述语音检测模型为利用如权利要求1 ‑3中任一项所述的语音检测模型构建方法构建得到；根据所述语音检测模型的检测结果判定所述待检测通话语音数据的类型。 5.根据权利要求 4所述的语音识别方法，其特征在于，所述方法还包括：若所述待检测通话语音数据的类型为非正常通话语音，向用户发送告警信息并将所述待检测通话语音数据所属的手机号加入黑名单。 6.根据权利要求5所述的语音识别方法，其特征在于，所述方法还包括：当检测到通话请求时，对所述通话请求对应的手机号进行检测；当检测到手机号在所述黑名单中，停止响应所述通话请求；当检测到手机号不在所述黑名单中，响应所述通话请求并利用所述语音检测模型对通话过程进行检测。 7.一种语音检测模型构建装置，其特征在于，所述装置包括：样本获取模块，用于获取通话语音样本集，所述通话语音样本集包括正常通话语音样本和非正常通话语音样本；文本转化模块，用于对所述通话语音样本集中的通话语音样本进行文本转化得到对应权　利　要　求　书 1/2 页 2 CN 115499541 A 2的文本集；静态特征提取模块，用于对所述文本集进行目标静态特征提取并将提取到的目标静态特征进行向量转换得到目标静态特征向量；模型训练模块，用于利用所述文本集中的训练文本集以及训练文本集中每一个训练文本对应的目标静态特征向量对预设检测模型进行训练，得到语音检测模型。 8.一种语音识别装置，其特征在于，所述装置包括：语音获取模块，用于获取待检测通话语音数据；静态特征提取模块，用于将所述待检测通话语音数据转换为文本数据并进行目标静态特征提取；语音检测模块，用于利用语音检测模型对所述待检测通话语音数据对应的目标静态特征进行检测，所述语音检测模型为利用如权利要求1 ‑3中任一项所述的语音检测模型构建方法构建得到；语音判断模块，用于根据所述语音检测模型的检测结果判定所述待检测通话语音数据的类型。 9.一种电子设备，其特征在于，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行如权利要求1 ‑3任一所述的语音检测模型构建方法的步骤，或如权利要求 4－6中任一项所述的语音识别方法的步骤。 10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1 ‑3中任一项所述的语音检测模型构建方法的步骤，或如权利要求 4－6中任一项所述的语音识别方法的步骤。权　利　要　求　书 2/2 页 3 CN 115499541 A 3

专利 一种语音检测模型构建和语音识别方法、装置及电子设备

专利一种语音检测模型构建和语音识别方法、装置及电子设备