团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211059854.8 (22)申请日 2022.08.31 (71)申请人 用友网络科技股份有限公司 地址 100094 北京市海淀区北清路68号 (72)发明人 陈超 任欣源 詹宇斌 张雷瀚 何鑫 方高林 何冠宇 (74)专利代理 机构 北京友联知识产权代理事务 所(普通合伙) 11343 专利代理师 马静 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/205(2020.01) G06N 20/00(2019.01) (54)发明名称 文本分类方法、 文本分类装置、 系统及可读 存储介质 (57)摘要 本发明提出了一种文本 分类方法、 文本分类 装置、 系统及可读存储介质。 文本分类方法, 包 括: 根据文本分类参数从多个预选分类模型中确 定第一模型以及多个第二模型; 根据第一文本数 据对多个第二模 型进行训练, 并确定训练后的多 个第二模型的多个输出数据; 根据多个输出数据 以及第一文本数据对第一模型进行训练; 对训练 后的第一模 型进行优化处理, 并对优化处理后的 第一模型进行压缩处理; 根据压缩后的第一模型 对待分类文本进行文本分类处理; 优化处理用于 提升第一模型的训练程度。 权利要求书2页 说明书12页 附图7页 CN 115455183 A 2022.12.09 CN 115455183 A 1.一种文本分类方法, 其特 征在于, 包括: 根据文本分类参数从多个预选分类模型中确定第一模型以及多个第二模型; 根据第一文本数据对所述多个第 二模型进行训练, 并确定训练后的所述多个第 二模型 的多个第二输出 数据; 根据多个所述第二输出 数据以及所述第一文本数据对所述第一模型进行训练; 对训练后的所述第 一模型进行优化处理, 并对优化处理后的所述第 一模型进行压缩处 理; 根据压缩后的所述第一模型对待分类文本进行文本分类处 理; 所述优化处 理用于提升所述第一模型的训练程度。 2.根据权利要求1所述的文本分类方法, 其特征在于, 在所述根据第 一文本数据对所述 多个第二模型进行训练之前, 还 包括: 为所述第一模型配置第一参数, 以使所述第一模型根据所述第一参数、 所述多个所述 输出数据以及所述第一文本数据进行训练。 3.根据权利要求1所述的文本分类方法, 其特征在于, 所述根据文本分类参数从多个预 选分类模型中确定第一模型以及多个第二模型, 具体包括: 根据第二文本数据对所述多个预选分类模型中的每 个预选分类模型进行训练; 计算每个训练后的所述预选分类模型对应的所述文本分类参数; 根据所述每个预选分类模型对应的文本分类参数的参数值, 从所述多个预选分类模型 中确定所述第一模型以及所述多个第二模型。 4.根据权利要求3所述的文本分类方法, 其特征在于, 所述文本分类参数包括以下至少 一种或其组合: 准确率、 精确率、 召回率以及F1分数。 5.根据权利要求1至4中任一项所述的文本分类方法, 其特征在于, 所述对训练后的所 述第一模型进行优化处 理, 具体包括: 为所述第一文本数据配置第 一预设函数, 为多个所述第 二输出数据配置多个第 二预设 函数; 对所述第一预设函数配置第一权 重, 对所述多个第二预设函数配置第二权 重; 根据所述第一权重和所述第二权重对所述第一预设函数和所述多个第二预设函数进 行加权求和处 理, 得到第一处 理函数; 根据所述第一处 理函数对所述第一模型进行优化处 理。 6.根据权利要求1至4中任一项所述的文本分类方法, 其特征在于, 在所述根据文本分 类参数从多个预选分类模型中确定第一模型以及多个第二模型之后, 还 包括: 为所述多个第二模型中的每 个第二模型配置不同的数据库。 7.根据权利要求1至4中任一项所述的文本分类方法, 其特征在于, 所述对优化处理后 的所述第一模型进行压缩处 理, 具体包括: 对所述优化处 理后的所述第一模型进行知识蒸馏处 理; 对所述知识蒸馏处 理后的所述第一模型进行自适应处 理。 8.一种文本分类装置, 其特 征在于, 包括: 确定单元, 用于根据文本分类参数从多个预选分类模型中确定第 一模型以及多个第 二 模型;权 利 要 求 书 1/2 页 2 CN 115455183 A 2处理单元, 用于根据第一文本数据对所述多个第二模型进行训练, 并确定训练后的所 述多个第二模型的多个输出 数据; 所述处理单元还用于: 根据多个所述输出 数据以及所述第一文本数据对所述第一模型进行训练; 对训练后的所述第 一模型进行优化处理, 并对优化处理后的所述第 一模型进行压缩处 理; 根据压缩后的所述第一模型对待分类文本进行文本分类处 理; 其中, 所述优化处 理用于提升所述第一模型的训练程度。 9.一种文本分类系统, 其特 征在于, 包括: 存储器, 所述存 储器存储有程序; 处理器, 所述处理器执行所述程序时实现如权利要求1至7中任一项所述的文本分类方 法。 10.一种可读存储介质, 其上存储有程序, 其特征在于, 所述程序被处理器执行时实现 如权利要求1至7中任一项所述的文本分类方法。权 利 要 求 书 2/2 页 3 CN 115455183 A 3
专利 文本分类方法、文本分类装置、系统及可读存储介质
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 02:15:24
上传分享
举报
下载
原文档
(1.1 MB)
分享
友情链接
联通 DevSecOps实践白皮书 2021.pdf
GB-T 33174-2016 资产管理 管理体系 GB-T 33173 应用指南.pdf
T-HAEPI 08—2023 核技术利用单位辐射事故应急预案编制指南.pdf
生成式大模型安全与隐私白皮书-之江实验室.pdf
GB-T 38318-2019 电力监控系统网络安全评估指南.pdf
YD-T 2703-2014 电信网和互联网安全防护基线配置要求及检测要求-web应用系统.pdf
GB-T 42467.2-2023 中医临床名词术语 第2部分:外科学.pdf
GM-T 0095-2020 电子招投标密码应用技术要求.pdf
美国国防部企业 DevSecOps 参考设计中英文正式版.pdf
GB-T 13591-2009 溶解乙炔气瓶充装规定.pdf
GB-T 39590.1-2020 机器人可靠性 第1部分:通用导则.pdf
GB-T 26119-2010 绿色制造 机械产品生命周期评价 总则.pdf
GB-T 4423-2020 铜及铜合金拉制棒.pdf
悬镜安全子芽 浅谈DevSecOps敏捷安全发展趋势 2021.pdf
GB-T 17393-2008 覆盖奥氏体不锈钢用绝热材料规范.pdf
GB-T 38625-2020 信息安全技术 密码模块安全检测要求.pdf
GB-T 8335-2011 气瓶专用螺纹.pdf
GB-T 40645-2021 信息安全技术 互联网信息服务安全通用要求.pdf
GB-T 2900.65-2023 电工术语 照明.pdf
GB-T 14844-2018 半导体材料牌号表示方法.pdf
1
/
3
22
评价文档
赞助2.5元 点击下载(1.1 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。