团体标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211148510.4 (22)申请日 2022.09.21 (71)申请人 吉林大学 地址 130012 吉林省长 春市前进大街269 9 号 (72)发明人 王芳荣 王昕宇 常志勇 孔铖  栾祥宇 白东升  (74)专利代理 机构 长春市恒誉 专利代理事务所 (普通合伙) 22212 专利代理师 梁紫钺 (51)Int.Cl. G06F 16/35(2019.01) G06K 9/62(2022.01) G06N 20/20(2019.01) (54)发明名称 一种基于人工智能的集成学习分类方法 (57)摘要 本发明公开了一种基于人工智能的集成学 习分类方法, 涉及集成学习分类技术领域, 包括 以下步骤: 对反馈文本进行收集; S2: 对待测样本 进行文本特征提取, 然后得到文本特征向量; 通 过集成分类器对待测样本进行分类, 得到待测样 本的分类结果; 同时根据设定关键字对文本信息 进行提取, 然后根据文本信息提取结果进行分 析, 得到待测样本的分类结果; 若两次待测样本 的分类结果并不相同, 则对该待测样本重新进行 检测, 若两次待测样本的分类结果相同, 则确定 最终分类结果, 对最终分类结果进行输出, 从而 提高了反馈文本的集成分类准确度。 权利要求书2页 说明书3页 附图1页 CN 115455188 A 2022.12.09 CN 115455188 A 1.一种基于人工智能的集成学习分类方法, 其特 征在于: 包括以下步骤: S1: 对反馈文本进行收集, 形成待测样本; S2: 对待测样本进行文本特 征提取, 然后得到文本特 征向量; S3: 通过集成分类 器对待测样本进行分类, 得到待测样本的分类结果; S4: 在进行S2的同时, 根据设定关键 字对待测样本文本信息进行提取; S5: 根据文本信息提取 结果进行分析, 得到待测样本的分类结果; S6: 对两次待测样本的分类结果进行分析判断, 确定最终分类结果; S7: 对最终分类结果进行输出。 2.根据权利要求1所述的一种基于人工智能的集成学习分类方法, 其特征在于: 所述S1 对反馈文本进行收集, 形成待测样本的步骤 包括: S11: 对反馈文本进行 预处理, 使反馈文本格式统一, 得到优化后的反馈文本; S12: 对反馈文本进行文本相似度检测, 获得有效反馈文本, 形成待测样本 。 3.根据权利要求2所述的一种基于人工智能的集成学习分类方法, 其特征在于: 所述 S12对反馈文本进 行文本相似度检测, 获得有效反馈文本的步骤中, 通过对收集的反馈文本 中的重复文本进行文本相似度检测, 将重复文本整合成有效文本, 获得有效反馈文本 。 4.根据权利要求1所述的一种基于人工智能的集成学习分类方法, 其特征在于: 所述S3 通过集成分类 器对待测样本进行分类, 得到待测样本的分类结果的步骤 包括: S31: 从历史数据库中获取反馈文本数据集, 并将反馈文本数据集分成训练样本集和测 试样本集; S32: 从训练样本集中取用不同的子训练样本集对集成分类器中不同类型的分类器分 别进行训练, 并基于测试样本集对训练好的各分类器分别进行分类测试, 得到各分类器的 分类结果; S33: 对各分类 器进行优化, 得到训练好的集成分类 器; S34: 通过训练好的集成分类 器对待测样本进行分类, 得到待测样本的分类结果。 5.根据权利要求1或4所述的一种基于人工智能的集成学习分类方法, 其特征在于: 所 述的集成分类器包含四种机器学习方法, 包括逻辑回归、 朴素贝叶斯、 支持向量机以及随机 森林, 投票策略为简单投票; 假设n个基分类器的出错率都是ε, 且相互独立, 则n个基分类器的结果中, 出现k个错误 的数量服从二项分布, 对集成模型来说, n个结果中, 有k个错 误的概率是: 6.根据权利要求1所述的一种基于人工智能的集成学习分类方法, 其特征在于: 所述S4 根据设定关键字对待测样本文本信息进行提取 的步骤中, 根据需要对关键字进行设置, 关 键字的设置遵循能够反映出文本信息的内容。 7.根据权利要求1所述的一种基于人工智能的集成学习分类方法, 其特征在于: 所述S5 根据文本信息提取结果进行分析, 得到待测样本的分类结果步骤中, 根据从文本信息中提 取出来的关键 字, 对待测样本进行分类。 8.根据权利要求1所述的一种基于人工智能的集成学习分类方法, 其特征在于: 所述S6权 利 要 求 书 1/2 页 2 CN 115455188 A 2对两次待测样本的分类结果进行分析判断的步骤中, 若两次待测样本的分类结果不相同, 则对该待测样本重新进行检测分类; 若两次待测样本的分类结果相同, 则得到最终分类结 果。权 利 要 求 书 2/2 页 3 CN 115455188 A 3

.PDF文档 专利 一种基于人工智能的集成学习分类方法

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于人工智能的集成学习分类方法 第 1 页 专利 一种基于人工智能的集成学习分类方法 第 2 页 专利 一种基于人工智能的集成学习分类方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:10:51上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。