团体标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211053861.7 (22)申请日 2022.08.31 (71)申请人 电子科技大 学 地址 611731 四川省成 都市高新区 (西区) 西源大道 2006号 (72)发明人 许毅 赵太银 解修蕊 罗光春  赵航 张博闻  (74)专利代理 机构 电子科技大 学专利中心 51203 专利代理师 邹裕蓉 (51)Int.Cl. G06F 16/335(2019.01) G06F 16/35(2019.01) G06F 16/9535(2019.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种基于用户兴趣建模的新闻推荐方法 (57)摘要 本发明公开了一种基于用户兴趣建模的个 性化新闻推荐方法, 包括步骤: 获得新闻文本数 据, 将文本 数据进行预处理, 删除停用词, 向量化 等操作; 将向量化的新闻数据输送到文本特征提 取器进行特征抽取, 获得新闻特征; 构建基于用 户兴趣的新闻推荐模型, 结合残差图卷积网络模 块与用户热兴趣模块, 输出用户点击概率; 模型 训练, 模型训练基于交叉熵损失函数进行训练; 对输入的一系列候选新闻的点击预测概率进行 排序, 输出设定好的前K篇新闻作为推荐结果。 本 发明用于用户个性化的新闻推荐, 能有效提升推 荐有效性。 权利要求书1页 说明书7页 附图2页 CN 115481236 A 2022.12.16 CN 115481236 A 1.一种基于用户兴趣建模的新闻推荐方法, 其特 征在于, 包括以下步骤: 步骤1、 根据所需的新闻属性信息进行预处理得到新闻数据构造新闻数据集; 用于训练 的新闻数据集中, 用户与新闻之 间存在交互则标记为正样 本, 表示用户阅读过该新闻, 否则 标记为负 样本; 步骤2、 新闻推荐模型的构建与训练: 利用新闻数据集中的训练数据对所述新闻推荐模型进行深度学习训练, 当满足预置的 停止训练条件时, 得到训练好的新闻推荐网络模型; 所述新闻推荐网络模型用于, 输出用户点击候选新闻的概率, 包括特征提取模块、 残差 图卷积网络 GCN、 用户热兴趣模块和全连接神经网络; 特征提取模块包括点击序列特征提取 器和新闻文本特征提取器, 分别用于提取用户近期点击序列特征和新闻文本特征; 残差 GCN 用于接收新闻文本特征输出新闻嵌入以及用户长期兴趣特征; 用户热兴趣模块用于接收用 户近期点击序列特征输出用户热兴趣特征; 全连接神经网络用于将用户长期兴趣特征与用 户热兴趣特 征进行结合, 结合后的结果作为用户的最终兴趣表示; 步骤3、 新闻推荐模型输出用户点击的预测结果: 对于给定的用户 和候选新闻, 基于预设的输入数据格式, 对候选新闻进行筛选和预处 理得到新闻数据, 将新闻数据输入完成训练的新闻推荐模型, 新闻推荐模型输出用户的最 终兴趣表示以及新闻嵌入, 将用户的最终兴趣表示作为用户嵌入, 利用用户嵌入与新闻嵌 入计算得到用户点击候选新闻的概率值; 最后根据所述概率值再选择候选新闻推荐给用 户。 2.如权利要求1所述方法, 其特征在于, 所述预处理包括过滤停用词以及新闻简介中无 意义的实体和实体类型, 再对过滤处理后得到的语料进行编码转换, 采用独热编码的方式 将单词初步 转换为向量模式, 最后将新闻文本向量作为预处 理后的新闻数据。 3.如权利要求1所述方法, 其特征在于, 所述新闻数据包含由阅读会话事件开始与 结束 的时间计算得出 的用户停留时间、 新闻标题单词序列、 新闻概要实体的单词序列以及新闻 正文的单词。权 利 要 求 书 1/1 页 2 CN 115481236 A 2一种基于用户兴趣建模的新 闻推荐方法 技术领域 [0001]本发明涉及 新闻推荐领域, 具体涉及一种基于用户阅读偏好的深度学习新闻推荐 方法。 背景技术 [0002]个性化推荐系统利用用户的行为(如搜索历史记录、 阅读记录等)为该用户生成推 荐列表。 传统的新闻推挤方法大抵可分为基于内容的过滤方法和基于协同过滤 的方法。 两 类方法虽然可以在一定程度上实现新闻推荐的功能, 但是这两类方法都存在一定的缺陷, 实际推荐效果 不佳, 难以满足 实际使用需求。 [0003]基于内容的算法在最初是最流行、 最高效的方法, 因此在任何推荐系统开始时被 广泛应用。 在基于内容过滤的推荐方法中, 通过分析用户过去感兴趣的新闻的属性, 推荐用 户某些未读过的新闻。 这些系统不关心用户对这些项目的评分。 在基于内容的算法中, 相似 度计算方法直接影响推荐结果的准确 性。 有几种被广泛使用的相似性计算方法: ①欧几里 德距离: 通过计算两个向量中每个元素的平 方距离之和来衡量两个向量之 间相似性的最常 用方法之一。 ②余弦: 该方法的主要思想是通过计算两个向量之间的夹角余弦来测 量两个 向量。③Pearson: Pearson相关系数反映两个向量之间的线性相关程度。 ④Jaccard: Jaccard相 似度通常用于比较两个有限样本集之间的相 似性和差异。 与其他协同过滤系统 相比, 基于内容的推荐系统有很多好处, 例如: 用户独立性、 透明度、 冷启动问题时的新项 目。 但是基于内容的方法还存在一些不足之处, 如分析内容有限、 过于专业化或缺乏新用户 的评分数据, 以及对某些 特定问题的准确性 不够。 [0004]在协同过滤方法中, 用户对新闻的评价会被考虑在内以做出建议。 具有相似评价 的用户称为邻居, 用于预测未评分新闻项的评分。 基于协同过滤 的推荐方法准确 性依赖于 不同算法(如SVM、 朴素贝叶斯、 决策树、 聚类等)开 发的有效建模。 然而, 在实际场景中, 许多 商业推荐系统中使用的数据集非常稀疏, 因为用户通常不会对每个项目进行评分, 而是只 对少数项目进行评分。 [0005]近年来, 以用户 ‑新闻交互为基础构建的图神经网络模型将用户与新闻建模为二 部图结构, 以新闻嵌入更新用户兴趣, 并依此计算候选新闻与用户兴趣的相似度来预测用 户的点击偏好, 此类模型在新闻推荐任务上 取得了优秀的效果, 但仍 不适用于稀疏环境。 发明内容 [0006]本发明所要解决的技术问题是, 针对在交互数据集中于少 数新闻的稀疏环境中, 仅使用交互行为构建的模型相在稀疏环境中存在严重的准确性问题, 提供一种能解决现有 基于协同过滤和基于内容的新闻推荐方法受 限于数据集数据分布不均且稀疏造成的冷启 动问题的基于用户兴趣的深度学习新闻推荐方法。 [0007]本发明为解决上述技术问题所采用的技术方案是, 一种基于用户兴趣建模的新闻 推荐方法, 包括以下步骤:说 明 书 1/7 页 3 CN 115481236 A 3

.PDF文档 专利 一种基于用户兴趣建模的新闻推荐方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于用户兴趣建模的新闻推荐方法 第 1 页 专利 一种基于用户兴趣建模的新闻推荐方法 第 2 页 专利 一种基于用户兴趣建模的新闻推荐方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:11:25上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。