(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210993476.4
(22)申请日 2022.08.18
(71)申请人 张燕
地址 510000 广东省广州市天河区天河北
路侨林街 47号1105房
(72)发明人 张燕 李林 白瑞芳
(74)专利代理 机构 合肥正则元起专利代理事务
所(普通合伙) 3416 0
专利代理师 杨润
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 16/9535(2019.01)
G06F 16/9537(2019.01)
G06F 40/289(2020.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
G06Q 50/00(2012.01)
(54)发明名称
一种基于人工智能的网络舆情实时监测系
统及方法
(57)摘要
本发明公开了一种基于人工智能的网络舆
情实时监测系统及方法, 涉及舆情监测技术领
域, 包括交互前端、 管理后台、 数据 收集模块、 热
度分析模块、 情绪分析模块、 争端分析模块; 使用
爬虫技术爬取网络平台内容, 根据用于提出的关
键词组, 计算出当前网络舆情的热度; 并使用 深
度学习技术实时监测网络舆情的热度、 情绪正负
面以及出现 争端的激烈程度, 解决了实时监测网
络阈值热度、 情绪以及出现争端问题。
权利要求书3页 说明书6页 附图2页
CN 115438180 A
2022.12.06
CN 115438180 A
1.一种基于人工智能的网络舆情实时监测系统, 其特征在于, 包括: 交互前端、 管理后
台、 数据收集模块、 热度分析模块、 情绪分析模块以及争端分析模块; 其中, 各个模块之间均
可通信和/或电气连接;
所述交互前端用于为用户提供数据交互的功能; 所述交互前端将用户提供的关键词组
以及网络平台集合发送至管理后台; 所述管理后台将关键词组以及网络平台集合 发送至数
据收集模块;
所述数据收集模块用于收集实时网络数据; 实时收集所述网络平台集合中各平台的新
发布内容; 在新发布内容中搜索关键词组, 并将包含关键词组的内容作为符合舆情 内容发
送至情绪分析模块以及争端分析模块; 将总数量及符合网络舆情的内容数量 发送至热度分
析模块;
所述热度分析模块用于分析所需监测的关键词组在网络中的热度; 计算网络舆情热
度;
所述情绪分析模块用于分析网络 舆情的正负面;
所述争端分析模块用于分析针对所监测舆情触发网络争端的强烈程度;
所述争端分析模块接收来自数据 收集模块发送的各个平台符合网络舆情的内容集合
Rn。
2.根据权利要求1所述的一种基于人工智能的网络舆情 实时监测系统, 其特征在于, 所
述数据收集模块收集网络数据包括以下步骤:
步骤S1: 所述数据收集模块接收到交 互前端发送的关键词组以及网络平台集 合;
步骤S2: 在所述网络平台集合中的网络平台中使用爬虫技术爬取若干分钟内发布的所
有内容; 将网络平台集合标记为N, 集合中的网络平台标记为n; 将从网络平台n爬取的内容
集合标记为Cn; 所述若干分钟具体时长由实际经验确定;
步骤S3: 在内容集合Cn中, 将发布内容按时间排序, 将每篇 内容标记为Cni; 使用关键词
组在Cni中搜索, 若搜索到的关键词数量占关键词组中关键词总量的比重超过一定比例, 则
将Cni标记为符合网络舆情; 将符合网络舆情的内容集合标记为Cns; 所述一定比例由实际
经验确定;
将各个平台符合网络舆情的内容集合数量|Cns|及总内容数量|Cn|发送至热度分析模
块; 将各个平台符合网络 舆情的内容 集合Cns发送至情绪分析模块、 争端分析模块。
3.根据权利要求2所述的一种基于人工智能的网络舆情 实时监测系统, 其特征在于, 所
述热度分析模块分析 热度包括以下步骤:
步骤S1: 接收来自数据收集模块的各个平台符合网络舆情内容集合数量|Cns|及总内
容数量|Cn|;
步骤S2: 计算网络平台n中, 符合网络舆情的内容数量占总内容数量的比值Qn, 计算公
式为
步骤S3: 计算总的网络舆情数值Q, 计算公式为Q=∑n∈NαnQn,其中αn为预设的各个平台
的比例系数, 用以表达平台的权威 性; 且∑n∈Nαn=1;
步骤S4: 根据预设的网络舆情热度数值阈值Q1、 Q2、 Q3, 将Q<Q1时网络舆情标记为冷淡、
将Q1≤Q<Q2时网络舆情热度标记 为微热、 将Q2≤Q<Q3时网络舆情热度标记为中热, 将Q≥Q3权 利 要 求 书 1/3 页
2
CN 115438180 A
2时网络舆情热度标记为火热; 并将网络 舆情热度实时发送至管理后台; 其中Q1<Q2<Q3 。
4.根据权利要求2所述的一种基于人工智能的网络舆情 实时监测系统, 其特征在于, 所
述符合网络舆情的内容集合Cns中内容为新闻、 文章类型; 使用网页技术截取新闻及文章的
正文作为分析内容 集合; 将分析内容 集合标记为 Wn;
所述符合网络舆情的内容集合Cns中内容为用户讨论的帖子; 使用网页技术截取用户
发布的帖子以及其 他用户的跟帖以及评论作为分析内容 集合; 将分析内容 集合标记为Rn。
5.根据权利要求1所述的一种基于人工智能的网络舆情 实时监测系统, 其特征在于, 所
述管理后台将接收到的网络舆情热度以及所监测舆情的总激烈系数发送至交互前端, 交互
前端通过 可视化方法展示给用户。
6.根据权利要求1所述的一种基于人工智能的网络舆情 实时监测系统, 其特征在于, 所
述争端分析模块分析争端激烈程度包括以下步骤:
步骤X1: 计算分析内容集合Rn中每条发布内容的活跃系数, 所述活跃系数包括参与人
数、 总跟帖及评论数、 发帖数量占总贴量比例在一定范围内用户数; 并分别标记为Yi,Ui,
Ii; 其中i代 表Rn中的每条发布内容; 所述 一定范围根据具体实际经验确定;
步骤X2: 收集网络中的评论 集合L1; 对于争议和辱骂的评论, 统一标记为争端;
步骤X3: 将所述评论 集合L1中的每条评论使用分词工具分为若干词;
步骤X4: 收集网络中常用的语料库, 对语料库进行分词, 并对分好的词库使用word ‑vec
工具, 将每 个词转化为词向量;
步骤X5: 对评论集合L1中的评论使用分词工具进行分词, 根据步骤S3所转化的词向量,
将分词后的评论 转化为词向量 集合;
步骤X6: 将步骤X5获得的词向量集合作为输入, 争端与否作为输出, 输入至神经网络中
进行训练, 获得神经网络模型; 在具体的实施例中, 所述神经网络可以为Rn n、 LSTM;
步骤X7: 使用网页技术提取每个发布内容i中的每条评论及帖子, 将评论及帖子进行分
词并使用word ‑vec转化为词向量集合, 将转化后的词向量集合作为输入, 输入步骤X6获得
的神经网络中, 获得每条评论的争端 预测值, 并将发布内容i中评论预测为争端的数量标记
为Pni,将非争端预测数量标记为Fn i;
步 骤 X 8 :计 算 每 条 发 布 内 容 i 的 激 烈 系 数 J i ,计 算 公 式 为 J i =
其中γ, δ, ε分别为预设的固定比例系数;
步骤X9: 计算Rn的总激烈系数On, 计算公式为 Qn=∑i∈RnJi; 且∑n∈Nθn=1;
步骤X10: 计算所监测舆情的总激烈系数K,计算公式为K=∑nθ n*On, 其中θ n为预设的各
个平台的比例系数, 用以表达平台的权威 性;
步骤X11:将所监测舆情的总激烈系数 K发送至管理后台。
7.一种基于人工智能的网络舆情实时监测方法, 其特征在于, 交互前端用于为用户提
供可视化界面, 以及用户在可视化界面提供所需监测的关键词组和需监测的网络平台集
合; 并将用户提供的关键词组和网络平台集 合发送至管理后台;
管理后台用于协调各个模块的工作; 将交互前端发送的关键词组和网络平台集合发送
至数据收集模块;
数据收集模块用于实时收集所述网络平台集合中各平台的新发布内容; 在新发布内容权 利 要 求 书 2/3 页
3
CN 115438180 A
3
专利 一种基于人工智能的网络舆情实时监测系统及方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 02:10:50上传分享