专利 一种基于人工智能的网络舆情实时监测系统及方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210993476.4 (22)申请日 2022.08.18 (71)申请人张燕地址 510000 广东省广州市天河区天河北路侨林街 47号1105房 (72)发明人张燕　李林　白瑞芳　 (74)专利代理机构合肥正则元起专利代理事务所(普通合伙) 3416 0 专利代理师杨润 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/9535(2019.01) G06F 16/9537(2019.01) G06F 40/289(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06Q 50/00(2012.01) (54)发明名称一种基于人工智能的网络舆情实时监测系统及方法 (57)摘要本发明公开了一种基于人工智能的网络舆情实时监测系统及方法，涉及舆情监测技术领域，包括交互前端、管理后台、数据收集模块、热度分析模块、情绪分析模块、争端分析模块；使用爬虫技术爬取网络平台内容，根据用于提出的关键词组，计算出当前网络舆情的热度；并使用深度学习技术实时监测网络舆情的热度、情绪正负面以及出现争端的激烈程度，解决了实时监测网络阈值热度、情绪以及出现争端问题。权利要求书3页说明书6页附图2页 CN 115438180 A 2022.12.06 CN 115438180 A 1.一种基于人工智能的网络舆情实时监测系统，其特征在于，包括：交互前端、管理后台、数据收集模块、热度分析模块、情绪分析模块以及争端分析模块；其中，各个模块之间均可通信和/或电气连接；所述交互前端用于为用户提供数据交互的功能；所述交互前端将用户提供的关键词组以及网络平台集合发送至管理后台；所述管理后台将关键词组以及网络平台集合发送至数据收集模块；所述数据收集模块用于收集实时网络数据；实时收集所述网络平台集合中各平台的新发布内容；在新发布内容中搜索关键词组，并将包含关键词组的内容作为符合舆情内容发送至情绪分析模块以及争端分析模块；将总数量及符合网络舆情的内容数量发送至热度分析模块；所述热度分析模块用于分析所需监测的关键词组在网络中的热度；计算网络舆情热度；所述情绪分析模块用于分析网络舆情的正负面；所述争端分析模块用于分析针对所监测舆情触发网络争端的强烈程度；所述争端分析模块接收来自数据收集模块发送的各个平台符合网络舆情的内容集合 Rn。 2.根据权利要求1所述的一种基于人工智能的网络舆情实时监测系统，其特征在于，所述数据收集模块收集网络数据包括以下步骤：步骤S1：所述数据收集模块接收到交互前端发送的关键词组以及网络平台集合；步骤S2：在所述网络平台集合中的网络平台中使用爬虫技术爬取若干分钟内发布的所有内容；将网络平台集合标记为N，集合中的网络平台标记为n；将从网络平台n爬取的内容集合标记为Cn；所述若干分钟具体时长由实际经验确定；步骤S3：在内容集合Cn中，将发布内容按时间排序，将每篇内容标记为Cni；使用关键词组在Cni中搜索，若搜索到的关键词数量占关键词组中关键词总量的比重超过一定比例，则将Cni标记为符合网络舆情；将符合网络舆情的内容集合标记为Cns；所述一定比例由实际经验确定；将各个平台符合网络舆情的内容集合数量|Cns|及总内容数量|Cn|发送至热度分析模块；将各个平台符合网络舆情的内容集合Cns发送至情绪分析模块、争端分析模块。 3.根据权利要求2所述的一种基于人工智能的网络舆情实时监测系统，其特征在于，所述热度分析模块分析热度包括以下步骤：步骤S1：接收来自数据收集模块的各个平台符合网络舆情内容集合数量|Cns|及总内容数量|Cn|；步骤S2：计算网络平台n中，符合网络舆情的内容数量占总内容数量的比值Qn，计算公式为步骤S3：计算总的网络舆情数值Q，计算公式为Q＝∑n∈NαnQn,其中αn为预设的各个平台的比例系数，用以表达平台的权威性；且∑n∈Nαn＝1；步骤S4：根据预设的网络舆情热度数值阈值Q1、 Q2、 Q3，将Q<Q1时网络舆情标记为冷淡、将Q1≤Q<Q2时网络舆情热度标记为微热、将Q2≤Q<Q3时网络舆情热度标记为中热，将Q≥Q3权　利　要　求　书 1/3 页 2 CN 115438180 A 2时网络舆情热度标记为火热；并将网络舆情热度实时发送至管理后台；其中Q1<Q2<Q3 。 4.根据权利要求2所述的一种基于人工智能的网络舆情实时监测系统，其特征在于，所述符合网络舆情的内容集合Cns中内容为新闻、文章类型；使用网页技术截取新闻及文章的正文作为分析内容集合；将分析内容集合标记为 Wn；所述符合网络舆情的内容集合Cns中内容为用户讨论的帖子；使用网页技术截取用户发布的帖子以及其他用户的跟帖以及评论作为分析内容集合；将分析内容集合标记为Rn。 5.根据权利要求1所述的一种基于人工智能的网络舆情实时监测系统，其特征在于，所述管理后台将接收到的网络舆情热度以及所监测舆情的总激烈系数发送至交互前端，交互前端通过可视化方法展示给用户。 6.根据权利要求1所述的一种基于人工智能的网络舆情实时监测系统，其特征在于，所述争端分析模块分析争端激烈程度包括以下步骤：步骤X1：计算分析内容集合Rn中每条发布内容的活跃系数，所述活跃系数包括参与人数、总跟帖及评论数、发帖数量占总贴量比例在一定范围内用户数；并分别标记为Yi,Ui, Ii；其中i代表Rn中的每条发布内容；所述一定范围根据具体实际经验确定；步骤X2：收集网络中的评论集合L1；对于争议和辱骂的评论，统一标记为争端；步骤X3：将所述评论集合L1中的每条评论使用分词工具分为若干词；步骤X4：收集网络中常用的语料库，对语料库进行分词，并对分好的词库使用word ‑vec 工具，将每个词转化为词向量；步骤X5：对评论集合L1中的评论使用分词工具进行分词，根据步骤S3所转化的词向量，将分词后的评论转化为词向量集合；步骤X6：将步骤X5获得的词向量集合作为输入，争端与否作为输出，输入至神经网络中进行训练，获得神经网络模型；在具体的实施例中，所述神经网络可以为Rn n、 LSTM；步骤X7：使用网页技术提取每个发布内容i中的每条评论及帖子，将评论及帖子进行分词并使用word ‑vec转化为词向量集合，将转化后的词向量集合作为输入，输入步骤X6获得的神经网络中，获得每条评论的争端预测值，并将发布内容i中评论预测为争端的数量标记为Pni,将非争端预测数量标记为Fn i；步骤 X 8 ：计算每条发布内容 i 的激烈系数 J i ，计算公式为 J i ＝其中γ, δ, ε分别为预设的固定比例系数；步骤X9：计算Rn的总激烈系数On，计算公式为 Qn＝∑i∈RnJi；且∑n∈Nθn＝1；步骤X10：计算所监测舆情的总激烈系数K,计算公式为K＝∑nθ n*On，其中θ n为预设的各个平台的比例系数，用以表达平台的权威性；步骤X11:将所监测舆情的总激烈系数 K发送至管理后台。 7.一种基于人工智能的网络舆情实时监测方法，其特征在于，交互前端用于为用户提供可视化界面，以及用户在可视化界面提供所需监测的关键词组和需监测的网络平台集合；并将用户提供的关键词组和网络平台集合发送至管理后台；管理后台用于协调各个模块的工作；将交互前端发送的关键词组和网络平台集合发送至数据收集模块；数据收集模块用于实时收集所述网络平台集合中各平台的新发布内容；在新发布内容权　利　要　求　书 2/3 页 3 CN 115438180 A 3

专利 一种基于人工智能的网络舆情实时监测系统及方法

专利一种基于人工智能的网络舆情实时监测系统及方法