团体标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211097380.6 (22)申请日 2022.09.08 (71)申请人 广东工业大 学 地址 510090 广东省广州市越秀区东 风东 路729号 (72)发明人 阳爱民 覃冠球 何俊亨 王纪刚  (74)专利代理 机构 广州粤高专利商标代理有限 公司 44102 专利代理师 刘俊 (51)Int.Cl. G06F 16/35(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种暴力事 件检测方法、 装置及设备 (57)摘要 本发明涉及自然语言处理领域, 更具体地, 涉及一种暴力事件检测方法、 装置及设备, 所述 方法包括: 获取标签数据集; 对标签数据集进行 预处理, 得到标签提示文本; 将待检测文本与标 签提示文本进行拼接处理, 得到重构输入文本; 对重构输入文本进行编码处理, 得到第一文本编 码序列, 并从第一文本编码序列中提取出重构输 入文本的文本表示序列和标签表 示序列; 对文本 表示序列和标签表示序列进行特征提取, 得到标 签特征序列; 利用标签特征序列和标签表示序列 重构出二元重构输入序列, 将二元重构输入序列 输入二元解码器进行解码处理, 二元解码器输出 暴力事件检测结果。 本发明提高了暴力事件检测 的精度和效率。 权利要求书2页 说明书6页 附图4页 CN 115470348 A 2022.12.13 CN 115470348 A 1.一种暴力事 件检测方法, 其特 征在于, 包括: S1: 获取标签数据集; 所述标签数据集包 含暴力事 件标签; S2: 对所述标签数据集进行 预处理, 得到标签提 示文本; S3: 将待检测文本与所述标签提 示文本进行拼接处 理, 得到重构输入文本; S4: 对所述重构输入文本进行编码处理, 得到第 一文本编码序列, 并从所述第一文本编 码序列中提取 出所述重构输入文本的文本表示序列和标签表示序列; S5: 对所述文本表示序列和所述标签表示序列进行 特征提取, 得到标签特 征序列; S6: 利用所述标签特征序列和所述标签表示序列重构出二元解码器的输入编码, 将所 述输入编码输入二元解码器进行解码处 理, 所述二元解码器输出暴力事 件检测结果。 2.根据权利要求1所述的暴力事 件检测方法, 其特 征在于, S2的具体步骤 包括: S2.1: 将所述标签数据集中的暴力事 件标签进行文本化, 得到标签文本序列; S2.2: 将所述标签文本序列重构成自然语言问句的标签提 示文本。 3.根据权利要求1所述的暴力事件检测方法, 其特征在于, S4中, 利用经过训练的BERT 模型对所述重构输入文本进行编码处 理, 所述BERT模型输出第一文本编码序列。 4.根据权利要求3所述的暴力事件检测方法, 其特征在于, 所述BERT模型的目标函数L 的表达式如下 所示: γ‑>γ+ 其中, L+表示正样本的损失函数, L‑表示负样本的损失函数, 为偏移概率, γ表示聚 焦函数, 表示模型输出的预测概 率, γ+为正聚焦参数, γ‑为负聚焦参数。 5.根据权利要求1所述的暴力事件检测方法, 其特征在于, S5中, 利用长短期记忆网络 对所述文本表示序列和所述标签表示序列进行特征提取, 得到标签特征序列, 具体的步骤 包括: S5.1: 将所述文本表示序列输入长短期记忆网络中, 所述长短期记忆网络输出前向上 下文向量和后向上 下文向量; S5.2: 分别利用所述前向上下文向量和所述后向上下文向量构建前向上下文序列和后 向上下文序列; S5.3: 将所述前向上下文序列和所述后向上下文序列进行拼接处理, 得到包含上下文 信息的第二文本编码序列; S5.4: 将所述第二文本编码序列与所述标签表示序列进行特征融合, 得到标签特征序 列。 6.根据权利要求5所述的暴力事 件检测方法, 其特 征在于, S5.4中, 具体的步骤 包括: 将第二文本编码序列与标签表示序列进行点乘 处理, 得到标签与文本的关系矩阵D, 其 表达式如下 所示: 其中, G表示第二文本编码序列, 为标签序列HY的转置; 利用卷积神经网络对所述标签与文本的关系矩阵D进行特征学习, 得到代表每个标签权 利 要 求 书 1/2 页 2 CN 115470348 A 2特征的标签特 征序列a, 其表达式如下 所示: a=tanh(Φ(D) ) 其中, 函数Φ( ·)表示ReLU激活与最大池化操作, tanh(Φ(D))表示对经过ReLU激活与 最大池化操作后得 出的特征向量用tanh函数进行 再激活。 7.根据权利要求1所述的暴力事件检测方法, 其特征在于, S6中, 利用所述标签特征序 列和所述标签表示序列重构出二元重构输入序列, 具体包括: 将所述标签特征序列和所述标签表示序列进行相乘 处理, 得到含有标签间交互信 息的 序列, 其表达式如下 所示: H′Y=HY×a 其中, H′Y为含有标签间交 互信息的序列, HY为标签表示序列, a为标签特 征序列; 将所述含有标签间交互信 息的序列与所述标签表示序列进行相加处理, 得到二元重构 输入序列, 其表达式如下 所示: K=HY+H′Y 其中, K为 二元重构输入序列。 8.根据权利要求1所述的暴力事件检测方法, 其特征在于, S6中, 将所述二元重构输入 序列输入二元解码器进行解码处理, 所述二元解码器输出暴力事件检测结果, 其表达式如 下所示: 其中, 包含n个标签的预测结果, n为正整数, K表示二元重构 输入序列, FC(·)表示全连接层, 为第i个暴力事件标签的检测结果, sigmoid( ·)表示将全连接层 的输出的数值区间用sigmo id函数转 化成概率并用argmax( ·)取出预测的最大值。 9.一种暴力事 件检测装置, 其特 征在于, 包括: 获取模块, 用于获取 标签数据集; 所述标签数据集包 含暴力事 件标签; 预处理模块, 用于对所述标签数据集进行 预处理, 得到标签提 示文本; 拼接模块, 用于将待检测文本与所述标签提 示文本进行拼接处 理, 得到重构输入文本; 编码模块, 用于对所述重构输入文本进行编码处 理, 得到第一文本编码序列; 提取模块, 用于从所述第 一文本编码序列中提取出所述重构输入文本的文本表示序列 和标签表示序列; 特征提取模块, 用于对所述文本表示序列和所述标签表示序列进行特征提取, 得到标 签特征序列; 重构模块, 用于利用所述标签特征序列和所述标签表示序列重构出二元解码器的输入 编码。 检测模块, 用于将所述输入编码输入二元解码器进行解码处理, 所述二元解码器输出 暴力事件检测结果。 10.一种电子设备, 其特征在于, 包括存储器和处理器, 所述存储器上存储有可在所述 处理器上运行的计算机程序, 当所述计算机程序被所述处理器执行时, 实现权利要求1~8 中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115470348 A 3

.PDF文档 专利 一种暴力事件检测方法、装置及设备

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种暴力事件检测方法、装置及设备 第 1 页 专利 一种暴力事件检测方法、装置及设备 第 2 页 专利 一种暴力事件检测方法、装置及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:12:31上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。