团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211039739.4 (22)申请日 2022.08.29 (71)申请人 中孚安全技 术有限公司 地址 250101 山东省济南市高新区经十路 7000号汉峪金谷A1- 5号楼24层 (72)发明人 王晶 刘胜平 (74)专利代理 机构 济南圣达知识产权代理有限 公司 372 21 专利代理师 赵妍 (51)Int.Cl. G06F 16/35(2019.01) (54)发明名称 一种基于非参数贝叶斯的关系图数据聚类 方法及系统 (57)摘要 本发明涉及关系图数据聚类技术领域, 提供 了一种基于非参数贝叶斯的关系图数据聚类方 法及系统, 包括: 获取关系图数据; 根据概率图模 型, 初始化模型参数; 基于关系图数据, 使用多种 采样算法, 迭代采样所述模型参数的样本; 基于 采样得到的模 型参数, 根据最大化似然函数的方 式选择簇划分样本, 得到聚类结果; 其中, 簇划分 样本的先验概率为非参数贝叶斯先验。 在参数推 断过程中可以自动推断出簇的个数, 不需要人工 设置。 权利要求书1页 说明书7页 附图2页 CN 115309903 A 2022.11.08 CN 115309903 A 1.一种基于非参数贝叶斯的关系图数据聚类方法, 其特 征在于, 包括: 获取关系图数据; 根据概率图模型, 初始化模型参数; 基于关系图数据, 使用多种采样算法, 迭代采样所述模型参数的样本; 基于采样得到的模型参数, 根据最大化似然函数的方式选择簇划分样本, 得到聚类结 果; 其中, 簇划分样本的先验概 率为非参数贝叶斯先验。 2.如权利要求1所述的一种基于非参数贝叶斯的关系图数据聚类方法, 其特征在于, 在 迭代采样模型参数的样本之前对关系图数据进行 预处理; 所述预处 理包括清除孤立的节点、 冗余自回路和将关系数据转换为统一格式。 3.如权利要求1所述的一种基于非参数贝叶斯的关系图数据聚类方法, 其特征在于, 所 述迭代采样模型参数的样本的过程 为: 基于超参数, 采用Met ropolis‑Hasting采样算法或Gib bs采样算法采样簇划分样本; 基于簇划分样本, 利用辅助变量法或切片采样法, 采样超参数; 根据标准 化互信息和迭代次数, 判断是否退 出采样迭代。 4.如权利要求1所述的一种基于非参数贝叶斯的关系图数据聚类方法, 其特征在于, 所 述关系图数据为同质节点关系图数据或异质节点关系图数据。 5.如权利要求1所述的一种基于非参数贝叶斯的关系图数据聚类方法, 其特征在于, 根 据似然概 率, 选择使对数似然最大的簇划分样本作为聚类结果。 6.如权利要求1所述的一种基于非参数贝叶斯的关系图数据聚类方法, 其特征在于, 利 用多项分布与狄利克雷分布的共轭关系, 通过积分消去所述概率图模型中的连接概率向 量。 7.一种基于非参数贝叶斯的关系图数据聚类系统, 其特 征在于, 包括: 数据获取模块, 其被 配置为: 获取关系图数据; 初始化模块, 其被 配置为: 根据概 率图模型, 初始化模型参数; 迭代采样模块, 其被配置为: 基于关系图数据, 使用多种采样算法, 迭代采样所述模型 参数的样本; 聚类模块, 其被配置为: 基于采样得到的模型参数, 根据最大化似然函数的方式选择簇 划分样本, 得到聚类结果; 其中, 簇划分样本的先验概 率为非参数贝叶斯先验。 8.如权利要求7所述的一种基于非参数贝叶斯的关系图数据聚类系统, 其特征在于, 还 包括预处 理模块, 其被 配置为: 在迭代采样模型参数的样本之前对关系图数据进行 预处理; 所述预处 理包括清除孤立的节点、 冗余自回路和将关系数据转换为统一格式。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执 行时实现如权利要求1 ‑6中任一项 所述的一种基于非参数贝叶斯的关系图数据聚类方法中 的步骤。 10.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求 1‑6中任一项 所述的一 种基于非参数贝叶斯的关系图数据聚类方法中的步骤。权 利 要 求 书 1/1 页 2 CN 115309903 A 2一种基于非参数贝叶斯的关系图数据聚类方 法及系统 技术领域 [0001]本发明属于关系图数据聚类技术领域, 尤其涉及 一种基于非参数贝叶斯的关系图 数据聚类方法及系统。 背景技术 [0002]本部分的陈述仅仅是提供了与本发明相关的背景技术信息, 不必然构成在先技 术。 [0003]随着大数据技术门槛不断下降, 各行各业迎来数字化转型。 数据在数字化转型中 处于核心 地位, 很多企业和组织拥有 大量的数据, 但要挖掘海量数据的信息, 互联网头部企 业选择尝试建立多种知识图谱, 用图数据库存储各种实体与关系, 并利用机器学习、 深度学 习等方法对关系图数据进行挖掘 。 这种利用知识图谱结合机器学习的数据挖掘方式, 不但 是企业、 组织和行业与数字化、 智能化结合的关键点, 而且还 可以给自身 带来具有实际价值 的业务情报。 [0004]图数据的挖掘算法种类繁多, 其中图节点聚类算法可以将图中节点划分成具有相 似特性和功能的子集合, 是针对图数据的十分重要的机器学习算法。 通过对关系图中节点 聚类, 可以挖掘图中的隐藏结构和隐藏特征, 通常这些结构和特征无法通过人工观测和统 计数据获得。 如通过对人物 ‑事件关系图进行聚类可以发现人物活动的交集; 对用户 ‑物品 关系图进 行聚类, 可以同时发现用户的不同偏好及物品的不同类型; 对实体 ‑属性关系图进 行聚类, 可以发现实体间的联系紧密程度。 [0005]关系图中的节点可以表示同一类事物(同质节点), 比如人物的共现关系中节点都 为人物; 也可以表示不同类的事物(异质节点), 比如用户 ‑物品购买关系中, 节点分为用户 和物品两类, 而且同一类节点之间不存在购买关系。 常见 的图节点聚类方法有基于谱聚类 的方法、 基于随机游走的方法, 基于无监督深度学习+k ‑means(或+谱聚类)的方法等, 但这 些方法并非针对关系图数据, 在对关系图数据聚类时存在瑕疵。 [0006]首先, 以上模型在对关系图数据聚类过程中, 需要提前设置簇的个数, 缺少自动发 现簇个数的能力, 聚类节点前需要 给定预估的簇个数, 这简化了模型的聚类过程, 但要找出 合理的簇个数, 需要利用最小化描述长度、 贝叶斯模型选择等方法, 不但增加实现复杂度, 还造成聚类效果 不佳。 [0007]其次, 以上模型对同质节点的聚类具有较好的表 现, 但缺乏考虑异质节点的关系, 如是否参与(某个事件), 是否购买(某个物品), 是否具有(某个特性)等异质节 点的关系, 导 致在这类数据集上聚类效果 不佳。 发明内容 [0008]为了解决上述背景技术中存在的技术问题, 本发明提供一种基于非参数贝叶斯的 关系图数据聚类方法及系统, 利用非参数贝叶斯方法生成节点的簇划分, 在参数推 断过程 中可以自动推断出簇的个数, 不需要人工设置 。说 明 书 1/7 页 3 CN 115309903 A 3
专利 一种基于非参数贝叶斯的关系图数据聚类方法及系统
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 02:11:42
上传分享
举报
下载
原文档
(530.8 KB)
分享
友情链接
T-ZZB 1589—2020 计算机控制360度机头旋转模板缝纫机.pdf
GB-T 16746-2018 锌合金铸件.pdf
招投标采购视角下网络安全市场2023年度报告最终版.pdf
T-BAX 0001.1—2021 安防监控中心值机工作与服务要求 :第1部分 值机工作要求.pdf
GM-T 0019-2023 通用密码服务接口规范.pdf
GB-T 22026-2008 气雾剂级丙烷 A-108.pdf
GB-T 41856.1-2022 无损检测 工业内窥镜目视检测 第1部分:方法.pdf
GB 25683-2010 钢液浇包 安全要求.pdf
GB-T 40750-2021 农用沼液.pdf
DL-T 1066-2023 水电站设备检修管理导则.pdf
DB5101-T 117—2021 医药化工企业安全管理规范 成都市.pdf
GB-T 42339-2023 金融机构风险管理 术语.pdf
GB-T 34690.10-2018 印刷技术 胶印数字化过程控制 第10部分:评价方法.pdf
GB-T 24425.1-2009 普通型钢丝螺套.pdf
DB31-T 329.1—2019 重点单位重要部位安全技术防范系统要求 第1部分:展览馆、博物馆 上海市.pdf
GB-T 36092-2018 信息技术 备份存储 备份技术应用要求.pdf
GB-T 39254-2020 增材制造 金属制件机械性能评价通则.pdf
GB-T 36547-2018 电化学储能系统接入电网技术规定.pdf
GB-T 20008-2005 信息安全技术 操作系统安全评估准则.pdf
腾讯 云上安全攻防实战手册.pdf
1
/
3
11
评价文档
赞助2.5元 点击下载(530.8 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。