(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211262586.X
(22)申请日 2022.10.14
(71)申请人 高德软件 有限公司
地址 102200 北京市昌平区科技园区昌盛
路18号B1座1- 5层
(72)发明人 董庆洲 杨晶
(74)专利代理 机构 北京智信四方知识产权代理
有限公司 1 1519
专利代理师 刘真
(51)Int.Cl.
G06F 16/9537(2019.01)
G06F 16/387(2019.01)
G06F 16/35(2019.01)
G06F 16/335(2019.01)
(54)发明名称
兴趣点信息的获取方法、 电子 设备及存储介
质
(57)摘要
本公开实施例公开了一种兴趣点信息的获
取方法、 电子设备及存储介质, 该方法包括: 获取
多个订单地址信息; 根据订单地址信息中的名称
信息和位置信息, 对多个订单地址信息进行聚类
处理, 得到至少一个聚类簇, 每个聚类簇中包含
至少两个订单地址信息, 每个聚类簇对应一个兴
趣点; 针对每个聚类簇, 从聚类簇内至少两个订
单地址信息的名 称信息中筛选一个满足兴趣点
命名条件的名 称信息作为聚类簇对应的兴趣点
的名称; 根据聚类簇内至少两个订单地址信息的
位置信息, 确定聚类簇对应的兴趣点的地址坐
标。 该技术方案可以高时效且低成本地获取兴趣
点信息。
权利要求书3页 说明书13页 附图2页
CN 115525841 A
2022.12.27
CN 115525841 A
1.一种兴趣点信息的获取 方法, 包括:
获取多个订单地址信息, 其中, 所述 订单地址信息包括名称信息和位置信息;
根据所述订单地址信 息中的名称信 息和位置信 息, 对所述多个订单地址信 息进行聚类
处理, 得到至少一个聚类簇, 每个聚类簇中包含至少两个订单地址信息, 每个聚类簇对应一
个兴趣点;
针对每个聚类簇, 从所述聚类簇 内至少两个订单地址信 息的名称信 息中筛选一个满足
兴趣点命名条件的名称信息作为所述聚类簇对应的兴趣点的名称;
根据所述 聚类簇内至少两个订单地址信 息的位置信 息, 确定所述 聚类簇对应的兴趣点
的地址坐标。
2.根据权利要求1所述的方法, 其中, 所述根据所述订单地址信 息中的名称信 息和位置
信息, 对所述多个订单地址信息进行聚类处 理, 得到至少一个聚类簇, 包括:
根据所述订单地址信 息中的名称信 息和位置信 息, 使用第 一聚类算法对所述多个订单
地址信息进 行初始聚类, 得到至少一个初始聚类簇, 每个初始聚类簇中包含多个候选信息,
每个候选信息为所述多个订单地址信息中的一个;
获取所述候选信 息对应的多维度特征信 息, 所述多维度 特征信息包括所述候选信 息对
应的文本特 征、 用户位置特 征和位置坐标中的至少一个;
根据所述候选信 息对应的多维度特征信 息, 使用第 二聚类算法对所述至少一个初始聚
类簇进行聚类簇拆分和合并, 得到 至少一个聚类簇 。
3.根据权利要求2所述的方法, 其中, 所述根据所述订单地址信 息中的名称信 息和位置
信息, 使用第一聚类算法对所述多个订单地址信息进行初始聚类, 得到至少一个初始聚类
簇, 包括:
根据所述多个订单地址信 息的名称信 息和位置信 息, 确定所述多个订单地址信 息之间
的名称相似度和位置相似度;
基于各订单地址信 息之间的名称相似度和位置相似度, 使用第 一聚类算法对所述多个
订单地址信息进行初始聚类, 得到 至少一个初始聚类簇 。
4.根据权利要求2所述的方法, 其中, 所述获取所述候选信 息对应的多维度特征信 息包
括以下至少一个步骤:
使用第一特 征提取模型从所述 候选信息中提取 所述候选信息对应的文本特 征;
获取所述候选信 息对应的用户在历史时间段内的定位信 息, 并使用第 二特征提取模型
从所述定位信息中提取 所述候选信息对应的用户位置特 征;
根据所述 候选信息中的位置信息确定所述 候选信息对应的位置坐标。
5.根据权利要求2所述的方法, 其中, 所述根据所述候选信息对应的多维度特征信息,
使用第二聚类算法对所述至少一个初始聚类簇进 行聚类簇拆分和合并, 得到至少一个聚类
簇, 包括:
针对每个初始聚类簇, 根据所述初始聚类簇中每个候选信息对应的多维度特征信息,
确定所述初始聚类簇内各候选信息之间的相似度;
根据所述初始聚类簇内各候选信息之间的相似度, 对所述初始聚类簇进行拆分, 得到
备用聚类簇;
从所述备用聚类簇 中选取一个候选信 息, 并将选取的候选信 息对应的多维度 特征信息权 利 要 求 书 1/3 页
2
CN 115525841 A
2确定为所述备用聚类簇的信息;
根据所述备用聚类簇的信息, 确定各 备用聚类簇之间的相似度;
根据所述各备用聚类簇之间的相似度, 对所述备用聚类簇进行合并, 得到至少一个聚
类簇。
6.根据权利要求1所述的方法, 其中, 所述从所述 聚类簇内至少两个订单地址信 息的名
称信息中筛选一个满足兴趣点命名条件的名称信息作为所述聚类簇对应的兴趣点的名称,
包括:
根据所述 聚类簇内每个订单地址信 息的名称信 息, 确定所述每个订单地址信 息的名称
信息的命名质量指标, 所述命名质量指标包括名称通顺度、 名称困惑度和名称完整度中的
至少一个;
根据所述每个订单地址信 息的名称信 息的命名质量指标, 对所述 聚类簇内至少两个订
单地址信息的名称信息进 行排序, 并选择排序第一的名称信息作为所述聚类簇对应的兴趣
点的名称。
7.根据权利要求1所述的方法, 其中, 所述根据所述 聚类簇内至少两个订单地址信 息的
位置信息, 确定所述聚类簇对应的兴趣点的地址坐标, 包括:
根据所述 聚类簇内至少两个订单地址信 息中的位置信 息, 确定所述聚类簇对应的兴趣
点的地址范围;
根据所述 聚类簇内至少两个订单地址信 息对应的用户在历史时间段内的定位信 息, 以
及所述地址范围, 确定所述聚类簇对应的兴趣点的地址坐标。
8.根据权利要求1所述的方法, 其中, 所述根据所述 聚类簇内至少两个订单地址信 息的
位置信息, 确定所述聚类簇对应的兴趣点的地址坐标, 包括:
根据所述 聚类簇内至少两个订单地址信 息中的位置信 息, 确定所述聚类簇对应的地址
范围;
根据所述地址范围内的移动热点WIFI的名称信息和定位信 息, 确定所述聚类簇对应的
兴趣点的地址坐标。
9.根据权利要求2所述的方法, 其中, 所述方法还 包括:
根据所述 聚类簇内的至少两个订单地址信 息, 确定所述 聚类簇对应的兴趣点的存在性
指标值;
若所述聚类簇对应的兴趣点的存在性指标值超过预设标准值, 则根据 所述聚类簇对应
的兴趣点的名称和地址坐标进行兴趣点信息更新。
10.根据权利要求9所述的方法, 其中, 所述根据所述聚类簇内的至少两个订单地址信
息, 确定所述聚类簇对应的兴趣点的存在性指标值, 包括:
针对每个聚类簇, 获取 所述聚类簇内订单地址信息的数量信息;
获取所述聚类簇对应的兴趣点的名称与预存的W IFI的名称信息之间的相似度信息;
获取所述聚类簇内至少两个订单地址信息对应的用户在历史时间段内的定位信息;
根据所述数量信息、 相似度信息以及定位信息中的至少一个, 确定所述聚类簇对应的
兴趣点的存在性指标值。
11.一种电子设备, 包括存储器和 处理器; 其中, 所述存储器用于存储一条或多条计算
机指令, 所述一条或多条计算机指令被所述处理器执行以实现权利要求1至10任一项所述权 利 要 求 书 2/3 页
3
CN 115525841 A
3
专利 兴趣点信息的获取方法、电子设备及存储介质
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 02:13:31上传分享