团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210999998.5 (22)申请日 2022.08.19 (71)申请人 深圳绿米联创科技有限公司 地址 518000 广东省深圳市南 山区桃源街 道福光社区留仙大道3370号南山智园 崇文园区1号楼801-804 (72)发明人 严海锐 (74)专利代理 机构 深圳壹舟知识产权代理事务 所(普通合伙) 44331 专利代理师 孔祥丹 (51)Int.Cl. G06F 40/279(2020.01) G06F 40/289(2020.01) G06F 40/295(2020.01) G06F 40/242(2020.01)G06F 16/35(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 实体的识别方法及装置、 存储介质、 电子设 备 (57)摘要 本申请实施例公开了一种实体的识别方法 及装置、 存储介质、 电子设备, 涉及自然语言处理 技术领域, 用于解决现有技术中的实体识别准确 性较差的问题。 包括: 基于已训练的实体识别模 型对获取的待处理文本进行实体识别, 得到所述 待处理文本的第一实体识别结果; 根据目标分词 策略对所述待处理文本进行分词处理, 得到所述 待处理文本的第二实体识别结果; 所述目标分词 策略具有识别文本中的自定义词的能力; 若所述 第一实体识别结果和/或所述第二实体识别结果 包括自定义词, 则基于所述第一实体识别结果和 第二实体识别结果, 确定所述待处理文本中的目 标实体。 主要用于实体的识别。 权利要求书2页 说明书15页 附图3页 CN 115293152 A 2022.11.04 CN 115293152 A 1.一种实体的识别方法, 其特 征在于, 包括: 基于已训练的实体识别模型对获取的待处理文本进行实体识别, 得到所述待处理文本 的第一实体识别结果; 根据目标分词策略对所述待处理文本进行分词处理, 得到所述待处理文本的第 二实体 识别结果; 所述目标分词策略具有识别文本中的自定义词的能力; 若所述第一实体识别结果和/或所述第二实体识别结果包括自定义词, 则基于所述第 一实体识别结果和第二实体识别结果, 确定所述待处 理文本中的目标实体。 2.根据权利要求1所述的方法, 其特征在于, 所述根据目标分词策略对所述待处理文本 进行分词处 理, 得到所述待处 理文本的第二实体识别结果包括: 按照分词 词典对所述待处 理文本进行分词, 得到分词结果; 基于所述目标分词策略将所述分词结果与自定义词库中的各自定义词进行匹配, 确定 第二实体识别结果。 3.根据权利要求1所述的方法, 其特征在于, 所述基于所述第 一实体识别结果和第 二实 体识别结果, 确定所述待处 理文本中的目标实体包括: 获取所述自定义词的评估权 重; 基于所述评估权重对所述第 一实体识别结果进行评估, 得到所述第 一实体识别结果的 第一评估结果, 并基于所述评估权重对所述第二实体识别结果进行评估, 得到所述第二实 体识别结果的第二评估结果; 根据所述第一评估结果与所述第二评估结果, 从所述第一实体识别结果、 所述第二实 体识别结果中确定所述待处 理文本中的目标实体。 4.根据权利要求3所述的方法, 其特征在于, 所述基于所述评估权重对所述第 二实体识 别结果进行评估, 得到所述第二实体识别结果的第二评估结果包括: 获取所述自定义词的使用间隔时长, 并根据 所述使用间隔时长确定所述自定义词的时 间衰减信息; 基于所述评估权重、 所述时间衰减信息对所述第二实体识别结果进行评估, 得到第二 实体识别结果的第二评估结果。 5.根据权利要求3所述的方法, 其特征在于, 所述第 一评估结果用于表征对所述第 一实 体识别结果进 行评估所得到的数值化内容, 所述第二评估结果用于表征对 所述第二 实体识 别结果进行评估所得到的的数值化内容, 所述根据所述第一评估结果与所述第二评估结 果, 从所述第一实体识别结果、 所述第二实体识别结果中确定所述待处理文本中的目标实 体包括: 若所述第一评估结果大于所述第 二评估结果, 则将所述第 一实体识别结果确定为目标 实体; 若所述第一评估结果小于所述第 二评估结果, 则将所述第 二实体识别结果确定为目标 实体; 若所述第一评估结果等于所述第 二评估结果, 则将所述第 一实体识别结果与 所述第二 实体识别结果进行相加组合, 得到目标实体。 6.根据权利要求1所述的方法, 其特征在于, 所述基于已训练的实体识别模型对获取的 待处理文本进行实体识别, 得到所述待处 理文本的第一实体识别结果包括:权 利 要 求 书 1/2 页 2 CN 115293152 A 2基于已训练的实体识别模型对所述待处 理文本进行分词特 征抽取, 得到分词特 征; 基于所述实体识别模型对所述分词特征进行实体识别, 并通过所述实体识别模型的解 码层识别所述分词特征 处于实体分类的分类权重, 根据所述分类权重得到第一实体识别结 果。 7.根据权利要求1 ‑6任一项所述的方法, 其特 征在于, 所述方法还 包括: 若所述第一实体识别结果和所述第 二实体识别结果中均 未包括所述自定义词, 则将所 述第一实体识别结果确定为所述待处 理文本的目标实体。 8.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 基于各所述目标实体识别对应的目标意图; 若所述目标意图匹配目标受控设备的控制意图, 则根据 所述目标实体和所述目标意图 生成所述目标受控设备的控制指令, 以指示所述目标受控设备按照所述目标意图进行操 作。 9.一种实体的识别装置, 其特 征在于, 包括: 识别模块, 用于基于已训练的实体识别模型对获取的待处理文本进行实体识别, 得到 所述待处 理文本的第一实体识别结果; 处理模块, 用于根据目标分词策略对所述待处理文本进行分词处理, 得到所述待处理 文本的第二实体识别结果; 所述目标分词策略具有识别文本中的自定义词的能力; 确定模块, 用于若所述第 一实体识别结果和/或所述第 二实体识别结果包括自定义词, 则基于所述第一实体识别结果和第二实体识别结果, 确定所述待处 理文本中的目标实体。 10.一种存储介质, 其特征在于, 所述存储介质中存储有至少一可执行指令, 所述可执 行指令使处 理器执行如权利要求1 ‑8中任一项所述的实体的识别方法对应的操作。 11.一种电子设备, 其特征在于, 包括: 处理器、 存储器、 通信 接口和通信总 线, 所述处理 器、 所述存 储器和所述 通信接口通过 所述通信总线完成相互间的通信; 所述存储器用于存放至少一可执行指令, 所述可执行指令使所述处理器执行如权利要 求1‑8中任一项所述的实体的识别方法对应的操作。权 利 要 求 书 2/2 页 3 CN 115293152 A 3
专利 实体的识别方法及装置、存储介质、电子设备
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 02:14:49
上传分享
举报
下载
原文档
(756.8 KB)
分享
友情链接
GB-T 32831-2016 高能激光光束质量评价与测试方法.pdf
《零售企业数据安全合规指南》2.10.pdf
GB-T 25875-2010 草原蝗虫宜生区划分与监测技术导则.pdf
T-CHIA 17.1—2020 健康医疗大数据资源目录体系 第 1 部分:总体框架.pdf
GB-T 33200-2016 社会治安综合治理 综治中心建设与管理规范.pdf
T-CTSA 0011—2022 虚拟演出交互实验平台测试规范.pdf
ISO 37301 2021.pdf
易观分析 AIGC产业研究报告2023——语言生成篇pdf.pdf
GB-T 14337-2022 化学纤维 短纤维拉伸性能试验方法.pdf
GB-T 13917.9-2009 农药登记用卫生杀虫剂室内药效试验及评价 第9部分:驱避剂.pdf
GB-T 36561-2018 清洁节能热处理装备技术要求及评价体系.pdf
GB-T 25068.2-2020 信息技术 安全技术 网络安全 第2部分:网络安全设计和实现指南.pdf
GB-T 26281-2021 水泥回转窑热平衡、热效率、综合能耗计算方法.pdf
DB35-T 1344-2013 橄榄丰产栽培技术规范 福建省.pdf
思度安全-DSMM-012 数据接口安全管理规范V1.0.pdf
GB-T 40873-2021 大洋富钴结壳资源勘查规程.pdf
DB35-T 1777-2018 政务数据汇聚 数据集的规范化描述 福建省.pdf
GB-T 42815-2023 债券价格指标产品描述规范.pdf
GB-T 616-2006 化学试剂 沸点测定通用方法.pdf
T-TAF 075.2—2020 支持北斗的移动通信终端定位技术要求及测试方法 第2部分:控制面协议一致性.pdf
1
/
3
21
评价文档
赞助2.5元 点击下载(756.8 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。