团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211103092.7 (22)申请日 2022.09.09 (71)申请人 北京大学 地址 100091 北京市海淀区颐和园路5号 (72)发明人 孔桂兰 张路霞 丁国辉 张家豪 林鸿波 沈鹏 孙烨祥 王怀玉 彭苏元 孟若谷 孙小宇 郝建国 (74)专利代理 机构 北京绘聚高科知识产权代理 事务所(普通 合伙) 11832 专利代理师 张春慧 (51)Int.Cl. G16H 50/20(2018.01) G06N 3/04(2006.01) G06F 16/31(2019.01) G06F 16/35(2019.01)G06F 40/295(2020.01) G16H 70/20(2018.01) (54)发明名称 基于深度学习的关键临床指标实体识别方 法和系统 (57)摘要 本发明公开了基于深度学习的关键临床指 标实体识别方法和系统, 该方法包括: 根据慢性 肾脏病原始临床指标数据建立原始指标实体库; 基于专家标记法建立慢性 肾脏病的关键指标实 体知识库; 基于EntityEmbeddings算 法构建指标 实体归一化模 型, 形成原始指标 实体库和关键指 标实体知识库之间映射关系和分类器; 将待处理 的化验数据输入至指标实体归一化模型得到分 类结果。 相对于现有技术而言, 本发明的技术方 案实现了高效、 精准的多源慢 性肾脏病临床关键 指标的自动化识别, 可靠性强, 准确度高, 具有良 好的推广应用前 景。 权利要求书2页 说明书9页 附图4页 CN 115394435 A 2022.11.25 CN 115394435 A 1.一种基于深度学习的关键临床指标实体识别方法, 其特 征在于, 包括: 根据慢性肾脏病原 始临床指标 数据建立原 始指标实体库; 基于专家标记法建立慢性肾脏病的关键指标实体知识库; 基于Entity Embeddings算法构建指标实体归一化模型, 形成所述原始指标实体库和 所述关键指标实体知识库之间映射关系和分类 器; 将待处理的化验数据输入至所述指标实体归一 化模型得到分类结果。 2.根据权利要求1所述的基于深度学习的关键临床指标实体识别方法, 其特征在于, 所 述基于Entity Embeddings算法构建指标实体归一化模型, 形成所述原始指标实体库和所 述关键指标实体知识库之间映射关系和分类 器包括: 获取混合后的所述原始指标实体库和所述关键指标实体知识库记载的化验数据, 根据 化验数据不同字段的特 征, 对所述待处 理的化验数据进行 预处理; 采用基于Entity Embeddings算法的模型, 将分类型化验数据逐个映射为离散型特征 数值; 基于Softmax函数输出 各个指标类别对应的概 率以形成Softmax分类 器; 利用交叉熵损失函数计算指标分类结果与实际结果之间的偏差度, 并通过梯度 下降法 调整权重参数以缩小所述偏差度。 3.根据权利要求2所述的基于深度学习的关键临床指标实体识别方法, 其特征在于, 所 述采用基于Entity Embeddings算法的模型, 将分类型化验数据逐个映射为离散型特征数 值包括: 利用硬编码方法将所述分类型化验数据逐个映射为数值, 并将映射关系存入 哈希表, 并对目标列进行One ‑Hot编码; 设置向量的长度, 将通过One ‑Hot编码的分类型字段输入Entit y Embeddings层进行转 化处理, 得到固定维度向量。 4.根据权利要求3所述的基于深度学习的关键临床指标实体识别方法, 其特征在于, 所 述基于Softmax函数输出 各个指标类别对应的概 率包括: 将所述固定维度向量输入至神经网络层进行训练; 在输出层采用所述Softmax函数将训练后的向量归一化为概率分布向量, 得到各个指 标类别对应的概 率值, 且总概 率和为1。 5.根据权利要求4所述的基于深度学习的关键临床指标实体识别方法, 其特征在于, 所 述将待处 理的化验数据输入至所述指标实体归一 化模型得到分类结果包括: 获取所述待处 理的化验数据; 将所述待处 理的化验数据通过 所述哈希 表进行映射处 理得到映射结果; 将映射结果输入所述神经网络层进行训练, 并经过所述Softmax函数得到化验数据所 属类别的概 率, 实现分类 器的分类; 选取所述化验数据所属类别中概 率最高值所对应的类别作为临床指标实体 类别。 6.根据权利要求5所述的基于深度学习的关键临床指标实体识别方法, 其特征在于, 所 述临床指标实体类别包括机构编号、 指标内部编号、 化验中文名称、 化验英文名称、 单位和 参考范围。 7.根据权利要求3所述的基于深度学习的关键临床指标实体识别方法, 其特征在于, 所权 利 要 求 书 1/2 页 2 CN 115394435 A 2述将通过One ‑Hot编码的分类型字段输入Entity Embeddings层进行转 化处理包括: 在所述Entity Embeddings层将所述离 散型特征数值映射 为向量; 通过向量距离确定不同离散型特征数值之间的关联程度, 并根据关联程度大小确定所 述固定维度向量的距离 长度。 8.根据权利要求3所述的基于深度学习的关键临床指标实体识别方法, 其特征在于, 所 述对所述待处 理的化验数据进行 预处理包括: 对所述待处 理的化验数据进行 数据清洗和数据补全, 并筛 选出需要的分类型的数据。 9.根据权利要求3所述的基于深度学习的关键临床指标实体识别方法, 其特征在于, 还 包括: 判断是否存在新的字段值或类别, 且所述字段值或类别未纳入训练集中; 若是, 则将所述 新的字段值或类别进行统一 替换。 10.一种基于深度学习的关键临床指标实体识别系统, 其特 征在于, 包括: 原始指标实体库建立单元, 用于根据慢性肾脏病原始 临床指标数据建立原始指标实体 库; 指标实体知识库建立单元, 用于基于专家标记法建立慢性肾脏病的关键指标实体知识 库; 模型构建单元, 用于基于Entity Embeddings算法构建指标实体归一化模型, 形成所述 原始指标实体库和所述关键指标实体知识库之间映射关系和分类 器; 数据分类单元, 用于将待处理 的化验数据输入至所述指标实体归一化模型得到分类结 果。权 利 要 求 书 2/2 页 3 CN 115394435 A 3
专利 基于深度学习的关键临床指标实体识别方法和系统
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 02:14:24
上传分享
举报
下载
原文档
(992.1 KB)
分享
友情链接
DB4403-T 27-2019 城市轨道交通警用安全防范系统与通信系统技术规范 深圳市.pdf
SN-T 4030-2014 香薰类化妆品急性吸入毒性试验.pdf
T-CESA 1264—2023 非接触式掌纹掌静脉融合识别终端设备 技术要求.pdf
GB-T 14555-2015 船用导航雷达接口及安装要求.pdf
安恒信息-GBT31168-2023 信息安全技术云计算服务安全能力要求 国家标准解读.pdf
T-FSI 090—2022 低挥发性甲基环硅氧烷的107胶.pdf
GB-T 42453-2023 信息安全技术 网络安全态势感知通用技术要求.pdf
GB-T 37002-2018 信息安全技术 电子邮件系统安全技术要求.pdf
DB22-T 370-2014 建筑逃生缓降器设置技术规范 吉林省.pdf
DB45-T 2761-2023 电子政务外网运维管理规范 广西壮族自治区.pdf
GB-T 42381.8-2023 数据质量 第8部分:信息和数据质量:概念和测量.pdf
DB11-T 945.1-2023 建设工程施工现场安全防护、场容卫生及消防保卫标准 第1部分:通则 北京市.pdf
DB37-T 4440.3—2021 城市轨道交通互联互通体系规范 信号系统 第3部分:工程设计 山东省.pdf
360 2022年智能网联汽车信息安全研究报告.pdf
GB-T 20277-2015 信息安全技术 网络和终端隔离产品测试评价方法.pdf
SY-T 7657.3-2021 天然气 利用光声光谱-红外光谱-燃料电池联合法测定组成 第3部分:红外光谱法测定乙烷及以上烷烃、二氧化碳、一氧化碳含量.pdf
GB-T 29115-2012 工业企业节约原材料评价导则.pdf
CSA 安全数据湖的敏捷数据原则.pdf
GB-T 30363-2013 森林植被状况监测技术规范.pdf
YD-T 3957-2021 基于LTE的车联网无线通信技术 安全证书管理系统技术要求.pdf
1
/
3
16
评价文档
赞助2.5元 点击下载(992.1 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。